AI重新定義機器人:Robotics 2.0系列#1/Bastiane Huang

人工智慧所造就的機器人技術領域,最大成果是從原先以人工編寫程式而來的自動化,邁向了真正的自主學習。本文將嘗試揭開人工智慧應用的神秘面紗,協助讀者瞭解AI機器人將如何影響我們的未來,並釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。

本文為「Robotics 2.0」系列文章的第一篇,講述機器人技術與人工智慧AI對於各大產業和未來工作的影響。

在後續文章中,我們將討論深度強化學習(Deep Reinforcement Learning,DRL)如何釋放機器人技術的潛力、這項新技術的挑戰和機會,以及這一切將如何影響我們的生產力、就業狀況、乃至於日常生活。

透過這些文章,我們希望鼓勵建設性和整體性的探討;在人工智慧被大肆宣傳的當下,幫助大家建立明確認知與正確判斷,迎向通用人工智慧(AGI)的新時代。

本文摘要

• AI所造就的機器人技術領域,最大成果是從原先的「自動化」邁向真正的「自主學習」。

• 隨著深度學習、強化學習、以及雲端技術釋放出的機器人潛力,我們將看到下一代機器人帶來的爆炸式增長、並且不斷變化的產業格局。

• 隨著產業成熟,我們更加需要標準的機器人作業系統、通訊協定、介面,從而提高效率、並縮短上市時間。

• 機器人新創產業結構可分為「垂直應用」與「水平應用」兩種商業模式。

重新定義機器人:揭開次世代AI機器人的神秘面紗

提到機器人,總有各式各樣天馬行空的想像:Softbank(軟銀集團)的社交機器人Pepper、能輕鬆做到後空翻的Boston Dynamics公司機器人Atlas、《魔鬼終結者》(Terminator)系列電影的人造人殺手,以及電視影集《西方極樂園》(West World)中隨處可見、栩栩如生的擬真機器人角色等等。

然而,不熟悉產業的一般人,觀點經常傾向於兩極化;有些人不切實際地高估了機器人模仿人類智慧的能力,但也有人低估了新研究和技術的潛力與用途。

在過去一年之中,許多創業、科技、新創業界的朋友都曾問過我,在深度強化學習和機器人技術的領域,究竟有哪些「實際」進展。

引人好奇的是:

AI機器人和傳統機器人有什麼不一樣?AI機器人真有顛覆各大產業的潛力?它們的能力和限制又是什麼?

有些問題,甚至讓我感到驚訝。看來,想要瞭解現在的技術進步和產業格局,是出乎意料的困難,更不用說要對未來做出預測。

藉由這篇文章,我嘗試揭開人工智慧應用於機器的神秘面紗;尤其針對強化深度學習機器人,試圖釐清我們常常聽到,但卻著墨不多、或根本未全然理解的主題。

首先必須回答的基本問題:什麼是AI機器人(AI-enabled Robotics)?它們又有什麼獨特之處?

機器人演進:從自動化到自主化

「機器學習解決了以往『對電腦困難,對人來說卻容易』的各種問題,或以更容易理解的方式來說,就是解決了『人類很難讓電腦也理解』的問題。」

——Benedict Evans,安霍創投(a16z)

AI所造就的機器人技術領域,最大成果是從原先的「自動化」(藉由程式設計編寫規則,讓機器人遵守)邁向了真正的「自主學習」。

如果機器人只需要處理一件事情就好,那麼,它到底有沒有人工智慧,差別其實看不出來;但是,如果機器人需要處理各式各樣的任務、或是回應人類與環境的變化,就需要一定程度的自主性才能勝任。

我們不妨借用下列不同等級的自駕車定義,一併解釋機器人的演變:

  • Level 0 — 無自動化:由人類操作機器,沒有機器人的參與。(機器人的普遍定義,係指有能力自行從事複雜動作的可程式化擬人機械)。

  • Level 1 — 駕駛輔助:單一自動化運作。單一功能已自動化,但不需要使用環境資訊。

    這是自動化與製造業中傳統的機器人使用狀況。機器人透過程式編輯,以高精度與速度重複執行特定工作;直至目前為止,多數實際運用的機器人都無法感知或適應環境的變化。

  • Level 2 — 部分自動化:透過環境感知所輸入的特定功能,協助機器進行決策。

    例如某些機器人透過視覺感應器,識別並應付不同的對象:然而,傳統的電腦視覺,卻需要對每個對象進行預先登記和清楚的指示,並且缺乏處理變更、意外狀況、或是新對象的能力。

  • Level 3 — 條件式自主:機器控制了所有的環境監控行為,但仍需要人為檢查關注與(即時)介入。

  • Level 4 — 高度自主:在某些情況下、或是定義的區域內完全自主。

  • Level 5 — 完全自主:在任何狀況下均可完全自主。

我們現在處於哪一種自主等級呢?

如今,工廠裡的多數機器人都是透過開放式迴路、或是非回饋方式予以控制。這意味著它們的運作與感測器回饋都各自獨立、彼此互不影響(level 1)。

極少數的先進現場機器人,會根據感測器回饋而調整操作(level 2);協作型機器人(cobot)的設計更加通用,還能與人類並肩、共同作業。

然而,相較於產業用機器人,這種機器人的功率和速度卻相形失色。雖然協作型機器人的程式化相對較簡易,但它們並不具有自主性;每當工作或環境有所變動時,就需要由人類手動引導協作機器人進行調整。

我們已經開始看到一些使用 AI 機器人(level 3/4)的前導試行專案,例如「倉儲揀貨」就是一個很好的例子。

在貨運倉庫中,員工需要根據客戶需求,將數百萬種不同的產品放入箱子裡。傳統的電腦視覺沒辦法處理如此廣泛的物品類別,因為每個物品都需要事先登錄、並針對機器人需要採取的動作,先進行程式設計。

深度學習和強化學習能幫助機器人自主處理各種物件,將人類的介入程度降到最低。

然而,現在的深度學習和強化學習技術,能幫助機器人自主學習處理各種物件,從而將人類的介入程度降到最低。在機器人的學習過程中,可能會出現它未曾遇過的某些貨品;如此一來,機器還是需要人類的協助或示範(level 3)。

但是,隨著機器人搜集更多的資料、從試驗和錯誤中學習(level 4),演算法也將日益改善,邁向完全自主。

就像自駕汽車產業一樣,機器人新創公司也採取了不同的方法:有些人看好的是人類和機器人之間的未來協作前景,並專注於level 3的研發;其他的人則相信,未來終將實現真正的完全自主,於是他們跳過level 3,直接著眼於level 4、最終甚至到level 5。

這也是為什麼我們很難評估實際自主程度的原因之一。

新創公司有可能自稱致力於研究以人為中心的level 3人工智慧(例如遠端操作),但實際上卻是大量的委外人工運算堆疊而成。

另一方面,目標為level 4/5的新創公司,萬一無法在短時間取得理想結果,可能反而降低了客戶的早期採用意願、並導致早期階段的資料搜集更加困難。

在本文的後半部分,我將進一步討論關於不同方法和描繪新創公司的思考。

AI機器人的崛起:運用範圍不再侷限於倉儲管理

值得慶幸的是,機器人的人工智慧潛能高於汽車,可以運用在更多使用案例與產業當中;因此從某種意義上說,機器人理當比汽車更容易實現level 4目標。

我們首先見證的,將是AI機器人在倉庫中的採用和運行。因為倉庫屬於「半受控」的環境,揀貨作業是雖然關鍵、但還能容許錯誤的任務。

至於自主居家型或手術機器人,則要等到更遙遠的未來才能實現;畢竟相關作業環境的變數更加繁多,且有些任務具備不可逆性。隨著技術精度、準確性、可靠性的與時俱進,我們將看到更多場景和產業採用更多AI機器人。

許多產業還沒有使用機械手臂,主要原因在於傳統機器人和電腦視覺的限制。

目前世界上只有大約300萬台機器手臂,其中大多數從事搬運、焊接、裝配等任務。到目前為止,除了汽車業和電子業以外,倉儲、農業和其他產業,幾乎都還沒有開始使用機械手臂;主要原因,就在於上述傳統機器人和電腦視覺的限制。

在接下來的幾十年中,隨著深度學習、強化學習、以及雲端技術釋放出的機器人潛力,我們將看到下一代機器人帶來的爆炸式增長、並且不斷變化的產業格局。

由於當前參與者的動機各不相同,上述技術的複雜程度也不一而足,不同產業的自動化步調可說是進度各異、參差不齊。

次世代AI機器人新創企業格局

AI機器人產業的成長契機有哪些?這個市場的新創公司和現有業者,採取了哪些不同的方法和商業模式?

接下來,我會概括介紹不同市場區隔跟領域中的幾家範例公司。這樣的概略介紹,當然無法涵蓋所有企業的狀況;歡迎讀者提供其他的公司以及應用案例,一起讓內容更加完備。

AI/Robotics新創公司概況(作者提供)

垂直應用與水平應用

研究新世代機器人新創產業結構,可以看到兩種截然不同的商業模式。

  • 垂直應用

第一種是垂直應用:矽谷當地多數的新創公司,專注於為特定的垂直市場開發解決方案;如電子商務履行、製造業、農業等等。

這種完整堆疊式的方法相當合理,畢竟相關技術還處於萌芽階段;公司不依賴他人提供關鍵模組或元件,而是建構端對端的解決方案。這種垂直整合的解決方案速度更快,也能確保公司更全面掌握終端使用者的案例與效能表現。

但是,像「倉庫自動化」這樣相對容易實現的使用案例,則沒有那麼容易找到。倉庫揀貨是較為簡單的工作,客戶的投資意願與技術可行性都較高,而且每個倉庫幾乎都有相同的揀貨需求。

但在其他產業(如製造業)中,裝配任務可能因工廠而各不相同;例如與倉庫中執行的任務相比,在製造業中執行的任務,需要講求更高的精度和速度。

具有學習能力的機器人,仍無法達到與封閉迴路機器人相同的精度。

儘管機器學習能讓機器人與時俱進,但目前透過機器學習運作的機器人,仍無法達到與封閉迴路機器人相同的精度,因為它需要累積嘗試錯誤的經驗,才有辦法學習。

這點說明了為什麼MujinCapSen機器人這樣的新創公司,並未採用深度強化學習,反而選擇使用傳統電腦視覺。

然而,傳統電腦視覺要求每個物件都要事先登錄,終究還是缺乏擴充和適應變化的能力。不過,一旦深度強化學習達到了效能門檻、逐步成為產業主流,這種傳統方法終究會變得英雄無用武之地。

此外,這些新創公司的另一個問題,在於它們的價值往往遭到高估。我們經常看到,新創公司在矽谷籌集了數千萬美元資金,卻無法承諾創造出任何真正具體的收入流。

對於創業者來說,「描繪」深度強化學習的美好未來,再容易也不過了;但現實則是,我們還需要數年的時間才能達到如此的成果。儘管這些公司離創造營收還很遠,風險資本家仍繼續押寶在這些人才優秀、技術先進的團隊上。

  • 水平應用

另一方面,水平應用則是更實用、卻比較罕見的方法,可以建構出在不同產業使用的技術堆疊和驅動器。

我們可以將機器人技術堆疊簡化為感測(輸入)、處理、驅動(輸出)三個元件;除此之外,還有開發工具。

這裡使用的「處理」一詞,同時概略涵蓋了控制器、機器學習、作業系統和機器人模組等等,各種不屬於感測或驅動的其他項目。

機器人製造商都只推自家的語言和介面,使得整合商與使用者都很難進行整合。

我認為在不遠的將來,這個領域將最具增長潛力。對於機器人的用戶來說,破碎而零細的市場是棘手的問題;因為所有的機器人製造商,都各自推展自家開發的語言和介面,使得系統整合商與終端使用者,都很難將機器人與相關系統進行整合。

隨著產業的逐漸成熟,有越來越多機器人應用到了汽車和電子廠以外的領域;因此我們更加需要標準的作業系統、通訊協定、介面,從而提高效率、並縮短上市時間。

美國波士頓的幾家新創公司正在研究相關的模組化方法;例如Veo Robotics公司開發的安全模組,就容許機器人和人類協同工作;Realtime Robotics公司提供的解決方案,則加速了運動規劃。


關於人工智慧和機器人,您還想閱讀哪些主題的文章?敬請期待後續的系列文章介紹,筆者更期待聽到大家的意見,希望大家多留言互相交流!