AI重新定義機器人：Robotics 2.0系列#1／Bastiane Huang

Bastiane Huang

Sep 19, 2019

人工智慧所造就的機器人技術領域，最大成果是從原先以人工編寫程式而來的自動化，邁向了真正的自主學習。本文將嘗試揭開人工智慧應用的神秘面紗，協助讀者瞭解AI機器人將如何影響我們的未來，並釐清我們常常聽到，但卻著墨不多、甚至根本尚未全然理解的主題。

本文為「Robotics 2.0」系列文章的第一篇，講述機器人技術與人工智慧AI對於各大產業和未來工作的影響。

在後續文章中，我們將討論深度強化學習（Deep Reinforcement Learning，DRL）如何釋放機器人技術的潛力、這項新技術的挑戰和機會，以及這一切將如何影響我們的生產力、就業狀況、乃至於日常生活。

透過這些文章，我們希望鼓勵建設性和整體性的探討；在人工智慧被大肆宣傳的當下，幫助大家建立明確認知與正確判斷，迎向通用人工智慧（AGI）的新時代。

本文摘要

• AI所造就的機器人技術領域，最大成果是從原先的「自動化」邁向真正的「自主學習」。

• 隨著深度學習、強化學習、以及雲端技術釋放出的機器人潛力，我們將看到下一代機器人帶來的爆炸式增長、並且不斷變化的產業格局。

• 隨著產業成熟，我們更加需要標準的機器人作業系統、通訊協定、介面，從而提高效率、並縮短上市時間。

• 機器人新創產業結構可分為「垂直應用」與「水平應用」兩種商業模式。

重新定義機器人：揭開次世代AI機器人的神秘面紗

提到機器人，總有各式各樣天馬行空的想像：Softbank（軟銀集團）的社交機器人Pepper、能輕鬆做到後空翻的Boston Dynamics公司機器人Atlas、《魔鬼終結者》（Terminator）系列電影的人造人殺手，以及電視影集《西方極樂園》（West World）中隨處可見、栩栩如生的擬真機器人角色等等。

然而，不熟悉產業的一般人，觀點經常傾向於兩極化；有些人不切實際地高估了機器人模仿人類智慧的能力，但也有人低估了新研究和技術的潛力與用途。

在過去一年之中，許多創業、科技、新創業界的朋友都曾問過我，在深度強化學習和機器人技術的領域，究竟有哪些「實際」進展。

引人好奇的是：

AI機器人和傳統機器人有什麼不一樣？AI機器人真有顛覆各大產業的潛力？它們的能力和限制又是什麼？

有些問題，甚至讓我感到驚訝。看來，想要瞭解現在的技術進步和產業格局，是出乎意料的困難，更不用說要對未來做出預測。

藉由這篇文章，我嘗試揭開人工智慧應用於機器的神秘面紗；尤其針對強化深度學習機器人，試圖釐清我們常常聽到，但卻著墨不多、或根本未全然理解的主題。

首先必須回答的基本問題：什麼是AI機器人（AI-enabled Robotics）？它們又有什麼獨特之處？

機器人演進：從自動化到自主化

「機器學習解決了以往『對電腦困難，對人來說卻容易』的各種問題，或以更容易理解的方式來說，就是解決了『人類很難讓電腦也理解』的問題。」
——Benedict Evans，安霍創投（a16z）

AI所造就的機器人技術領域，最大成果是從原先的「自動化」（藉由程式設計編寫規則，讓機器人遵守）邁向了真正的「自主學習」。

如果機器人只需要處理一件事情就好，那麼，它到底有沒有人工智慧，差別其實看不出來；但是，如果機器人需要處理各式各樣的任務、或是回應人類與環境的變化，就需要一定程度的自主性才能勝任。

我們不妨借用下列不同等級的自駕車定義，一併解釋機器人的演變：

Level 0 — 無自動化：由人類操作機器，沒有機器人的參與。(機器人的普遍定義，係指有能力自行從事複雜動作的可程式化擬人機械)。
Level 1 — 駕駛輔助：單一自動化運作。單一功能已自動化，但不需要使用環境資訊。
這是自動化與製造業中傳統的機器人使用狀況。機器人透過程式編輯，以高精度與速度重複執行特定工作；直至目前為止，多數實際運用的機器人都無法感知或適應環境的變化。
Level 2 — 部分自動化：透過環境感知所輸入的特定功能，協助機器進行決策。
例如某些機器人透過視覺感應器，識別並應付不同的對象：然而，傳統的電腦視覺，卻需要對每個對象進行預先登記和清楚的指示，並且缺乏處理變更、意外狀況、或是新對象的能力。
Level 3 — 條件式自主：機器控制了所有的環境監控行為，但仍需要人為檢查關注與（即時）介入。
Level 4 — 高度自主：在某些情況下、或是定義的區域內完全自主。
Level 5 — 完全自主：在任何狀況下均可完全自主。

我們現在處於哪一種自主等級呢？

如今，工廠裡的多數機器人都是透過開放式迴路、或是非回饋方式予以控制。這意味著它們的運作與感測器回饋都各自獨立、彼此互不影響（level 1）。

極少數的先進現場機器人，會根據感測器回饋而調整操作（level 2）；協作型機器人（cobot）的設計更加通用，還能與人類並肩、共同作業。

然而，相較於產業用機器人，這種機器人的功率和速度卻相形失色。雖然協作型機器人的程式化相對較簡易，但它們並不具有自主性；每當工作或環境有所變動時，就需要由人類手動引導協作機器人進行調整。

我們已經開始看到一些使用 AI 機器人（level 3/4）的前導試行專案，例如「倉儲揀貨」就是一個很好的例子。

在貨運倉庫中，員工需要根據客戶需求，將數百萬種不同的產品放入箱子裡。傳統的電腦視覺沒辦法處理如此廣泛的物品類別，因為每個物品都需要事先登錄、並針對機器人需要採取的動作，先進行程式設計。

深度學習和強化學習能幫助機器人自主處理各種物件，將人類的介入程度降到最低。

然而，現在的深度學習和強化學習技術，能幫助機器人自主學習處理各種物件，從而將人類的介入程度降到最低。在機器人的學習過程中，可能會出現它未曾遇過的某些貨品；如此一來，機器還是需要人類的協助或示範（level 3）。

但是，隨著機器人搜集更多的資料、從試驗和錯誤中學習（level 4），演算法也將日益改善，邁向完全自主。

就像自駕汽車產業一樣，機器人新創公司也採取了不同的方法：有些人看好的是人類和機器人之間的未來協作前景，並專注於level 3的研發；其他的人則相信，未來終將實現真正的完全自主，於是他們跳過level 3，直接著眼於level 4、最終甚至到level 5。

這也是為什麼我們很難評估實際自主程度的原因之一。

新創公司有可能自稱致力於研究以人為中心的level 3人工智慧（例如遠端操作），但實際上卻是大量的委外人工運算堆疊而成。

另一方面，目標為level 4/5的新創公司，萬一無法在短時間取得理想結果，可能反而降低了客戶的早期採用意願、並導致早期階段的資料搜集更加困難。

在本文的後半部分，我將進一步討論關於不同方法和描繪新創公司的思考。

AI機器人的崛起：運用範圍不再侷限於倉儲管理

值得慶幸的是，機器人的人工智慧潛能高於汽車，可以運用在更多使用案例與產業當中；因此從某種意義上說，機器人理當比汽車更容易實現level 4目標。

我們首先見證的，將是AI機器人在倉庫中的採用和運行。因為倉庫屬於「半受控」的環境，揀貨作業是雖然關鍵、但還能容許錯誤的任務。

至於自主居家型或手術機器人，則要等到更遙遠的未來才能實現；畢竟相關作業環境的變數更加繁多，且有些任務具備不可逆性。隨著技術精度、準確性、可靠性的與時俱進，我們將看到更多場景和產業採用更多AI機器人。

許多產業還沒有使用機械手臂，主要原因在於傳統機器人和電腦視覺的限制。

目前世界上只有大約300萬台機器手臂，其中大多數從事搬運、焊接、裝配等任務。到目前為止，除了汽車業和電子業以外，倉儲、農業和其他產業，幾乎都還沒有開始使用機械手臂；主要原因，就在於上述傳統機器人和電腦視覺的限制。

在接下來的幾十年中，隨著深度學習、強化學習、以及雲端技術釋放出的機器人潛力，我們將看到下一代機器人帶來的爆炸式增長、並且不斷變化的產業格局。

由於當前參與者的動機各不相同，上述技術的複雜程度也不一而足，不同產業的自動化步調可說是進度各異、參差不齊。

次世代AI機器人新創企業格局

AI機器人產業的成長契機有哪些？這個市場的新創公司和現有業者，採取了哪些不同的方法和商業模式？

接下來，我會概括介紹不同市場區隔跟領域中的幾家範例公司。這樣的概略介紹，當然無法涵蓋所有企業的狀況；歡迎讀者提供其他的公司以及應用案例，一起讓內容更加完備。

垂直應用與水平應用

研究新世代機器人新創產業結構，可以看到兩種截然不同的商業模式。

垂直應用

第一種是垂直應用：矽谷當地多數的新創公司，專注於為特定的垂直市場開發解決方案；如電子商務履行、製造業、農業等等。

這種完整堆疊式的方法相當合理，畢竟相關技術還處於萌芽階段；公司不依賴他人提供關鍵模組或元件，而是建構端對端的解決方案。這種垂直整合的解決方案速度更快，也能確保公司更全面掌握終端使用者的案例與效能表現。

但是，像「倉庫自動化」這樣相對容易實現的使用案例，則沒有那麼容易找到。倉庫揀貨是較為簡單的工作，客戶的投資意願與技術可行性都較高，而且每個倉庫幾乎都有相同的揀貨需求。

但在其他產業（如製造業）中，裝配任務可能因工廠而各不相同；例如與倉庫中執行的任務相比，在製造業中執行的任務，需要講求更高的精度和速度。

具有學習能力的機器人，仍無法達到與封閉迴路機器人相同的精度。

儘管機器學習能讓機器人與時俱進，但目前透過機器學習運作的機器人，仍無法達到與封閉迴路機器人相同的精度，因為它需要累積嘗試錯誤的經驗，才有辦法學習。

這點說明了為什麼Mujin和CapSen機器人這樣的新創公司，並未採用深度強化學習，反而選擇使用傳統電腦視覺。

然而，傳統電腦視覺要求每個物件都要事先登錄，終究還是缺乏擴充和適應變化的能力。不過，一旦深度強化學習達到了效能門檻、逐步成為產業主流，這種傳統方法終究會變得英雄無用武之地。

此外，這些新創公司的另一個問題，在於它們的價值往往遭到高估。我們經常看到，新創公司在矽谷籌集了數千萬美元資金，卻無法承諾創造出任何真正具體的收入流。

對於創業者來說，「描繪」深度強化學習的美好未來，再容易也不過了；但現實則是，我們還需要數年的時間才能達到如此的成果。儘管這些公司離創造營收還很遠，風險資本家仍繼續押寶在這些人才優秀、技術先進的團隊上。

水平應用

另一方面，水平應用則是更實用、卻比較罕見的方法，可以建構出在不同產業使用的技術堆疊和驅動器。

我們可以將機器人技術堆疊簡化為感測（輸入）、處理、驅動（輸出）三個元件；除此之外，還有開發工具。

這裡使用的「處理」一詞，同時概略涵蓋了控制器、機器學習、作業系統和機器人模組等等，各種不屬於感測或驅動的其他項目。

機器人製造商都只推自家的語言和介面，使得整合商與使用者都很難進行整合。

我認為在不遠的將來，這個領域將最具增長潛力。對於機器人的用戶來說，破碎而零細的市場是棘手的問題；因為所有的機器人製造商，都各自推展自家開發的語言和介面，使得系統整合商與終端使用者，都很難將機器人與相關系統進行整合。

隨著產業的逐漸成熟，有越來越多機器人應用到了汽車和電子廠以外的領域；因此我們更加需要標準的作業系統、通訊協定、介面，從而提高效率、並縮短上市時間。

美國波士頓的幾家新創公司正在研究相關的模組化方法；例如Veo Robotics公司開發的安全模組，就容許機器人和人類協同工作；Realtime Robotics公司提供的解決方案，則加速了運動規劃。

關於人工智慧和機器人，您還想閱讀哪些主題的文章？敬請期待後續的系列文章介紹，筆者更期待聽到大家的意見，希望大家多留言互相交流！

吐納商業評論 | Tuna Business Review

Discussion about this post