如果聲控介面是未來趨勢,那麼何時才會成真?/Jean-Louis Gassée

自從Amazon推出搭配Alexa語音辨識技術的智慧揚聲器、並且形成一股風潮之後,許多人認為「聲控」將會成為未來人機介面的主流之一。不過我們仍然需要數字佐證:有多少人在嘗鮮期過去之後,仍然繼續使用Alexa(或是Siri和Google assistant)?我們都用它來做什麼?

有了這些進一步的使用狀況資訊,我們才能夠容易瞭解聲控究竟是不是真正的未來趨勢。

幾十年來,一直都有人嘗試設計出以語音控制的人機介面,而類似的幻想也一直在電影中出現;像是「星際爭霸戰」(Star Trek)中只要先說「Computer!」就可以對電腦下命令,或是「2001太空漫遊」(2001 Space Odyssey)中的著名台詞「I’m sorry Dave, I’m afraid I can’t do that」等等。

也是這幾十年來,每年都有人會說「這次是真的」,但之後就雷聲大雨點小、甚至無聲無息了(還有人記得「Ubi」嗎?)。曾經有一位記者去參觀過幾位宣稱聲控介面有多好的作家辦公室,結果發現真的在用的人……一個也沒有。

聲控是另一種介面

雖然如此,人們對於聲控介面仍然不會死心;能以口中說出的自然語言來下指令,確實會是人機介面演化的一大進步。就像當年由Xerox Parc實驗室開發的圖形電腦介面取代了艱澀的命令列介面(CLI)一樣。

如果有一天聲控介面成熟,就可以讓我們把雙手空出來做別的事情;或者也可以說,聲音會變成我們的「第三隻手」,讓我們在雙手忙碌的時候還可以控制室溫、導航系統、音響設備等等。

對於有某些身障困擾的人來說,聲控功能不僅是一種額外的便利,更提供了自理能力、以及心理上的尊嚴。

此外,語文能力不佳所造成的障礙也會降低;即使不會讀寫某種語言,也不見得會礙事。所以,對於一些教育還不夠普及的地方,聲控也提供了另外一種操作設備的途徑。

時至今日,聲控不再只存在於想像之中;這一波聲控設備的流行,可以說必須歸功於Amazon在這方面的遠見、以及技術上的實踐。

率先上市的Amazon Echo

Amazon在2014年底推出的Echo系列聲控智慧揚聲器,是最早結合新近人工智慧技術的同類產品之一。在第三方開發者的支持之下,目前它已經擁有超過15,000種語音應用(Skills;回應特定用途指令的功能模組,大致相當於手機上的app)。

此外,Amazon對於新用戶的支援也相當貼心而實用。除了提供一份Skill使用指引(Skills Guide;編按:目前無中文版),讓新手不需要使用手冊、鍵盤、滑鼠就可以進入狀況,也讓現有的Echo用戶享受更多Alexa語音助理的協助。

每個星期,Amazon都會寄出一份郵件,告訴Echo使用者最新可用的Alexa語音互動方式。這些郵件的內容不像一般只會叫人繼續買東西的廣告,而是會持續告訴用戶如何善用他們手邊的Echo產品。

在我看來,Apple的高級主管之中似乎沒有人買過Echo;不然他們應該要懂得學學Amazon老闆Jeff Bezos,每週寫一封文情並茂的電子郵件給那些死忠支持Mac、iPhones、或是iPad的支持者。

雖然聲控功能有時候略嫌名過其實、甚至有時候用起來令人氣結,但不能不說已經有了很大的進步。一部分的問題是,如果我們不對它講話,這類設備整天就等在那邊、做不了太多事;但卻又不讓我們知道,它到底能聽懂什麼話、或是用什麼樣的說法才聽得懂。

此外,大多數的這類「語音助理」都無法通過圖靈測試(Turing Test);也就是說,它們目前「智慧」的程度,還無法讓我們以為是在跟真人說話。

我們要看數字

對於有興趣長期使用這類技術的人來說,另外一個有點困擾的地方,在於無論Amazon、Google、或是Apple都不願意公布一些相關的統計數字。像是「Echo究竟賣了多少台?」、「每個用戶每天平均使用幾次?一天10次?一週5次?還是根本沒在用了?」、「什麼年紀、或是什麼職業的人最常用它、用它做什麼?」之類的。

對於上面這些問題,Amazon都有答案,但是並沒有對外公開;如果想多瞭解這些,就只能看看產業分析師們的說法了。

2016年底(以這類技術來說,這算是很久很久以前了)有一項調查報告指出,Echo用戶最常試用的聲控功能是「設定時鐘」;後來的另外一項調查則顯示,Echo使用者「比較願意買東西」。

作者註:真正嚴謹的調查相當曠日廢時,而且需要夠大(例如1000人以上)的統計母體、而且受訪者必須具有這個母體的代表性,才能產生有意義的統計結果。上述的「調查報告」是從用戶論壇得來的結果,而「最常設定時鐘」的詢問對象只有180人,所以這個結果參考就好。

說到缺乏參考數據,Google Assistant也是一樣。Android智慧手錶的成功,代表Google Assistant語音助理即使在識字率還不是極高的地方(例如印度),還是發揮了它的功能;但如果沒有相關的統計資訊,對於Google在這方面是否成功、使用狀況如何,我們還是只能用猜測的。

在Apple方面,Siri語音助理的使用數字倒是有些眉目;四年以內出品的iOS設備銷售量,就是大致上的數字。Apple也提供了類似Amazon「Skills Guide」的教學網頁,以清爽的內容引導新手學習使用Siri的各種功能。

然而,用戶使用Siri的狀況如何?誰會在什麼時候如何用它?我們還是不知道。

各家的如意算盤

我們為什麼需要知道這些數字?「好奇」當然是原因之一,但如果有這些數字,我們也好進一步瞭解聲控介面到底有沒有希望。目前這個領域的龍頭是Amazon,但它會領先多久?Amazon、Google、Apple是目前的前三大,而他們都有不同的入手策略。

Amazon:

Amazon首先發掘了聲控介面和電子商務之間的關係,因此取得了目前的領先地位;但就市場上的設備數量而言,它還遠遠落在Google Assistant(Android)和Siri(iOS)之後。

因此,Amazon必須能夠大量增加Echo、或其他具備Alexa語音助理功能的設備銷售量。

Google:

Google目前並沒有直攻消費性市場,而是以「向商家賣廣告」作為主要的收入來源。雖然因為Android的普及,Google Assistant在觸及用戶數量上有絕對優勢,但缺乏像Amazon一樣的廣告與電商整合。

Apple:

Apple不賣商品、也不賣廣告,而是純粹從賣設備上賺錢。Siri和Apple生態系中的其他成員如iTunes或App Store一樣,都屬於利潤急速增加中的服務事業;它的目的也很單純,就是幫Apple賣更多的電腦、iPhone、iPad、還有Apple Watch手錶。

由此可見,這前三大廠商各有各的策略和盤算。至於誰能領先、誰能獲利最多,讓我們之後再來看看。

要真的發生,才是未來

無論未來市場如何,Amazon現在的聲控介面確實表現不錯;Google如何將聲控介面與廣告業務連結、並且整合到旗下的連網設備中,也值得觀察。

雖然目前的技術已經進步到可以「號稱可用」,然而在沒有數字佐證的狀況下,要如某些專家說的「聲控介面是下個世代電腦應用的最後一片拼圖」似乎還言之過早。

就如同過去曾經提過的,即使萬事具備,還是需要東風幫忙:

能預測未來會發生什麼事,叫做趨勢大師;知道未來什麼時候會發生,才叫做億萬富翁。

作者註:由於使用時間尚短,所以本文中沒有討論到Apple的HomePod。


編按:以下與主文無關,只是剛好看到這段用《2001太空漫遊》台詞開Alexa玩笑的影片,所以放進來跟讀者分享。

[facebook url="https://www.facebook.com/TheDailiesByScreenJunkies/videos/10156026243637403/" /]