Metaverse 漫遊指南下篇:別慌張,元宇宙還沒到/Manny Li

本系列文章的上篇針對元宇宙(metaverse)的前世今生與概念框架,做了一些簡單的討論;本篇則討論近代各項發展中,筆者個人頗感興趣的「可交互性」議題。

前言

本系列文章的上篇針對元宇宙(metaverse)的前世今生與概念框架,做了一些簡單的討論;本篇則討論近代各項發展中,我個人頗感興趣的「可交互性」(interoperability)議題。

之所以選擇探討可交互性,而非其他實務上更重要的議題(例如運算能力、硬體設備、通訊技術等),是因為可交互性是目前許多想像與爭議的焦點,例如:

NFT(非同質化代幣)是元宇宙嗎?

沒有真正的 AR(擴增實境)以前,就沒有元宇宙。

由於元宇宙尚未存在一個公認的定義,與其試圖將每件事情都套進定義這件「衣服」中、然後指責誰不合身,更務實、更有啟發的作法,或許是去分析各種陳述背後的想像:

  • 虛擬世界/虛擬宇宙之間的交互:使用者的化身與物品可以自由遊走

  • 真實世界與虛擬世界的交互:在虛擬世界中的行為可以影響到真實世界(反之亦然)

從化身到元宇宙

「可交互性」(interoperability)是談到元宇宙時,經常被提及的一個關鍵;指的是不同世界、甚至不同宇宙之間交換訊息,以及對已交換的訊息加以使用的能力。

單看這個字或許會覺得有點玄,可以理解成不同軟體之間,透過讀取相同文件格式、採用相同協議的方式來交換數據。

在元宇宙中,哪一種數據的交互對使用者來說最為重要?許多人認為是化身(avatar),因為它不只代表了身分,還乘載了個性、頭銜、甚至是地位等資訊。

遊戲當然是化身的愛用者,例如任天堂於 2006 年搭配遊戲主機 Wii 推出的 Mii 化身系統。在智慧手機普及之後,行動社交應用也迎來一波化身浪潮,其中較具代表性的有 2015 年推出的 Bitmoji(之後被 Snap Inc. 收購),以及 2018 年 Apple、Google、Samsung 等大廠為了行銷行動 AR 功能,紛紛推出可根據真人影像生產的虛擬角色。

Zepeto 也是 2018 年行動虛擬化身熱潮期間出現的一款熱門應用,由韓國網路巨擘 Naver 底下專門推出攝影與修圖應用的子公司 Snow 所推出。

Zepeto 熱潮很快就退燒了。雖然應用內建類似 IG 的功能,可以讓使用者在裡面經營另一個自我,但應用本身 bug 不少、遲遲沒有新功能、加上行動化身的討論度開始下滑,最後人們還是回到 IG 與 TikTok。

不過,Zepeto 並沒有就此消失,而是更加茁壯,在短短兩年多的時間中從一個化身產生器蛻變成了一個多元宇宙應用,並於近期表示要進一步成為元宇宙應用(雖然我認為是對資本市場喊話的募資語言)。

2019 年,Zepeto 推出虛擬世界功能,從此化身不只能用來拍照,還能在不同的世界中跑跳,並與其他化身一起交談、遊玩。2020 年,Zepeto 推出一系列的創作者工具,開放使用者上傳自製的衣著配件、以及自製的虛擬世界,也有了讓創作者可以從銷售虛擬物品中獲利的經濟系統。2021 年,Zepeto 更推出虛擬化身直播功能。

如今,Zepeto 可說是「IG/TikTok + Roblox + VTuber」的超級綜合體,並在全球創下 2.8 億名註冊使用者的佳績。值得一提的是,當中有超過八成使用者屬於 Z 世代,且有超過九成來自韓國以外的國家。

為了瞭解 Zepeto 是不是真的有人在用、還是只是靠一波波的行銷來打一波,我特地重新下載來體驗了一個禮拜。心得是:有夠不可思議。

最讓我震驚的,不是 Zepeto 更新功能的神速,而是上頭有固定更新影片、將近 20 萬追蹤(且有真實互動)的少女網紅!

可交互性的難題

Zepeto 是少數(如果不是唯一)從化身生產器出發,最後成為一款多元宇宙應用的經典案例。

與《Second Life》與《Roblox》等應用一樣,Zepeto 的化身系統也可在自己的多元宇宙中穿梭於不同世界;然而,Zepeto 的化身能「走出」自己的多元宇宙,被其他宇宙所使用嗎?

有人認為這難度很高,「因為是 3D 的」。確實,3D 化身在資料格式與使用上的複雜度遠超過一張圖片或一段影片;不過,就算只是 2D 化身也不容易。

2007 年問世的 Gravatar 的全名為 Globally Recognized Avatar(全球認證化身)。如果我們將網路中的各個服務視為一個個的虛擬世界、整個網際網路是個巨大的多元宇宙,那麼 Gravatar 的野心就是打造一個有極高可交互性的化身。

Gravatar 推出後不久,就被 WordPress 的母公司 Automattic 收購,也因此有了更廣的使用率。然而,根據 builtwith 的數據,目前全球只有 660 萬個網站有導入 Gravatar,占 builtwith 追蹤網站總數的 0.98%。

如果分母是全球網站總數,那麼我相信小數點後還會多加幾個零,更不用提當代網路世界處處是科技巨頭建立的封閉花園。

近年許多人對區塊鏈(blockchain)技術寄予厚望,認為該技術將更容易實現資料與資料之間的可交互性。我們可以簡單地將區塊鏈技術想像成新型態的資料庫(database)結構,當大量服務之間共用同一套資料庫結構、同時也支援該結構上的某些格式標準時,理論上能大幅提升可交互性。

不過,現實是世界上並不只有一種區塊鏈。目前全球至少有超過一百個仍在活動中的公鏈(public chain);雖然有越來越多的「跨鏈服務」在試圖解決可交互性上的問題,但離倡議者口中的「簡單」還有一段距離。

如果只是身份、歷程紀錄、圖片檔等還較好解決;當牽涉到 3D 模組,就會有許多挑戰需要克服。如果進一步牽涉到「可互動」的 3D 模組,問題就更多了。

以上談的仍只是「技術面」的問題,當牽涉到「設計面」的問題時,就更加與是否使用區塊鏈技術無關了。例如,一個化身具有「能力數值」,而該能力數值必須搭配原生虛擬世界的設計規則才能發揮作用,這就會大幅提昇化身的可交互性難度。

虛寶也面臨同樣的挑戰。技術上而言,虛寶確實是程式碼,但虛寶的功能以及價值得靠人為設計的「遊戲規則」來實現;因此,寶可夢卡牌(PTCG)在遊戲王的世界中無法使用、也沒有價值,因為兩邊的規則不盡相同。

雖然有上述的各種難題,區塊鏈技術身為一個全新的共識基礎、一個全新的世界運算網絡,確實替可交互性提供了新的可能。這種可能性被稱為「可組合性」,根基是區塊鏈應用的程式碼為公開透明,應用之間能夠更快速的相互參照、組合,進而提升彼此之間的可交互性。

一口氣解決可交互性難題的方法可能是「只要世界上只存在一個元宇宙就好了」。然而,先不論這個方法是否讓人欣賞,實務上來說幾乎是不可能的,因為如 Oculus 顧問技術長 John Carmack 所言:

世界上沒有人能夠一直做出正確的選擇。

沒有一個人、一間公司、一個語言、一種技術是完美的,在「允許自由競爭」(非常重要的前提)的情況下,所有不完美都會催生另一個新的或替代選項。人類文明一直都是在迭代過程中發展,我們或許得再與破碎的世界共處上一段時日。

NFT 為何與元宇宙扯上關係

可交互性的另一層描述、同時也是人們對元宇宙的核心想像,是跨越虛擬與現實的界線,讓這兩個世界彼此之間可交互作用。

我不打算談虛擬實境(VR),因為自 2014 年第二波浪潮以來,相關的討論(或失望)已經很多。我比較想談的,是 2021 下半年起極為火熱的 NFT。

越來越多人認為 NFT 就是元宇宙的基礎,因為它具有以下三個特性。

  • NFT 是基於區塊鏈技術的產物,因此同樣具有理論上的不可竄改性

  • NFT 是非同質化的資料,每一個都是獨特的存在,因此可用來創造稀缺

  • 由於不可竄改且又獨特,持有私鑰的使用者彷彿「擁有」了 NFT

為什麼這三個特性會讓 NFT 被視為是元宇宙的基礎?主流的說法是「NFT 讓使用者可以跨世界、跨宇宙地使用數位資產」,而這點已在上一節詳加討論過,實際問題比想像中要複雜許多。

我認為 NFT 之所以被視為是元宇宙的基礎,更深層的原因來自持有者可透過 NFT 來跨越虛擬與現實之間的某條界線:經濟。

NFT 的特性,讓人們第一次對數位資料產生了「物」的觀念,進而開始將各種真實世界中的經濟活動帶入 NFT。從這個角度來說,就不難理解為什麼有人認為 NFT 項目就是元宇宙;因為 NFT 確實在心理上滿足了一部分「元宇宙 = 虛實不分」的想像。

縱使 NFT 並沒有跟真實世界之間產生實質的交互作用,但「賺到錢」這件事是一樣的。

如果上面的文字看起來太玄,那麼《Decentraland》會是一個很好的案例。

2015 年《Decentraland》計畫問世,一開始只是一張 2D 點陣圖,每一個像素格子都是一個開放讓使用者競標的 NFT。雖然聽起來很瘋狂,但當時參與競標的很多人其說法是「這些『地產』是有限的」。

2016 年起,《Decentraland》開始往 3D 世界邁進,如今可以買的 NFT 已不只限於地產,還包括當中穿的、用的,與玩的東西。

賦予 NFT 如此爆發力的不只是它具有「物」的特質,還有加密貨幣經濟。如果沒有已成形的加密貨幣經濟體系,NFT 的「價值」將更難實現,各種交易、投資、炒作行為也會冷卻許多。

不少人說:「賣遊戲幣又不是什麼新鮮事,現代人太年輕、沒經歷過二十年前的《天堂》盛況」。

然而,兩個時代之間最大的差別在於天幣(《天堂》內的虛擬貨幣)與法幣中間並不存在一個廣被接受、具有高度流通性、而且市值高達數千億(ETH)甚至上兆(BTC)美元的數位貨幣系統。

對樂觀主義者而言,一旦真實世界中有更多支付場景採納 ETH 與 BTC 等加密貨幣,圍繞在 NFT 之上的經濟活動自然就更加虛實不分。更激進一點的想法是一旦區塊鏈成為人類記錄所有資訊的標準,則虛實之間的疆界就更加不存在了。

數位雙生世界

雖然區塊鏈技術以及衍生的 NFT 推進了許多「概念」上的虛實不分,但更多人談到元宇宙時的直覺想像是「感知」上的虛實不分。

2014 年爆發的第二波 VR 浪潮推進人們重新探索感知上虛實不分的可能性。一開始只是戴上頭盔、進入到有立體視覺的虛擬世界,緊接著開始戴上觸覺乃至嗅覺感測器來模擬更多感知體驗,近幾年則是越來越多強調可自由移動、甚至多人互動的體驗。

近期讓我「看」過(因為疫情的關係無緣體驗)印象較深刻的 VR 作品之一,是《歡迎光臨巴黎舞夜》(Le Bal de Paris de Blanca Li)。VR 產品的溝通難處在於其體驗很難言傳,但透過下面這支影片可以較好理解。

《歡迎光臨巴黎舞夜》 是一個多人互動作品,十位參加者戴上 VR 頭戴顯示器後將先被傳送到一個更衣室,並在裡頭選好代表自己身分的動物面具。之後,十位參加者將在兩名專業舞者的引導下,一起穿著 Chanel 設計的華服,在大舞池中共舞華爾滋、探索花園迷宮、一起跳吉普賽爵士舞,最後以欣賞紅磨坊歌舞秀收尾。

VR 是讓人產生感知上的虛實不分的最有效途徑,但目前的限制也很明顯。這些障礙很多時候跟「暈眩」或是「畫質還不夠好」無關,而是一些消費性市場更關心的實際問題:例如頭戴裝置的舒適度仍欠佳,以及為求體驗逼真而追加的感測器將大幅抬高裝置售價等。

另一個人們常想像的虛實不分是 AR。然而,相較於 VR 已經在處理貼近消費性市場的實際問題,AR 還有相當多的基礎課題需要克服。在眾多基礎課題當中(投影、電池、AI、通訊、演算…太多了),有一件事情特別吸引我的注意:數位雙生世界(digital twin)。

數位雙生是 2000 年早期開始在製造產業中出現的概念,指的是先在數位環境中設計與模擬,再實際把東西生產出來。採用數位雙生的好處自然是可大幅降低製造成本。如今,數位雙生的概念也不只僅限於製造業,在營建業甚至都市計畫等領域中都開始廣被使用。

為什麼不牽涉到實物製造的 AR 也與數位雙生有關呢?因為要提供更為逼真的 AR 體驗。

如果人們對 AR 的渴望不僅限於把一個虛擬化身「重疊」在照片上,而希望它/他/她出現的大小位置正確、與真實世界的物體有逼真碰撞反應、能找到椅子坐下跟你聊天、甚至留下不可抹滅的痕跡,那麼這樣的 AR 系統需要跟人一樣有「感知世界」的能力,其所感知的對象就是真實世界的數位雙生。

Niantic 是第一個在數位雙生這件事情上吸引我注意的 AR 公司。絕大多數人對 Niantic 的印象是《Pokémon GO》,更資深一點的玩家應該會講到《Ingress》。不過,他們的願景是搭建一個 AR 應用平台:「Niantic 真實世界平台」(Niantic Real World Platform)。

整個平台要完成的事情很多,但當中有一項任務是近兩年來 Niantic 最常公開提及的:繪製現實(mapping reality)。繪製現實並不是新鮮事,自古以來人類就用各種方式在捕捉世界,包括現代人已經離不開的 Google Map。

Niantic 一開始的繪製現實手法與 Google Map 如出一轍(畢竟前身是 Google 內部的創業公司),例如圖資以外的景點資訊是透過一個類似 Google Map 在地嚮導的機制,讓使用者上傳圖文並評分。

2020 年起,Niantic 開始不滿足於圖文資訊,陸續在《Ingress》及《 Pokémon GO 》這兩款人氣遊戲中推出景點掃描任務,利誘使用者主動上傳景點資訊的環繞影片。

使用者在遊戲任務的驅動下所上傳的影像,最後都成了 Niantic 建構數位雙生世界的養分。為了達到此一目的,Niantic 也陸續收購了 6D.ai、Scaniverse 等電腦視覺技術新創,並將其技術逐步融入自家的開發者平台 Lightship 當中。

Lightship 目前主打上圖中的三項功能,其中網面建模(meshing)就是前述技術的成果之一,可讓虛擬物件與影像中的真實物件之間有擬真的互動。例如,拋出去的水球會在碰到桌面時破裂,並留下逼真的水漬。

另一個 Niantic 正在研發中的重要功能是「虛擬定位系統」(virtual positioning system)。透過該系統,我們才能夠讓某個虛擬馬克杯(或是寶可夢)固定出現在 A 棟六樓 306 房內的某張桌子上。而該系統的建立也有賴我們建立出一個真實世界的數位雙生。

另一家同樣正在投入資源建構數位雙生世界的企業是公司剛改名為 Meta 的 Facebook。在去年的 Connect 2020 大會上,首次公開了數位雙生計畫:Live Map。Live Map 分成三個層級:

  • 位置層:記錄地理資訊

  • 索引層:記錄物體資訊,包括靜態(例如建築)與動態(例如房間內的桌椅)物體

  • 內容層:使用者在前兩層基礎上所創建的內容與活動歷史

建構索引層的最大挑戰是沒有資料,尤其是缺乏「第一人稱視角」資料。相較於 Niantic 利用手機遊戲中的任務來引誘玩家提供資料,Facebook 更專注在透過「眼鏡」這個穿戴裝置來蒐集資料。

Facebook 先是在 2020 年推出「Project Aria」智慧眼鏡研究計畫,緊接著在 2021 年與時尚眼鏡品牌雷朋(Ray-Ban)合作推出了內建攝影與拍照功能的智慧太陽眼鏡:Ray-Ban Stories。

不過,縱使 Meta 已經投注 VR 與 AR 領域多年,首席科學家 Michael Abrash 還是非常誠實地說:

距離實現我們的願景,還有很長一段路。

結語與展望:務實的樂觀

終於,文章到了結尾。很遺憾,雖然這系列文章叫《Metaverse 漫遊指南》,但我們或許都還沒看到它的存在,而只能透過 Mark Zuckerberg 與他的絢麗 CG 影片小夥伴來放任想像力馳騁。

不過,我也不認同用「舊瓶裝新酒」、「就是出來炒股騙錢」等話語來輕易否定自《Second Life》以來所發生的一切科技與商業上的創新。在元宇宙想像的核心概念「可交互性」上,包括區塊鏈、VR、以及 AR 在內,我們確實看到了些進展。

其中,我對數位雙生特別感到興奮與期待,因為那將是一場全新的賽局,需要全新的資料與建構方式,開拓出來的應用可能性將數倍於當今的網路空間。同時,數位雙生與區塊鏈技術之間能產生什麼火花,也是令人感到興奮。

然而,如同 Oculus 顧問技術長 John Carmack 在今年的演說中不斷提及的一個觀念:很多事情在高概念層次(high concept)說得通,但一旦要實際捲起袖子幹事時,才知道限制一大堆。

如何用高概念層次來保持自己的熱情與想像力(但不盲目鼓吹)、同時不失去對實事的關注(但不消極否定),我經常覺得這是在變動越來越快速的世界中,沒有人有把握做得好,只能持續練習的事。

至於我會怎麼期待(而非預知)接下來兩、三年的元宇宙發展呢?我認為變化或許不會太大,大多屬於現況的延伸:

  • AR 眼鏡比大部分人所想像的要困難很多,手機上的 AR 體驗仍然會是發展焦點

  • VR 仍是人們體驗感知上虛實不分的主要媒介,但裝置穿戴性將更佳、讓人更樂意使用

  • 基於區塊鏈技術的「邊玩邊賺」(play to earn)遊戲類型會越來越精緻並自成一類

  • 更多企業開始投入開發自己的多元宇宙,並在當中導入區塊鏈技術與 NFT(但不一定都會採去中心化的方式運作)

最後,許多人對元宇宙的想像來自科幻小說與電影,在這些文本當中,元宇宙通常是反烏托邦(dystopian)的。我認為那些文本之所以會這樣描述元宇宙,很大程度上是為了替敘事設計衝突點。

我不認為元宇宙是反烏托邦的,因為歸根究柢,元宇宙的各種相關技術都是在提升「人」的行為能力、並擴大人與人之間的「連結」,而這正是過去三十年來數位與網路科技對世界帶來的最大影響,其結果就是大幅增加了全人類的生產力。

我相信進入元宇宙的全人類將迎來新一波的生產力高峰,到時我們應該也不會只是透過這樣一篇文章交流了。See you then.


本文摘自作者的《曼報》,歡迎讀者也前往訂閱

A guest post by
長年關注娛樂及生活產業的創新商業模式,對未來的世界充滿好奇。過去曾擔任過產業研究員及新創加速器的主要推動者,2020年起開始每日分享與分析全球創新動態,內容收錄於免費電子報《曼報》( https://bit.ly/mannyli )。