□文│徐奇智 劉雪琛 周榮庭
增強現實技術(Augmented Reality,簡稱AR)是指借助計算機圖形技術、可視化技術等技術將虛擬信息疊加集成在真實世界,使得真實世界和虛擬信息同時存在,從而達到超越現實的感官體驗的一種技術。[1]這種技術的目標是在電子屏幕上(或目鏡上),把虛擬世界加入現實世界影像上并進行互動。其基礎技術包括跟蹤定位技術、用戶交互技術、虛擬融合技術和系統顯示技術。
一般認為,波音公司的湯姆·考戴爾(Tom Caudell)在 1990年創造的“Augmented Reality”這個術語是首次提出增強現實的概念。考戴爾將之用于描述一種在現實世界影像之上疊加計算機虛擬圖像的技術。[2]AR技術隨著移動平臺的興起快速發展,逐漸應用到眾多的數字內容中,形成了增強現實出版物。趙丹在2016年認為:“增強現實出版物 (Augmented Reality Publication, 簡稱 ARP),是在傳統紙質出版物的基礎上,利用增強現實技術中的三維注冊和攝像頭的圖像識別等技術識別標識或圖形,在屏幕上顯示出虛擬的三維物體和場景,實現虛實結合、實時交互的立體出版物。”[3]這一定義的缺陷在于把增強現實出版物限制為傳統印刷出版物的補充數字內容,雖然目前國內主要的AR出版機構還是傳統的出版社,但游戲、廣告、電視、報紙、玩具、教育甚至新媒體等行業的企業也開始越來越多地介入AR內容出版中。
除了內容創意,這些AR出版機構面臨的最大挑戰還在于技術解決方案的選擇。大部分AR技術解決方案都掌握在信息技術供應商手中,出版機構只能將AR技術開發外包給IT供應商,限制了內容創意的發揮。對于AR技術缺乏了解,已經成為眾多出版社在出版AR內容時的最大困擾,盡管很多出版機構并未意識到這一點。
在國內文獻檢索中,凡是涉及AR出版的論文,總體上對AR技術缺乏深入的了解,甚至給研究帶來了諸多的限制與約束。而在計算機科學領域,涉及AR技術的內容,大多集中于3D技術、計算機視覺、識別與定位算法等底層領域,對AR出版者幫助甚少。在對一些技術社區的調查中,有一些AR技術社區總結了一些技術解決方案的優劣或特點,但是,我們未發現任何針對AR出版各環節提供的技術方案比較,也沒有如何根據出版物需求和內容創意進行AR技術解決方案選擇的指南。
本文嘗試從出版機構的角度,根據其掌握的受眾、創意、內容等信息,提供一份技術解決方案選擇的指南。
在選擇技術解決方案時,需要綜合考慮各種因素,包括內容形式、受眾、發行渠道、使用環境等維度,從而選擇最適合的技術解決方案。
AR圖書是目前最常見的AR出版物,而且一般提起AR出版物都是指以實體印刷品為載體的AR應用。AR技術的作用主要是用作數字內容和印刷品之間橋梁,方便用戶通過印刷品獲得數字內容。但在實際應用中,很多AR出版物雖然使用了AR技術,其使用方法完全可以被成本更低的二維碼解決方案取代。
AR游戲是以《精靈寶可夢GO》為代表的一種新的電子游戲形態。玩家可以在現實世界中與一些虛擬形象進行互動,從而完成任務以獲得游戲體驗。與傳統電子游戲的區別就在于,這類AR游戲要求玩家在現實世界的空間中完成游戲過程。
除了AR圖書與AR游戲,還有一些AR應用是屬于工具類、資料類或教育類的應用,比如AR翻譯、AR動植物識別、AR導覽等。
目前AR出版物的主要受眾是少年兒童,但幼兒與中小學生的應用還有一些區別。從操作能力來看,幼兒在把持移動設備或穿戴設備的能力上不足,而一般中小學生可以較為熟練地使用各種設備。從內容定位上,幼兒內容強調寓教于樂,娛樂性更強;中小學生的應用要么是單純的游戲,要么是單純的學習,娛樂與學習的融合較少。
在文獻調查的過程中發現,職業教育與專業培訓領域是被忽視的領域。AR有很大一部分應用領域是在具體技能培訓中,比如修理汽車發動機、維修機柜排線等。此外,也有一些特定領域的AR出版物是為普通大眾設計的,其中AR游戲是數量最多的,而AR廣告、展覽場館的AR展品等常有出彩的表現,具有一定的吸睛效果。
傳統發行渠道即是指AR出版物中的印刷品通過傳統圖書發行渠道發行,而其配套的AR數字內容通過圖書上提供的鏈接或二維碼進行下載。目前也有部分產品先發行數字內容再通過數字內容發行平臺購買配套圖書,可以通過AR技術將圖書和數字內容連接起來。
應用發行渠道通常是指包括蘋果的應用商城、安卓的各種應用市場、STEAM(全球最大游戲發行平臺,也是全球較大的綜合性數字發行平臺)等發行渠道。
教育/B2B渠道指教育行業中AR出版物由機構采購后分發給用戶的模式,通常是AR出版機構面對學校和各類校外培訓機構的商業模式。這是AR內容進入學校和各類展館的主要渠道。
嚴格地說,社交網絡并不是一個獨立的發行渠道,更多時候是作為發行渠道配套的宣傳推廣平臺使用。一般用戶通過社交網絡得到某個AR應用的信息,還需要轉到傳統發行渠道購買圖書,或進入對應的應用發行渠道下載AR內容。但是,隨著各大社交網絡功能的逐漸強大,社交網絡開放平臺能夠支持越來越多的應用形態,而且HTML5(超文本標記語言的第五次重大修改)技術能夠支持更復雜的3D交互和硬件調用,有一些AR內容已經開始試驗性地在社交網絡上發行和直接使用,例如一些AR廣告應用。
移動環境是指在移動設備上使用AR內容的環境,也是目前AR內容的主要環境。因為移動設備集成有AR應用必須的攝像頭,以及可以極大地擴展AR應用形態的各種傳感器,所以目前的AR出版物主要都將移動環境作為主要環境。在未來應當特別關注的是,除了智能手機和平板電腦,類似微軟的Hololens(微軟2015年發布的頭戴式顯示設備,支持融合現實技術)、谷歌的Google Glass(谷歌2012年發布的“增強現實”眼鏡)的穿戴式設備將有可能成為移動環境中使用的另一大類設備。
固定環境是AR應用的另外一個場景,通常是指在某個固定場地中使用不可移動的設備完成AR應用,比較流行的有基于微軟Kinect的一些AR解決方案。另外配備有內置或外接攝像頭的桌面電腦也可以當作AR的使用環境。在展覽場館的AR應用中,還可以看到一些比較大型的定制AR設備,主要由顯示設備、主機再加上視頻采集設備構成。
AR出版物的技術解決方案無非是“云”與“端”兩個部分及兩者之間的通信方案構成(參見圖1)。“云”主要是指在服務器端為AR出版物提供支持的各種服務,“端”是指用戶消費AR內容時所使用的硬件設備和軟件,而“云”與“端”之間的通信主要是指兩者之間完成APP(Application的縮寫,目前特指智能移動設備上以桌面圖標為入口的應用軟件)下載、內容下載以及其他數據傳輸所需的通信過程。

圖1 一般AR出版物技術解決方案組成結構簡圖
通常“云”要解決的問題主要是APP下載、內容下載和用戶管理的問題,因此一般會在云提供管理信息系統(Management Information System, MIS系統)和云存儲。這部分不存在太多難以選擇的解決方案,而且各種方案相對成熟。
但是在用戶訪談中發現,絕大部分AR出版機構在使用公有云服務還是自建私有云服務的選擇上還是存在誤區。出版機構一般認為,自建私有云服務安全性更高、更可控,并因此傾向于自建私有云而非選擇阿里云或騰訊云這樣的公有云服務。筆者團隊對各種云服務解決方案進行了比較(參見表1),在出版機構可承受的成本范圍內,公有云服務從安全性、可靠性、訪問速度、可擴展性等方面全面優于一般的私有云服務。此外,國內的阿里云和騰訊云還為開發者提供很多基礎云服務或接入第三方云服務,如流媒體服務、文件存儲服務、數據采集服務等,極大地降低了開發者的風險和成本。
在AR出版物的技術解決方案中,因為用戶幾乎完全是通過“端”來消費AR內容,因此“端”是最復雜的部分。通過圖1可以看出,“端”主要由硬件平臺、操作系統、AR SDK和AR應用4個部分組成。
硬件平臺的解決方案分為移動終端、桌面終端、游戲主機、穿戴式設備和其他定制終端等5個類別(參見表2)。移動終端主要是指各類智能手機和平板電腦;桌面終端包括臺式計算機和筆記本電腦;游戲主機主要是PS4(索尼公司的游戲主機 Play Station 4)、Xbox(微軟的游戲主機)等主機;目前支持AR應用的穿戴式設備主要是微軟 Hololens、谷歌 Glass、索尼 SmartEyeGlass(索尼公司2014年發布的智能眼鏡原型)等;定制終端主要是在各展覽場館、商業中心用于展示的AR設備。

表1 公有云與私有云比較

表2 硬件平臺比較
操作系統主要分為桌面操作系統和移動操作系統兩種。桌面操作系統中,Windows占據絕對多數用戶,Mac和各版本Linux也有一些用戶。移動操作系統中iOS(蘋果公司的移動終端操作系統)和Android兩分天下,Windows Phone(微軟公司的移動終端操作系統)已逐漸消亡。游戲主機中的操作系統一般是游戲主機廠商深度定制的封閉操作系統,比如PS4采用的是FreeBSD 9.0(一種類Unix操作系統)的定制版,XBox One采用了Windows 8的精簡版。穿戴式設備的體積較小,一般采用移動操作系統,而定制終端一般體積龐大,采用桌面操作系統的居多。
AR SDK是AR應用的核心,AR的各項功能和特性都依賴于AR SDK的支撐。目前國內大多數AR應用都是采用國外的AR SDK,而國內的AR SDK大部分都基于開源SDK進行改進。通常出版機構在選擇技術供應商時,所遇到的聲稱擁有自主知識產權AR引擎的供應商,大多也還是在國外的AR SDK上加以定制和二次封裝,進而提供一些快速編輯與發布的功能。
因為AR SDK繁多,幾乎很少有研發機構能夠接觸到所有主流SDK。因此在國外Social Compare的網站上,通過社交媒體集合眾多網友的經驗,對目前市面能見到的主流SDK進行了綜合的評估并制作了一張表格。該表格隨時根據各SDK的發布情況進行更新,雖然依然比最新的信息略有滯后,但已經是目前最新、最全面的AR SDK綜合比較了。現在將SDK技術特性的部分關鍵信息整理成表3。

表3 主流AR SDK比較
AR應用一般是在SDK基礎上開發的具有人機界面的應用程序。目前主流AR應用包括移動APP、桌面軟件、Web應用。如果按照功能類型劃分,AR應用則可以劃分為專有應用和通用應用。專有應用一般是針對本AR出版物發布的應用,如科普繪本《消失的世界》使用的“消失的世界”APP、配套教育卡片使用的“AR口袋動物園”APP。通用應用則指那些可以發行、下載、使用多套AR內容的平臺,如中國科技大學新媒體研究院的“科學薈”APP。
在AR出版物應用中,主要功能都依賴于客戶端,服務端僅為客戶端提供必要的下載和數據支持,一般包括應用下載、內容下載、用戶數據采集等部分。其中內容下載部分的解決方案一般可分為:與應用打包下載、使用前下載到本地、使用中實時下載。
杰西·加瑞特在2010年為網站設計提出了一個用戶體驗要素五層次模型。[4]該模型根據設計目標“基于任務”還是“基于信息”,將網站分為“軟件界面”與“超文本系統” 兩類,并按照“抽象-具體”程度和從概念到完成的順序,將整個網站的用戶體驗設計過程進行了層次劃分,分別提出不同類網站在各個環節應當進行的工作。按照從概念到完成的順序,用戶體驗要素共分為“戰略層”“范圍層”“結構層”“框架層”和“表現層”。
如果將此模型應用于AR出版物,在戰略層和范圍層中,AR出版機構應當已經確定了本文第一部分所述需求分析中的所有維度,即用戶體驗要素中戰略層的產品目標和用戶需求、范圍層中的功能規格。在結構層中,應當完成技術解決方案的選擇工作。筆者為需求維度和技術解決方案之間建立了一種映射關系,并以此形成了4張表格,期望能夠成為AR出版機構技術解決方案選擇的指南。
內容形式維度對于技術解決方案的決策影響參見表4。其中,AR游戲的形式非常多樣,可以基于各種硬件平臺產生完全不同的體驗,大部分時候游戲創意都是基于硬件平臺產生的。

表4 內容形式對AR技術解決方案的影響
受眾維度會從硬件形態上影響用戶體驗,因此硬件解決方案的選擇成為基礎(參見表5)。例如針對幼兒或兒童的應用,硬件平臺首選移動終端,因為移動終端的普及率最高,方便內容到達最終用戶。但是,僅僅是智能手機或平板電腦還不能完全滿足幼兒的使用特點。以針對幼兒的AR繪本為例,幼兒會在翻書和拿手機掃描兩個動作中來回切換,從而導致注意力分散降低使用興趣。在焦點小組觀察中,大部分幼兒會在短時間內要么專注于圖書,要么專注于手機,要么注意力轉移,很難做好兩者的結合使用。在這一點上比較成功的是OSMO套件(參見圖2)。這組套件通過一個支撐架將平板電腦支撐起來,再用反射鏡將桌子表面的畫面反射到前置攝像頭中,完全讓幼兒擺脫用手操作平板電腦的負擔,可以集中注意力在桌面的其他組件和平板電腦顯示器的畫面反饋中。而在職業教育和技能培訓中,因為可以承擔相對較大的成本,且對交互要求更高,因此定制設備和穿戴式設備成為首選,例如直升機駕駛培訓、通訊線路檢修培訓等。

表5 受眾類型對AR技術解決方案的影響

圖2 OSMO Genius Kit
發行渠道與內容形式有強關聯,因此選擇內容形式后,發行渠道也已經基本確定。如AR圖書會通過傳統發行渠道,AR游戲會通過應用發行渠道,其他AR應用可以通過應用發行渠道、教育/B2B渠道和社交媒體。發行渠道對技術方案選擇的影響參見表6。

表6 發行渠道對技術解決方案的影響
使用環境對于技術方案選擇的影響很大,在移動環境和固定環境下,幾乎所有的技術環節都會選擇完全不同的解決方案(參見表7)。

表7 使用環境對技術解決方案的影響
本文將需求從受眾、內容形式、發行渠道、使用環境4個維度進行解讀,把技術解決方案分為了6個部分并提供了可行的選擇項,旨在提供一套指南,能夠根據需求解讀抽取技術選項并組合成為合適的技術解決方案。這份指南可能的缺陷在于很難跟上技術發展的腳步,也許在其面世之時便已經存在過時之處。但其價值在于,我們將在未來形成一份相對易維護、易更新的電子指南放于互聯網上供所有AR出版機構參考。