梁家輝,柯曉曉,汪亞珉
(首都師范大學 心理學院,北京市“學習與認知”重點實驗室,北京 100048)
虛擬現實是(Virtual Reality,VR)是一項在一定范圍內生成擬真數字化環境的計算機技術[1]。與傳統的實驗室模擬情境相比,虛擬現實實驗情境具有在視聽覺刺激情境的模擬上更加真實、更易重復、抽樣代表性更強等優勢[2],還可以避免極端環境下的實驗倫理及大型儀器的昂貴費用等問題[3]。隨著虛擬現實技術的成熟,虛擬現實環境已廣泛應用于心理學及相關學科研究,如何增強虛擬現實環境中參與者的臨場感等主觀體驗是各項研究中需要密切關注的問題。VR應用程序是專門為了產生高度臨場感的體驗而創建的[4],臨場感是評價虛擬現實環境質量的客觀指標,也是虛擬現實實驗情境任務效果的重要影響因素。已有研究表明,涉及知識在虛擬經驗與現實經驗之間轉移的情境(如虛擬現實訓練系統)需要高臨場感[5]。更高的臨場感能夠減少信息混亂、提高交互任務的性能,并且對于空間理解具有積極意義[6]。因此在使用虛擬現實環境進行實驗研究時,需要對臨場感進行方便有效的測量,以評估場景的質量。
目前,IPQ量表(IGroup Presence Questionnaire)是唯一公開發布并被普遍使用的臨場感評估工具[7-8]。Schubert[9]最初收集多名此領域研究學者制定的問卷,挑選75個項目翻譯為德語對3D游戲玩家和桌面式虛擬現實用戶進行施測,根據探索性因素分析結果產生8個維度。為更加明晰研究重點,剔除部分題目后再次施測,并進行驗證性因素分析,最終確定的IPQ問卷具有3維度,分別為:空間臨場感(SP)、參與感(INV)和真實感(REAL)以及1個一般因素(G),共14個項目,其中第2、11以及13題為反向計分。同時,從因素分析角度得出的這三個主要維度也與符合相應的理論假設。Schubert等人在總結虛擬現實體驗的相關理論后提出,虛擬現實體驗的核心為虛擬現實心理模型(Mental Models)的認知建構,而心理模型的認知構建可以分為空間感的建構以及對沖突信息的抑制(Suppression)兩個過程。空間感的建構又可以進一步分解為空間感知與互動感知兩方面。總體來看,IPQ問卷中的空間臨場感(SP)維度主要測量的是虛擬現實場景引起的空間感知程度,體現為“我的身體正置身于眼前所見到的虛擬空間當中”。參與感維度(INV)則評估的是互動感知程度,即用戶的注意確實分配到了虛擬場景中設計的事件當中,而不僅僅是從外部觀察這個世界。問卷的真實感(REAL)維度本質上就對應于沖突信息的抑制,即衡量一個人造場景是否已經較好地避免了那些不符合真實世界規律的“穿幫”現象。
從已有的知覺理論上看,空間臨場感維度是更為基本的感知層面的判斷,就如Gibson的直接知覺理論所假設的[10]那些人造的光流設計引起了真實的空間知覺。參與感是比空間感更進一步的空間存在感建構,這符合空間認知中的知動環(Perception Action Cycle)理論假設[11],即個體與虛擬場景中的對象進行交互時,這種交互會自動啟動知動環加工從而調整人的空間感知系統以獲得更為“真實”的空間感。無論是空間感知還是互動感知,在建構層面上這種感知顯然都會分為兩方面:一方面是有多少空間的與互動的感覺被引發建構起來了,另一方面是還有多少空間的與互動的感覺沒有被建構出來,是失真的。
從問卷的制定角度看,雖然IPQ問卷的結構維度與理論假定相一致,但問卷涉及的主要概念——臨場感(Sense of Presence)在交叉學科的角度總容易引起誤解。在虛擬現實技術領域,沉浸感是一個廣泛使用的類似概念, Burdea[12]很早就提出后來被普遍接受的虛擬現實“3I特征”,即“Immersion-Interaction-Imagination”(沉浸-交互-構想)。那么就用戶體驗而言,臨場感與沉浸感到底有什么樣的區別?Slater和Wilbur等學者認為,沉浸感是產品本身具有的技術屬性,是一種由分辨率、刷新率等一系列參數決定的客觀屬性;臨場感才是用戶在使用虛擬現實場景時所產生的主觀體驗,是一種“存在”于場景之中的感覺。可見,臨場感是心理體驗,沉浸感是技術術語。與之不同的是,以Witmer和Singer為代表的學者們則提出沉浸感與參與感都是臨場感的組成要素,沉浸感強調用戶產生的“存在”于場景之中的感覺而參與感則強調了將注意集中于某件事情之上而產生的感覺[13]。相比而言,Witmer和Singer所說的沉浸感與Slater和Wilbur等人的空間臨場感在內涵上一致。基于用戶體驗是一種心理體驗這一本質特征,Schubert綜合兩種觀點,確認臨場感是一個更廣泛的概念,它包含空間臨場感和參與感。使用空間臨場感而不是沉浸感,有助于將問卷與相關的知覺理論結合起來,使問卷具有了更好的結構效度而不是技術顯示度。鑒于此,中文版問卷仍然使用空間臨場感而不是沉浸感這一概念。
在國外的相關研究中,IPQ量表已廣泛應用于虛擬現實環境的體驗評價并在此過程中不斷得到檢驗[14-15]。在國內,也已經有學者對于IPQ量表進行了中文化修訂,初步驗證了IPQ量表的可靠性[16],但該研究中使用的虛擬現實場景均為當下較受歡迎的商業游戲場景,場景的類型過于單一,場景的體驗感也缺乏代表性。虛擬現實場景并不都是游戲場景,很多是專業的場景,如仿真情境、景點、場所等。商業游戲的用戶體驗通常強調可玩性,這與眾多場景的用戶體驗有相當大的不同。此外,作為一份專門用于評估虛擬現實場景用戶體驗的問卷,其根本價值不在于顯示某一虛擬現實場景是否足夠好,而更在于它能否幫助我們確定好與不好的邊界在哪里。為此,本研究在對問卷進行中文版修訂時特別選取了商業游戲、教育游戲、教育課堂、簡單放松體驗場景、應激體驗場景以及心理學情境實驗等場景。這些場景不僅在類型上不同,在存在感的體驗上也有著較大的差異。通過對近600多人的綜合性樣本測試,本研究得以從項目鑒別力、維度結構及信效度幾方面修訂中文版本問卷。
從2016年-2019年,分別在北京、衡水和涿州的學生中通過方便抽樣進行了9個批次的數據收集。共發放660份問卷,剔除部分漏填或錯填問卷,最終回收有效問卷633份,有效率95.9%。其中有430名學生報告了年齡,年齡的平均數為19(s=4)歲。有效被試中男生292人,占46.1%;女生329人,占52.0%;12人未報告性別,占1.9%。有效被試中北京市大學生339人,衡水市初中生40人,涿州市高中生254人。
本研究使用的IPQ量表中文版,首先由2名心理學專業研究生分別對原量表項目獨立進行中譯,經過1名心理學教授和1名心理學研究生對比分析兩份獨立的譯稿,對存在歧義或不符合中文表達習慣的語句進行調整,擬定問卷的初始版本。再分別讓1名心理學專業和1名英語專業的研究生將其回譯為英文,確保與英文原意無差異后,確定最后的翻譯版本(見表1)。

表1 場景簡介
研究設備使用HTC公司生產的VIVE 沉浸式虛擬現實頭盔(分辨率2 880*1 600,刷新率:75 Hz)和戴爾的筆記本工作站(CPU:Intel i7-6 820 hk;內存:16G)。使用Unity引擎對VR場景進行編輯,3ds max對于場景中使用到的部分模型進行調整,最后使用STEAM VR將VR場景輸入頭盔。
為確保測試場景具有廣泛的代表性,本研究選取了仿真課堂、游戲課堂、孔德公園、應激實驗、仿真叢林、認知風格測試、成語測試、焦慮誘發、深海之藍(The Blue)、極速飛鷹、沙漠過山車(Desert Ride)、472號杰克森12個虛擬場景,分為九個實驗批次進行測驗。這些場景的實驗批次、類型、內容及與現實場景的差異程度見表1。此外,為檢驗IPQ量表的區分度,所選取各場景的臨場感體驗跨度也較大,這一選取標準希望通過不同批次測驗的量表分數差異得到檢驗。
指導被試在熟悉使用VIVE頭盔以及Xbox的手柄后,進入VR場景完成指定的任務。任務結束后,指導被試根據自身體驗填寫IPQ量表,方式包括網上填寫、紙質問卷填寫和電子版問卷填寫。
使用SPSS 20.0計算IPQ量表中所有項目得分情況,結果如表2所示。其中空間臨場感(SP)維度下,各項目的平均分都在1分左右,表明各場景都能讓被試體驗到置身于其中的感覺。而參與感(INV)維度以及真實感(REAL)維度中部分項目分數低于0分,表明至少存在部分場景的參與感和真實度體驗不佳。

表2 各項目維度均分
進一步分批次對各場景維度均分及總分進行分析。結果顯示,場景5、6、7、8的多個維度均分以及總分得分均低于總體平均分(見表3),表明這部分場景未能給被試帶來良好的體驗。據此可將這4個場景劃分為低分場景組,剩余場景劃分成為高分場景組。

表3 各個批次場景維度均分
場景分類后,對不同場景分組的同一項目進行獨立樣本t檢驗。結果表明(見表4),,除項目4(sp3)(t(631)=0.79,P=0.43,d=0.06)以外,其余項目t檢驗分數差異具有統計學意義(一般因素G結果為(t(631)=4.81,P<0.001,d=0.38)),證明高分場景與低分場景的臨場感之間存在顯著差異。同時也反映出IPQ量表項目具有良好的鑒別力,能夠較好地分別出場景優劣。

表4 高低分場景組各項目獨立樣本t檢驗及效應量(d)
將各個項目分數與總分進行相關分析,結果顯示一般因素G與總分相關為0.61,其他各個維度項目與總分相關相關系數范圍為0.36~0.74(見表5),均具有中等程度的相關,說明此量表各項目能夠較好地反映所測量的內容。

表5 項目總分相關表(r)
根據獨立樣本t檢驗結果,低分場景組的項目均分顯著低于高分場景,反映出其在設計制作中可能存在缺陷,導致被試體驗不佳。考慮到此類不合格場景難以為其他場景中的用戶體驗提供有效參考,只選取高分場景進行探索性因素分析,以檢驗IPQ量表的結構效度。通過統計分析處理,樣本數據KMO值為0.84,Bartlett球形檢驗顯著性<0.01,說明數據適合進行探索性因素分析。根據特征>1的標準提取取出3個因子,方差解釋率為51.10%。經斜交旋轉后,量表維持了原有的3因子結構,按照最大因素載荷進行排序,結果如表6所示,大部分項目符合原問卷中的維度,表明IPQ中文版量表總體結構效度良好。但部分項目歸屬于不同于原來的維度下,需要進一步討論。
探索性因素分析的結果表明:(1)成分1與原量表REAL維度重合較高。如果將其直接翻譯成為真實感,在中文語境中使用易產生歧義。例如“我感覺這個場景很真實”,既可能表達了用戶認為場景設計得很好,在場景內活動和現實中一樣;也可能表達場景中的物體紋理等方面制作精良,可以輕松地以假亂真。因此建議翻譯為逼真感來避免翻譯產生歧義。(2)成分2與原量表INV維度高度重合,表現為被試全身心的投入到了虛擬現實場景中,將注意更多的分配到了虛擬現實場景中,抑制了來自現實中的各種信息接收,可以將其命名為參與感。(3)成分3基本保留了SP維度的項目,主要表現為被試感覺自己真實的存在于構建的虛擬現實場景中,而不是在現實的物理空間中。結合引言部分對于臨場感與沉浸感概念的探討,建議使用空間臨場感命名這一維度,見表6。

表6 各項目因素分析因素載荷
對量表總體和各個維度進行內部一致性系數檢驗,結果顯示,IPQ量表總體信度為0.82,逼真度維度的信度為0.74、參與感維度的信度為0.74、空間臨場感維度信度為0.54。除空間臨場感維度外,各部分內部一致性信度均在0.7以上,量表信度較好,而空間臨場感維度信度不佳的原因則需進一步進行討論。
本研究的目的是在前人的研究基礎上進一步修訂和檢驗中文版IPQ量表,通過選取商業游戲、教育游戲、簡單放松體驗以及心理學情境實驗等不同類型場景進行綜合性樣本測試,在更具有代表性的各類虛擬現實場景中驗證量表的可靠性。研究結果表明,中文版IPQ量表具有良好的信度和效度,適用于評估中國人虛擬現實的臨場感體驗是否達到良好的用戶體驗標準。
通過IPQ量表得分情況,將場景劃分為高分組和低分組并進行獨立樣本t檢驗,結果表明,除項目4以外高分場景得分均顯著高于低分場景,證明IPQ問卷具有良好的鑒別力,能夠分別出好的場景與不良場景之間的差異。在虛擬現實場景設計中應追求良好的體驗,部分場景得分偏低,反映出它們可能存在一定的瑕疵,例如模型紋理不真實、動畫僵硬、大小比例不當、同屏模型面數過多導致卡頓、交互設計不合理等,此類不合格場景的用戶體驗較差,無法滿足實驗和應用要求。因此在實際使用中一旦辨別出不良場景,應對上述問題進行排除或停止使用該場景,本研究在分析臨場感量表的結構時也對此類數據進行了排除。
對于高分場景進行探索性因素分析結果表明,IPQ量表中文版維持了原有的3因子結構,探索出的因子與原有的REAL、INV以及SP維度保持對應關系,可以分別命名為逼真度、參與感以及空間臨場感,表明量表結構效度良好,具有跨文化一致性。但同時也存在部分項目所屬維度發生了變化,其中項目9及項目13從空間臨場感(SP)維度轉移到了逼真度維度中,項目14從參與感(INV)維度轉移到了逼真感維度中。這三個項目的中文表述都具有一定的誤導性,可能造成被試理解困難,建議將項目9修改為“我不知道為何感覺這個虛擬世界正環繞著我”,項目13修改為“我感覺我只看到了一些圖片,而不是身處于立體的世界中”,項目14修改為“我的注意力全都集中在虛擬現實的世界中”。
IPQ量表總體的內部一致性信度達到0.82,逼真度維度、參與感維度的信度系數均高于0.7,但空間臨場感維度內部一致性信度略低,原因可能為:(1)項目2與項目6的題干一致且原維度相同,僅在選項的表達方式上具有差異。但中文版項目2聚合在了空間臨場感維度而非逼真度維度下,可能是因為其選項設置在中文語境中并沒有達到很好地效果,建議將其剔除。(2)項目4鑒別力較低,可能是題目的表述以及選項設置造成了被試理解的困難,建議將題目修改為“我感覺自己置身于這個虛擬空間中”。
IPQ量表的理論架構提出SP、INV以及REAL維度分別對應了虛擬現實心理模型認知構建過程中的空間感知建構、互動感知建構以及沖突抑制的過程。本研究驗證了中文版IPQ與英文版保持了一致的三因子結構,這進一步說明了IPQ原有理論結構的合理性。同時,從虛擬現實技術層面提出的“3I特征”也能夠以不同的角度來支持IPQ問卷的結構:(1)第一個I為沉浸,其定義與Witmer和Singer所定義的沉浸感接近,指的是一種使用者身處于眼前所看到的虛擬場景之中的感覺,能夠從內涵上較好的對應空間臨場感維度。(2)第二個I即交互,它的定義與IPQ中參與感維度相似。強調用戶在虛擬現實場景中并不只是簡單地、被動地進行體驗,而是在具身認知的參與下與場景的物體進行互動[17-19],同時用戶會將更多的注意分配在當前的活動中。(3)第三個I為構想。一方面,虛擬現實可以將現實的場景通過數字化的手段在虛擬空間中復現,另一方面,設計者可以通過計算機構造出現實中不存在的、只存在于人們想象中的場景。早期,由于技術能力不足,虛擬現實場景設計只能盡量保持與現實一致,提升逼真度以減少用戶使用過程中對于場景內沖突信息的覺知,進一步抑制對外部場景的感知。但隨著技術能力的提高以及產品的更新換代,各種各樣的場景已經能夠被實現出來,已有研究證明即使逼真度降低,用戶的臨場感體驗卻會上升[20]。第三個I——構想特征所體現的場景設計合理性才是更加值得我們關注的問題。IPQ理論架構與虛擬現實“3I特征”的結合,進一步為優化虛擬現實用戶體驗,促進虛擬現實技術發展提供了思路。
綜上,修訂后的虛擬現實臨場感量表可以用于測量我國虛擬現實用戶的臨場感。但同時,被試在實驗過程中體驗到悶熱、眩暈、疲勞等,也會影響用戶的沉浸體驗以及實驗效果,僅使用IPQ問卷難以對虛擬現實環境的用戶體驗進行全面的考量,因此建議在測試的過程中搭配測試眩暈的模擬器病問卷(Simulator Sickness Questionnaire,SSQ)等相關量表一同使用。如何對虛擬現實場景中的用戶體驗進行有效的評估,是促進虛擬現實技術發展、推動虛擬現實廣泛應用過程中不容回避的問題。之后的研究仍需針對這一問題進行長期討論和探索,本研究中通過因素分析結果對IPQ量表進行的修改,也有待進一步的評估和驗證。
綜上所述,中文版IPQ量表信效度良好,具備多角度理論基礎,適宜在國內虛擬現實用戶體驗評價中使用。