李 晶,薛晨琦,宋昊陽
隨著計算機迅速發展,“面對面”的信息交互逐漸被人機交互(Human-Computer Interaction,HCI)取代,計算機媒介溝通(Computer-Mediated Communication,CMC)時代隨之到來,依托計算終端開展一對多的“虛擬”交互成為日常。誠然,人機交互下的CMC大大促進了信息傳遞和交流的效率,但冷冰冰的計算終端如何營造“交互情境”,最大程度地提升用戶的感知與體驗,一直是人機交互領域研究的熱點[1]。彈幕較早出現在國內知名社交網站Bilibili視頻平臺(以下簡稱“B站”),其參與式、即時性、碎片化的交互特征充分滿足了當代公眾的心理需求。借助其在視頻內以快速滾動或靜止的形式顯示留言的功能[2],用戶根據自己在觀看視頻和彈幕時所產生的情感、態度及想法,通過發表彈幕進行及時的信息呈現[3],依靠與計算機的交互實現信息交流。用戶采用彈幕進行交互的方式營造了強烈的“圍觀”體驗[4],能使用戶與其他參與者產生虛擬的“共在感”,大大增加了用戶身臨其境的體驗。學者們在研究這種身臨其境感時將其定義為社會臨場感(Social Presence,SP),并表明其與交互存在著密不可分的關系[5]。目前針對社會臨場感已有較為豐富的研究成果,普遍分布在通訊[6-7]、遠程教育[8-9]、人機交互[10-11]及營銷[12-13]等領域。這些成果在研究方法方面,主要采用了問卷調查法和內容分析法;在研究主題方面,針對網站、論壇的信息交互研究居多。本文嘗試對彈幕短視頻用戶交互行為的社會臨場感進行研究,以B站科普類視頻為樣本對象,引入社會臨場感計算方法,對視頻彈幕形成的社會臨場感進行精確測度,在此基礎上探討社會臨場感與用戶使用視頻的各種行為特征關聯關系。本文的研究結論為拓展人機交互領域及CMC時代的社會臨場感理論,以及基于用戶視角促進科普類視頻的分享與傳播提供啟示和參考。
人機交互主要研究人與計算機之間的交互關系,是一個多領域學科交叉的研究方向,早期的概念來源于卡德、莫蘭和內韋爾在1983年所著的《人機交互心理學》一書[14]。不同于現實情境下個體之間的面對面交互,人機交互依托于互聯網技術特性的優勢,實現了人與計算機的交流,為用戶提供了一種虛擬的交互環境。雖然人機交互使用戶獲取信息的方式更加簡便高效,但計算機的非人性化仍為用戶信息的獲取帶來了一系列的問題。進入21世紀以來,盡管系統設計[15]、界面設計[16]及人工智能等關鍵技術[17]仍然是人機交互領域的焦點所在,但是也有越來越多的學者注意到與“人”有關的因素,如感知風險、愉悅、舒適、可靠等[18-19]對人機交互效果的影響[20-21],試圖找尋在人機交互中滿足用戶感知與體驗需求的最佳策略[22]。這些對人機交互中用戶體驗的關注將目光轉向“人”而非純粹的技術,不僅是研究視角的轉變,更凸顯了研究價值的回歸。
社會臨場感,又稱社會存在、社會表露、社會呈現,是來自通訊領域的一個重要概念。該理論最早出現在馬里蘭大學教授Short等1976年的著作《通訊社會心理學》(The Social Psychology of Telecommunications)中,并將其首次定義為在利用媒體進行溝通過程中,一個人被視為“真實的人”的程度及與他人聯系的感知程度[5]。隨著該理論影響力范圍的不斷擴大,越來越多的學者將其應用于不同的領域的交互行為研究,并根據研究情境的不同,對社會臨場感展開了不同的維度劃分及測量的探索。表1對社會臨場感在不同研究情境下的維度劃分及測量方法的部分文獻進行了梳理。

表1 不同研究情境下社會臨場感維度劃分及測量方法梳理
學者們基于社會臨場感的維度劃分包括單維度、多維度兩種情況。根據不同情境的要求及學者們的研究探索,多維度對社會臨場感進行劃分更具有科學準確性,其中針對社交媒體或在線社區的維度可以總結為意識、情感及認知3類。從社會臨場感的測量方法來看,大部分學者采用量表對其進行測量計算,有部分學者針對交互內容通過人工或機器編碼進行統計,但量表的測算方法僅基于部分使用者的行為與感受展開,具有一定的研究不足;基于文本的計算則是依據場景現有的整個文本內容對社會臨場感進行計算,數據全面,具有更高的可信度。
通過梳理,基于文本的社會臨場感計算主要包括兩種方式。一是基于文本的人工編碼處理。通過對獲取的文本信息根據劃分維度進行人工編碼,將分類數據按照深刻程度進行賦值,賦值結果的總和表示社會臨場感水平[41]。二是基于自然語言處理的自動編碼。面對海量、復雜的文本信息,依靠人工智能機器的自然語言處理逐漸取代了人工,學者們針對獲得的文本信息,通過人工智能機器進行自動編碼,在處理過程中,通過計算每種社會臨場感出現的頻率來確定每種社會臨場感水平[42],或者將具有社會臨場感維度的記1分,自動累計分數,獲得臨場感水平[43]。
綜合考慮上述計算方法,本文選取“意識、情感、認知”的維度劃分對彈幕視頻社會臨場感水平進行測度(見圖1)。其中,意識指用戶認為其他社會行為者似乎存在并能夠對用戶做出反應的程度[44],即用戶與其他參與者之間存在“共在意識”,具有強烈的感知交互;情感指用戶通過虛擬社交引發的情感感知,Riva等也證明情緒反應與存在感密切相關[45],而存在感正反映了社會臨場感;認知是指用戶在社交平臺中通過持續的交互建構知識的過程[46],在線社區的認知也是通過用戶以發帖或評論的形式持續參與在線討論來實現的[31]。

圖1 社會臨場感的3個維度
根據以上分析,通過獲取每種維度出現的頻率對社會臨場感進行計算,計算過程見公式(1)。
其中,某視頻社會臨場感(Sp)各個維度出現頻率分別為p1,…,pi,i=1,2,…,n。后文中將應用上述公式計算視頻的社會臨場感。
為從B站視頻中選取影響力大且具有代表性的科普視頻,本文通過B站專業的數據分析平臺——火燒云數據平臺,以“一級分類-二級分類”的“知識-科學科普”為檢索類目,選取截止到2021年4月17日排名前十的UP主。由于B站沒有直接明確的功能對彈幕數、播放量等進行排名,為方便選取,對以上UP主共1,867個視頻的彈幕數、視頻時長、播放量、發布時間等進行排序統計,以綜合篩選條件,盡量確保每個視頻都在選取范圍之內,最終共選取40個視頻。數據的收集采用Python作為爬蟲編程語言,通過B站API接口,并以B站視頻唯一BVID號作為區別標識。考慮到B站現有的彈幕庫只保存少數彈幕數據,因此,基于視頻界面的歷史彈幕列表,對彈幕庫進行逐日爬取并進行去重清洗,以盡量完整地獲取所有歷史彈幕。獲取視頻的信息列表見表2。

表2 科普視頻信息收集列表
(1)分詞處理。本文使用開源的中文jieba分詞工具,對彈幕文本內容進行預處理。其原理為基于前綴詞典生成句子中所有可能成詞的情況,并動態查找最大概率路徑,找出基于詞頻的最大切分組合[47]。如彈幕文本“自己就是不長痘的體質”,基于jieba分詞后可以得到“自己/就是/不/長痘/的/體質”。
(2)停用詞清洗。彈幕作為用戶表達情感及認知的文本,往往含有無意義的表達詞、標點符號、特殊符號,在一定程度會影響測量的結果。針對分詞后的結果,考慮到“?”“!”及“哈哈哈”等詞具有明顯的情感內涵,從停用詞典中刪除,作為保留詞,構建包含數字標識、逗號、句號等無意義詞的停用詞典,然后進行停用詞清洗。
(3)詞頻統計與主題分類。為計算各類詞出現的頻率,利用Python的Collection包下Counter的類對分詞結果進行詞頻統計。使用TF-IDF算法進行特征提取,進行主題歸類及數量統計,計算每個視頻每種社會臨場感維度出現的頻率。
通過去重清洗等操作,截至2021年4月17日,爬取科普類視頻共計299,994條彈幕,分別將每個視頻彈幕的發表日期、視頻時間節點進行數量統計,得出單日發表彈幕數量列表、逐日累積數量列表及視頻時間點的彈幕數量列表,并對其分別進行可視化,制作相應的趨勢分布圖。
(1)彈幕數量分布。所選取的科普視頻在彈幕數量的日期分布上具有明顯的一致性。從圖2可以發現,科普視頻單日的彈幕數量分布呈現初期短暫突增而后驟降,最終逐漸趨于平穩的趨勢,視頻發布初期的彈幕數量遠遠大于后期彈幕數量。這說明視頻平臺發布的內容具有一定的時效性,隨著時間推移,視頻傳播力減弱,用戶的關注度也隨之降低。

圖2 科普視頻彈幕數量日期分布
(2)彈幕數量累積分布。通過對每日的彈幕的累積數量進行統計,分別制作每個視頻的彈幕累積趨勢圖。總體上可以發現,科普視頻整體趨勢與彈幕數量分布相符合,但存在兩種不同的累積趨勢。一是普遍趨勢:彈幕累計數量短時間內急劇增長后趨于平穩(見圖3);二是特殊趨勢:彈幕累積數量隨日期緩慢增長至某一節點以較快速度持續增長,最終逐漸趨于平穩(見圖4)。

圖3 彈幕數量累積普遍趨勢圖

圖4 彈幕數量累積特殊趨勢圖
(3)不同視頻時間點彈幕數量分布。通過對科普視頻時間點的彈幕數量進行統計,制作每個視頻基于視頻時間點的彈幕數量趨勢圖(圖5為某個視頻的時間節點彈幕數量趨勢)??梢园l現,不同視頻時間節點彈幕數量趨勢不同,但有兩個共同點:從整體上觀察,所有視頻均不存在明顯的上升下降趨勢,且彈幕數量波動不具有普遍規律;每個視頻都存在明顯的突增、低谷點,這意味著每個視頻在某一時間段都存在互動的高潮及低谷。

圖5 科普視頻時間節點彈幕數量趨勢圖
依據科普視頻時間點彈幕數量分布趨勢體現的突增點及低谷點特征,能推斷由低谷點到突增點的整個階段最能體現用戶的交互特征。為此,統計每個視頻的突增及低谷點,以此對視頻的交互行為進行統計,計算視頻的社會臨場感。為達到選取標準統一,作以下設定:一是突增點(T):①大于3/4振幅②頂點(左右時間段彈幕數量均小于此點);二是低谷點(B):①小于1/4振幅②突增點之前的最低點,該點之后彈幕數量均有上升趨勢;三是中振幅=(最大值-最小值)/2。具體來說,分別統計每個視頻突增點、過渡段及低谷點的時間段和彈幕信息,截取彈幕文本列表,通過分詞及去除停用詞操作,使用TF-IDF算法進行特征提取,進行主題歸類。最終,共提取到4類特征:情感反饋、認知交互、UP主交互及用戶交互。其中,情感反饋指用戶觀看彈幕視頻及彈幕后產生的與視頻或其他用戶之間的情感反饋;認知交互指用戶觀看視頻及彈幕后所產生的知識建構;UP主交互及用戶交互分別指用戶與UP或用戶進行無特殊內涵的對話,如打招呼、道別等。以視頻1為例,其主題代表詞見表3。

表3 視頻1特征提取及代表詞
經過具體內容分析,對選取的B站科普類視頻的社會臨場感水平進行計算。在發布彈幕過程中,用戶認為此刻其他用戶虛擬存在,并能與之互相反應??紤]到彈幕與視頻畫面的位置重合且與對應視頻內容相對同步的獨特表現形式,可以認為彈幕用戶存在絕對的意識臨場感。因此,本文刪除意識維度,僅從情感和認知兩個維度展開研究。所提取的情感反饋和認知交互特征分別對應情感臨場感與認知臨場感,根據計算公式,計算出各視頻的社會臨場感水平。各科普視頻的主題特征頻率統計及社會臨場感見表4。

表4 各科普視頻的主題特征頻率統計及社會臨場感計算
本文進一步探索彈幕視頻臨場感與用戶視頻使用行為之間的相關性規律。選取每條視頻的視頻播放量、用戶點贊量、用戶投幣量描述用戶視頻使用行為[48],對每項數據進行標準化處理,以確保數據的量綱統一,數據選取的截止時間是2021年4月17日。由表5所示的數據描述性統計分析結果看出,所有視頻樣本的社會臨場感均值達到了0.782,說明大部分視頻的社會臨場感較高。圖6進一步揭示社會臨場感與各行為變量之間的相關關系,所有變量與社會臨場感之間都具有正向相關關系。具體地,圖6中(a)、(b)、(c)分圖表明社會臨場感增強有利于提升視頻播放量、用戶點贊量和用戶投幣量,(d)圖說明了本文基于彈幕數計算的社會臨場感與視頻的彈幕總量之間具有較強的正向相關關系。

圖6 社會臨場感與視頻使用行為變量之間關系圖

表5 描述性統計
(1)社會臨場感在人機交互中的理論構建。傳統的信息交互發生在基于現實情境的面對面交流,但是隨著互聯網技術的出現,傳統的“人-人”交互理論不適合直接解釋新時代CMC的問題,而不斷涌現的人機交互理論更關注的是人與計算機之間信息交換技術層面的問題[49],忽略了人作為主體的認知特征和情感表達。本文引入新聞傳播學和教育學領域的社會臨場感理論研究人機交互中用戶體驗優化的問題,對基于文本分類的社會臨場感水平進行了定量測度,證明了社會臨場感測度方法在人機交互研究場景的適用性,在一定程度上拓展了人機交互中用戶體驗研究的理論視域。
(2)社會臨場感的多維度計算方法。自社會臨場感理論提出后,逐漸被應用于多個領域的理論與實踐研究中,并取得了豐富的研究成果。但隨著CMC時代的到來,關于社會臨場感的測度研究卻少有學者關注。本文對已有的測量方法進行了梳理,在此基礎上對社會臨場感的多維度計算方法進行了完善,并從彈幕交互行為出發,探索采用彈幕文本數據,從情感和認知兩個維度,研究測算了B站科普視頻的社會臨場感,為社會臨場感的量化研究提供了方法和技術路徑。
(3)社會臨場感對用戶視頻使用行為存在影響。長期以來,有許多學者研究用戶信息行為的前置動因,如風險情境[50]、商務營銷環境[51]下的用戶的感知特征(感知有用性[52]、感知滿意度[53]等),信息特征(有用性[54]、質量[55]、信息不足[56]等),用戶特征[57]及社會因素[58]等。但是,CMC環境下用戶信息行為的關鍵影響因素很少有研究。本文關注了社會臨場感這一因素,通過實證研究,運用文本分析與數據挖掘及相關性分析等方法,發現社會臨場感對用戶視頻的使用行為具有一定的影響,這是在傳統的面對面交互的環境下不存在的規律和特征,本研究為完善CMC環境下的信息行為理論,包括信息分享行為、信息利用行為、信息傳播行為的影響機理提供了新的視角。
本研究發現視頻的社會臨場感在一定程度上會促進用戶使用視頻的行為,這對于幫助科普視頻制造者基于用戶視角促進科普類視頻的分享與傳播提供了新思路。科普視頻制造者可以依據視頻所反映的社會臨場感水平獲知用戶對視頻的滿意程度,針對用戶所感興趣的內容確定更吸引用戶的科普視頻主題,提高視頻傳播力;對視頻平臺方而言,在擴大平臺的影響力方面也有借鑒意義,平臺方可將高社會臨場感的科普視頻作為主頁面的推薦內容,在提高視頻傳播效果的同時,促進用戶的分享行為,從而擴大平臺的影響力;同時,視頻的社會臨場感水平也能通過用戶的使用行為反映視頻的質量,為其他用戶選擇更具有意義和實用性的科普視頻提供了參考。
本文選取彈幕視頻平臺B站的科普視頻為研究對象,獲取視頻彈幕數據299,994條,利用文本分析與數據挖掘的方法,研究了彈幕的分布特征、視頻彈幕反映的社會臨場感測度及社會臨場感與用戶視頻使用行為的關聯關系,研究在一定程度上豐富了CMC時代的社會臨場感理論,并在科普視頻制造者、視頻平臺方促進科普視頻傳播、提高自身影響力及用戶的視頻選擇方面具有實踐價值。本文作為一項探索性的實證研究主要存在兩方面的不足,為未來的深入研究提供了方向。第一,本研究發現彈幕兩個階段式累積等特征,但沒有深入研究,未來計劃針對這兩種不同的特征進一步分析不同趨勢對社會臨場感水平的影響。第二,本研究僅使用TF-IDF算法進行特征提取,未來將繼續探索和利用不同的特征提取方法和分類算法,發現社會臨場感水平測量的最優方式,以提高研究的準確性。