陳憶金,卓林鍇,趙一鳴
彈幕是新媒體時代用戶之間一種新的交互方式,滿足了視頻用戶的求新心理和娛樂需求。彈幕塑造的“圍觀”體驗可以滿足視頻用戶的自我認同需要和自我表現需要。通過彈幕,視頻用戶可以匿名并即時發表自己的看法或表達其情感,發表的內容可以是與視頻內容有關的,也可以是與他人發布的彈幕內容有關的,還可以是完全無關的內容。學習類視頻中的彈幕內容呈現了用戶在觀看學習類視頻時實時交流的問題或與他人討論的話題。用戶在觀看學習類視頻時發送的彈幕文本及其相關數據是視頻用戶交互特征的直接體現。本文研究目的是揭示學習類視頻用戶通過彈幕進行信息交互的過程中存在的普遍特征以及不同用戶群體之間存在的差異,研究問題包括:①學習類視頻用戶彈幕的發布時間是否存在規律;②學習類視頻用戶發布的彈幕文本體現何種內容特征;③彈幕數量隨視頻播放進度的變化情況;④學習類視頻用戶是否存在彈幕跟隨行為。
目前國內關于彈幕的研究主要是將彈幕看待為一種文化現象,從傳播學的角度對彈幕文化的形成以及彈幕的傳播價值等方面進行探討。彈幕族的存在給青年文化帶來了一定程度的影響,主導文化和亞文化可以實現一定的互動,主導文化可以考慮如何形塑、牽引亞文化及建構其傳播平臺[1]。彈幕具有受眾反饋即時性、評論的針對性和碎片化、表達的多樣化等特點。彈幕視頻無限更新循環的傳播模式區別于傳統網絡視頻多中心裂變式的傳播模式,給受眾的觀感體驗帶來巨大的變化,并實現了人與人之間關于視頻的實時互動,但同時也存在著一定的消極影響[2]。
彈幕的優勢在于通過互動改變了傳統的“作者-編輯-受眾”的關系,彈幕用戶擁有共通的敘事價值觀,但彈幕用戶年齡偏低,傳播內容的社會認同度不高,主流視頻網站缺乏彈幕編輯的共通語境,可能阻礙彈幕的進一步發展[3]。彈幕文化是受眾宅文化群體在網絡社群交流中所創造的一種具有相對獨立結構和使用群體的文化形式傳播,是一種以受眾主導的文化生產消費模式,因其以受眾為核心而具有內驅力[4]。彈幕文化具有主體間性式的文化特質,使視覺文化時代所產生的霸權、壓制等病癥得以緩解,觀眾由原本的被動接受內容轉變為通過彈幕來表達不滿,為受眾提供了一個多視角、多層面的觀看角度[5]。
已有研究對用戶使用彈幕進行互動的動機、需求等方面的關注較多。用戶使用彈幕視頻網站的原因包括娛樂、被陪伴需求、歸屬感以及尋求信息[6]。彈幕滿足了用戶的求新心理,彈幕內容滿足了以娛樂為主要動機的視頻觀看需求的用戶的娛樂需求,彈幕塑造的“圍觀”體驗滿足了用戶的自我認同和自我表現的需要,彈幕增加了視頻的信息量,可幫助用戶理解視頻內容[7]。彈幕視頻的隱匿性使用戶更加真實地進行自我表達,彈幕視頻聚集了具有共同愛好的用戶,用戶在與他人互動中可以獲得自我認同的滿足感和成就感,帶來歸屬感,擺脫孤獨感[8]。
彈幕視頻觀看者之間的互動可以通過從彈幕中提取的刺激因素影響觀看者的喚醒程度,與彈幕相關的刺激類型包括其他人的存在,社會競爭和情感刺激[9]。朱鈺涵基于B站數據,通過聚類分析將彈幕用戶分為“理性探討型”“彈幕引領型”“大眾籠統型”3種[10]。彈幕對用戶的沉浸感和觀看滿意度具有顯著的積極影響,也對觀看節目時用戶之間的感知交互具有顯著的積極影響[11]。時間增強技術使彈幕具備同步性,空間增強技術使彈幕具備可見性,同步性與可見性對彈幕用戶的積極參與起至關重要的作用[12]。
已有研究認為,學習類視頻網站提供的彈幕功能對研究用戶的學習行為具有一定的參考價值。彈幕在MOOC中具有潛在價值,有助于提高學習者的視頻學習參與度,誘發學習動機,保持良好的學習狀態,提供有效的臨場感效應,促進視頻內容的深度理解,實現頭腦風暴認知,有利于學習者的學習行為分析和完善學習視頻的教學設計,彈幕可能發展成為MOOC等遠程在線視頻學習平臺中的一項主要功能[13]。彈幕評論和視頻播放的同步性易讓觀眾產生共鳴,互動快捷及時,彈幕視頻有助于為學習者營造臨場感,分析學習數據為完善教學視頻提供數據支持[14]。李健和張新明認為彈幕應用于在線教育時應注意彈幕質量的把控,彈幕顯示應選擇合適樣式,教師應設法全面及時地對彈幕進行反饋[15]。
同時,研究者發現,基于彈幕的交互有助于提高學習者的參與度以及學習效果。彈幕可以作為增強學習者互動,增加課程參與度和改善學習體驗的有效途徑[16]。張婧婧等通過對B站中一門PS課程的彈幕數據進行分析和文本挖掘,發現學習者之間交互的語言特點體現了互聯網時代的時空轉換,學習者之間就此形成了語言認同,彈幕在一定程度上有助于促進老師和學習者、學習者和學習者之間的情感交流,縮小彼此之間的距離,增強學習者的社會臨場感,減少網絡學習過程中產生的孤獨感。相比傳統課堂,彈幕中學習者表達情感的方式更為直接,情感交流更加頻繁[17]。
大部分學習者愿意使用彈幕且希望視頻學習中有彈幕功能,學習者打開彈幕的社會存在感明顯高于關閉彈幕的社會存在感。教師發送與視頻內容相關的引導性彈幕有助于幫助學習者提高學習滿意度、社會存在感、學習成績,但也會增加學習者的認知負荷,其中場依存型學習風格學習者的認知負荷受到的影響較場獨立型學習風格學習者的認知負荷大[18]。彈幕對學習者學習的總效應量和學習結果的影響顯著,但是對學習過程的影響并不顯著[19]。彈幕對不同類型知識學習的影響不同:彈幕對陳述性知識學習無促進作用而對程序性知識學習有一定促進作用,主要能提高學習者的遷移成績[20]。
綜上可知,當前研究以對彈幕用戶的參與動機、參與意愿和彈幕對學習效果影響等為主,而因特網用戶信息交互具有從眾行為[21],作為一種新的在線實時評論,以彈幕數據為研究對象,剖析用戶通過使用彈幕而實現與學習類視頻的交互過程的研究較少,用戶如何利用彈幕實現交互,這種交互具有哪些顯著特征等問題尚不明確。本研究從用戶交互角度看待用戶之間基于彈幕的互動與信息交流行為,分析彈幕發布的時間特征、文本特征、數量特征以及從眾特征。
本研究探究學習類視頻用戶的交互行為特征,在Bilibili視頻網站(簡稱B站)以“學習”為關鍵字搜索后篩選彈幕數量最多的視頻,并發現檢索結果里以日語課程視頻以及Python、Java、C語言等編程技術課程視頻為主。因而本文以B站編程類視頻和日語類視頻的彈幕為研究素材,基于彈幕數據分析用戶的交互行為特征。
數據采集使用Java作為爬蟲編程語言,基于Java垂直爬蟲框架WebMagic與支持HTTP協議的客戶端編程工具包HttpClient進行開發,通過B站API與視頻aid編號獲取視頻信息與存儲彈幕信息的XML文件,通過對API響應的JSON數據和彈幕XML文件進行解析后寫入本地MySQL數據庫。為方便數據存儲與解析,數據庫建立3個表:視頻信息系列信息表、視頻分集信息表和彈幕信息表,所采集的具體數據字段見表1。

表1 數據采集表
數據爬取的時間為2020年2月1日,利用爬蟲分別抓取了編程學習10個系列視頻和日語學習10 個系列視頻,共1,801 個視頻的彈幕數據,爬取的樣本視頻上傳時間最早為2012年7月17日,最晚為2019年7月17日。通過彈幕XML文件解析得到1,064,137條彈幕數據,剔除重復或不合理的24條數據后,用作分析的彈幕數據合計1,064,113條。
數據分析圍繞研究問題進行,主要采用描述性統計、分詞處理、社交網絡分析等3種方法。
(1)學習類視頻用戶發表彈幕的時間分布特征分析采用“彈幕發送日期和時間”這個數據字段,將一天分為24小時,統計每小時內的彈幕數量。
(2)學習類視頻彈幕的文本內容特征分析采用“彈幕內容”“顏色”兩個字段,對所有彈幕內容進行分詞處理,由于B站的彈幕最大字數限制為100字,本研究將1到100平均分為10個區間,統計樣本彈幕的字數在這些區間的分布情況。B站為用戶提供了包括紅、藍、綠、黃、白、黑等10種彈幕顏色樣式,用戶在發送彈幕前可根據需要自由選擇,彈幕默認顏色為白色。本研究將除默認的白色以外其他9種顏色歸類為彩色對彈幕顏色分布進行統計。
(3)彈幕數量隨視頻播放的變化情況分析采用“彈幕在視頻中出現的位置(以秒為單位)”和“彈幕在視頻中出現的位置(以相對視頻時長的百分數表示)”兩個字段,將彈幕的出現時間除以彈幕所在視頻的時長得到彈幕在視頻中出現的相對位置,并將視頻時長平均分為100個區間,統計彈幕相對位置在各個區間的分布情況。
(4)彈幕跟隨行為分析采用“發送彈幕的用戶id”“彈幕內容”“彈幕在視頻中出現的位置(以秒為單位)”“彈幕發送日期和時間”等字段,采用Gephi對用戶間彈幕跟隨形成的網絡進行分析,將根據彈幕出現時間在視頻中的相對位置來判斷該彈幕是否為首次出現,遍歷視頻中所有彈幕,對每條彈幕判斷是否已有相同內容的彈幕存在,若存在則將發送彈幕的用戶id記錄為一次共現,并根據彈幕是否首次出現來判斷共現用戶間的跟隨關系。首先分別對編程學習類視頻和日語學習類視頻中的共現彈幕進行統計,將統計結果加工成Gephi所需的CSV文件并導入生成網絡圖。網絡中每個節點代表一個用戶,每條邊代表一次彈幕跟隨行為。
統計分析結果顯示(圖1),編程學習類視頻中的彈幕數量最高峰出現在下午4點處,日語學習類視頻的彈幕數量最高峰出現在晚上9 點。可見,觀看編程學習類視頻的用戶傾向于在下午觀看視頻并進行彈幕互動,觀看日語學習類視頻的用戶更傾向于在晚上觀看視頻并發送彈幕進行互動。

圖1 日語學習類(左)和編程學習類(右)視頻彈幕發送時間分布圖
彈幕文字數量統計分析結果顯示,兩個群體的彈幕存在明顯差異。觀看編程學習類視頻的用戶發送的彈幕在1~10 字的數量比重為66.1%,在11~20字的比重為25%,在21~30字的比重為5.66%,大于30字的比重約3.24%。而觀看日語學習類視頻的用戶發送的彈幕在1~10字的比重達82.4%,11~20 字的比重只有14.3%,21~30字的比重為2.68%,大于30字的比重僅約0.62%。如果將字數大于30的彈幕定義為長文本彈幕,那么編程學習類視頻的長文本彈幕占總體比重明顯大于日語學習類視頻的長文本彈幕比重。
彈幕字體顏色分析結果顯示,約9成的彈幕顏色為默認的白色,用戶在發送彈幕時大多偏向于選擇默認的白色。而將兩個群體的彈幕分別進行統計,可以發現日語學習類視頻的彈幕中彩色彈幕的比重(12.9%)明顯大于編程學習類視頻的彈幕中的彩色彈幕比重(8.1%),可以認為觀看日語學習類視頻并進行彈幕互動的用戶群體中有著更多對于彈幕表現力有較高需求的用戶。
彈幕出現時間隨視頻播放進度變化過程如圖2 所示。彈幕數量在視頻的開頭已經達到最大值,隨著視頻的播放,彈幕數量逐漸減少且趨于平穩,而在視頻即將結束時彈幕數量又明顯增加。據此推斷原因可能是用戶通過視頻開頭初步了解視頻內容后決定推出播放或是專注于觀看視頻因而減少發送彈幕。

圖2 彈幕出現時間在視頻中的相對位置分布
將相對位置小于0.1和相對位置大于0.9的彈幕即出現在視頻開頭10%和結尾10%的彈幕提取出來,通過Java開源詞云框架KUMO分別進行詞頻統計(表2)有了兩個發現。

表2 視頻進度前10%和后10%部分的高頻詞
(1)出現在編程學習類視頻開頭10%部分詞頻最高的詞語是“老師”,發表的多為對視頻主講老師的評論或者問候;而出現在日語學習類視頻開頭10%部分詞頻最高的詞語是“為了”,學習日語的用戶以此為跟隨彈幕來集體表達各自學習日語的原因以及表達開始觀看視頻的行為。
(2)出現在編程學習類視頻結尾10%部分詞頻最高的詞語仍然是“老師”,且其他高頻詞與出現在視頻前10%的高頻詞有部分重合;在日語學習類視頻結尾10%部分出現頻率最高的詞語是“存活”,“存活”屬于彈幕網站特色詞語,用戶一般以此表達自己并未中止觀看時長較長的視頻,在視頻結尾用“存活”表示已堅持看完視頻或在系列視頻最后一集用以表示仍在觀看該系列視頻。在視頻開頭和結尾的兩處彈幕高峰中,編程學習類視頻的用戶彈幕互動行為傾向于關注視頻內容本身,與視頻中的講師相關的彈幕內容出現頻次較高;而日語學習類視頻的用戶彈幕互動行為中與視頻內容相關的相對較少,彈幕氛圍相對活躍,較具有趣味性。
編程學習類視頻的彈幕共現網絡共64,215個節點,產生159,547條邊;日語學習類視頻的彈幕共現網絡共16,452個節點,產生149,822條邊。編程學習類視頻彈幕用戶社交網絡平均度為2.485,平均加權度為2.69。日語學習類視頻彈幕用戶社交網絡平均度為9.107,平均加權度為16.853。
從共現網絡邊與節點之比可以看出,兩類視頻的共現網絡的平均度存在較大差距,日語學習類視頻共現網絡節點間的聯系較為緊密。日語學習類視頻的網絡平均度較高,且經過加權計算的平均度更高。觀看日語學習類視頻的用戶更熱衷于通過復制其他用戶的評論進行彈幕互動,一條具有趣味性或使得到眾多用戶贊同的彈幕會帶領一波較龐大的彈幕跟隨行為,且部分用戶存在著多次復制相同用戶的相同評論的行為。
結合兩類視頻的網絡圖來看,觀看日語學習類視頻用戶的彈幕跟隨行為具有較高的集中度,在日語學習類視頻規模越大的彈幕跟隨行為更易吸引到更多用戶的注意與參與,于是這種現象得以進一步傳播。相比之下,這種“滾雪球”現象在編程學習類視頻中的表現則并不明顯,編程學習類視頻網絡圖中劃分出多個社群但規模較小,且平均度可以看出觀看編程學習類視頻的用戶并不熱衷于通過這種彈幕跟隨的方式進行互動。
由彈幕位置分布結果(圖2)可知,彈幕數量隨著視頻播放進度變化,彈幕數量在視頻開始時較多集中在視頻開頭,隨著視頻播放逐漸減少并趨于穩定,而在視頻即將結束時彈幕會再次增多。而當大量用戶用彈幕跟隨的方式進行互動時也會導致短時間內的彈幕數量增加,本研究嘗試根據彈幕位置將其按視頻播放進度劃分來了解用戶的彈幕跟隨行為在視頻播放的不同階段的分布情況。
本研究分別對兩類視頻各按播放進度平均分為前、中、后三階段,對各階段的彈幕共現進行統計,整理導入Gephi得到兩類視頻三階段的網絡圖并計算網絡平均度,結果如圖3 和表3 所示。可見,日語學習類視頻三個階段的網絡平均加權度逐步降低,網絡平均度在后階段也出現明顯降低,而編程學習類視頻的網絡在各階段的變化則不明顯。可以推斷,觀看日語學習類視頻的用戶通過彈幕跟隨進行互動的意愿隨著視頻播放逐漸減弱。

圖3 兩類視頻三階段社交網絡圖

表3 兩類視頻社交網絡三階段平均度與平均加權度
本文使用網絡爬蟲抓取B站部分日語學習類視頻和編程學習類視頻的彈幕數據,基于彈幕數據,基于文本分析、統計分析和可視化分析等手段,從時間分布、彈幕文字數量和顏色、彈幕時間與內容、用戶交互網絡等方面分析學習類視頻用戶的交互行為特征。研究結果表明:
(1)學習類視頻用戶發布彈幕的時間具有一定的規律性。總體上,學習類視頻用戶在下午4點前后和晚上9 點前后發布的彈幕數量居多,其他時間段較少;而且編程學習視頻用戶發布彈幕數量最多的時間段是下午,而日語學習視頻用戶發布彈幕數量最多的時間段是晚上。由于彈幕發布是在用戶觀看視頻時發布的,彈幕的時間分布時間可以視為用戶觀看視頻的時間。由此可見,學習類視頻的彈幕用戶高峰期存在于下午4點左右和晚上9點左右,不同學科類型的學習視頻的彈幕高峰之間存在差異。
(2)學習類視頻的彈幕文本文字數量較少,字體顏色以白色為主。總體上,低于10個字的彈幕數量占比最大,編程學習類視頻用戶發布彈幕的文字數量略多于日語學習類視頻用戶發布彈幕的文字數量。日語學習類用戶發布有色字體彈幕的占比相對編程學習類用戶發布有色字體彈幕的占比較高。
(3)學習類視頻用戶發布彈幕的數量隨著視頻播放時間有規律變化,發布彈幕的內容在兩類用戶群體間呈現顯著差異。總體上彈幕數量呈現視頻播放的前期和后期多、中間少的分布趨勢。根據分詞統計結果可知,日語學習視頻用戶發布彈幕的內容與視頻內容相關性低,而編程學習視頻用戶發布彈幕的內容與視頻內容相關性高。
(4)學習類視頻用戶存在彈幕跟隨行為,但在不同類型的用戶之間存在顯著差異。從社會網絡分析結果可知,日語學習視頻用戶基于彈幕體現出強烈的交互意愿并出現較多的跟隨行為,而編程學習視頻用戶的交互意愿相對較低。進一步從視頻推進時間短的分析結果可知,日語學習視頻用戶在視頻播放初期的交互行為最密切,交互行為隨著中期、末期逐漸變少;編程學習視頻用戶在視頻播放初期、中期和后期的交互行為沒有太大的變化。
本文研究結論有助于深入理解彈幕這種新型的用戶交互方式,有助于從時間特征、內容特征、數量特征以及從眾行為特征等多個維度刻畫和理解學習類視頻用戶的彈幕使用行為,彌補了現有研究在該方面的不足。同時,本研究還有助于學習類視頻網站提供商更好地理解用戶,針對用戶彈幕交互行為特征對學習類視頻網站或系統進行優化。
本研究存在一些不足之處包括:(1)由于受爬蟲以及B站保留彈幕數據規則所限,用作研究的20個系列視頻彈幕僅為網站最新保留的數據而不是全部。(2)僅選擇了兩類學習視頻作為研究素材。后續研究需要擴大研究數據量和視頻類型覆蓋面,以更全面揭示學習類視頻用戶基于彈幕的交互行為。