■ 袁 媛 嚴宇橋
新世紀以來處于社會轉型期的中國社會當中,有關科學的爭議性事件層出不窮。從核電站和PX項目到霧霾治理問題和轉基因食品安全問題,這些事件引發了社會各界層出不窮的爭論,有些處理不當的事件甚至引發了某些群體之間的割裂和敵對。作為輿情研究者和分析者,如何做好爭議性事件當中的輿情預判、監測、分析,并及時采用應急預案加以干預和控制,從而達到建立良性溝通的輿論環境和避免出現惡性事件的目的,是對于此類事件研究的重點。輿情管理需要一種能夠預測爭議事件輿論走向的方法,以此在輿情事件爆發之前加以干預,避免因為該科技問題引發更大的社會不良后果。風險傳播(Risk Communication),指的是一個為公眾提供減少焦慮和恐慌的信息以及有助于其應對危機的建議的過程。有效的風險傳播能夠快速提高人們防范、應對突發公共事件危害的意識和技能,消除無謂的恐慌情緒,保持社會穩定。風險傳播采用的范式是建立在心理實驗的實證數據和社會調查的量化分析基礎上的,也正基于此領域的這一屬性,對于一些已發生事件的測量和分析成果才有可能作為輿情預測的重要經驗參考,同時建立準確的預測模型的設想也因此成為可能。
當下,輿情研究已經不單單局限于輿情的監測以及事后分析,而是更多地將目光轉向輿論狀態的預測研究。社交媒體中的輿情預測主要是靠社會網絡分析通過數學建模的方法來進行。信息科學領域的研究者們通過借鑒生物學當中的傳染病傳播規律數理研究和社會學中的創新擴散原理,提出了將過程模型和影響力模型結合起來的針對輿論的信息傳播模型。隨著網絡時代的不斷發展,信息傳播模型研究的載體逐漸轉移到網絡上,眾多傳播模型的提出幾乎都可歸結為影響力的問題。作為心理學家,保羅·斯洛維奇的一系列研究則將風險感知這一抽象問題具象化,將其從宏觀引向微觀。斯洛維奇的研究核心概念就是個人“風險的感知”,從不同維度測量個體對風險事件的感知,并以一系列實證測量來驗證和改進風險感知的因子分析和測量方案。斯洛維奇提出了風險感知測量的不同維度并根據這些維度設計了測量方法和量表,集中在《風險的感知》一書中。斯洛維奇最大的貢獻在于創立了風險感知的測量學派,將以往人文社會科學研究中難以度量的個人對于風險的感知進行量化,使研究者能夠直觀地觀測到風險感知值的高低。
對于微博輿情的仿真,目前的研究成果主要分為兩類:一是借助系統動力學模型來仿真公眾風險感知對輿情熱度的影響;二是采用傳染病模型模擬風險感知的傳遞過程及其對社會危機的影響。此外,還有一些學者對風險感知的演變、影響因素及作用進行探索。王煉和賈建民①從時間和空間兩個維度對地震爆發后公眾風險感知的演變規律進行研究;李鋒②運用Logit模型研究了“5·12”汶川地震中公眾風險感知演變的影響因素;成俊會和趙金樓③研究了風險感知對輿情傳播穩態的影響。然而,趙文兵在《Web2.0環境下社交網絡信息傳播仿真研究》④中卻指出,傳染病模型并不適用于描述社交網絡下的信息傳播,并因此構建了信息接受—瀏覽—分享模型。對于風險感知和傳播模型的結合,成俊會在《基于信息風險感知的社交網絡輿情傳播模型研究》當中有所使用,但是成俊會的成果當中對于“風險感知”的定義和范圍界定并不是心理學或者傳播學范疇中傳統意義的“風險感知”,即對于風險的潛在威脅性的認識,而是將其理解成了傳播錯誤信息會導致違法犯罪的風險,因此基于這種風險建立的模型雖然有其較強的可靠性和借鑒意義,但由于風險測量解釋的不同導致了其模型會與本研究出現截然不同的結果。盡管如此,成俊會將傳播概率的影響因素拆解為四部分:風險感知、傳播涉入度、輿情話題熱度和傳播好友數這四個維度,為本研究對其他變量進行控制從而單獨就風險感知進行建模提供了實證依據。對于微博的整體輿情傳播情況,賀幸在《微博影響力傳播模型的改進與驗證》⑤中將兩個模型也就是IC模型和LT模型進行結合并改進,但微博影響力具體的測量值是基于1—2個樣本直接賦值計算,而來源參數并未給出實證依據,模型的效度有待改進。
上述研究均為本研究提供了理論基礎。情報學的建模方法提供了研究范式,但由于參數賦值缺乏實證計量而存在效度不足的問題。盡管心理學的測量方案推廣到整個輿情領域的宏觀性研究較少,但目前的成果仍為本研究提供了傳播節點個體數值的計算方法。因此本文將基于傳播學相關理論、心理學實驗、情報學已有模型,加以大數據基礎上的輿情微博信息挖掘,改進并提出新的信息傳播模型并加以驗證。
本研究的目標為:通過風險感知的定量心理測量,得出在不同風險感知程度情況下單個用戶在社交媒體當中的傳播選擇(傳播還是不傳播及其閾值、傳播的量、傳播的概率等),并以該行為結果作為參數值,進行建模。該模型用以描述某個爭議性科技事件的社交媒體傳播過程,在理想狀態下(對于輿情并不加以控制的情況下)經過一段時間的發展后,對于此事件參與傳播過程的人群的數量。
因此理想狀態下,當知道一個風險性科技事件信息、初始傳播情況和受眾風險感知時,可以通過測量受眾的風險感知值的高低來觀測最終有多少人成為傳播者,以此來幫助相關機構制定輿情控制方案。在確定模型之后,將該模型代入相關爭議性科技事件,用實際數據與模型預測數據進行檢驗。
在做出正式的測量值之前,根據受眾對于風險感知的不同維度,設計在不同風險層面下受眾風險值不同的新聞事件,并測量出事件的風險值H,以此作為測量受眾傳播行為選擇的參考變量之一。在此模型中,對于事件的風險感知被分為了“恐懼風險維度”和“未知風險維度”,此外除了此模型,還涉及到時間維度和情感維度。考慮到本實驗屬于用來篩選事件和自變量的前測實驗,需要對被試的人口學變量和學科背景進行控制。因此本實驗選擇15名被試,年齡為20—24歲,均為北京師范大學本科高年級或研究生一年級學生,且未參加過新聞學、心理學、情報學相關專業課程。
15名被試到達之后,依次進入實驗室,編號為1—64的64個事件打亂順序后逐個顯現,每個事件的閱讀時間為15秒,閱讀完一個事件之后被試立即填寫量表題,每個事件的量表填寫限時30秒。試題測量維度如表1。
其中a,c變量與事件風險值呈負相關,因此測試數據需進行反向計分,即被試所給分值越高,則分值越低。前測實驗中H的計算采用直接加和求平均法,即:
本實驗采取單因素被試內實驗設計,自變量為被試在面對不同事件的風險感知情況,因變量為被試對風險事件的轉發意愿,其中,在總實驗數據中控制事件的轉發和點贊次數等事件傳播情況的干擾,從而測量個體在不同風險感知情況下,對風險事件的傳播意愿。保羅·斯洛維奇在對風險事件的研究過程中,采用量表方法對個體的風險感知情況進行測量。在1998年,謝曉非根據該測量成果基于中國實際情況制定了《一般社會情境中風險認知研究問卷》,研究選取了前人風險感知量表中的五個維度進行測量,通過李克特7級量表要求被試對不同事件的風險感知情況進行評分,從而得到不同事件下不同被試的風險感知情況,并將傳播意愿和刺激的次數作為參照量。量表設計如下(見表2):

表2 實驗二量表設計
本實驗選取95個被試,年齡分布為18—28歲,學歷為大學本科。
除事件風險值H外,實驗結果輸出以下變量(數據)見表3:

表3 實驗二輸出變量
1.事件風險分值與被試傳播意愿
首先,直接測試H與P的相關性,顯著性計算如下(見表4):

表4 事件風險分值與被試傳播意愿相關性檢驗
皮爾遜相關系數為0.367,雙尾顯著性p值為0.023。從結果看事件風險分值H與被試的傳播意愿P沒有明顯的相關,因此引入被試的風險感知狀況F,進一步計算回歸并分析。
2.探究被試風險感知與傳播意愿的相關關系
由于傳播狀態的直接表現為傳播或不傳播,因此因變量傳播意愿P劃分為兩類,即0或1。對應至問卷中的七級量表,轉化為以4進行分類,大于等于4則傳播、小于4則不傳播兩種。
對樣本f與p檢驗相關性并使用logistics曲線擬合,結果如圖1。

圖1 傳播意愿與被試風險感知狀況的擬合結果
結果可以看出,以被試為觀測點,在99.9%的置信水平上f與p相關,相關性較強。具體而言,兩者呈logistics曲線相關,擬合曲線為:
該關系對下一部分傳播模型構建十分重要。
由以上三個方案可知,建立有相關性的傳播模型需要以被試為觀測點進行擬合,即個人的轉發意愿不只取決于事件本身的風險值,更重要的是被試個體對于事件的風險感知。以此實驗結果,建立模型進行計算。
為了簡化模型,使模型更為清晰可實現,提出以下假設條件:1.傳播過程中用戶關系、用戶總數量、用戶特征不變,是靜態網絡;2.各影響因素之間相互獨立。
首先構建BA無標度網絡,該網絡以每個用戶作為節點,每個用戶的粉絲數量作為節點的度,形成無向網。接著初始激活節點,通過為節點賦予屬性s(t),來表示節點是否知在知曉后轉發該事件,即節點是否被激活。s(t)取值如下:

由上述結論,我們使用概率模型表示用戶的傳播意愿:
其中H為事件的風險值;n(t)表示t時刻激活狀態的鄰居數量n(t),wi表示激活狀態鄰居i的影響力。由于實際情況中不同等級用戶的影響力有所差異,同一用戶其粉絲感知的影響力也有所差異,因此模型中節點的影響力用一個在常數附近波動的隨機量表示,該常數的確定根據愿意轉發的傳播次數t與事件風險值H、傳播意愿閾值thr的關系確定,即:
wi=α±ζ,ζ?α
傳播過程以構建的概率模型為基礎,使用獨立級聯模型(Independent Cascade Mode,IC模型)為思路。在傳播過程中的每一時刻,每個已激活的節點嘗試對其鄰居節點進行激活,每個未激活節點根據概率模型計算出被激活的可能性,當滿足P(i,t)>0.5,即被激活。也就是說,被激活的閾值為P=0.5。在t+1時刻,重復上述過程。完成傳播模擬后,計算每一時刻激活節點占總節點比例。
首例基因編輯嬰兒事件是本研究進行模型驗證的實際數據樣本,因此首先需要對于該事件的整體輿情狀況有所把握。該事件的主要內容是:
11月26日,來自中國深圳的科學家賀建奎在第二屆國際人類基因組編輯峰會召開前一天宣布,一對名為露露和娜娜的基因編輯嬰兒于11月在中國健康誕生。這對雙胞胎的一個基因經過修改,使她們出生后即能天然抵抗艾滋病。這是世界首例免疫艾滋病的基因編輯嬰兒。
(人民網2018年11月26日報道)
該事件由于涉及醫學風險、基因工程、人類基因庫潛在威脅和巨大的倫理問題,在短時間內就引發規模較大的討論和爭議,并且在該事件爆發之后的36小時內均處于發酵爆發狀態,未有明顯的反轉傾向。本研究對于事件數據的選取選用新浪官方大數據輿情平臺,對于該事件的信息做出采集和處理。微博信息數量變化如圖2。

圖2 11月26日—11月29日微博信息數量變化
由圖可見,在此時間段內,微博整體的信息數量變化與新聞媒體報道變化情況基本吻合。在72小時內,總信息數量為1579096條。
事件的發端時間為11月26日早10:00前后,此后傳播信息數量迅速增長。11月27日0:00—11月27日7:00之間的信息谷值區域為夜間時間段,而從7:00之后又開始按照之前的趨勢開始上升,11月27日早8:00—10:00為峰值區域,而8:30—9:30期間這一小時內微博信息數量達到最高峰值點,共85694條。由于本研究的模型預測的是信息快速傳播直到峰值點的傳播激活傳播狀況,因此樣本時間段需要選取從發端到信息回落的時間區段。基于該事件總時間的總體統計結果,觀測事件從發端到快速傳播期的時間點需要選擇11月26日10點前后,因此截取11月26日09:55到11月27日09:55作為樣本時間段,也就是傳播熱度增長期。
源頭微博為:“美聯社:南方科技大學研究人員賀建奎宣布完成全球首例基因編輯嬰兒”(2018年11月26日10時52分02秒)。在此事件段內,微博總數為884359條。最高峰值點時,微博數量為85694條。該時段內,微博新增信息量變化情況如圖3所示。

圖3 樣本截取時間段內微博信息增量情況
根據全網微博數據可知,其網絡結構符合BA無標度網絡特性。對粉絲數量分布(即節點度分布)進行擬合,發現分布符合帕累托分布,符合BA無標度網絡特點。通過進一步對該事件涉及的用戶進行粉絲分布的擬合,同樣符合BA無標度網絡特點。擬合結果為:
y=1503491x-x2.34
其中x為粉絲數量,y為該粉絲量對應的人數。擬合優度R2=92.4%。該事件中,涉及傳播的用戶共1775307人。考慮到計算機性能與運算安全性等因素,以節點數10000,冪指數-2.34構建BA無標度網絡。構建網絡后設置節點屬性,即節點影響力設置為一個在常數附近波動的隨機量,傳播意愿閾值thr=20,計算得常數α=0.25。
該事件呈爆發式傳播的時間段約為2018年11月26日11:00—11月27日23:59。選擇26日11:00-11:59非轉發的原創用戶,共12位,映射到構建的網絡中,映射方法為將這些原創用戶粉絲數量在本次傳播網絡中的排名對應至所構建網絡節點度的相應排名節點上。
圖4所示為部分節點(度>10)的激活情況,激活節點為黑色,未被激活的節點顯示為灰色。前4次度>10節點的網絡傳播仿真情況如下。
經過4次傳播后擴散到較大的范圍,同時,激活節點占總節點比例隨時間變化情況如圖5。

圖5 激活節點占總節點比例與傳播次數的關系變化情況
從仿真結果可以看出,傳播數量在前期大致呈指數增長后,傳播速度逐漸放緩。經過36次傳播后,網絡覆蓋率達到96.45%。仿真曲線增長趨勢與圖3描述的實際情況(去除夜間低活躍時段)的總體趨勢比較吻合,實際情況中的波動可視為其他因素的擾動。
總體來說,仿真效果與實際情況吻合。但從效果上來看,仿真結果與實際情況仍然存在不可避免的偏差。造成這些偏差值的主要原因是:其一,初始傳播源在實驗中的設定根據其粉絲數量映射到仿真網絡模型時,應從全網范圍進行考量,但由于無法得知這一規模的數據,因此使用了粗略的估計方法,這對傳播速率(特別是傳播開始階段的速率)有所影響。其二,由于模型主要基于事件的風險值和用戶風險感知情況展開,囿于篇幅限制,對于用戶的傳播習慣和偏好、傳播主客體間的特征等其他影響因素暫時沒有加入進去。這是模型本身需要改善之處。在心理實驗中,被試觀測事件微博屬于理想狀態,控制了被試的傳播涉入度、點贊、轉發數等其他變量,但實際微博傳播中變量比模擬狀態復雜,因此造成了一些程度上的偏差。其三,實際傳播時,傳播延遲以及時刻測算也是十分重要的因素,而本實驗將傳播按次數無差別演化,由此也會存在結果曲線視覺上的一些誤差。
要觀測事件的風險值對用戶的傳播意愿是否具有十分重要的影響,用戶對事件風險值的感知情況需要作為中間變量,串聯兩者,向后與傳播意愿存在logistic曲線關系,向前與事件風險值取對數后呈線性相關。除此外,傳播情況還與網絡結構、接觸的傳播者影響力、傳播源等相關,對于這一類事件的傳播現象本文從風險感知的角度進行切入建模,增加改進了以后模型的風險感知維度。
在風險感知測量方面,得出了風險感知狀況與傳播意愿的關系。在模型方面,建立了在風險感知基礎上,其他傳播影響因素隨機擾動的情況下爭議性科技事件在微博上的信息傳播模型,且效果較好。在已知某一事件的風險值及傳播環境的條件下,該模型能夠較好地預測事件傳播情況,模擬實驗的結果與實際傳播情況基本吻合,模型建立基本成立。在某些重大事件爆發時,相關部門能夠及時利用改進后的該模型進行事件傳播預測,并根據不同用戶的傳播意愿采取對應措施。
本文研究建立在以往情報學領域對于網絡輿情和微博傳播模型設計的原理上,建立了在爭議性科技事件的基礎之上的模型,較好地在這一類型的事件上增加了以實際用戶實驗為基礎的模型參數,而該模型的獨特意義也主要體現在前期實驗設計的參數上,即風險感知不只是對特定危險量的屬性的感知,還是對特定危險質的屬性的感知,如意愿性、可控性、潛在性等。由于這類事件的風險感知可以根據斯洛維奇的理論劃分為兩個維度(恐懼程度和未知程度)并根據級別進行測量,而科技事件的未知程度則可以根據網民的相關知識和學歷程度進行較為準確的預估,因此本模型對比其他通用性網絡輿情相對更加精確。在學科角度,本研究具有心理學、情報學、傳播學三門學科交叉的優勢,能夠從不同學科、不同層面對于該問題進行深入分析與探究,也初步解決了問題并驗證了研究目標當中的假設。
同時,在本文實驗原理的基礎上,加入傳播主客體特征,以及更多的能夠評價其他風險性事件中用戶感知程度的數據之后,使用統計學習的方法增加原始數據量,就能夠將事件進一步分類整合,對更多事件進行預測。下一步通過對于多個較為精確的單類事件的模型進行整合和優化,也將會整體提升通用型風險性事件模型的預測準確性。
本文局限之處在于,由于模型主要基于事件的風險值和用戶風險感知情況展開,對于用戶的傳播習慣和偏好、傳播主客體間特征等其他影響因素暫時沒有考慮,因此所設立的模型只是一個初步的原型,在預測精準度方面還有待提高,在進一步改進測量方案和模擬手段后,模型的實際應用效果將會大大提高。
注釋:
① 王煉、賈建民:《突發性災害事件風險感知的動態特征——來自網絡搜索的證據》,《管理評論》,2014年第5期,第169頁。
② 李鋒:《旅游危機后潛在旅游者的旅游從眾度變化過程研究——以四川“5.12”地震為例》,《旅游論壇》,2010年第1期,第16頁。
③ 成俊會、趙金樓:《基于信息風險感知的社交網絡輿情傳播模型研究》,《情報雜志》,2015年第1期,第134頁。
④ 趙文兵:《Web 2.0環境下在線社交網絡信息傳播仿真研究》,南京大學碩士學位論文,2013年,第65頁。
⑤ 賀幸:《微博影響力傳播模型的改進與驗證》,中國科學技術大學碩士學位論文,2014年,第19頁。