999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

群體極化還是協商調和?
——維基百科“Islamophobia”詞條實證研究

2019-08-31 06:23:50尚聞一車尚錕
圖書館論壇 2019年9期
關鍵詞:情感用戶

尚聞一,車尚錕

1 研究背景與文獻綜述

1.1 群體極化

隨著網絡技術的發展和網絡社會影響的擴大,特別是由網民開發工具、提供內容和建設社區[1]的Web2.0模式的高速推進,民眾在網絡空間中社會交往和活動的重要性日益增強。網民參與網絡信息處理與加工的門檻大大降低,信息加工與分享得以普及,于是全民的社會交往和活動向網絡空間拓展,大大加強了普通民眾公共參與的能力和意愿:“如果……在過去25年間個人傾向加強了,公共參與減少了,那么互聯網就是扭轉這種傾向的中心力量。”[2]在網絡社會中,民眾發聲能力強化,社會也就注入了新的活力。

網絡技術也為社會帶來隱憂,一種走向是極端思想的匯流和群體暴力的肆虐。古斯塔夫·勒龐(Gustave Le Bon)在《烏合之眾》中指出,作為行動群體一員的個人,其集體心理與個人心理有著本質差別,而其智力也會受到這種差別的影響,于是智力在集體中不起作用,而完全處在無意識情緒的支配之下[3]134-136。這種心理如果不加約束,就會導致“群體極化”(Group Polarization)問題。

托克維爾指出,個人主義會隨著身份平等的擴大而不斷在社會中擴散[4]625-627。在網絡社會中,身份平等正以遠勝托克維爾所處時代的程度在社會中擴大,個人主義傾向隨之伴生,這種傾向倘若任其發展,相互串聯,就會形成“群體極化”現象,即“團體成員一開始即有某些偏向,在商議后,人們朝偏向的方向繼續移動,最后形成極端的觀點”[5]47。受困于信息過載的網民有對信息過濾的需求,網站經營者又有對相似觀點的青睞,群體極化因而形成。群體極化藉由“虛擬串聯”進一步發酵,腐蝕“社會粘性”(SocialGlue)[5]41-67。

對群體極化問題,學界從不同角度進行討論。西方學者主要關注其機制的不同闡釋。Van Swol認為,群體極化的產生源于個體希望在群體中獲得認同,因此傾向持有與群體相似的觀點,并通過更極端化的表達彰顯其領袖地位[6]。Vinokur等指出,由于人們在不同觀點中普遍傾向選擇自己了解更多信息的一種,處在群體中的人們會自然地轉向這一群體普遍持有的觀點[7]。Abrams等則將這一現象歸因于“自我歸類”(Self-categorization):群體成員選擇相同的觀點是為了凸顯自己從屬于這一群體的身份特征[8]。

在對群體極化概念加以理解的基礎上,學界近年來一個重要的研究轉向是關注群體極化的測量。對此,這一發軔于政治學的概念不僅受到社會學和心理學等方面的關注,人機交互乃至信息系統領域的學者也試圖利用本專業的研究范式對群體極化現象加以度量。Isenberg使用實驗方法,論證社會比較(Social Comparison)和說服論證(Persuasive Argumentation)過程對群體極化的引發機制,指明后者的影響尤為重要[9]。Friedkin使用選擇轉向(Choice Shift)來度量群體極化,解釋了社會心理學視域下人際影響網絡的構成和地位結構對個體選擇變化的影響[10]。Dubrovsky等在人機交互視角下,通過實證研究,比較計算機媒介下和面對面溝通中決策小組地位的影響,也研究了這一過程中決策者傾向的變化和決策的轉變[11]。Sia等從信息系統研究角度出發,通過實證研究,引入統計學方法度量,以檢驗計算機輔助交流(CMC)與群體極化問題的關聯[12]。

應對網絡空間的“群體極化”問題,必須培養一種“協商調和”機制,即公民進行充分溝通和討論,以實現理性協商作為決策的前提。對此,在《網絡共和國》中提出要抑制群體極化的凱斯·桑斯坦(Cass Sunstein)從政府規訓角度提出解決方案,認為應由政府促成網絡空間中不同意見的協商[5]90。但僅僅依靠政府進行規制是不足的,網絡社區同樣可能內蘊著能夠促成“協商調和”的內部力量。在Web2.0大潮中,以此為宗旨的Wiki技術正在付諸實踐,先行者便是以維基百科為代表的在線協作書寫(Collaborative Writing)。

1.2 在線協作書寫:維基百科

維基百科是全球最具影響力的網絡百科全書,作為在線協作書寫的代表吸引學界的廣泛關注。周慶山等提出維基百科信息自組織模式的六種特征:中立定位、內容和用戶開放、協作共享、信息自組織管理和修改、信息增長、用戶互動形成規范[13],并注意到其協作書寫的基本屬性。維基百科的在線協作書寫特質,使之成為應對群體極化問題的一個有效嘗試。其對群體極化制衡作用的第一種途徑,是多元化、差異化的參與者組成。參與者的多元屬性是維基百科提高書寫質量、特別是抑制群體極化的秘訣所在。Arazy等注意到,維基百科致力于擴大編撰者群體的數量與差異性。而群體差異帶來的基于任務的沖突恰恰是提高詞條質量的重要因素[14];類似地,Wilkinson等考察了編輯行為和合作行為對詞條質量的影響,證實了編撰者的差異性和詞條質量呈現正相關[15]。這些差異性不僅有利于詞條質量的增強,更增加了維基百科編撰群體的異質性,使之不至于在討論之初便普遍具備某種偏向,從而抑制了群體極化的風險。

維基百科制衡群體極化的第二種途徑,是維基百科協作書寫的各種運行機制。Halfaker等對維基百科“拒絕”(reject)機制的實證研究表明:編撰者豐富的經驗并不能使他們在避免被拒絕時有所優勢;編撰者非常熱衷于維護自己的貢獻,盡管這種所有權意識行為(Ownership Behavior)不為維基百科的原則所鼓勵[16]。他們還在另一個研究中關注了維基百科的“復原”(revert)機制,發現復原機制盡管會在相當程度上打消編撰者(特別是新編撰者)的積極性,但積極影響大于消極影響,有利于維基百科維系其質量[17]。此外,王烽對維基百科擁有的一種獨特且相對完善的協商途徑——討論頁進行研究,發現“討論頁……不同于條目編輯頁直接對條目作出修改,而是通過志愿者對話的形式,對條目的內容與質量進行協商”[18]。這三種維基百科獨特的運作模式為詞條協作書寫提供了有效的協商機制,讓各種觀點充分交鋒,從而促進協商調和。

維基百科多元化的參與者組成和促進觀點充分交鋒的協商機制引起大量沖突,而這種沖突同時也是抑制群體極化、達致協商調和的關鍵所在。吳克文分析了互聯網群體協作中的沖突模式,提出基于段落編輯歷史的文本比較、沖突網絡的可視化和內容歸屬展示三種改進設計[19]。更多學者則針對某一個詞條進行案例分析,選取的詞條包括英文維基百科“Wukan protests”詞條(和對應的百度百科“9·21烏坎村事件”詞條)[20]、中文維基百科“南京大屠殺”詞條[21]和百度百科“11·13巴黎恐怖襲擊事件”詞條[22],分別從不同話語框架的建構對話語沖突的反映、在線記憶社群的協作與話語權爭奪、在線集體記憶有別于媒介報道的特點等角度,綜合利用編輯成員構成及其社會網絡分析、詞條篇幅變遷分析、討論頁分析等手段進行研究。這些基于某一詞條的案例分析并未試圖針對群體極化問題進行實證分析,但仍為本文提供了諸多借鑒。

綜上所述,對于在線協作書寫的代表維基百科與群體極化問題的關聯,學界已從參與者組成、協商機制和書寫中的沖突三個角度進行了充分的討論。“正如啟蒙運動引導了一個知識創造的新組織模型,新網絡也幫助把科學界轉變為一個逐漸開放和協作的網絡。”[23]163“大規模協作”的先驅維基百科并不掩蓋編撰者觀點的差異,相反,其運行機制為了避免百科全書成為某些特定群體的“回音室”,著力讓擁有不同背景、秉持不同觀點的編撰者相互協作。以此為背景,本文通過實證研究,討論維基百科在線協作書寫對群體極化的抑制作用。本文選取英文維基百科“Islamophobia”(伊斯蘭恐懼癥)這一極具爭議性的詞條,通過對其討論頁文本的情感傾向分析和對詞條編輯用戶的社會網絡分析,試圖回應如下問題:在維基百科運行中,參與協作的編撰者的意見在討論后是進一步分化,走向“群體極化”,還是會相互調和,實現理想的“協商調和”模式?

2 研究方法

在文獻調研的基礎上,筆者提出研究框架,見圖1。首先,收集英文維基百科詞條“Islamophobia”(伊斯蘭恐懼癥)討論頁(Talk Page)中的自然語言文本數據和詞條編輯歷史(Revision History)中的編輯數據;接著,展開兩個并行的數據分析過程:情感傾向分析和社會網絡分析;最后,對數據分析的結果進行評估與闡釋。

在研究框架中,兩個并行的數據分析過程——情感傾向分析和社會網絡分析在邏輯上相互聯系、相互補充。情感傾向分析討論頁中文本的情感傾向變化,反映用戶針對詞條內容進行相互溝通與辯爭時情緒和觀點的變化,關注用戶的討論行為;而社會網絡分析則針對編輯行為,依托詞條編輯數據,通過基于詞條編輯關系構建的編輯網絡,分析用戶的編輯關系變化,反映用戶對詞條進行編輯時立場的轉移,關注用戶的編輯行為。二者互為表里:編輯行為所處的立場,決定討論行為所秉持的觀點,而討論后觀點的變遷又深刻影響著下一步的編輯行為。本研究選用情感傾向分析和社會網絡分析,分別考察詞條發展過程中用戶討論行為和編輯行為的變化。通過對這兩種行為的度量,分析維基百科獨特的“討論頁”功能對用戶編輯行為的影響,從而理解維基百科在線協作書寫影響網絡民主的內在機制。

圖1 研究框架

2.1 數據收集

本研究選取“Islamophobia”(伊斯蘭恐懼癥)詞條作為數據源。“伊斯蘭恐懼癥”專指非穆斯林針對伊斯蘭信仰的原生恐懼與仇恨,這一說法最早產生于1970年代。2001年“9·11事件”后,隨著西方對伊斯蘭世界敵視情緒的增長而升溫,引起激烈辯爭。這一概念影響頗大,John Esposito等甚至撰寫專著進行探討[24]。

“Islamophobia”詞條的諸多優點使之成為群體極化問題研究的天然數據源。第一,這一詞條極具爭議性,關涉文明沖突、宗教對立和族群對話等母題,對其話語權的爭奪貫穿詞條編輯歷史的全過程,符合“群體極化”定義中“團體成員一開始具有某些偏向”的特征;第二,這一詞條影響力大,編輯次數逾5000次;第三,促成伊斯蘭恐懼癥升溫的“9·11事件”與維基百科的創建同在2001年,該詞條較早吸引了維基百科編輯用戶的關注,創建時間早。同時,盡管僅使用一個詞條存在樣本量不足而導致的效度問題,但該詞條較強的代表性和詞條內部較大的數據量可以在一定程度上克服樣本量的局限性。

該詞條自2003年創建以來,每年的編輯次數明顯波動:2003年22次;2004年118次;2005年792次;2006年、2007年達到峰值,均超過1000次;2008年后編輯次數高速下降,2008年303次;2009年跌至50次,從此再也沒有回到過峰值。密集編輯反映的是詞條熱度的變遷,當詞條熱度驟降,群體極化現象便不顯著。因此,本研究選取該詞條創建、發展至鼎盛期的討論和編輯歷史作為研究對象,截取2003-2007年討論頁中全部的討論文本和編輯數據進行分析研究。其中,討論頁記錄用戶有關詞條內容的辯爭、討論與協商,提供的自然語言文本數據能夠反映處于不同立場的討論參與者之間情感傾向的變化;而編輯數據記錄不同用戶對詞條修改的全部歷史,能夠揭示用戶之間的編輯關系,反映編輯用戶對詞條內容話語權的爭奪。在數據分析階段,本文對討論頁文本數據進行情感傾向分析,對編輯數據進行社會網絡分析。

2.2 情感傾向分析

對數據收集階段獲取的2003-2007年記錄于討論頁的全部文本(詞條討論頁Archive1-10及Archive11的前33組數據),首先在預處理階段進行數據清洗,對換行問題和部分元數據的缺失進行自動修復,并將清洗后的數據以一組對話為基本單元、以討論對話的縮進作為判定對話對象的標準,創建情感傾向分析的數據源。為了得出每一組對話的情感傾向,研究使用三個模型進行訓練。

(1)利用自然語言處理工具NLTK自帶的、基于電影評論文本及其對應情感傾向數據訓練的樸素貝葉斯(Naive Bayes)模型(使用的數據集為nltk.corpus中的movie reviews),使用NLTK提供的分類器直接進行訓練[25]。使用這一分類器是機器學習領域的通用方法,優勢在于作為訓練數據的電影評論文本較為完備、標簽也較為細致:內置的情感分析相關語料既包含整個句子的三元分類標注,也包含重要情感詞的情感傾向數值(為[-1,1]區間內的一位小數)。因此,利用NLTK內已集成好的樸素貝葉斯分類器既可以輸出情感傾向的三元分類值(-1、0、1,即反對、中立、支持),又可以輸出具體的極性值(即[-1,1]區間內的、表示情感傾向具體強度的任意一個小數)。訓練數據共有2000條,按照4:1劃分訓練集與測試集;最終的訓練集共有1600條、測試集共有400條數據,準確率達73.5%。

(2)利用卷積神經網絡(CNN)訓練互聯網電影數據庫(IMDb)共10662條電影評論文本及其對應的情感傾向數據,選取這一訓練集同樣沿用機器學習領域通用的做法,旨在利用其完備的數據集以達到良好的訓練效果。每條數據由兩個部分組成:評論文本和對應的情感傾向(標簽為pos或neg,分別表示積極和消極),10662條數據中正負向情感的訓練數據各一半。參考Kim在多項任務中獲得“頂尖水準”(state of the art)的模型[26],對這些以txt格式存儲、包含文本和類別標注的訓練數據進行深度學習。在具體實現中,使用Tensorflow作為深度學習框架,構建包含詞嵌入(Word Embedding,將自然語言詞語轉化為高維向量)層[27-28]、卷積層、池化層以及隨機失活方法和softmax決策函數的模型,采用L2正則化技術避免過擬合。模型在詞嵌入層設置窗口大小為5、詞語向量維度為128,共訓練200輪次(epoch),每一輪次150批(batch)。同樣按照4:1劃分訓練集與測試集,最終的訓練集為8530條、測試集為2132條,通過調參,準確率可達到85%。

(3)考慮到上述兩種基于機器學習的方法所使用的訓練數據都是電影評論文本,而非Wikipedia討論頁文本,因此本研究使用基于規則的方法,以詞語為特征進行基于規則的匹配,從而為情感傾向判定提供補充。研究采用在WordNet詞集[29]基礎上擴展而出、被廣泛應用于情感識別任務的情感語義網詞集SentiWordNet[30-31]。這一詞集共包含100000多個詞條記錄,每個詞條記錄由詞性、詞條編號、正向情感值、負向情感值、同義詞詞條名和注釋組成。因為詞集共包含名詞、形容詞、動詞和副詞四種詞性,每個詞語可以具有多個詞性,在不同詞性下對應的情感傾向值也不同。所以,本研究通過詞性識別和詞形還原(基于NLTK工具包的句法分析和詞形還原工具實現),得到文本中每個詞語的詞性和原始詞形(去掉復數、動詞時態等),然后通過停用詞表進行詞語過濾,將選中的詞語根據詞性在詞集中搜索其對應的正負向情感傾向值,將段落中所有選中詞語的正向情感傾向值和負向情感傾向值分別累加,根據二者的相對大小關系判定每段對話的情感傾向。

上述3種模型是情感分析中最為主流、性能最為優越的幾種模型。不過,這3種模型各有優劣,為進一步提高結果的信度,采用集成學習中并行集成[32]的方法,將3個模型結合起來以提高準確率。由于前兩種模型均為基于電影評論數據進行機器學習得到的模型,為平衡機器學習方法和基于規則的方法,將基于規則的模型3賦予2倍的權重,3個模型的最終權重比例為1∶1∶2。通過加權和集成,得到最終的情感分析結果:對每一條評論,在1(正向情感)、0(中立情感)和-1(負向情感)中輸出一個情感傾向的取值。

2.3 社會網絡分析

對2003-2007年全部編輯數據,提取每次作出編輯行為的用戶ID及其編輯時間,按照時間順序排列。然后,對每次編輯,以作出編輯行為的用戶作為發起方、以該次編輯所對應的上一次編輯的用戶作為接收方,建立一組關系(其意義為,用戶的編輯行為代表作出這次編輯的用戶對上一次編輯的用戶的修改)。以這些關系為數據源,分別建立基于全部數據的詞條整體社會網絡,以及基于2005年及更早、2006年和2007年三段編輯數據(這三段數據大致相等)的3個分時段子網絡(按照時間順序依次命名為分時網絡A、B、C)。

首先,對網絡中的互惠性關系進行分析。互惠性是度量有向網絡中兩個節點相互連接程度的指標[33]55-56。由于本文中的社會網絡由以時間為順序的編輯數據構建,網絡中的互惠關系實質上是一種“A修訂B,B反過來修訂A”的交替修訂關系,反映的是尖銳的沖突和話語權爭奪。剔除網絡中反映自反關系的數據(即連續兩次修改都由同一個用戶作出,代表用戶進行自我修訂)后,本研究首先計算詞條整體社會網絡互惠性關系的占比;隨后,對三個子網絡分別計算互惠性關系的占比,從而得到互惠性關系占比變化的趨勢。

其次,分別對整體社會網絡和3個子網絡,使用在時間效率和準確性上都很優越的Louvain模塊化算法進行社群發現,以探測復雜網絡中的社群結構。這一算法分為兩個階段:第一階段將節點不斷加入到能使局部模塊性(Modularity)達到最大化的社群中,第二階段則從第一階段的結果出發構建一個新的網絡。二者不斷迭代,直到各個節點所屬的社群不再發生變化。這一用于計算模塊性的公式為:

其中,△Q為模塊性的增量,∑in為節點被歸入的社群內部所有邊的權重之和,∑tot為指向這一社群中所有頂點的所有邊的權重之和,ki為指向頂點i的所有邊的權重之和,ki,in為從頂點i出發并指向這一社群內所有頂點的所有邊的權重之和,m為整個網絡中所有邊的權重之和[34]。整體社會網絡社群發現的結果被呈現于開源可視化和網絡分析平臺Gephi[35]中,利用Force Atlas算法進行布局,并基于Laplacian動力(Laplacian Dynamics)方法[36]對社群劃分后的網絡進行可視化呈現。

最后,對3個分時網絡的社群發現結果進行橫向比較,計算3個網絡間的社群相似度。這種相似性計算實質上是數據結構“圖”的相似性計算。衡量相同用戶在不斷時段所屬社群的關系,實質上就是不同圖的公共頂點間邊的重合度的計算。在3類主流的圖的相似性算法(精確計算[37]、基于圖的特征屬性計算[38]和基于頂點相似的迭代計算[39])中,因為本研究處理的數據集較小,不受到算法復雜度的過度制約,無需降低精確度以換取時空代價,所以采用復雜度和精確度都較高的精確計算方法,比較圖公共頂點間邊集合重合的比例,將這一比例定義為社群相似度。此處,邊的重合的意義為:同時出現在兩個子網絡中的用戶,在兩個網絡中屬于同一個社群。

3 結果討論:在線協作書寫中的協商調和

3.1 情感傾向:組內趨向激烈,組間趨向緩和

對本文2.2中得到的情感分析結果,分別進行組內情感傾向變化分析和組間情感傾向變化分析。對前者,選取在同一組討論中至少有兩次對話的兩個用戶,比較其前半段對話與后半段對話的平均情感傾向;對后者,選取至少在兩組討論中有過對話的兩個用戶,比較其在前一半討論中與后一半討論中的平均情感傾向(若同一組討論中對話次數或討論組數為奇數次,則將處于中間位置的一次對話或討論歸于前半段對話或前一半討論)。

在組內比較中,在剔除同組討論前后半段對話情感傾向一致的數據后,以同組討論中兩位用戶對話的次數為標準,分別計算不同次數下情感傾向上升的比例。如表1所示,組內情感傾向上升的總數目占據少數。其中,在同組討論中兩名用戶有2~3次對話時,后半段對話相對于前半段情感傾向上升的比例在50%左右;而有4~8次時,情感傾向上升的比例下降到42.42%,明顯低于情感傾向下降的比例;當同組討論對話數目進一步增多到9次及以上,這一比例繼續下降到41.67%。這一結果表明,當兩名用戶在同一組討論中進行少量(2~3次)對話時,其情感傾向在討論前后的變化并無明顯的偏向,上升與下降的可能性相仿;隨著對話的深入,在往復交流中,情感傾向越發可能隨著討論的持續而趨于下降。總的來看,兩名用戶在同一組討論后的情感傾向相對于討論前會趨于激烈。

表1 組內情感傾向變化

在組間比較中,同樣剔除前一半討論與后一半討論平均情感傾向一致的數據,以兩位用戶參加討論的組數為標準,分別計算不同組數下情感傾向上升的比例。如表2所示,組間情感傾向上升的總數目占據多數。其中,在兩名用戶參與2~3組討論時,后一半討論相對于前一半,其情感傾向上升的略高于50%;而在參與4~8組時,情感傾向上升的比例迅速增長到60%,明顯高于情感傾向下降的比例;不過,這種偏向不會始終持續,當兩名用戶參與討論的組數繼續增多(達到9次及以上)時,情感傾向的偏向出現逆轉,上升的比例小于下降的比例。

表2 組間情感傾向變化

組間分析的結果表明,當兩名用戶參與討論組數較少(2~3組)時,在靠后討論中的情感傾向比靠前討論中的傾向,上升的可能性略高于下降的可能性。隨著兩名用戶討論話題的增多,彼此之間更加熟悉、更加理解,情感傾向上升的可能性大幅增加,明顯高于情感傾向下降的可能性。但當兩人繼續圍繞不同的話題討論,在往復交鋒中,情感傾向下降的可能性反而會逆轉、超越上升的可能性。不過,這一異常情況僅涉及6組數據,可能屬于樣本量規模過小而出現的偶然情況。這一異常并不妨礙組間比較的總體結論:當兩名用戶進行2組或以上討論時,靠后的討論的情感傾向相對于靠前的討論整體會趨于緩和。

綜合上述結果可以發現,在組內比較時,隨著時間的推移,用戶討論的情感傾向更多地向負向移動,情感趨于激烈。而在組間比較時,隨著兩名用戶參與討論次數的增多,情感傾向更多地往正向移動,情感趨于緩和。

3.2 社會網絡:用戶社群重組,編輯關系協調

對本文2.3所建立的整體社會網絡的互惠性關系進行分析,發現互惠性關系共有712條,占全部非自反性關系的35.55%。這意味著:平均每三次編輯行為,就有一次以上是對針對自己的修改而反過來所作出的重新修訂。這一比例反映出對“Islamophobia”詞條極為激烈的話語權爭奪。大量編輯用戶并不滿意他人對自己所編詞條文本的修改,因而要對新的版本再行改正。當然,第二次修改往往并非對他人的修改作簡單撤銷、恢復原狀,詞條也正是在這樣的交替修改中日臻完善。然而,這種對他人修改自己版本的重新修訂,仍能非常清晰地反應出對詞條編輯主導地位的爭奪。

由表3可見,分時網絡的互惠性關系占比呈現出鮮明的下降趨勢:從分時網絡A的41.72%下降到分時網絡B的38.81%,并在分時網絡C中驟降為26.82%。這一趨勢表明,在他人對自己的版本進行修改后,越來越少的用戶會立即反過來對新的版本再行修訂。盡管直到2007年,互惠性關系的占比依然可觀,但話語權爭奪激烈度呈現出逐年降低的趨勢仍是極為明晰的事實。隨著時間推移,更多用戶選擇接受他人對自己的修訂。這一方面反映出原始編輯用戶對針對自身的修改愈發樂于接納;另一方面則反映出第一次修改本身趨于理性。二者相輔相成,共同促成編輯關系逐漸由對立變為協調。對整體網絡社群發現的結果將整體網絡分成7個社群,如圖2所示。

表3 互惠性關系占比

圖2 “Islamophobia”詞條編輯的社會網絡

將對50位及以上用戶作過修改的用戶定義為核心用戶,并將對20位及以上用戶作出過修改的用戶定義為活躍用戶,可以發現:盡管并不存在一位或幾位起到絕對主導地位的用戶,但用戶的社會網絡仍很不平衡。大部分編輯行為由少量核心用戶和活躍用戶作出,而這些用戶的分布非常集中。6位核心用戶全部處于社群A(Nysin、Netscott、 Raphael1、 SlimVirgin) 和 B(Karl Meier、YahelGuhan)中;而22位活躍用戶中,處于社群A和B的也分別有9位和10位,另外3位分處社群C和D中。當用戶被分為一個社群時,表示這些用戶間有密集的相互編輯行為。因此,對整體網絡社群發現的結果揭示:“Islamophobia”詞條2007年及以前的編輯行為主旋律是以一批核心用戶和活躍用戶為領導、圍繞兩個“核心戰場”展開的激烈交鋒,并在次中心的其他戰場上開展不同程度的話語權爭奪。

對三個分時網絡間社群相似度的比較,首先要抽取分時網絡的公共頂點。分時網絡A與C僅有兩個不存在公共邊的公共頂點,且這兩個頂點同時存在于分時網絡B中。這表明不存在同時活躍于2005年及以前和2007年,卻在2006年沒有作出任何編輯行為的用戶,顯示出用戶編輯行為的連續性。在時間上連續的分時網絡A與B和B與C分別有10個和14個公共頂點,這些頂點間分別形成了29條和43條邊。但是,兩個網絡(組)公共頂點組成的這些邊中分別僅有3條和6條公共邊,因此,兩組分時網絡的社群相似度都處于0.1~0.15這一極低的區間內(見表4)。由于社群相似度由公共頂點間邊的重合比例定義,這一數據意味著在上一個時間區間內屬于同一個社群中的用戶,在下一個時間區間的網絡中有極大概率分屬于不同的社群,亦即:在兩個不同時段內,編輯用戶很少與同一位用戶發生密集的相互編輯關系,而是會轉向新的用戶。

表4 網絡間社群相似度

這一發現進一步說明了互惠性關系分析中得到的結論。在一個時段中產生頻繁相互編輯關系、進行激烈話語權爭奪的兩位用戶,有的在下一個時段中仍然活躍,但卻不再頻繁地相互編輯。這表明,在詞條修訂的過程中,大部分的爭論都能夠隨著時間的推移達成共識或妥協。對一位活躍于兩個時段的編輯用戶而言,上一時段的辯爭并不持續到下一時段。新的爭論隨著時間的推移繼續產生,盡管用戶過去的辯爭對手依然在頻繁參與(詞條)編輯,但在新爭論中,其辯爭對手卻往往出現了變化。在編輯的過程中,編輯用戶的社會網絡不斷重組,反映出編輯關系從對立到協調的變化趨勢。

4 結論

通過對英文維基百科詞條“Islamophobia”討論頁文本的情感傾向分析和詞條編輯用戶的社會網絡分析發現,就討論頁文本的情感傾向而言,在同一組討論內用戶的情感傾向隨著時間的推移趨于激烈,而在不同組間的討論中卻趨于緩和;就詞條編輯用戶的社會網絡而言,反映“A修訂B,B反過來修訂A”的互惠性關系比例逐年降低,編輯網絡也大規模重組,即與某一編輯用戶同屬于一個社群、有著密集相互編輯關系的用戶組成,在不同時段中呈現出明顯的差異。

這些發現表明,討論頁中用戶之間的討論微觀上趨向激化,宏觀上趨向緩和;用戶之間的編輯關系由對立變為協調。微觀的激化與宏觀的緩和、編輯關系的協調之間并不矛盾。相反,正是這樣一種激烈討論與迭代修訂的過程,構成維基百科獨特的協商調和機制:它不掩飾觀點的分歧,反而通過提供討論頁這一渠道促成迥異觀點間的充分對話。這種對話在某一組討論的過程中趨向激化,卻讓對立的觀點在盡情碰撞中促成理解之同情,“人們因此持續擴大自己的視野,并且經常以另一種觀點來測試自己原有的觀點”[5]137,推動不同立場間的相互理解。于是,一組討論中愈發激化的情感傾向沒有讓辯爭的雙方彼此對立,加劇用戶編輯過程的話語權爭奪。與之相對,隨著時間的推移,用戶的編輯行為整體趨于理性。于是詞條質量在討論中得到提高,協商調和在辯爭中得以實現。

本研究最突出的局限性在于:盡管從計算社會科學角度進行的實證研究證明,在“Islamophobia”編輯中觀點的激烈碰撞會促成整體討論趨向緩和、編輯關系趨向協調,但這種促進關系發揮效用的具體機理仍有待詳細說明。另外,對某一個詞條討論和修改歷史的深度挖掘能夠證明在這一詞條的發展過程中,協商調和而非群體極化占據主流,卻不足以說明由以宗教為議題的“Islamophobia”詞條得到的這一結論,普適于浩如煙海的各個主題的維基百科條目。而使用計算機自然語言處理技術盡管能夠部分反映情感傾向,但計算機技術對復雜的自然語言文本的理解仍有較大的局限性。

針對未來研究的改進方向,最直接的是利用定性方法對詞條討論中觀點的碰撞是如何導致詞條編輯行為趨于理性的具體機理加以闡釋。此外,在維基百科其他詞條中進一步驗證本研究通過個案得到的結論,以增強其說服力;使用維基百科討論頁文本作為訓練數據進行機器學習,以優化集成學習中機器學習模型的效果,從而提升情感分析算法的整體信度,也是本研究方法論層面的一個改進方向。最后,對于組間情感傾向變化在兩位用戶進行9組及以上對話時異常值出現的原因,需要用其他數據加以驗證。

本研究的意義在于:通過對“Islamophobia”詞條的案例研究,對網絡社會的重要議題——群體極化問題從實證的角度作出了驗證。從方法論意義上,研究通過集成機器學習算法和基于規則的方法并行集成建立的模型進行情感分析、通過社群發現算法和圖的相似度計算的思想進行社會網絡分析,所建立的研究框架具有獨創性;同時,這一框架具有較強的可復制性,可以在類似的計算社會科學研究和其他領域中推廣。從內容意義上,研究初步證實了維基百科存在一種討論與修訂相結合、在觀點激烈交鋒中促成編輯行為協調的協商調和機制。這一在線協作書寫中的機制對于抑制群體極化問題存在重要意義,值得新時期網絡社會建設借鑒。

在新時期,各種立場的聲音在網絡上層出不窮,其中褊狹、激烈的聲音不在少數,稍有不慎,就會因虛擬串聯而無限放大。所以,警惕網絡空間中的群體極化,保證社會粘性,是不容回避的問題。但是,即便是提出“群體極化”盛世危言的桑斯坦也認為:盡管新科技可能造成莫大的危險,但“它們帶來的希望遠多于危險”[5]142。一個由政府調控進行外部規訓、(由)網絡空間建立內部協商機制的環境,足以使網絡這一新科技成為協商溝通機制的推動者,一如文字、紙張與印刷術在歷史中起到的作用。維基百科便是建立這種環境的一個絕好范本。Rask指出:“盡管通常來說,維基百科更適合來自發達國家的參與者。但發展中國家的參與者一樣可以從中受益。”[40]我國當然不必對維基百科的模式亦步亦趨,但通過討論頁刻意凸顯而非掩蓋群體差異、在激烈的討論中讓觀點充分交鋒而達成協調的理念,卻是利用在線協作書寫以發展協商調和、抑制群體極化的良好思路。

英國思想家約翰·密爾(John Stuart Mill)說:“(與不同于自身的人、不熟悉的思想模式)溝通一直是,尤其對現在來說,是我們進步的主要來源之一。”[41]135并不過分地說,維基百科正是一個在網絡空間中促成這種溝通,抑制群體極化的有益嘗試,其理念與運行機制,值得持續地研究、反思與借鑒。

猜你喜歡
情感用戶
如何在情感中自我成長,保持獨立
被情感操縱的人有多可悲
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
如何在情感中自我成長,保持獨立
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
情感移植
發明與創新(2016年6期)2016-08-21 13:49:38
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 国产国模一区二区三区四区| 全色黄大色大片免费久久老太| 国产成人综合久久精品尤物| 国产三级国产精品国产普男人 | 亚洲狠狠婷婷综合久久久久| 毛片在线看网站| 国产成人精品高清在线| www精品久久| 手机在线国产精品| 国产乱人激情H在线观看| 香蕉eeww99国产在线观看| 亚洲成人黄色网址| 日韩成人免费网站| 91小视频版在线观看www| 波多野结衣一区二区三视频| 亚洲动漫h| 久久久久青草线综合超碰| 久久综合伊人77777| 91视频区| 亚洲欧美在线综合图区| 九色在线视频导航91| 99re这里只有国产中文精品国产精品 | 无码精油按摩潮喷在线播放| 亚洲Av激情网五月天| 国产精品视频猛进猛出| 国产手机在线小视频免费观看| a免费毛片在线播放| 91精品啪在线观看国产91九色| 欧美成人国产| 久久久久无码国产精品不卡| 狂欢视频在线观看不卡| 成人免费午夜视频| 国产一国产一有一级毛片视频| 99re免费视频| 久久人人97超碰人人澡爱香蕉 | 亚洲国产精品成人久久综合影院| 永久成人无码激情视频免费| 精品无码国产一区二区三区AV| 亚洲一级毛片在线播放| 在线综合亚洲欧美网站| 亚洲开心婷婷中文字幕| 国产在线自乱拍播放| 国产精品v欧美| 欧美自拍另类欧美综合图区| 国产美女主播一级成人毛片| 色综合成人| 中文无码精品A∨在线观看不卡| 国产女人在线观看| 亚洲国产欧美目韩成人综合| 98精品全国免费观看视频| 极品私人尤物在线精品首页| 无码人妻免费| 日韩精品成人在线| 在线视频一区二区三区不卡| 亚洲黄色网站视频| 久久婷婷五月综合色一区二区| 人妻21p大胆| 日韩A级毛片一区二区三区| 日本手机在线视频| 九色国产在线| 华人在线亚洲欧美精品| 国产精品无码作爱| 国产女人18水真多毛片18精品 | 欧美区一区二区三| 欧洲熟妇精品视频| 久久a级片| 国产亚洲精品97在线观看| 欧美三级视频网站| 丝袜无码一区二区三区| 国内精品视频区在线2021| 中国一级毛片免费观看| 3344在线观看无码| 亚洲色图欧美在线| 久久视精品| 亚洲色图欧美激情| 九九视频免费看| 丁香婷婷久久| 免费毛片全部不收费的| 国产视频入口| 婷婷综合亚洲| 午夜欧美理论2019理论| 精品一区二区三区自慰喷水|