張薇薇 朱杰
關鍵詞:在線知識社區;知識貢獻行為;網絡百科;詞條質量;專業身份;知識質量
以維基百科為代表的在線知識社區的產生和發展,解決了傳統百科全書更新速度慢、出版周期長、內容審核效率低等問題。我國也相繼出現了百度百科、互動百科等大型中文百科知識社區。截至2018年10月,百度百科收錄詞條超過1500萬,參與編輯用戶數超過650萬,幾乎涵蓋了所有已知的知識領域。據調查,在線百科受到我國多數網絡用戶的推崇和使用.知識參與度和使用程度都很高。但是在線百科相比傳統百科,依然存在詞條編輯者專業水平參差不齊、內容質量與可信度較低的問題。例如,通過參考文獻分析發現,維基百科歷史類詞條質量與專業期刊文獻質量存在較大差距。如今,在線知識社區越來越重視內容貢獻者的專業身份,大量有專業知識及其愛好者的用戶逐漸成為知識社區的核心成員。一些百科知識平臺也制定了一系列與貢獻者專業身份有關的詞條創建、編輯與審核制度,鼓勵更多具有專業知識的社區用戶參與內容貢獻。
在線知識社區的內容質量一直是信息學界關注的重要問題。對于網絡百科這類大規模知識社區而言,訪問量、詞條編輯次數、貢獻者數量、生存期等,都可能成為影響詞條質量的前導因素。st.vilia B等針對維基百科提出一個包含內生、關系、聲譽三大類型以及若干細分計量指標的信息質量評估框架.張博等采用層次分析法建立了協同知識生產社區的內容質量評估模型。知識社區質量在貢獻者社會網絡“平衡一非平衡一動態平衡”的演化過程中會呈現螺旋上升趨勢_6]。此外,借助用戶群體認可.以使貢獻者獲得相應的社區榮譽和知識地位,可以有效提升知識內容質量和社區價值。也有一些研究尋求對知識內容質量的自動化評估,這方面文獻尤以維基百科詞條質量的研究居多。例如,Lira EPV等利用在線社區的協作屬性.設計相應模型計算詞條質量和貢獻者信譽值,Adler B T等基于詞語粒度構建模型以計算Wikipedia每個語詞的質量與可信度,Zeng H等基于句子分析粒度構建模型計算維基百科詞條每個片段的內容質量。,Suzuki Y基于h指數評估維基百科詞條質量。此外,國內學者基于分句粒度和詞條編輯歷史的文本修改記錄提出評估知識貢獻質量的方法,肖奎等應用迭代與向量標準化方法計算某個特定領域內各詞條質量值以及貢獻者信譽值。這些研究都十分關注貢獻者專業背景和信譽值對內容質量的評估作用。
目前關于在線百科知識貢獻者身份對內容質量作用機理與影響關系的研究并不多見。隨著在線知識社區的發展,內容更新速度加快,傳統的專職人員質量審核機制已無法滿足用戶需求。本文認為,自動化評估與人工審核各有利弊,前者效率高、成本低但準確性也低,后者準確性高但效率低、成本高。因此,有必要將兩種質量控制途徑結合起來。相比對知識內容進行審核的難度,對貢獻者專業身份的審查與級別認定實現起來要容易得多。因此,關于貢獻者身份對內容質量影響效果的研究可以更好地為在線知識社區管理與內容質量改進提供有力的理論指導與實踐參考。
1理論基礎與研究模型
1.1在線社區用戶身份交流理論
身份交流理論最初由Hecht M L提出,由個體身份、展示身份、關系身份、群組身份4個維度構成。個體可以基于對某個在線社區的歸屬感構建虛擬層面的社會認同.自我分類是社會認同形成的重要途徑之一。在線社區身份交流的重要性在于3個方面:幫助用戶有效獲取信息、激勵用戶參與社區活動、身份展示使用戶獲得更高層次的社區認同。用戶介紹、自我展示等是在線社區支持成員身份交流的技術途徑。用戶身份也是社會學習系統的核心概念之一.身份塑造是學習的重要組成部分,身份同時具有社會屬性(別人如何看你)和個體屬性(自己如何看自己)。研究表明來自他人的身份認同對在線社區成員知識貢獻有顯著影響,這也解釋了為何積分系統和用戶身份標識能夠驅動用戶知識貢獻。社會身份也是社群成員的自我認知,通過社群氛圍間接影響成員貢獻質量。針對維基百科內容質量評估模型的實驗研究結果發現.信息來源是內容質量最重要的指標,而貢獻者專業背景在信息來源中的權重遠大于其他指標。即用戶認為貢獻者專業背景對于內容質量的影響程度最大。而貢獻者專業背景的審核認證與等級標識均屬于用戶身份交流的一部分。
1.2內容質量感知的雙過程理論
就概念層面而言,質量被定義為“與卓越或者某些情形下真實度有關的用戶標準”:就操作層面而言,信息質量被定義為用戶認為信息是有用的、好的、及時的、準確的程度。在線知識社區用戶對內容質量的感知過程可用社會認知心理學領域的雙過程理論來解釋。雙加工理論及其模型在很多領域都有所應用,并且能夠成功解釋很多社會性判斷問題,包括說服式傳播、印象形成、個體感知和決策制定等。Petty RECJT在ELM模型中闡釋了說服式傳播的兩種路徑:一種是中樞路徑;一種是外圍路徑。研究表明,信息本身(例如信息組織、詳細程度等)和信息來源共同作用于用戶對知識內容的質量感知。根據推理,用戶對知識社區內容質量的感知同樣源于雙過程:基于線索判斷的啟發式評估,諸如社區類型、外觀設計、貢獻者專業身份等線索;基于內容本身的系統評估,即從質量的各個維度來判斷。
1.3研究模型
基于以上理論和實踐研究成果.我們提出本研究的2個假設:
H1:在線知識社區對貢獻者身份的專業認證程度越高,用戶感知內容質量越高。
H2:在線知識社區對貢獻者身份的專業標識等級越高,用戶感知內容質量越高。
研究模型示意圖如圖1所示:
2研究設計與數據采集
2.1研究設計與測量
如何對在線知識社區貢獻者身份進行構面區分和量化處理,以及如何測量百科知識的內容質量,是研究中的關鍵問題。
1)內容質量感知的測量
根據現有研究,在線百科內容質量可以劃分為內容、圖文、規則、分類、鏈接等多個維度。我們依據相關文獻研究成果,將在線百科內容質量劃分為4個維度:①D1-內容正確性;②D2-排版規范性;③D3-分類準確性;④D4-鏈接參考資料詳盡程度。每個維度采用1~5五級量表測度,分別表示感知內容質量從低到高。在各個質量維度上分別獲取被試者對來自不同知識社區和不同詞條的內容質量感知數據,然后以平均值來作為該詞條內容質量感知的度量。這種做法可以提高用戶對詞條內容質量感知結果的可靠性和有效性,進而提高研究結果的信度和效度。詞條選取原則遵循文獻的建議,所選素材均為科學、歷史、藝術類等專業性較強的詞條,排除娛樂、新聞、社會事件等非專業性內容。此外,所選詞條必須同時出現在各個百科社區中且含義相同或相近,同時控制貢獻者數量,使之在不同社區盡可能接近。經過反復挑選和比較,最終選定A1-“恩格爾系數”、A2-“聯合國”、A3-“RNA病毒”、A4-“C++”、A5-“印象派”5個來自不同專業領域的詞條。研究素材直接選用在線百科社區的詞條內容,被試者通過在線問卷中所給詞條鏈接進行訪問閱讀。