張朝旭,劉 云
(北京交通大學通信與信息系統北京市重點實驗室,北京100044)
隨著互聯網進入Web2.0時代,社交網絡作為Web2.0中的典型應用和創新2.0模式在互聯網領域的典型體現,逐漸成為當前互聯網領域的一個研究熱點。
眾多社交網絡服務(SNS)網站在提供應用服務的同時都積累了海量的數據信息,包括用戶個人信息、用戶關系信息,以及用戶之間的交互信息。用戶數目多、數據量大、用戶關系復雜,龐大而冗余的數據集給用戶行為分析、用戶發現潛在好友和興趣空間都造成了困難。建立一個合理的感知模型,通過科學的方法和手段從這些海量的數據中更加準確和快速地感知用戶所需要的上下文信息,就可以幫助社交網絡的運營商及時準確地掌握用戶的興趣或行為的變化情況,更好地支持社交網絡中的用戶行為分析、潛在好友推薦等系統應用。本文利用CSCW領域相對成熟的感知模型,結合社交網絡基于關系的基本特性,提出一種新穎的基于關系的社交網絡感知模型。
社交網絡作為Web2.0的典型和熱門應用,是以一定的社會關系或共同興趣為聯系紐帶,提供各種形式在線聚合服務的互聯網應用。社交網絡是由眾多節點以及節點之間的連線構成的一種社會結構,節點通常是個人或者群體,節點之間的連線表示的是個人或群體之間的關系。通常是社交網絡代表各種社會關系,通過這些社會關系,把從偶然相識的泛泛之交到緊密結合的家庭關系的各種人或群體串連起來。社交網絡是一種基于網絡的服務,并且為用戶提供以下幾種功能:
(1)在系統范圍內,創建并共享一個公開或半公開的個人資料;
(2)提供與他們共享同一個連接的其他用戶列表;
(3)查看和遍歷他們的好友鏈接列表和其他用戶的好友鏈接。
即使在CSCW領域,對于感知也并沒有明確的定義,但存在一個普遍認同的共識,即感知是個人或群組主體對周圍環境上下文的了解和認知。其中對周圍物質環境的認知稱為環境感知,在社交網絡中表現為社交網絡規模、特征、性質和結構等內容的感知;對社會環境上下文的認知則稱為群體感知,在社交網絡中表現為對網絡中用戶身份、共享的資源、用戶活動等的感知[1]。社交網絡和CSCW群組的幾個主要差異如表1。

表1 社交網絡和CSCW群組比較[2]
由表1可見,社交網絡與CSCW中的群組最大的區別在于前者以社會關系和個人興趣空間作為基礎,而后者以任務為基礎。CSCW領域中環境感知和群體感知的內容都可以歸為上下文信息。上下文信息是用戶在與社交網絡應用程序交互的過程中產生的一系列數據集合,包括社區的環境信息,如社區規模、個人中心度、網絡集中性等;也包括群組信息,包括群組中其他用戶的身份,共享的資料(如興趣、偏好、位置等),用戶的活動(如發布狀態、共享日志、上傳照片等),用戶的社會關系(如用戶的好友資料、參加的小組等)等。
對于群體感知技術的主要研究方向有2個:(1)群體感知模型的建立。(2)感知的具體實現手段。其中前者主要研究群體感知的形式描述和性質刻畫,后者主要研究的是具體的感知功能實現技術。本文研究的重點是前者群體感知模型的建立。當前出現的群體感知模型有以下幾種:基于空間對象的感知模型、基于角色的感知模型、基于任務的感知模型和基于用戶的群體感知模型。下面對幾類模型的原理和特點做簡要的分析。
其中Benford和Fahlen提出的基于空間對象的感知模型[3],利用對象的空間特性作為2個對象之間交互的基礎,通過對象的影響(aura)空間和興趣(focus)空間的交并關系描述2個對象之間的感知強度。但作者只提出了一個模型的概念,缺乏具體的理論推導過程和精確的感知強度計算方法。
葛聲等人提出了一種基于角色的群體感知模型及其實現機制[4~5]。該模型通過任務分解和角色細化,對用戶活動進行基于角色的集合劃分,然后根據角色差異度確定用戶和活動之間的感知強度。該模型是建立在模型靜態的假設之上,無法適用于結構動態變化的群組,更無法應用于用戶可以自組和定義群組結構的社交網絡。
閆臨霞和曾建潮提出了一種基于任務的群體感知模型[6],并提出了該模型的形式化描述[7]。該模型認為用戶通過任務建立彼此之間的聯系,并且任務對群體感知特性的刻畫粒度要比角色更細。但該模型對感知粒度的控制還是比較困難,難以描述動態變化的感知信息。
丁振國等人提出了基于用戶的細粒度可控的群體感知模型[8],該模型基于多成員組成的有機群組結構和事件處理機制,通過對用戶的角色和任務分解來計算協作感知強度。試圖解決感知粒度的控制。可存在著角色和任務難以分解的問題,而且也沒有給出具體的實現機制。
由于以上提到的現有群體感知模型均是為CSCW系統而設計的,而且存在感知強度無法精確量化、難以描述動態變化感知信息等問題。在CSCW領域,通常采用任務、角色和活動這3個基本元素來描述群組結構,以此為基礎構建群體感知模型。而社交網絡的核心是用戶之間的社會關系,不是基于任務、角色等其他屬性的。因此在社交網絡中研究的主體往往不是單個的用戶或者群體,而是2個或多個用戶之間的關系,并且用這種關系來描述群組結構。
結合社交網絡的這個特點,提出了下面基于關系的社交網絡感知模型。
互聯網上的用戶關系指的是2個或多個用戶之間的資源交換,每一次用戶之間的資源交換都可以認為是一個用戶關系的基本單位,發出資源交換請求的用戶稱為關系請求方,接受資源交換請求的用戶成為關系接受方。而每一種類型的交換都可以認為是一種互聯網用戶關系。
最早互聯網上的關系的形成是MSN、QQ、Gtalk等即時聊天工具(IM)構建的一種雙向的關系,這種關系需要一方發出請求,另外一方接受請求后才構建的。這種雙向用戶關系可以用無向圖來表示。之后以Twitter和新浪微博為代表的社交網絡,將原來的雙向用戶關系切割成2個單向的關系。用戶可以主動關注別人,但是別人不一定要反過來關注,甚至可以屏蔽對方。實際上這種單向的關系是IM中雙向關系的一種延伸,用戶相互關注其實就可以認為是一種IM上的好友的關系。而這種單向的用戶關系可以用有向圖來表示。
社交網絡中存在著一個由用戶自主維護的關系矩陣,該矩陣不僅能表示用戶關系的數量,也表示用戶關系的質量。而這2者正是衡量用戶關系的2個基本元素,也是維持社交網絡正常運作的2個關鍵因素。其中關系數量可以用關系復雜度來衡量,而關系質量則用關系強度表示。
根據關系復雜度,社交網絡模型可以分為單一關系社交網絡模型和多關系社交網絡模型[2]。單一關系模型中只存在一種類型的用戶關系,可用有向圖來表示。其中有向圖的頂點表示用戶,邊表示用戶關系。而多關系模型中存在多種類型的用戶關系,如同事、親屬、好友等。可用有向染色圖來表示,其中有向染色圖的頂點表示用戶,邊表示用戶關系,顏色表示關系的類別,如圖1。
而關系強度,是對相同關系質量或者說強弱度的描述,如剛認識的人、普通好友和特別關注的好友等。關系強度通常包括用戶之間的緊密度、信任度、親密度、關系持續性和交互頻度等基本屬性。根據關系強度,社交網絡模型可以分為強關系模型和弱關系模型。弱關系通常存在于非親密交互和偶然性關系當中,如社交網絡中對陌生人發表狀態的共享;而強關系則表示具有較高親密度的關系,如社交網絡中對好友上傳照片的分享和評價。

圖1 社交網絡的有向圖和有向染色圖表示
由以上分析可知,社交網絡中關系的強度和復雜度是描述社交網絡感知模型的2個基本元素。我們通過社交網絡中的關系強度和關系復雜度,更加科學和有效地刻畫和描述社交網絡的感知特性,構建了基于關系的社交網絡感知模型。
本文將基于關系的社交網絡感知模型(Tiesbased Social Networks Awareness Model,簡稱TSNAM)定義為如下二元組:

其中C表示的是關系復雜度(Complexity),而I表示的是關系強度(Intensity)。
(1) 社交網絡中存在多種類型的關系,一般用多關系模型表示。因此社交網絡的關系復雜度可以用下面的無向染色圖公式表示:

其中USERsn表示頂點集合,也就是用戶集;TIEsn表示邊集合,也就是用戶關系集合;而COLOR表示的是顏色集合,也就是用戶關系類別。
(2)對于關系強度,我們可以用2個用戶之間的感知強度來表示。當2個用戶user1和user2之間的距離Length(user1, user2)最近的時候,他們彼此之間的感知強度最大。計算方法如下:

其中k是經驗系數。在不同的社交網絡和不同的應用場景中,取不同的值,以得到最為準確的感知強度計算方法。
本文在深入研究群體感知模型的基礎上,提出了基于關系的社交網絡感知模型。
由于感知技術和模型是社交網絡研究領域的主要組成部分,而社交網絡的根本是用戶的社會關系和興趣空間。因此本文提出的基于關系的社交網絡感知模型,對于實際社交網絡中的上下文感知有著很好的應用。適用于社交網絡中的用戶行為分析、潛在好友發現以及推薦等應用。
而本文下一步的工作是對基于關系的社交網絡感知模型,提出一個合理高效的算法和科學可行的實現機制,并且通過仿真過程驗證模型的科學性、算法的復雜度、實現機制的可行性。
[1] Joachim Kimmerle, Ulrike Cress. Group awareness and selfpresentation in computer-supported information exchange [J] .International Journal of Computer-Supported Collaborative Learning, 2008, 3(1): 85-97.
[2] 李建國,湯庸. 社交網絡中感知技術的研究與應用[J] . 計算機科學,2009,36(11):152-156.
[3] Steve Benford, Lennart Fahlen. A Spatial Model of Interaction in Large Virtual Environments[C] . Proceedings of the Third European Conference on Computer-Supported Cooperative Work. 1993(9).
[4] 葛聲,馬殿富,懷進鵬. 基于角色的群體感知模型[J] . 軟件學報,2001,12(6):864-871.
[5] 葛聲,懷進鵬. 基于角色的群體感知模型實現機制[J] . 計算機工程與應用,2001,37(23):9-13.
[6] 閆臨霞,曾建潮.基于任務的群體感知模型的形式化描述[J] . 計算機工程與應用,2005(30):84-88.
[7] 閆臨霞,曾建潮. 基于任務的群體感知模型[J] . 太原重型機械學院學報,2004,25(2):115-120.
[8] 丁振國,劉杰. 基于用戶的細粒度可控群體感知模型[J] .航空計算科學,2008,38(6):39-42.
[9] 黃帆,湯庸. 上下文技術在群體感知中的研究與應用[J] . 計算機研究與發展,2007(44):341-348.
[10] D Boyd, N Ellison. Social Network Sites: Definition, History,and Scholarship[J] . Journal of Computer-MediatedCommunication, 2008, 13(1): 210-230.