李 陽 呂 欣
(國家信息中心博士后科研工作站 北京 100045)
基于關鍵節點的社會網絡治理路徑研究
李 陽 呂 欣
(國家信息中心博士后科研工作站 北京 100045)
(liyang_cas@163.com)
互聯網+時代的到來,社會網絡被賦予了全新的內涵與功能,其中關鍵節點在拓撲結構中占據了重要的位置,在社會網絡中承載著重要的功能.隨著社會網絡中數據規模的不斷增加,關鍵節點的承載數據蘊含了重要的價值,立足對關鍵節點的挖掘,發揮關鍵節點在社會網絡中的導向作用,有利于了解社會網絡的運行機理與規律,進一步創新社會網絡治理方式,使之更好地服務于我國的經濟社會.
社會網絡;關鍵節點;拓撲結構;信息傳播;主題模型
隨著信息化時代的到來,互聯網日益融入到我們的經濟、工作、生活當中,隨著互聯網+行動計劃的實施,社會網絡繼續深入到了我們生活的各個領域,被賦予了全新的內涵,擴展了豐富的功能,我們置身于一種泛社會化的網絡之中.
在社會網絡中,節點被抽象為行動主體,邊被抽象為行動主體之間的聯系,節點可以作為一種組織結構、一個商家、一個用戶等等,政府機構、企業、用戶等等在線上的社會網絡中交互共存.因此,在日益網絡泛化與功能擴展的社會網絡中,關鍵節點越來越發揮著重要的作用,例如政府機構可以進行政務信息發布、突發公共事件監測等,企業可以進行市場營銷、廣告投放等,個人可以關注經濟生活、快速分享興趣等;與此同時,在管理措施與技術手段相對滯后的情況下,也出現了一些信息泄露、金融詐騙、謠言傳播等事件,在知名博主、大V用戶等關鍵節點的分享與轉發下,造成了級聯的擴散,帶來了一定的負面影響.
立足于對社會網絡中關鍵節點的挖掘研究,展開對其結構承載功能的統計分析,有利于及時了解社會網絡上的社會民生、公共事件、經濟生活等信息,具有重要的導向作用,能夠進一步創新社會網絡的治理,提高社會網絡的管理水平.
關鍵節點在社會網絡中發揮了重要的作用,因此立足于關鍵節點的研究,有助于深化理解社會網絡運行機理,早期對關鍵節點的研究是從拓撲結構開始的.
2.1 基于拓撲結構
在基于圖的拓撲結構的基礎上,早期的研究者認為節點在網絡中的位置反映了其重要程度,主要通過度中心性、接近中心性、介數中心性、特征向量中心性、子圖中心性、k-shell分解法、結構洞、PageRank等方法來評估節點的重要性.
早期的這些研究中主要以拓撲特征為指標,對節點的局部拓撲重要性進行度量.但是隨著網絡上功能的不斷擴展與泛化,出現了更多的社區結構、主題興趣、信息傳播等領域,因此在拓撲結構分析的基礎上,需要融入更多的屬性要素來深化對關鍵節點的研究.
2.2 基于信息傳播
隨著傳播動力學研究的深入,研究者認為具有網絡連通性強的節點在信息傳播過程中有助于信息傳播.早期的信息擴散研究是以傳染病模型為主在復雜網絡上展開研究的,將節點視為活動主體并具有3種狀態:易感染態S、感染態I以及免疫態R,基于傳染病模型的主要研究主要集中于SI模型、SIS模型以及SIR模型等.
隨著網絡科學理論研究的深入,研究者開始從社會學角度出發,在社交網絡中建立信息傳播模型,根據模擬傳播的范圍來度量關鍵用戶的影響力,來進一步挖掘關鍵用戶,即影響力最大化問題[1-6].
社會學模型主要考慮的是概率問題,隨著研究問題的深入和細化,信息傳播更多需要考慮主題性、相關性等問題,使得經典的社會學模型無法面向場景地評估應對信息傳播,還有待對傳播模型進行改進.
2.3 基于主題模型
社會網絡中節點關聯的內容信息對節點的重要性評估具有現實意義.一些意見領袖的關注興趣常常吸引粉絲的關注與分享,一些用戶的消費習慣常常有助于進行廣告營銷,如何基于節點的關聯內容信息,將無結構的原始文本數據轉化為面向主題的屬性計算具有重要的意義.目前一些計算方法主要包括布爾模型、向量空間模型[7]、概率主題模型[8-10]等.
基于內容的主題模型,在節點的內容關聯分析方面提供了基于概率的量化方案,但是隨著互聯網+時代的到來,數據的多源性、異構性、時序性成為關注的要點,同時如何融合多源的語義分析需要主題模型的進一步改進.
隨著物聯網、云計算、大數據等信息化技術的蓬勃發展,互聯網把人、機、物等都連接在一起,社會網絡與各個領域行業進行了深度的融合,功能得到了極大的擴展,進入了一個范圍更大的異質、泛化的經濟與社會網絡.同時,當前社會網絡的發展上面臨以下特點.
3.1 管理扁平化
在互聯網+時代,商業流、金融流、服務流、通信流等趨勢的加速,公眾可以成為自媒體,充分表達個人訴求或者群體民意;同時在多主體、多社區、多訴求的背景下,公眾的關注需求瞬息萬變.傳統金字塔式的管理方式無法應對快速發展的社會網絡,隨著時間上的滯后與信息上的缺失會導致整體決策的效力低下.扁平化的管理縮短了組織層級、打通了層級壁壘、下移了主體權限,在經濟領域已凸顯其推動作用,社會治理領域也需要順應發展趨勢,積極借鑒扁平化方式.對于政府而言,需要及時對公共事件作出了解掌握,快速回應社會網絡反映的社情民意;對于企業而言,需要圍繞用戶多樣化需求,快速應對市場活動.
3.2 數據規模化
在互聯網+時代,隨著社會網絡與各個領域的深度融合,公眾是數據的使用者,也伴隨著數據的記錄、積累、共享、傳播等行為,成為數據的生產者.例如2011年美國弗吉尼亞地震中,在此期間用戶利用社交媒體不斷地制作、加工、分享、轉發數據,猶如一個個傳感器,以至于信息傳播速度超過了地震波的震感.這種通過群體實時產生數據的方式產生了規模越來越大的數據,也可稱為帶有時間性和空間性的時空大數據.大數據的意義在于蘊含的重要價值,隨著計算能力的逐步提升,對于大數據的存儲、計算、可視化等技術也在不斷提高,面對數據規模不斷的增長,當前提高對大數據的計算與挖掘能力顯得尤為關鍵.
3.3 主體征信化
社會網絡上的確產生了大量的數據,同時也充斥著大量的虛假信息,因此真實、可信數據能夠降低經濟成本、增強社會互信.由于管理與措施的相對滯后,出現了類如P2P網貸的信用問題、層出不窮的信息詐騙等事件,如果不加強征信體系建設,將無法為經濟社會的發展提供安全保障.面向互聯網的大規模數據,深入挖掘相關性信息,立足于拓撲、區域、場景、消費等多維度建立指標框架,為主體信用體系的評估融入多源數據資源成為一個重要的手段.因此,基于社會網絡上大規模的多源異構數據,客觀公正地對社會主體信用進行量化評估,將有利于促進社會信用體系建設.
當前處于社會網絡發展的融合期,在我們不斷用信息化技術來擴展社會網絡功能的同時,也衍生了一系列的管理滯后與信息安全方面的問題.針對社會網絡而言,通過對其支撐結構和承載功能的關鍵節點展開研究,可以為我們創新治理社會網絡積極發揮導向作用.為了更好地推進社會網絡治理,使之能夠更好地服務于經濟生活,提出以下建議.
4.1 拓展社區發現方法,深化異質網絡互聯
基于互聯網+融合所形成的異質社會互聯網絡,需要根據結構與功能定位,研究結構形成機理與社區凝聚策略,建立異質社區劃分的評估標準,為社會網絡的社區發現與功能分類提供支撐.以在線社會網絡為例,通過分析節點之間的鏈接結構、節點的主題特征以及節點的交互行為等信息,來發現層次化、重疊化社區,有助于更好的社區管理、社區自治、商業的廣告投放與市場營銷等.
4.2 深化區域節點定位,適應網絡去中心化
當前社會網絡的逐步發展,關鍵節點(例如大V用戶)的形成,將現實社會中的權利不對等進一步放大,因此越來越多主題社區、興趣圈子的出現,趨向于用戶越來越追求平等化、自組織的權利.隨著社會網絡功能的不斷擴展與延伸,需要積極順應去中心化的趨勢,尤其應加大區域節點的定位,綜合關聯分析節點的社區屬性在網絡結構中承載的功能.例如對區域性關鍵節點進行定位,對跨社區的橋節點進行統計,可以為金融、商業等領域的精準營銷、客戶定制提供量化參考.
4.3 研制數據匯聚標準,推動節點多源融合
面對大規模多源信息的整合,尤其是包括大量的非結構化數據,缺乏統一的標準,勢必降低大數據整合的價值.建立多源數據的匯聚標準,通過提出多特征識別的融合算法,對具有不同特征模式的多源信息進行梳理,加強多源信息的互補集成,建立一種基于知識規則的表征框架,將多源異質的大數據轉換為支撐分析的小數據,改善大數據環境下計算損耗的決策問題.
4.4 加強數據融合分析,建立節點征信體系
社會網絡上隱私泄露、信息詐騙等問題,對互聯網時代的社會信任體系提出了嚴峻挑戰,充分融合多源異質的互聯網數據,可以作為傳統征信體系的有力補充.健全信息采集的立法工作,明確面向個人互聯網數據的采集、存儲、加工、交易等領域規范細則,推進征信業務開展的有法可依;構建綜合的征信指標體系,基于大數據計算技術,分別面向個人、組織、企業、政府等領域,通過對節點的多源數據進行融合分析,將更多直接信用記錄以外的間接數據納入到計算框架中,服務于金融領域、商業領域、行政監管等場景領域,推動社會信用體系建設.
4.5 構建節點評估指標,加強網絡態勢感知
面向社會網絡的關鍵節點,以功能承載為依托,對關鍵節點進行梳理、匯總、分類,以此有效整合關聯的拓撲結構、社情民意、熱點追蹤等關聯要素,構建起多層次、多維度的指標體系,通過對關鍵節點進行客觀、科學的評估,充分發揮關鍵節點在社會網絡中的導向作用,推動對社會網絡的公共事件態勢進行感知,為政府公共服務、金融商業營銷等提供科學支撐,為公眾提供優質化的社會網絡服務,進而推動我國經濟社會的健康發展.
人類社會已經進入信息化的互聯網+時代,社會網絡承載著更為廣闊的功能,在經濟、社會、文化、軍事等領域發揮著重要的作用,也深刻影響著公眾利益與國家安全.因此,要深刻領會創新社會網絡治理的理念,著重以關鍵節點挖掘為立足點,理解社會網絡的運行機理,通過加強社區發現、數據融合、征信體系、量化評估等方法,發揮關鍵節點在社會網絡中的導向作用,積極響應社會網絡上發生的社情民意,提高社會網絡的綜合治理與惠民服務水平,促進經濟社會的健康發展,建立起社會網絡創新治理的長效機制.
[1]Domingos P, Richardson M. Mining the network value of customers[C] //Proc of the 7th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2001: 57-66
[2]Richardson M, Domingos P. Mining knowledge-sharing sites for viral marketing[C] //Proc of the 8th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2002: 61-70
[3]Granovetter M. Threshold models of collective behavior[J]. American Journal of Sociology, 1978, 83(6): 1420-1443
[4]Goldenberg J, Libai B, Muller E. Talk of the network: A complex systems look at the underlying process of word-of-mouth[J]. Marketing Letters, 2001, 12(3): 211-223
[5]Goldenberg J, Libai B, Muller E. Using complex systems analysis to advance marketing theory development: Modeling heterogeneity effects on new product growth through stochastic cellular automata[J]. Academy of Marketing Science Review, 2001, 31(3): 8-11
[6]Kempe D, Kleinberg J, Tardos é. Maximizing the spread of influence through a social network[C] //Proc of the 9th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2003: 137-146
[7]Salton G, Wong A, Yang C S. A vector space model for automatic indexing[J]. Communications of the ACM, 1975, 18(11): 613-620
[8]Deerwester S C, Dumais S T, Landauer T K, et al. Indexing by latent semantic analysis[J]. JASIS, 1990, 41(6): 391-407
[9]Hofmann T. Probabilistic latent semantic indexing[C] //Proc of the 22nd ACM SIGIR Int Conf on Research and Development in Information Retrieval. New York: ACM, 1999: 50-57
[10]Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022

李 陽
博士,高級工程師,主要研究方向為社交網絡、信息安全、數據挖掘.
liyang_cas@163.com

呂 欣
博士,國家信息中心副研究員,主要研究方向為網絡安全評價體系、網絡安全戰略、網絡空間安全體系結構.
lux@cei.gov.cn
The Research of Governance Path of Social Network Based on the Key Node
Li Yang and Lü Xin
(PostdoctoralScientificWorkstation,StateInformationCenter,Beijing100045)
With the advent of the internet plus era, social network has been given new functions and meanings, in which the key nodes occupy a crucial position in the topology, and bear significant functions in the social network. With the increase of data scale in social network, the holding data in the key nodes contains a great value, standing on the mining of key nodes and playing an oriented role of key nodes in social network which can help us to understand the operating mechanism and regularity of social network, further govern social network with innovativeness, and serve our economic society effectively.
social network; key nodes; topology; information propagation; topic model
2016-11-30
國家社科基金重大項目(11&ZD061)
TP309