邱呂琳,張志堅,蔡光程,鐘 慧
(昆明理工大學 理學院,云南 昆明 650500)
隨著當今社會經濟與科技的飛速發展,互聯網已成為一個重要的新媒體,在人們的學習、工作、生活等各個方面扮演著不可或缺的角色。社交網絡以人際關系網為基礎,近年來發展迅速,正逐漸融入人們的日常生活并發揮重要影響,極大豐富了人們的各種需求。與此同時,在線社交網絡使得人們不再受到時間、空間限制,可快捷接收外界信息,并實時參與熱點話題討論,發表自己的觀點。在線社交網絡在傳播方面已顯示出強大的影響力,例如,“澳洲森林山火”“全球新冠病毒”等新聞事件在微博不斷實時發布消息等。在線社交網絡信息傳播對于生活和社會發展有著深遠影響,因此受到了研究者們的廣泛關注。
近年來在線社交網絡信息傳播研究取得了許多進展,使人們能夠從信息傳播角度進一步理解社交網絡的屬性和規則。本文旨在分析在線社交網絡的信息傳播現象,了解信息傳播規律,并根據相關規律進行引導,從而更好地進行信息傳播,同時最大限度減少虛假消息和不良消息的傳播。要想獲取信息傳播規律,需要分析社交網絡圖。然而,目前在分析社交網絡圖時,采用最短路徑、介數中心性、聚類系數和度分布等度量指標研究與認識在線社交網絡結構。雖然這些指標足以提供網絡圖在特定方面的信息,但無法提供在線社交網絡的全面特征。在線社交網絡存在太多不確定信息,如網絡節點分布很難確定,且在線社交網絡的節點數量特別龐大,會隨著時間不斷變化,屬于動態網絡,所以對在線社交網絡進行全面可視化是一個很有意義的問題。因此,本文從拓撲角度分析在線社交網絡的拓撲結構,對在線社交網絡進行全面分析。拓撲學中的持續同調為社交網絡圖中存儲信息的全面可視化表示提供了一種新方法。
大量研究致力于理解在線社交網絡的相關熱點問題,主要研究方法已從早期社會學研究領域的實證研究轉向基于小數據集的理論研究與驗證。本文主要利用持續同調方法和代數拓撲的一些知識提取在線社交網絡的拓撲特征,并基于這些特征分析在線社交網絡傳播。
在線社交網絡分析可總結為3個方面:在線社交網絡結構特征和演化機制,在線社交網絡群體行為形成和互動規律,在線社交網絡信息傳播規律和演化機制。在早期社會學與圖論的研究基礎上,Kempe 等提出的線性閾值模型LTM(Linear Threshold Model)和獨立級聯模型ICM(Independent Cascade Model)以及借鑒醫學研究的傳染病模型SIR(Susceptible Infected Recovered Model)成為描述影響力傳播的主要基礎模型,這些模型描述了社交網絡中影響力傳播的隨機性與累積性。后來許多研究者根據具體傳播問題的特點擴展了基本模型,以反映傳播模型的具體傳播特性。目前,Aggarwal已從數據挖掘的角度對社區發現、影響力計算、溝通可視化等方面進行了總結;Kwak 等基于Twitter 的數據,對用戶之間的關系、用戶影響以及Twitter 上話題的傳播進行了實證分析;Fang 等介紹了在線社交網絡相關研究,并從網絡結構特征與演化機制、群體行為形成與互動規律、信息傳播規律與演化機制3個維度提出進一步的研究方向。在在線社交網絡信息傳播方面,Guille 等從話題檢測、傳播建模以及識別有影響力的傳播者3個方面進行了介紹,為社交網絡中圍繞信息擴散的工作提供全面的分析指導;Zinoviev從傳播者、傳播路徑和傳播機制出發,提出博弈論模型來理解信息傳播,并對已有研究進行總結。
鑒于在線社交網絡的網絡拓撲結構及特征,許多研究者提出利用“網絡復雜性分析”的方法論進行相關問題分析與研究。Watts 等提出一個小世界網絡模型,該模型更好地描述了從常規網絡到隨機網絡的過渡;Barabdisi 等提出BA 無標度網絡模型,并根據模型的增長算法和優先連接特性演示了BA 無標度網絡演化過程。根據社交網絡的基本功能和特點,田燕等描述了不同類型在線社交網絡的目的、特點及典型代表,分析了在線社交網絡的拓撲結構和信息傳輸特點;候夢男等提出一種融合拓撲勢的層次化社區發現算法;Claire 等將網絡圖轉換為持續同調中的條形碼格式,對照各種效用度量來觀察圖之間關鍵特征的相關性。因此,使用持續同調分析網絡拓撲結構以得到網絡的傳播變化,同樣是一個挑戰。
近年來,利用拓撲性質和單純復形、持續同調性等方法對復雜網絡,特別是加權網絡的研究取得了很大進展。Carstens 等描述了作者合作網絡的持續同調性,將拓撲學中的單純復形方法應用于網絡,通過對貝蒂數的定量比較解釋了合作網絡的持續同調性,并通過分析發現持續同調性在區分無標度網絡和隨機網絡方面也起著重要作用;Dlotko 等提出一種簡化的持續同調計算復形方法,從而加深了對拓撲單純復形及其計算方法的理解;Cerri 等研究了多維持續同調理論中貝蒂數的連續性質;Maletic 等采用拓撲單純復形法構造網絡,并對復雜網絡的持續同調性進行分析與研究;Kahle探討隨機網絡的同調性與網絡連通性之間的關系,為進一步理解網絡拓撲性質與網絡連通性之間的關系作了理論準備。
本文旨在采用一種不同的方法對社交網絡進行概括,通過持續同調性表示在線社交網絡圖的傳播特性,使用算法計算持續同調得到相應的貝蒂數和持續性圖,并獲取社交網絡的拓撲特征,分析其傳播特點。
由于同胚對兩個空間的拓撲性質相同,本文主要運用代數拓撲知識構造出該空間的同胚型。在研究一個社交網絡時,常把社交網絡中的各個用戶看作節點,用戶之間的關系看作邊。換言之,可將社會網絡中的節點視為點云,用持續同調方法構造一個由一系列簡單復形組成的空間,并用構造的空間逼近社會網絡空間。持續同調性為人們提供了一種在不減少維數情況下刻畫數據全貌的方法。把數據放在原始高維空間中得到數據里的群集與環結構個數,這種計算拓撲特征的方法為網絡圖分析提供了一種新的效用度量。
G
定義為一個有序二元組(V
,E
) 。其中,V
稱為頂集,E
稱為邊集,E
與V
不相交。頂集的元素被稱為頂點,表示對象;邊集的元素被稱為邊,表示對象之間的關系,有不同類型的圖表示頂點之間的不同關系。在無向圖中,邊對稱地連接兩個頂點;在有向圖中,邊不對稱地連接兩個頂點。如果頂點之間的關系有相互作用的強度,可用加權網絡表示這種類型的關系。有n
個頂點的圖G
可用n
×n
個鄰接矩陣表示,對于未加權圖,若有G
=1,則表示頂點i
到頂點j
有一條邊。如果頂點i
與頂點j
之間沒有邊,則G
=0。如果圖隨時間變化,則該圖被稱為動態圖,圖中的頂點和邊會隨著時間的變化不斷刪除或添加。在在線社交網絡圖中,用戶被看作節點,用戶之間的關系被看作邊。1.2.1 單純復形與單純同調
通常,單純復形是一種抽象代數結構,由點、邊、三角形、四面體和高維多面體組成。0 維單形是一個頂點,1維單形是邊,2 維單形是三角形,3 維單形是四面體(見圖1),直到第k
維,其結構取決于單純復形的維度。
Fig.1 Simplex圖1 單形
定義1
設K
是n
維歐氏空間R
中單形的有限集合,稱K
為單純復形,簡稱復形(見圖2),則有:①若為K
中的單形,則其任意面都屬于K
;②若s
和s
為K
中任意兩個單形,則s
?s
或者是空集,或者是s
與s
的一個公共面。
Fig.2 Complex圖2 復形
在單純復形中,把這些孔視為以不同維數的單純形為界的空洞。在0 維中,其是連接分量;在1 維中,其是以邊(1 維單純形)為邊界的環;在2 維中,其是以三角形為邊界的孔……在i
維中,其是以i
維單純形為邊界的孔。單純同調是指尋找單純復形中空洞的方法,下面定義兩種特殊類型的鏈,即圈和邊界。單純形包含復形中最高維單形的所有面,也即是說,如果存在一個二維復形(具有最高維單形的單純復形是一個二維單純形,即三角形),則該復形還包含所有維數低于它的面(如邊和頂點)。在同調理論中,i
鏈是一個具有整數系數的單純復形K
所有i
維單形的和。K
的所有i
鏈集合都用C
(K
)表示,即C
(K
)表示單純復形上的i
維鏈群。對其作邊緣同態映射:
C
(K
)為K
的所有i
維鏈,C
(K
)通過此映射后得到幺元的同態核是i
維鏈群C
(K
)的子群,稱為維閉鏈群,記作Z
(K
)。帶有方向向量[v
,v
,v
,…,v
]的n
維單純形K
的邊界(?(K
))為:

C
(K
)中的所有邊界,即經過同態映射 ?:C
(K
)→C
(K
)得到的同態像是i
維鏈群C
(K
)的子群,也是i
維閉鏈群Z
(K
)的子群(因為邊緣都是封閉的),稱為i
維邊緣閉鏈群,簡稱i
維邊緣邊界群,記作B
(K
)。則定義單純復形K
的i
維同調群為:
i
個連通數b
定義為H
的維度,b
=dim(H
) 。1.2.2 持續同調計算
對于有限的一組點X
(如點云數據),同調性不能給出感興趣的信息。β
給出了連通分支數目,但這只是點的數目,其他所有貝蒂數都是零,因為集合中沒有其他維度的洞。因此,可在數據上構建一個最大ε
值的單純復形,而不是構建多個不同ε
參數的單純復形,然后將其組合成一個序列。記錄所有點對之間的距離,并了解何值使得每對點形成邊。所有隱藏在這些值中的單純復形形成了一個連貫的濾流,即為一系列嵌套的復形。因此,本文不去處理點集,而定義復形濾流為:由不斷增加的比例參數ε
生成的單純復形序列。在這樣的結構中,一些洞可能出現,然后消失,這些同源特征的持續性可被認為是數據集特征。在一個濾流中,可以記錄洞的出生,即洞出現的時間,以及洞的死亡,即洞消失的時間。持續同源性的本質是對這些同源特征的出生和死亡進行持續性地追蹤,每個同源特征的壽命可表示為一個區間,其中區間的起點與終點分別對應同源特征的出生和死亡。對于給定數據集,可通過持久性條形碼(PB)記錄這些間隔。同樣地,持久性條形碼可通過持久性圖(PD)表示。下面定義貝蒂數,并構建Vietoris-Rips(VR)復形。
持續同調計算的理論基礎是刻畫網絡拓撲結構,通過網絡拓撲結構變化分析網絡社交的變化是有效、合理的。構建社交網絡,計算相應的網絡拓撲同調群和貝蒂數相關參數,進一步分析網絡拓撲特性。這些同調空間可用空間維數來表征,因此引入貝蒂數來量化拓撲不變量,同時其也是拓撲空間的拓撲不變量。單純復形K
的n
個貝蒂數表示為β
:
b
(X
)=dim(H
(X
)),即對于非負整數k
,定義空間X
的第k
個貝蒂數b
(X
)為X
第k
個同調群H
(X
)的秩(線性無關生成子數)。添加或刪除網絡節點時,相應同調群和貝蒂數都會發生變化。在網絡拓撲圖中,零維貝蒂數表示網絡上的連通分支數,一維貝蒂數表示網絡上的環(一維孔)數,二維貝蒂數表示網絡圖中的空腔數。貝蒂數越大,拓撲含義越復雜。
對于Vietoris-Rips(VR)復形,其是一種抽象的代數結構,能夠表示歐氏空間E
中的一組點。假設G
=(V
,E
) 是一個無向加權圖,權重值為W
:V
×V
→R
。對于?δ
∈R
,1 維骨架G
=(V
,E
) ?G
被定義為G
的子圖,其中V
=V
,其邊界集E
=E
只包含權重小于或等于δ
的邊。然后,對于?δ
∈R
,本文將VR 復形定義為1 維骨架G
、Cl
(G
) 的團復形,并將Vietoris-Rips 過濾定義為:
ω
到最大權重ω
進行排序,并讓參數δ
從ω
增加到ω
。在每一步中添加相應的邊,得到閾值子圖G
的復形,因此產生了Vietoris-Rips 過濾結構。1.2.3 持續性圖
隨著Rips 復形的構建,連續的間隔一起組成持續性圖。持續性圖是濾流的點圖,當一個洞出現時,持續性圖中的一個點會被標記出,該洞即具有包圍開放空間的邊緣結構。持續性圖的橫坐標代表開始時間,標志著一個洞的誕生;縱坐標代表洞消失的地方。該間隔通常被稱為特征持續時間,持續性圖可定性地描述持續同調。
δ
很小時,會有一些斷開的組件。當δ
足夠長時,該圖成為一個連接圖,斷開的組件組合成一個。因此,所有持續性圖都有一個無限持續下去的持續性點。對應在網絡圖中,當距離較小時用戶緊密相連,從信息迅速傳播到最后信息傳播完成,形成一個穩定的圈。運用代數拓撲中持續同調的知識對在線社交網絡構造VR 復形,將在線社交網絡邊數據集生成距離矩陣,再使用perseus 軟件計算得出貝蒂數和持續性圖,從而分析在線社交網絡的傳播特征。具體方法如下:
利用圖描述社交網絡時,節點表示社交網絡中的用戶,邊表示用戶之間的關系,有關系則為“1”,沒有關系則為“0”。社交網絡中關注的是節點間的連接關系,并不強調坐標位置。因此,本文首先利用Floyd算法計算得到距離矩陣,再將距離矩陣導入Perseus 軟件,最后通過Perseus 軟件計算得到社交網絡圖的貝蒂數和持續性圖。
2.1.1 數據處理
由于在線社交網絡往往較為龐大,為方便進行持續同調相關計算,本文使用隨機游走算法對數據進行處理,在有效保護網絡的同時,創建一個可行的數據集。隨機游走算法通常被視為一些隨機過程的基本模型,并被視為馬爾可夫過程。隨機游走算法的基本思想是從一個頂點或一系列頂點游走一個圖,在任何頂點中,遍歷者將以概率1-a
移動到此頂點的相鄰頂點,并以概率a
隨機跳到圖中任何頂點,a
稱為跳躍發生概率。每次行走后都會得到一個概率分布,此概率分布描述了圖中每個頂點被訪問的概率。使用此概率分布作為下一次行走的輸入,并迭代該過程。當滿足一定條件時,概率分布趨于收斂,得到平穩的概率分布。一維的隨機游走可定義如下:每過一個單位時間,游走者從數軸位置x
出發,以固定概率隨機向左或向右移動一個單位。不妨將n
時刻游走者的位置記為L
,則有:
X
,X
,…X
為相互獨立的隨機變量,滿足:
G
′中。此后,程序查看連接到原始圖中當前節點的邊,并隨機選擇一個進行遍歷,同時將相同的邊添加到新的圖G
′中。整個過程經歷了多次迭代,直到新構建的圖G
′完全包含一部分節點,本文取得的節點數為100。2.1.2 距離矩陣形成
此時初始化一個鄰接矩陣作為輔助,即在給定一組節點時,一個鄰接矩陣表示其邊關系。該矩陣表示在具有“1”和“0”的一對節點之間是否存在一條邊,“1”表示兩節點間存在一條邊,“0”表示兩節點間不存在邊。然后使用Floyd算法,通過Python 計算得出距離矩陣。下面簡單介紹Floyd算法以及距離矩陣。
Floyd算法又稱為插點法,是一種利用動態規劃的思想尋找給定加權圖中多源點之間最短路徑的算法。首先,從任意一條單邊路徑開始,所有兩點之間的距離是邊的權,這里設所有邊的權值為1。如果兩點之間沒有邊相連,則權為無窮大。對于每一對頂點u
和v
,看看是否存在一個頂點w
,使得從u
到w
再到v
比已知路徑更短,如果是則對其進行更新。用鄰接矩陣G
表示圖,如果從v
到v
有路可達,則G
=d
,d
表示該路的長度,否則G
=∞
。定義一個矩陣D
用來記錄所插入點的信息,D
表示從v
到v
需要經過的點,初始化D
=j
。把各個頂點插入圖中,比較插點后的距離與原來的距離,G
=min(G
,G
+G
) 。如果G
的值變小,則D
=k
。由此便可得到任意兩點間的距離信息,一個距離矩陣是一個包含一組點兩兩之間距離的矩陣(即二維數組),所以可將距離信息轉換成距離矩陣。2.1.3 持續性圖生成
對數據進行處理后,首先運用Floyd算法對處理得到的100個點計算得出距離矩陣,然后利用持續同調計算軟件計算得出各維數的持續性間隔以及各維貝蒂數,最后得到持續性圖(見圖3)。

Fig.3 Steps to generate a persistence diagram圖3 持續性圖生成步驟
已知兩個小型社交網絡,節點與節點之間的關系如圖4、圖5 所示。利用Floyd算法計算得到兩個小型網絡圖的8 × 8 距離矩陣,分別如下:

Fig.4 Small network diagram a圖4 小型網絡圖a

Fig.5 Small network diagram b圖5 小型網絡圖b

此時通過貝蒂數持續性圖計算方法得出兩個社交網絡的貝蒂數分別如表1、表2 所示。

Table 1 Betti number of small network diagram a表1 小型網絡圖a 的貝蒂數

Table 2 Betti number of small network diagram b表2 小型網絡圖b 的貝蒂數
在網絡拓撲圖中,零維貝蒂數表示網絡上的連通分支數,一維貝蒂數表示網絡上的環(一維孔)數,二維貝蒂數表示網絡圖中的空腔數,貝蒂數越大,拓撲含義越復雜。
對于圖4,一開始它有8個連通分支(即一開始的8個節點),更高維的貝蒂數為零;形成第一個子復形時,零維貝蒂數為1,即連通分支數為1,一維貝蒂數為2,即有2個圈,沒有更高維的貝蒂數;形成第二個復形時,零維貝蒂數為1,沒有一、二維的貝蒂數,三維貝蒂數為5,即更高一維的三維空間有5個空洞;形成第三個復形時,零維貝蒂數為1,沒有一、二維的貝蒂數,三維貝蒂數為35,即更高一維的三維空間有35個空洞;沒有再形成更多復形。
對于圖5,同樣一開始它有8個連通分支,更高維的貝蒂數為零;形成第一個子復形時,零維貝蒂數為1,即連通分支數為1,沒有更高維的貝蒂數;形成第二個復形時,零維貝蒂數為1,沒有一、二維的貝蒂數,三維貝蒂數為25,即更高一維的三維空間有25個空洞;形成第三個復形時,零維貝蒂數為1,沒有一、二維的貝蒂數,三維貝蒂數為35,即更高一維的三維空間有35個空洞;沒有再形成更多復形。
圖4 和圖5 是兩個小型網絡圖,都擁有8個節點,從圖中可以看出,圖4 相對于圖5 節點與節點之間的聯系更緊密。所以圖4 各個節點之間的距離比圖5 更近,如果是節點之間相互傳播,圖4 相對于圖5 也更為容易,而這一點在持續同調計算得出的貝蒂數中得到了驗證。表1 的貝蒂數總的來說少于表2 的貝蒂數。
小型網絡圖的持續性圖如圖6 所示。

Fig.6 Persistence diagram of small network diagram圖6 小型網絡圖的持續性圖
其中,橫坐標表示持續性點的出生時間,縱坐標表示持續性點的死亡時間。
對于持續性圖,具有無限持續性點的出生時間被繪制為紅色菱形,即在網絡圖a 的持續性圖中有出生時間為2 和3 的兩個持續性點,網絡圖b 的持續性圖中只有1個出生時間為3 的持續性點。
通過示例可以看出:該方法充分捕捉了網絡拓撲特征,可計算出網絡拓撲信息,得到的拓撲信息與網絡圖的圖像一致,并且可根據拓撲信息畫出持續性圖;節點間聯系更緊密的網絡圖更容易傳播,且其貝蒂數更大,傳播更容易擴散;節點間聯系更緊密的網絡圖的持續性點數量多于稀疏的網絡圖;貝蒂數在零維、一維和二維中表現出持續同調性。
選取SNAP數據庫中Facebook、Deezer 和Wiki-Vote的3個社交網絡圖,每個圖都提供了邊列表(每個邊列表數據由兩個節點ID 組成)。所有包含的數據集都滿足社交網絡標準,即一個簡單、未加權的網絡圖。具體來說,Facebook 網絡圖代表匿名社交圈人與人之間的關系,Deezer 網絡圖表示在線音樂網站中在線社交網絡的信息,而Wiki-Vote 網絡圖是由世界各地的志愿者合作編寫的免費百科全書。上述社交網絡來自于大眾廣泛使用的社交媒體平臺,可使本文能更好地模擬持續同調的實際應用。
對每個在線社交網絡的研究,主要是分析網絡所對應的持續性圖。通過對每個使得持續性圖穩定區間的分析與研究,可得到社交網絡空間的同調信息。這些同調信息可幫助獲取在線社交網絡的空間特點,從而分析其傳播變化。
Facebook、Deezer 和Wiki-Vote 網絡數據集都包含了節點數據和邊數據,通過邊數據獲取節點間的關聯信息,若形成邊則為“1”,若沒有形成邊則為“0”,由此生成網絡圖如圖7-圖9 所示。

Fig.7 Facebook network diagram圖7 Facebook 網絡圖

Fig.8 Wiki-Vote network diagram圖8 Wiki-Vote 網絡圖

Fig.9 Deezer network diagram圖9 Deezer 網絡圖
圖7-圖9 分別是Facebook、Wiki-Vote 以及Deezer 3個網絡在經過數據處理后100個節點的網絡圖,從圖中可以看出,Facebook 網絡圖分成了3個團,且各個團中各節點相互之間聯系緊密,具有很強的互聯性,這也對應表現出Facebook 各個用戶之間的聯系。Wiki-Vote 與Deezer 兩個社交網絡的網絡圖則呈現出一個節點被其他多個節點連接,出現了類似于環狀結構,這與3個網絡的類型有一定聯系。在現實世界中,Facebook 網絡圖代表匿名社交圈的人際關系,每個用戶之間都存在相互聯系的可能,所以圖中所有節點之間始終具有很強的互連性;Wiki-Vote 網絡圖是用多種語言編寫而成的網絡百科全書,其基于維基技術的多語言百科全書式協作計劃,所以其一個節點連接到多個端節點,形成環狀;Deezer 網絡圖代表法國在線音樂網站,可提供樂隊與歌曲搜索及音樂播放等功能,通常在圖的中心創建一個環,而邊界節點保持連接。
根據節點以及邊關系,對Facebook、Deezer 和Wiki-Vote 3個社交網絡分別創建距離矩陣,通過持續同調計算,分別生成3個網絡圖的零維貝蒂數、一維貝蒂數及二維貝蒂數(見表3-表5),分析并比較其傳播規律。

Table 3 Facebook Betti number表3 Facebook 貝蒂數

Table 4 Wiki-Vote Betti number表4 Wiki-Vote 貝蒂數

Table 5 Deezer Betti number表5 Deezer 貝蒂數
從表3 數據中可以看出,當沒有形成子復形時,Facebook 網絡對應的零維貝蒂數為100,即連通分支數量為100(本文選取100個節點),更高維的貝蒂數都為0;形成第一個子復形時,零維貝蒂數為1,即連通分支數為1,一維貝蒂數為10,即有10個圈,二維貝蒂數為1,即有1個洞,沒有更高維的貝蒂數;形成第二個復形時,零維貝蒂數為1,沒有一、二維的貝蒂數;之后隨著子復形的增加,零維、一維、二維貝蒂數均沒有發生變化;直到第9個子復形形成,之后沒有再形成更多復形。
同理,從表4 的數據中,一開始零維貝蒂數都為100,即連通分支數量為100,一維貝蒂數為12,二維貝蒂數為6;當第二個子復形形成時,零維貝蒂數變為1,而一、二維貝蒂數分別為19 和0;當第三個子復形形成時,零維貝蒂數依然為1,而一、二維貝蒂數變為0;該情況一直持續到第四個子復形形成,之后沒有再形成更多復形。
表5 的數據情況與表3 類似,一開始零維貝蒂數都為100,第二個子復形形成時,零維貝蒂數變為1,而一、二維貝蒂數分別為10 和3;當第三個子復形形成時,零維貝蒂數依然為1,沒有一、二維貝蒂數;直到第四個子復形形成,之后沒有再形成更多復形。
從表中3 組數據可以看出,當沒有子復形形成時,3個網絡圖對應的零維貝蒂數都為100,即連通分支數量為100(本文選取100個節點)。Facebook 網絡和Deezer 網絡的一、二維貝蒂數都為0,而在Wiki-Vote 網絡中,一維貝蒂數為12,二維貝蒂數為6,這是由于Wiki-Vote 網絡是一個百科全書網絡。從網絡圖中可以發現,它有一些圈和洞產生,即一、二維貝蒂數。隨著子復形個數的增加,連通分支的個數逐漸穩定為1,而更高維的圈、洞個數逐漸變為0,此時意味著傳播結束。從整個貝蒂數表格數據中可以看出,Facebook 網絡和Deezer 網絡在第二個復形形成時的一維貝蒂數都小于Wiki-Vote 網絡,說明Facebook 網絡和Deezer網絡的傳播更容易擴散,更有利于傳播,而Wiki-Vote 網絡不容易激活很多節點,傳播力相對弱一些,傳播更為困難。因此,可利用貝蒂數來刻畫在線社交網絡的傳播。
根據節點以及邊關系,對3個社交網絡分別創建距離矩陣,由此生成3個網絡圖的持續性圖(見圖10),分析比較其傳播變化規律。
對于持續性圖,具有無限持續性點的出生時間被繪制為紅色菱形。從3個持續性圖可以看出,Facebook 網絡的持續性圖有9個紅色菱形,即有9個無限持續性點,與上述貝蒂數中的子復形個數相對應;Wiki-Vote 網絡的持續性圖有4個紅色菱形,即有4個無限持續性點;Deezer 網絡的持續性圖同樣有4個紅色菱形,即有4個無限持續性點。對于持續性點,圖結構越復雜,其持續性點也會更多。從以上3個持續性圖可以看出,Facebook 網絡的無限持續性點多于Wiki-Vote 網絡和Deezer 網絡,說明Facebook 網絡比Deezer 網絡和Wiki-Vote 網絡更利于傳播,而Deezer 網絡和Wiki-Vote 網絡的傳播力相對弱一些,傳播更為困難。說明Wiki-Vote 網絡和Deezer 網絡相對于Facebook 網絡更穩定,這也很好地驗證了上述小型網絡圖示例得出的結論。因此,持續性圖也可用來刻畫在線社交網絡的傳播。

Fig.10 Persistence diagram of online social networks圖10 在線社交網絡的持續性圖
社交網絡傳播是在線社交網絡的重要研究內容,本文主要運用持續同調方法構造一系列單純復形來逼近社交網絡空間,得到社交網絡的同調信息,再將這些信息寫入持續性圖中,通過貝蒂數和持續性圖的穩定信息分析在線社交網絡傳播。在一定程度下,盡管在線社交網絡會發生變化(在線社交網絡本就屬于動態網絡),對本文要得到的同調信息也幾乎沒有影響。從本文得出的結論中,發現持續同調性可作為描述社交網絡圖傳播的一種手段。根據已有數據顯示,該方法充分捕捉了網絡拓撲特征,為在線社交網絡圖描述傳播提供了有效的新方法。在后續工作中將采用更大的數據集,并根據在線社交網絡得到的持續同調對在線社交網絡傳播進行更深入研究。