游新年 劉 群
(重慶郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 重慶 400065)
?
基于傳染病模型的微博信息傳播預(yù)測研究
游新年劉群
(重慶郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院重慶 400065)
摘要隨著微博的爆炸式發(fā)展,微博已成為消息擴(kuò)散和輿論傳播的重要平臺。研究微博信息的傳播對市場營銷、輿情管控等方面都具有重要意義。根據(jù)微博信息傳播特點,結(jié)合傳染病動力學(xué)原理,提出基于經(jīng)典SIR(Susceptible-Infectious-Recovered)傳染病模型的微博信息傳播預(yù)測模型。該模型考慮了微博用戶轉(zhuǎn)發(fā)行為對信息傳播機(jī)理的影響,構(gòu)建具有微博傳播特性的演化方程組。實驗結(jié)果表明,該模型比SISe模型的預(yù)測誤差更小,可以更準(zhǔn)確地擬合和預(yù)測微博信息的轉(zhuǎn)發(fā)數(shù),從而預(yù)測得出微博信息的傳播趨勢。
關(guān)鍵詞微博信息傳播傳染病模型轉(zhuǎn)發(fā)行為預(yù)測模型傳播趨勢
0引言
微博作為一種迷你博客,是通過關(guān)注機(jī)制分享簡短實時信息的廣播式的社交網(wǎng)絡(luò)平臺。用戶可以通過手機(jī)短信、即時通信、郵件、Web網(wǎng)頁或者第三方應(yīng)用即時發(fā)布信息或轉(zhuǎn)發(fā)、評論好友信息。在微博中,轉(zhuǎn)發(fā)是微博信息傳播的主要途徑,微博信息通過用戶之間的轉(zhuǎn)發(fā)得以廣泛傳播。由于每個微博用戶可以在不需要發(fā)布者的同意而即時地閱讀、評論和轉(zhuǎn)發(fā)微博信息,使微博信息比其他傳統(tǒng)媒體信息傳播速度更快、范圍更廣、效率更高,這導(dǎo)致了微博驚人的發(fā)展。微博已成為中國網(wǎng)民的主流互聯(lián)網(wǎng)應(yīng)用,微博中每個用戶都是信息的傳播源,這增加了人們獲得信息的途徑。微博對于人們的社會生活影響深遠(yuǎn),因此對微博信息傳播問題的研究逐漸成為國內(nèi)外學(xué)者的關(guān)注熱點,并且深入研究微博網(wǎng)絡(luò)信息的傳播機(jī)制。這些問題的研究在市場營銷、輿情控制和熱點話題發(fā)現(xiàn)等應(yīng)用方面具有重要意義。
在微博信息傳播研究中,如何預(yù)測微博信息傳播趨勢是現(xiàn)在需要解決的問題。雖然現(xiàn)在很多研究集中在基于微博各種特性上,例如利用機(jī)器學(xué)習(xí)中的算法預(yù)測微博是否轉(zhuǎn)發(fā)的問題,然而都未能對微博信息傳播趨勢預(yù)測。文獻(xiàn)[1]利用協(xié)同過濾算法預(yù)測微博的轉(zhuǎn)發(fā)預(yù)測,得出影響微博轉(zhuǎn)發(fā)的主要特性是微博的發(fā)布者和轉(zhuǎn)發(fā)者的身份。文獻(xiàn)[2]通過分析微博用戶轉(zhuǎn)發(fā)行為及轉(zhuǎn)發(fā)影響因素等,提出因子圖模型來預(yù)測微博的轉(zhuǎn)發(fā)行為。文獻(xiàn)[3]通過利用推文內(nèi)容以及上下文特征來分析轉(zhuǎn)發(fā)功能的影響因素,并且構(gòu)建了轉(zhuǎn)發(fā)預(yù)測模型,發(fā)現(xiàn)推文內(nèi)容特征、URL、標(biāo)簽、上下文特征、粉絲數(shù)和朋友數(shù)等是影響推問轉(zhuǎn)發(fā)的重要因素。文獻(xiàn)[4]利用基于被動主動算法的機(jī)器學(xué)習(xí)方法預(yù)測一條微博是否被轉(zhuǎn)發(fā)。文獻(xiàn)[5]采用分類方法預(yù)測流行微博的轉(zhuǎn)發(fā)范圍。文獻(xiàn)[6]利用機(jī)器學(xué)習(xí)中的分類算法對微博上下文特征的重要性進(jìn)行分析,提出基于特征加權(quán)的預(yù)測模型,預(yù)測單條微博是否會被轉(zhuǎn)發(fā)來研究微博客中轉(zhuǎn)發(fā)行為的問題。這些研究都不能預(yù)測微博信息從發(fā)布之后隨時間變化的轉(zhuǎn)發(fā)總數(shù)和微博信息傳播趨勢,只是簡單地預(yù)測微博信息是否被轉(zhuǎn)發(fā)的問題。也有一些學(xué)者,發(fā)現(xiàn)微博信息傳播過程與傳染病傳播過程具有相似性,將傳染病模型應(yīng)用到微博信息傳播研究。文獻(xiàn)[7]提出通用流行閥值條件,利用傳染病模型的方法預(yù)測微博的轉(zhuǎn)發(fā)規(guī)模,但模型只進(jìn)行仿真驗證,未進(jìn)行真實數(shù)據(jù)的模型驗證。Li等[8]利用擴(kuò)展的傳染病模型對騰訊微博信息的轉(zhuǎn)發(fā)次數(shù)進(jìn)行了準(zhǔn)確的預(yù)測。Wang等[9]提出擴(kuò)展的SIS(Susceptible-Infectious-Susceptible)疾病傳染模型,但是沒有考慮微博用戶轉(zhuǎn)發(fā)行為的免疫性,即微博用戶不會再次轉(zhuǎn)發(fā)自己已經(jīng)發(fā)表或者轉(zhuǎn)發(fā)過的微博信息。
針對上述研究,缺乏在微博信息傳播過程中對微博信息轉(zhuǎn)發(fā)總數(shù)的預(yù)測和微博信息傳播趨勢預(yù)測研究。本文根據(jù)微博信息傳播與傳染病傳播的相似性,借鑒經(jīng)典的SIR傳染病傳播模型,引入微博信息傳播的開放特性,在SIR傳染病模型的基礎(chǔ)之上引入外來用戶,構(gòu)建微博信息傳播預(yù)測模型。本文模型能較好地預(yù)測微博信息隨時間變化的轉(zhuǎn)發(fā)數(shù),并預(yù)測微博信息的傳播趨勢。
1經(jīng)典SIR傳染病傳播模型
從20世紀(jì)開始,研究者利用傳染病模型研究病毒的傳播,Hamer等[10]對麻疹的傳播創(chuàng)建了離散時間模型。Ross等[11]研究蚊子和人群之間的瘧疾的傳播,提出了SI模型,并證明了如果蚊子數(shù)量限制低于某一閾值,瘧疾是可以控制的。Kermack和Mckendrick[12]提出了著名的SIR隔離模型。到目前為止,傳染病模型有5種:SI、SIS、SIR、SIRS和SIRSE[13]。文本主要闡述經(jīng)典的SIR傳染病模型。
在 SIR模型中,此假設(shè)環(huán)境中人口總數(shù)為N(t),將總?cè)丝诜譃橐韵氯悾阂赘腥菊逽,其數(shù)量記為S(t),表示t時刻未感染疾病但有可能被傳染疾病的人數(shù);感染者I,其數(shù)量記為I(t),表示t時刻已被感染成為病人而且具有傳染力的人數(shù);康復(fù)者R,其數(shù)量記為R(t),表示t時刻不再傳播病毒的康復(fù)者的人數(shù)。
SIR模型的假設(shè)有:(1) 不考慮人口的出生率和死亡率,此環(huán)境中總?cè)丝跀?shù)為不變的常數(shù),即N(t)=K。(2) 當(dāng)易感染者與感染者接觸時,就有可能被感染。假設(shè)從t時刻起,單位時間內(nèi)一個感染者能傳染的易感者數(shù)目與此環(huán)境內(nèi)易感者總數(shù)S(t)成正比,比例系數(shù)為β,從而在單位時間內(nèi)新增感染人數(shù)為βS(t)I(t)。(3) 在t時刻,單位時間內(nèi)從感染者中康復(fù)的人數(shù)與感染者數(shù)量成正比,比例系數(shù)為α,單位時間內(nèi)康復(fù)者的數(shù)量為αI(t)。我們可以使用一下方程組來描述SIR模型:

根據(jù)微博信息傳播特性,我們觀察發(fā)現(xiàn)微博信息傳播與傳染病傳播具有相似性。微博用戶發(fā)布或轉(zhuǎn)發(fā)某微博之后,其關(guān)注者將會在微博信息中看到此微博,并有可能轉(zhuǎn)發(fā)。根據(jù)微博用戶的免疫性,微博信息在傳播過程中逐漸消亡,當(dāng)關(guān)注者轉(zhuǎn)發(fā)之后,隨著微博在網(wǎng)絡(luò)中不斷傳播,此關(guān)注者再次看到該微博就會具有免疫性則不會再次轉(zhuǎn)發(fā)該微博。微博信息傳播是一個從創(chuàng)建—轉(zhuǎn)發(fā)—消亡的過程,與傳染病的傳播易感—感染—康復(fù)的過程具有相似性,由此啟發(fā)我們將經(jīng)典SIR傳染病傳播模型應(yīng)用到微博信息傳播研究中。其中微博信息傳播與傳染病傳播類比關(guān)系,如表1所示。

表1 傳染病傳播和微博傳播
由于SIR模型中假設(shè)此環(huán)境中人口的總數(shù)是不發(fā)生變化的,并且只是存在3種狀態(tài)。但是微博信息傳播具有開放性,外來用戶可以在沒有關(guān)注轉(zhuǎn)發(fā)微博用戶的時候,自主地閱讀和轉(zhuǎn)發(fā)此微博。所以本文對SIR模型進(jìn)行改進(jìn)并應(yīng)用到微博信息傳播研究中。
2微博信息傳播預(yù)測模型
在微博網(wǎng)絡(luò)中,微博信息傳播的主要途徑是通過微博用戶之間的轉(zhuǎn)發(fā)。一個微博用戶發(fā)布的消息會被其粉絲看到,并可能轉(zhuǎn)發(fā)該微博信息。當(dāng)用戶轉(zhuǎn)發(fā)微博之后,用戶不會再次轉(zhuǎn)發(fā)自己已經(jīng)轉(zhuǎn)發(fā)過的微博信息成為“免疫用戶”。由于微博信息傳播的開放性,微博用戶可能在沒有關(guān)注轉(zhuǎn)發(fā)用戶的情況之下閱讀且轉(zhuǎn)發(fā)該微博而成為“外來用戶”。因此本文在經(jīng)典的傳染病傳播的SIR模型的基礎(chǔ)之上引入外來用戶,提出滿足微博信息傳播特性的微博信息傳播預(yù)測模型,并定義為SIRE(Susceptible-Infectious-Recovered-External)模型。
在SIRE模型中,將微博用戶定義為以下4類:感染用戶(I)、易感染用戶(S)、免疫用戶(R)和外來用戶(E)。微博用戶的狀態(tài)轉(zhuǎn)變規(guī)則如下:
1) 假設(shè)微博用戶A發(fā)布或者轉(zhuǎn)發(fā)某條微博信息,則微博用戶A的狀態(tài)為感染用戶(I),且微博用戶A的直接粉絲的狀態(tài)為易感染用戶(S)。
2) 假設(shè)微博用戶B為微博用戶A的直接粉絲,則用戶B轉(zhuǎn)發(fā)該微博信息的概率是β,即微博用戶從易感染用戶成為感染用戶的概率是β。
3) 假設(shè)用戶B轉(zhuǎn)發(fā)信息成為感染用戶之后,不會再次轉(zhuǎn)發(fā)該微博信息的概率為α,即微博用戶從感染用戶(I)成為免疫用戶(R)的概率是α。
4) 假設(shè)微博用戶C沒有關(guān)注發(fā)布該微博信息的用戶和任何轉(zhuǎn)發(fā)該微博的用戶,則用戶C的狀態(tài)為外來用戶(E)。用戶C自主閱讀該微博并轉(zhuǎn)發(fā)的概率為γ,即微博用戶從外來用戶(R)成為感染用戶(I)的概率是γ。
微博用戶的狀態(tài)轉(zhuǎn)變圖,如圖1所示。

圖1 SIRE模型用戶狀態(tài)轉(zhuǎn)變圖
當(dāng)給定某條微博,在t時刻,在SIRE模型中,易感染用戶S,其數(shù)量記為S(t),表示t時刻易感染用戶且可能轉(zhuǎn)發(fā)該微博的人數(shù);感染用戶I,其數(shù)量記為I(t),表示已轉(zhuǎn)發(fā)該微博的用戶而且具有傳播力的人數(shù);免疫用戶R,其數(shù)量記為R(t),表示t時刻不再轉(zhuǎn)發(fā)傳播該微博的人數(shù)。
SIRE模型的假設(shè)有:(1) 當(dāng)某微博用戶發(fā)布或者轉(zhuǎn)發(fā)某條微博信息時,該用戶的直接粉絲即易感染用戶就有可能轉(zhuǎn)發(fā)該微博。假設(shè)從t時刻起,單位時間內(nèi)一個感染用戶能傳播的易感染用戶數(shù)為S(t),轉(zhuǎn)發(fā)傳播的概率為β,從而在單位時間內(nèi)新增感染用戶數(shù)為βS(t)I(t)。(2) 在t時刻,單位時間內(nèi)從感染用戶成為免疫用戶的概率是α,單位時間內(nèi)增加的免疫用戶的數(shù)量為αI(t)。(3) 在t時刻,單位時間內(nèi)外來用戶轉(zhuǎn)發(fā)該微博的概率為γ,單位時間內(nèi)由外來用戶轉(zhuǎn)變?yōu)楦腥居脩舻臄?shù)量為γE(t)。外來用戶占實時的感染用戶的比例ω,則單位時間內(nèi)增加的外來用戶為ωI(t)。
根據(jù)上述定義,我們可以得出SIRE的表達(dá)式為:

(1)
由式(1),可以計算得出在單位時間內(nèi)轉(zhuǎn)發(fā)該微博的易感染用戶數(shù)量、免疫用戶數(shù)量、外來用戶數(shù)量和感染用戶數(shù)量。由感染用戶數(shù)量得出單位時間內(nèi)微博的轉(zhuǎn)發(fā)總數(shù),從而可得出微博在一定時間內(nèi)的轉(zhuǎn)發(fā)總數(shù)和傳播趨勢。
3對比實驗與分析
本文是采用Win 7,CPU G3200,4 GB的電腦平臺進(jìn)行實驗,與文獻(xiàn)[9]中的SISe模型進(jìn)行對比。提出的SIRE模型和SISe模型的模型系數(shù)均為定值,不隨時間發(fā)生變化,使對比實驗更具有合理性。本文實驗采用兩種指標(biāo)對模型效果進(jìn)行評估,首先是對模型的擬合效果評估,然后是對模型的預(yù)測效果評估。
3.1數(shù)據(jù)獲取
目前,新浪微博是國內(nèi)影響力最大,為了客觀地驗證本文提出的微博信息傳播預(yù)測模型,本文通過新浪微博提供的API接口函數(shù),首先獲取從2014年3月到5月的“頭條新聞”用戶的原創(chuàng)微博信息,再獲取這些原創(chuàng)微博信息的轉(zhuǎn)發(fā)微博信息。微博信息傳播傳播速度衰減較快,后期的轉(zhuǎn)發(fā)數(shù)基本不會有較大的改變,所以篩選出200條從微博發(fā)布開始轉(zhuǎn)發(fā)行為持續(xù)2天時間的轉(zhuǎn)發(fā)數(shù)在1000次到20 000次的微博信息作為本實驗數(shù)據(jù)集。其中取100條微博的轉(zhuǎn)發(fā)信息作為訓(xùn)練數(shù)據(jù)集。另外100條微博的轉(zhuǎn)發(fā)信息作為測試數(shù)據(jù)集。
3.2模型的擬合對比實驗
設(shè)置微博發(fā)布時刻為初始狀態(tài),假設(shè)為t0,此時只有微博信息的發(fā)布者為感染用戶,其微博發(fā)布者的粉絲為易感染用戶,即t=t0,I(t0)=1,E(t0)=0,S(t0)=K,K為微博發(fā)布者的粉絲數(shù)量,各參數(shù)數(shù)據(jù)獲取見3.1節(jié)。其中模型的參數(shù)β、α、γ、ω的取值,采用了粒子群算法對訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練求解得出最優(yōu)系數(shù)。根據(jù)其最優(yōu)系數(shù),可得出t時刻的感染用戶I(t),表示該時刻微博信息的轉(zhuǎn)發(fā)總?cè)藬?shù)。因此得出本文提出的SIRE模型和SISe模型的擬合效果對比圖如圖2所示。其中縱坐標(biāo)為某微博信息的轉(zhuǎn)發(fā)總數(shù),橫坐標(biāo)為時間變量,數(shù)據(jù)取微博轉(zhuǎn)發(fā)早期,持續(xù)轉(zhuǎn)發(fā)2天的微博,以每小時為時間單位則t(0≤t≤48)。

圖2 模型擬合效果對比圖
從圖2中可以看出:
1) 在初始階段微博信息轉(zhuǎn)發(fā)總數(shù)增長較快,說明微博信息傳播初期的轉(zhuǎn)播速度較快。隨著時間的推移,微博信息的轉(zhuǎn)發(fā)總數(shù)增長緩慢,微博信息的傳播速度較慢,微博信息傳播趨于衰減。一定時間段后轉(zhuǎn)發(fā)總數(shù)趨于平穩(wěn)狀態(tài),不再有用戶轉(zhuǎn)發(fā)該微博信息,微博信息傳播結(jié)束。本文提出的模型能較好地擬合微博信息傳播趨勢。
2) 當(dāng)t接近于0 時刻,模型的擬合值真實數(shù)據(jù)值相差較大,因為初始值和算法本身相關(guān),粒子群算法初期易出現(xiàn)早熟等現(xiàn)象,隨著迭代的增加,更逼近真實值。
3) 在微博傳播的初始階段,SIRE模型擬合值比SISe模型擬合值更接近真實數(shù)據(jù)。在微博傳播的衰減階段,SISe模型擬合值更接近真實數(shù)據(jù)。在微博的傳播過程中,相比于微博傳播的穩(wěn)定期,其初期的快速傳播擬合在謠言傳播、輿情控制中的應(yīng)用更具有意義。
為了對兩個模型的建模效果進(jìn)行分析,我們采用絕對誤差和均方根誤差(RMSE)來進(jìn)行比較。絕對誤差值和RMSE用來衡量擬合值和真實數(shù)據(jù)之間的誤差大小,絕對誤差越趨于零值,表示擬合效果越好。RMSE越小,表示擬合效果也越好。
RMSE的計算方法如下:
(2)
本文提出的SIRE模型和SISe模型的擬合絕對誤差和RMSE分別如圖3和表2所示。圖3中縱坐標(biāo)為模型的絕對誤差值,橫坐標(biāo)為時間t,由比較結(jié)果可知,本文提出的SIRE模型擬合的絕對誤差和RMSE值均更小,說明SIRE模型的擬合效果更好,能更好地擬合微博信息傳播發(fā)展的趨勢,符合微博信息傳播規(guī)律。

圖3 模型擬合絕對誤差圖

SIRE模型SISe模型228.4209369.9183
3.3模型的預(yù)測對比實驗
為了客觀衡量模型預(yù)測的效果,采用測試集數(shù)據(jù)對模型進(jìn)行驗證。利用前面訓(xùn)練得出的模型最優(yōu)系數(shù)引入式(1)中預(yù)測得出微博信息隨時間變化的轉(zhuǎn)發(fā)總數(shù)。預(yù)測效果對比如圖4所示。其中縱坐標(biāo)為某微博信息轉(zhuǎn)發(fā)總數(shù),橫坐標(biāo)為時間變量t,數(shù)據(jù)取微博轉(zhuǎn)發(fā)早期,持續(xù)轉(zhuǎn)發(fā)2天的微博,以每小時為時間單位則t(0≤t≤48)。

圖4 模型預(yù)測效果對比圖
從圖4中可以看出:
1) 在微博信息傳播初期,t接近于0時刻,兩個模型的預(yù)測效果均不太好,這與粒子群算法本身相關(guān),初期易出現(xiàn)早熟等現(xiàn)象,隨著迭代的增加,更接近于真實值。
2) 兩個模型均能較好地預(yù)測微博信息的隨時間變化的轉(zhuǎn)發(fā)總數(shù),本文提出的SIRE模型的預(yù)測值更接近真實數(shù)據(jù),預(yù)測效果更好。
其中SIRE模型和SISe模型的預(yù)測絕對誤差和RMSE分別如圖5和表3所示。圖5中縱坐標(biāo)為模型的絕對誤差值,橫坐標(biāo)為時間t。由比較結(jié)果可知,本文提出的SIRE模型的預(yù)測效果比SISe模型的預(yù)測效果更好,驗證了從圖上分析得出的結(jié)論。

圖5 模型預(yù)測絕對誤差對比圖

SIRE模型SISe模型53.74357.9756
4結(jié)語
本文研究了微博信息的傳播,提出一個微博信息傳播預(yù)測的模型。該模型在經(jīng)典的SIR傳染病模型基礎(chǔ)之上,結(jié)合了微博用戶轉(zhuǎn)發(fā)行為特性,并且與SISe模型進(jìn)行對比實驗。實驗結(jié)果表明,本文提出的SIRE模型可以更準(zhǔn)確地擬合和預(yù)測微博信息的轉(zhuǎn)發(fā)總數(shù),準(zhǔn)確地預(yù)測微博信息的傳播趨勢。盡管如此,本文的工作中仍有需要改進(jìn)的地方。比如,在微博信息傳播過程中,隨著傳播用戶的增加,微博信息傳播的概率也可能有變化,如何提高模型的預(yù)測精度是本文的未來工作。
參考文獻(xiàn)
[1] Zaman T R,Herbrich R,Van G J,et al.Predicting information spreading in twitter[C]//Whistler,Canada: Proceedings of Workshop on Computational Social Science and the Wisdom of Crowds,2010:1-4.
[2] Yang Zi,Guo Jingyi,Cai Keke,et al.Understanding retweeting behaviors in social networks[C]//Toronto,ON,Canada: Proceedings of the 19th ACM International Conference on Information and Knowledge Management,2010:1633-1636.
[3] Suh B,Hong L,Pirolli P,et al.Want to be retweeted? large scale analytics on factors impacting retweet in twitter tetwork[C]//Proceedings of IEEE 2nd International Social Computing Conference,2010:177-184.
[4] Petrovi S,Osborne M,Lavrenk O V,et al.RT to win! predicting message propagation in twitter[C]//AAAI Publications,Fifth International AAAI Conference on Weblogs and Social Media,2011:586-589.
[5] Hong Liangjie,Dan O,Davison B D.Predicting popular messages in twitter[C]//Hyderabad,India:Proceedings of the 20th International Conference Companion on World Wide Web,2011:57-58.
[6] 張旸,路榮,楊青.微博各種轉(zhuǎn)發(fā)行為的預(yù)測研究[J].中文信息學(xué)報,2012,26(4):109-114.
[7] Chakrabarti D,Wang Y,Wang C,et al.Epidemic thresholds in real networks[J].ACM Transactions on Information and System Security,2008,10(4):1-26.
[8] Li Y,Feng Z,Wang H,et al.ReTweetp:Modeling and predicting tweets spread using an extended Susceptible-Infected-Susceptible Epidemic Model[C]//Wuhan,China:Database Systems for Advanced Applications:18th International Conference,2013:454-457.
[9] Wang H,Li Y,Feng Z,et al.ReTweeting analysis and prediction in microblog:An epidemic Inspired Approach[J].China Communication,2013,10(3):13-24.
[10] Hamer W H.Epidemic disease in engliand[M].London:Bedford Press,1906.
[11] Ross R.The Prevention of malaria[M].Dutton:NaBu Press,1910.
[12] Kermack W O,Mckendrick A G.Contributions to the mathematical theory of epidemics. II. The Problem of Endemicity[J].Bulletin of Mathematical Biology,1991,53(1-2):57-87.
[13] Hethcote H W.A Thousand and on epidemic models[C]//Davis,CA,USA:WorkShop of Lecture Notes in Biomathematics,1994:504-504.
RESEARCH ON MICROBLOGGING INFORMATION DISSEMINATION PREDICTION BASED ON INFECTIOUS DISEASE MODEL
You XinnianLiu Qun
(SchoolofComputerScienceandTechnology,ChongqingUniversityofPostsandTelecommunications,Chongqing400065,China)
AbstractWith the explosive growth of microblogs, it has become the important platform of news pervasion and public opinions dissemination. Research on the dissemination of microblogging information is of great importance for many different fields such as marketing management and public opinions control, etc. According to the features of microblogging information dissemination and in combination with dynamics principle of infectious diseases, we present a prediction model of microblogging information dissemination which is based on the classical susceptible-infectious-recovered (SIR) epidemic model. The model takes the influences of microblog users’ reblogging behaviours on information dissemination mechanism into account, and builds an evolution equation with the characteristics of microblogs dissemination. Experimental results show that the proposed model has lower predictive error compared with SISe model, and it can fit and predict the reblogging number of microblogging information more correctly, so that predict and get the dissemination trend of microblogging information.
KeywordsMicroblogging information disseminationEpidemic modelReblogging behaviourPrediction modelDissemination trend
收稿日期:2014-11-18。國家自然科學(xué)基金項目(61075019);重慶市自然科學(xué)基金項目(CSTC2014jcyjA40047);重慶市教委研究項目(KJ1400403)。游新年,碩士生,主研領(lǐng)域:智能信息處理,社交網(wǎng)絡(luò)。劉群,教授。
中圖分類號TP393
文獻(xiàn)標(biāo)識碼A
DOI:10.3969/j.issn.1000-386x.2016.05.014