姜偉偉+顧程
1.廣西互聯網新聞傳播研究中心,廣西南寧 530000 2.上海微趣網絡科技有限公司,上海 200235
摘 要 當前對社交媒體的研究集中于關注微博、微信的用戶使用行為分析,缺乏對微博尤其是微博信息實時影響力的動態性研究。本研究以頁面評級(Page Rank)算法為基礎,提出改進的社會評級(Social Rank)算法,結合用戶微博使用行為分析得出的權重值,并將時間因素納入微博動態影響力評估模型之中。通過具體實例探討了微博動態影響力指數構建的重要性和實用性。研究認為社交媒體中大量數據的深度分析與挖掘可以更好地幫助市場營銷以及輿情監管部門及時掌握信息的發展動態,從而更有效地推進品牌傳播和干預輿論信息的走向。
關鍵詞 新媒體;微博;信息傳播;動態影響力
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2017)11-0045-02
隨著互聯網技術的不斷發展,許多社交平臺也從最初的萌芽逐漸發展成熟,人與人之間的空間距離得以進一步拉近。特別是微博、微信等社交工具的出現,也更進一步地推動了互聯網的發展,人們可以借助微博、微信,以及一些移動客戶端隨時進行信息的瀏覽、關注與分享。大量的信息瀏覽、關注與分享也產生了大量的數據,數據尤其是實時數據的深度分析挖掘可以幫助輿情監管部門及時發現影響力最強的信息,從而有針對性地對其可能產生的負面影響及時進行干預,避免負面信息更大范圍傳播所帶來的負面影響。
互聯網信息的影響力主要通過信息排序獲取,排序越靠前的信息人們對它的關注程度越高,影響力也就越大。本研究認為新的微博影響力評估方法應強調信息辨識的問題,并考慮怎樣解決時間因素對于信息影響力衰減的影響,進而實現一個兼顧全面性、及時性和真實性的實時互聯網信息列表構建。基于以上分析,本研究以微博信息為研究對象,結合以往有關網頁排序的Page Rank算法,在此基礎上提出了Social Rank的計算方法,得到相應微博用戶的權重信息,并將時間因素納入到信息影響力排名計算之中,構建了更為合理的微博動態影響力指數。
1 基于社會評級(Social Rank)的微博影響力權重計算
騰訊和新浪微博是中國最主要的2個微博平臺,其各自所擁有的注冊用戶超過3億。用戶與用戶之間通過相互關注、單方面的關注或被關注,不僅可以實現微博使用者資訊獲取或交流的目的,還可以滿足使用者間情感交流的訴求。根據以往國內外學者的研究,微博使用者所發布的信息可以在其粉絲群中得到廣泛和迅速的傳播,從而擴大其信息傳播的影響力。微博所具有的傳播快、影響大、覆蓋廣、社會動員能力強等特點,使其在某種程度上成為推動社會發展的一個重要工具,因此,有效微博影響力的獲取,可以更為準確合理的向公眾傳遞更有價值的信息。
Page Rank近似于一個用戶,是指在互聯網上隨機地單擊鏈接將會到達特定網頁的可能性。通常,能夠從更多地方到達的網頁更為重要,因此具有更高的網頁排名。每個到其他網頁的鏈接,都增加了該網頁的排名。具有較高排名的網頁一般都是通過更多其他網頁的鏈接而提高的。考慮到Page Rank算法涉及的網頁數量和網頁鏈接與微博平臺用戶關系間的相似性,本研究將用戶與用戶之間的鏈接網絡看作網頁與網頁之間的超鏈接,并由此計算出大部分活躍用戶的社交權重值,即用戶的Social Rank值。Social Rank的等級范圍介于0到10之間,10級為滿分,SR值越高說明用戶(或信息)越受歡迎(越重要、影響力越大)。例如,SR值為1的用戶表明該用戶不太受歡迎,而SR值為7到10則表明該用戶非常受歡迎(或者說極其重要)。另外,Page Rank方法不僅考慮網頁鏈接數量,還考慮了網頁質量因素,因此,對于Social Rank來說,被權重高的人關注(或信息被高權重的人關注或分享),微博用戶自身的權重值也會相應提高。
所以一個微博自媒體的Social Rank值是由其他自媒體的Social Rank值計算得到。與Page Rank
算法的原理基本相同,Social Rank剛開始賦予每個微博用戶或者每條微博信息相同的重要性得分,通過迭代遞歸計算來更新每個用戶或信息節點的Social Rank得分,直到得分穩定為止。基于大量的數據和計算,最終可以獲取每個微博用戶或每條微博信息穩定的Social Rank值,通過實際比對,該值可以線性地評估各個微博自媒體賬號及其所發布信息的傳播價值。從排名計算過程可以看到Social Rank計算的結果與用戶特征及其所發布的信息主題是沒有任何關系的,即該算法是用戶與主題無關的,因此Social Rank算法能夠較好的獲取微博的影響力。
2 微博實時動態影響度計算
確定了微博用戶及微博信息影響力的權重之后,就獲取了微博信息實時影響力測量的基礎。考慮到信息傳播影響度的實用價值性,需要從實時動態性及最終靜態性兩個角度測量信息的影響度。
信息的實時動態性強調關注信息傳播過程中實時變化的影響力,微博使用者一條信息發布后,如果該信息影響力足夠大,那么它可能很快獲取更多受眾的關注,并且在某種程度上可能會對人們的日常生活產生影響。因此,快速處理最近的消息并同時處理新出現的信息,在很短時間內評估出某一時刻信息的傳播影響力,并將其隨時間變化而出現的衰減性特征納入信息影響力分析框架,則可能會更有針對性的對某些不好的信息采取提前干預的手段,避免其對人們的日常生活產生負面影響。實時動態性信息影響力的獲取對于網信辦快速發現重要輿情并快速處理大量輿情相關信息聚焦輿論關注點,爭取應對時間方面有著較強的實戰意義。對于最終靜態信息,其測量無需考慮時間的衰減,獲取微博所傳播信息在各新媒體平臺上所達到的最終用戶數進行累加,即獲取了該微博信息的影響力。由于信息發布后存在一段時間的衰減性,其衰減時限基本為7天,因此該靜態值基本可以在信息發布后的7天后進行測量。
借助數億個微博使用者歷史數據分析,通過Social Rank算法測量出微博使用者的使用權重函數后,就可以進一步評估微博信息的傳播影響力。一條信息某段時間內在微博自媒體中傳播影響的一個量化的數值被看作該條信息的時間傳播影響度。實時信息傳播影響度數值越高,那么這條信息的受眾也就越多,并且該條信息被繼續擴散的可能性也就越大。因此,實時信息傳播影響力本身是一個相對值,即只有兩條信息比較后才使其具有一定意義,體現出其實用價值。信息實時傳播影響力指標構建時涉及到三個主要參數:(1)單位時間內轉發的媒體數增量;(2)每個轉發節點的Social Rank權重;(3)發布時間距離現在的時間。
信息實時傳播影響力指數計算過程中計入時間的因素,考慮了時間的對信息衰減的作用,更適合表達當前信息的受關注程度。信息的最終靜態傳播影響力關注的則是信息隨時間衰減后的最終影響力,即信息最終達到了多少受眾,影響了多少人群。因此,如果只是計算或評估信息在完整傳播周期中的影響力,可以直接評估信息的最終靜態傳播影響力,信息傳播的7天周期結束后,將實時傳播影響力算法理論公式中的時間衰減項剔除后,便可以得到最終靜態傳播影響力的算法。
由于7天之后可以獲取信息的最終靜態傳播影響力,與7天之內該信息的實時影響力價值相比,其價值有效性或對人們日常生活的影響力相對較弱,因此,本研究更關注信息的實時影響力。
3 結論
本研究在以往學者研究的基礎上,結合互聯網數據采集與大數據處理分析技術,對Page Rank網頁排名算法進行改進后,在獲取大量微博使用者及其發布信息數據的基礎上,根據微博特點設計了測量微博當前影響力指數的計算方法并通過計算機實現了快速的數據處理計算,以獲取實時的微博影響力信息排名,并對信息進行自動化更新處理,以尋找到當前輿論最關注的相關信息。
研究結合微博信息的實時數據通過兩組數據的對比發現,將微博發布時間考慮在內的實時微博信息排行能夠更有效地發現最具影響力的微博信息。基于Page Rank方法所改進的Social Rank微博動態影響力指數構建考慮了微博用戶與用戶、用戶與信息、信息與信息之間的聯系,并結合相應微博使用者的影響力以及時間變化的因素,將這些因素共同納入微博信息影響力指數的構建之中,因此可以得到相對準確的信息影響力排名,從而幫助輿情監管部門對信息進行有效的監管。由于7天的周期會使得信息衰減到一個最終的靜態排名狀態,而該狀態更多的依賴于微博用戶自身的用戶權值,時間并不會對其影響力產生實質性的影響,因此,本研究并未對其進行深入探討。實時性信息影響力分析,更有助于為有限人力的互聯信息辦公室提供幫助,依靠信息技術,實現其高效捕捉高影響力信息進行監管的業務目標。
參考文獻
[1]劉璐佳.微博影響力的直覺模糊評價方法[J].電腦知識與技術,2011,7(33):8195-8196.
[2]郭林,陳潔,顧程.新媒體信息傳播影響度測量方法的研究[J].軟件產業與工程,2016(2):51-56.