999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新浪微博社交網絡用戶影響傳播預測方法

2021-07-24 14:00:22維,王
新一代信息技術 2021年3期
關鍵詞:用戶影響方法

黃 維,王 梅

(東華大學,上海 201620)

0 引言

隨著互聯網行業的快速發展與普及,在線社交網絡也得到了快速的發展,例如新浪微博、Twitter、Facebook等,在線社交網絡也成為了信息傳播和人與人之間相互影響的主要途徑。對用戶間影響關系和用戶影響的傳播進行估計,具有廣泛的應用,如商品營銷[1]、廣告投放策略[2]、事件發展預測[3]、謠言檢測[4]等均利用了社交網絡中用戶的相互影響。因此,對該問題的研究具有重要意義。

新浪微博作為目前國內最大的微型博客社交平臺,其注冊用戶接近四億,活躍用戶超過一億。用戶可以通過發布微博等方式來分享信息,其它用戶也可以通過評論轉發等方式來對信息做出反饋。即用戶通過微博的形式來對其它用戶產生影響,其它的用戶通過評論和轉發的形式對其影響進行擴散。基于此,在新浪微博中可以很方便的獲得用戶與用戶之間的直接的影響記錄,從而能夠比較準確的建立起用戶之間的影響關系。

本文基于新浪微博下社交網絡的特點,提出一種用戶影響傳播預測學習方法。該方法包括數據預處理、影響概率計算、影響力傳播三個主要模塊。數據預處理模塊首先對評論數據丟失的問題進行處理,影響概率計算模塊使用評論和轉發數據作為輸入來學習用戶的表征,并在此基礎上學習用戶與用戶之間的影響概率。影響傳播模塊通過傳播動力學過程模擬了社交網絡中的影響擴散過程,最終輸出初始活躍用戶影響的用戶,其數量標示了初始活躍用戶的影響力。在新浪微博實際數據集上的實驗結果表明,本文對用戶影響傳播預測的效果,相比較傳統 DTIC-Jaccard[5]、DTIC-Credit[5]方法,其F1值分別提升了26.7%和51.4%。

1 相關研究

由于社交媒體用戶數量的不斷增長以及社交媒體為影響傳播提供的便利,社交網絡中的影響關系成為研究的熱點。基于用戶之間的影響關系,可以對社交網絡中的影響力擴散進行建模。對影響關系的研究主要有兩類:統計方法和嵌入方法。統計方法利用傳統的統計學方法直接進行影響關系的計算,得到用戶與用戶之間的影響概率。嵌入方法通過相應的算法來學習得到用戶的表征向量,從而通過用戶的表征向量來學習到用戶之間的影響概率。

嵌入方法。受自然語言領域的單詞嵌入方法的啟發[7],人們對網絡嵌入進行了一些研究,將網絡中用戶嵌入到一個連續的潛在空間中,并根據潛在空間中的相對距離推斷用戶關系。Grover[8]提出“node2vec”算法,使用一個參數來平衡隨機游走的策略,通過該方法可以探索給定區域的不同鄰域節點。Feng[9]利用網絡結構和傳播事件來學習網絡嵌入,通過網絡表征來界定社會影響。然而,這些學習方法依賴于網絡結構,在大多數情況下,網絡結構是動態變化的。Bourigault[10]首先提出只從擴散事件中學習了網絡嵌入,即無網絡結構模型。在他們的研究中,他們模擬了像熱擴散一樣的影響擴散。然后他們將模型[10]擴展到另一個基于級聯過程的模型[11]。但是由于 EM算法的消耗,這個模型的可伸縮性受到影響。

相比于統計方法,嵌入方法有普遍有兩個好處:1)參數量少。每個用戶用一個稠密的向量來表示,相對于維持一個n×n的二維用戶矩陣來說,參數量大大減少。2)發現新關系。嵌入方法可以找到沒有直接交互的,但可能存在影響關系的用戶。3)嵌入方法不容易出現過擬合的現象。因此,本文的模型是基于網絡嵌入的思想提出的。

2 本文方法

2.1 相關定義

本文將微博下的用戶社交網絡圖定義為 G =(V, E, P),其中,V為社交網絡中的用戶集合,E為社交網絡中的邊集合,P為用戶間的影響概率(也稱為用戶間影響關系或社交網絡邊的權重)。一條有向邊(u, v)?E代表用戶u對v有影響概率p(u, v)?P。V集合中用戶所發布的微博集合記為M。具體地,用戶 u?V發布的微博記為 M(u)。對于每個微博 m?M,其轉發列表和評論列表分別記為 R(m)和 C(m),分別記錄了轉發和評論該微博的用戶。在新浪微博的數據集中,轉發列表記錄了全部的轉發用戶,而評論列表由于數據限制,只記錄了部分評論用戶。

基于上述定義,本文影響傳播學習的基本思想是給定一個用戶 u和一個用戶 v,如果用戶 u發布了一條信息(微博),用戶v轉發或評論了這條信息(微博),認為用戶u影響了用戶v。一旦用戶被影響,他將成為活躍用戶。影響傳播過程是基于獨立級聯模型的,在獨立級聯模型,用迭代的過程去模擬影響力傳播。

2.2 框架介紹

本文針對微博平臺下的社交網絡形式提出Inf-embedding模型,其中包括數據預處理、影響概率計算、影響力傳播三個部分。圖1展示了整體的模型框架。一共分為三個部分。在第一部分(數據預處理)中,該模型首先處理了評論數據丟失的問題,并利用最大似然估計將丟失的數據處理成一種可以在后面使用的形式。在第二部分(影響概率計算)中,構建相應算法使用評論和轉發數據作為輸入來學習用戶的表征。在對用戶進行特征化之后,進一步構建社交網絡,也就是學習到用戶與用戶之間的影響概率。在第三部分(影響傳播)中,通過傳播動力學過程模擬了社交網絡中的影響擴散過程,最終輸出初始活躍用戶影響的用戶。在下面的每個小節中,將詳細描述本文模型的每一部分的具體細節。

圖1 模型框架Fig.1 Model framework

2.3 數據預處理

由于微博平臺的限制,微博下的社交網絡數據是存在缺失的,所以將根據后面學習算法的需要,本文通過極大似然估計的思想來進行缺失數據的估計。對于第 i條微博,首先計算得到能獲得的評論用戶數量占真實微博的評論數量比例。進一步,對于用戶u的K條微博來說,可以構建用戶v對用戶u微博的評論情況的似然函數,通過極大似然估計算法,估計用戶v對用戶u微博評論概率。

2.4 影響概率計算

通過用戶u作為影響發出者時的表征向量Iu和用戶v作為影響接收者時的表征向量Sv可以計算得到用戶u對v的影響概率:

其中,

這里通過Sigmoid函數,可以將用戶間影響概率映射到(0,1),這也符合真實的社交網絡環境。

將上式擴展成為所有用戶的微博轉發列表和評論列表的對數似然函數:

同樣使用極大似然估計的思想,最終的學習目標就是最大化上式的對數似然函數。本文使用隨機梯度下降法去更新用戶表征從而最大化該對數似然函數,從而得到每個用戶的表征。基于用戶表征通過公式(1)計算得到每對用戶間的影響概率的集合P輸入到算法1。

2.5 影響傳播估計

對于用戶對(u,v),當用戶 u在任意一個時間戳影響用戶v時,則用戶u成功影響用戶v。因此,用戶u在每個時間戳成功影響用戶v的概率與用戶 u在所有時間戳成功影響用戶 v的概率p(u,v)有如下關系:

算法1影響傳播過程

輸入:種子用戶節點集合S,影響概率集合P,用戶集合V,時間戳的個數N

輸出:被影響的用戶集合f(S)

計算:用T代表整個發散過程持續的時間,t代表時間戳的長度。假定每個時間戳是相等的,那么時間戳的個數為。圖 2繪制了在本文數據集中,用戶被微博影響的數量,隨著距離微博發布的時間的變化。圖 3進一步繪制了在數據集中,用戶被影響的概率密度隨微博發布時間的變化。用函數f(x)來擬合圖3曲線,則不同時間戳里,用戶 u對用戶 v的影響概率有如下關系:

圖2 交互數量隨時間變化Fig.2 Nu mber of interactions vs. the time difference

圖3 交互頻率隨時間變化Fig.3 Frequency of interactions vs. the time difference

3 實驗

影響力傳播是影響力分析研究中重要的一個領域。對于每條微博,將最開始發布這條微博的人視為種子用戶。基于蒙特卡洛模擬來模擬影響傳播的過程。實驗中將對比在數據集中用戶真實影響的人和模擬結果所影響的人。從一個初始的種子用戶開始,活躍的用戶會嘗試去影響他的非活躍的鄰居,一個節點一旦被影響,便會重復這種嘗試。

3.1 數據集

本文通過構建爬蟲程序來獲得新浪微博下的數據。首先獲取微博中的若干用戶。根據這些用戶,來獲取這些用戶所發的微博。根據所獲得的微博,獲取轉發或評論這些微博的用戶。最終數據集中共有6792個用戶,本文獲取了這些用戶從2020年8月1日到2020年8月4日的發布微博。微博總數為 159 879,所有的這些微博共收到了507 014條轉發和177 888條評論。但是,評論列表能看到的評論只有50 369條,剩余的為缺失評論。本文將2020年8月1日到2020年8月3日的數據設定為訓練集,將2020年8月4日的數據設定為測試集。具體數據集的統計信息見表1。

表1 數據集統計信息Tab.1 Statistical information of dataset

3.2 對比方法

1. DTIC-Jaccard[5]。該模型利用Jaccard index來進行影響關系進行計算。

2. DTIC-Credit[5]。該模型是基于信用分配的方法來計算用戶之間的影響關系。

3. Inf-embedding。由本文提出的影響力嵌入方法。

3.3 實驗結果

本文通過正則化平方誤差[12]、精確率、召回率、F1、參數數量等評價指標評估本文學習得到的影響力與真實影響力的接近程度以及所提方法的參數復雜度。具體結果如表2所示。

測試集中真實的受影響的用戶集合:Inf(u) =u(m1) ∪u(m2)… ∪u(mn)

定義以下情況為 True Positive (TP), True Negative (TN), False Positive (FP), False Negative(FN):

表2 影響傳播模型對比Tab.2 Comparison of influence diffusion model

表2呈現了三個模型在影響傳播預測任務中的表現。Inf-embedding模型在各項評估指標上表現均優于另外兩個。由于數據集的時間跨度較短,用戶之間的實際交互歷史并不能充分包含在內。基于這種情況,通過對短期訓練集的學習,來對影響傳播的結果進行召回,得到 0.142的召回率相對其它模型已經有一定的提升。另外由于社交網絡中用戶行為本身存在的偶然性,所以對用戶影響力傳播的預測具有諸多不確定性。因此,對用戶影響力的傳播是十分有挑戰性的工作,例如在twitter環境下只能達到的0.013[11]的F1,在Digg環境下的 0.18[9]的平均準確率。本文所提出方法所達到的精確率 0.400相較于其它模型有了大幅度的提升。以 F1值作為評價標準,相比較傳統DTIC-Jaccard、DTIC-Credit方法,其 F1值分別提升了 26.7%和 51.4%。另外正則化平方誤差指標最低說明了,本模型對影響傳播范圍的預測更接近于真實的傳播范圍,能對用戶影響力有更準確的估計。最后作為嵌入學習的方法,本文在參數量上明顯少于基于統計的模型。綜合來看,本文模型相較于其它模型更適用于新浪微博下社交網絡的影響力分析。

4 結語

本文提出了微博社交網絡影響力預測學習方法,通過所提方法可以對用戶的影響傳播過程進行模擬并學習得到用戶的影響力。基于對用戶的歷史行為進行學習,訓練出用戶表征向量,從而建立起用戶間的影響關系,進而模擬影響傳播的動力學過程。利用該嵌入方法對用戶間影響概率進行計算,能夠很大程度的減少參數的復雜度。并且,該模型在微博的真實數據中各評估指標表現也明顯優于其它模型。

猜你喜歡
用戶影響方法
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 国产精品专区第一页在线观看| 自拍欧美亚洲| 一本一本大道香蕉久在线播放| 欧美日韩资源| 欧美成人免费一区在线播放| 国产精品13页| 欧美精品成人一区二区视频一| 四虎免费视频网站| 亚洲国模精品一区| 婷婷成人综合| 特级aaaaaaaaa毛片免费视频| 国产无吗一区二区三区在线欢| 久久亚洲国产最新网站| 免费xxxxx在线观看网站| 在线国产你懂的| 亚洲无码精品在线播放| 伊人国产无码高清视频| 国产在线精彩视频二区| 亚洲性色永久网址| 久久五月天综合| 日韩成人在线一区二区| 色有码无码视频| 国产精品一线天| 一级黄色欧美| 亚洲最黄视频| 中文字幕乱码中文乱码51精品| 色婷婷视频在线| 91区国产福利在线观看午夜| 777国产精品永久免费观看| 日日摸夜夜爽无码| 免费无码在线观看| 亚洲开心婷婷中文字幕| 精品超清无码视频在线观看| 国产97视频在线| 日韩小视频在线观看| 国产成人毛片| 丁香婷婷激情网| 国产精品亚洲精品爽爽| a级毛片免费看| 黄色在线不卡| 精品色综合| 国产成人精品日本亚洲| 国产成人精品一区二区免费看京| 特级aaaaaaaaa毛片免费视频 | 久久99蜜桃精品久久久久小说| 成人综合网址| 伊人久久大香线蕉aⅴ色| 91午夜福利在线观看| 国产打屁股免费区网站| 日本亚洲成高清一区二区三区| 欧美全免费aaaaaa特黄在线| 久久国产热| 免费国产黄线在线观看| 国产男女免费完整版视频| 国产青榴视频| 免费无码又爽又黄又刺激网站| 国产日本一区二区三区| 免费看a级毛片| 亚洲天堂精品在线观看| 亚洲国产天堂久久九九九| 国产va免费精品观看| 91av成人日本不卡三区| 国内精品一区二区在线观看| 中字无码av在线电影| 欧美国产综合视频| 久久午夜夜伦鲁鲁片不卡| 色婷婷在线影院| 精品亚洲国产成人AV| 欧美一区二区三区不卡免费| 91网址在线播放| 久视频免费精品6| 精品在线免费播放| 重口调教一区二区视频| 国产成人高清精品免费软件| 99精品视频播放| 久久综合伊人77777| 免费不卡视频| 国产婬乱a一级毛片多女| 婷婷色婷婷| 亚洲男人天堂网址| 最新国语自产精品视频在| 欧美色99|