999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost算法的社交網絡鏈路預測

2019-12-12 06:05:16陳耀飛王友國朱亮
軟件導刊 2019年11期
關鍵詞:機器學習

陳耀飛 王友國 朱亮

摘 要:提升鏈路預測精度是復雜網路研究的基礎問題之一。傳統基于局部信息相似性、基于全局信息相似性與基于隨機游走相似性的鏈路預測都是基于單個相似性指標進行預測的,而沒有充分利用這些相似性指標的綜合信息。將鏈路預測問題看作機器學習中的二分類問題,將有連接的樣本標簽記為1,無連接的樣本標簽記為0,將基于局部信息、基于全局信息與基于隨機游走相似性等15個指標作為樣本特征。綜合考慮以上信息,使用XGBoost算法,選取AUC作為模型評價準則,在facebook真實數據集上進行實驗。結果表明,該算法在測試集上的AUC高于基于單個相似性指標鏈路預測的AUC。

關鍵詞:鏈路預測; XGBoost;機器學習;社交網絡

0 引言

隨著網絡時代的到來,社交網絡已逐漸成為學者們研究的熱點。作為網絡科學領域的研究方向之一,鏈路預測是指通過已知與已觀察到網絡中的鏈接,預測給定網絡中尚不存在的兩個節點之間鏈接的可能性。鏈路預測既包含了對未知鏈接的預測,也包含了對未來鏈接的預測[1]。在計算機領域,已有不少學者針對鏈路預測進行深入研究,當前主要的鏈路預測方法是基于網絡拓撲結構的鏈路預測方法,其可分為基于節點鄰居相似性、基于最大似然估計及基于概率模型3種類型。在基于節點鄰居相似性的鏈路預測中,具有代表性的算法有基于局部信息相似性的共同鄰居算法、基于路徑相似性的Katz算法與基于游走相似性的RWR算法。

Getoor等[1]把文檔與單詞之間的關系看作鏈路預測問題,通過觀察到的鏈接與節點屬性可以估計一個鏈接存在的最大可能性。之后,David & Kleinberg[2]首次定義了社交網絡中的鏈路預測問題,并且在大規模共同作者網絡數據集上進行實驗,結果表明,關于未來交互的信息可以單獨從網絡拓撲中提取出來。社交網絡中由于存在不準確信息,導致網絡中存在虛假鏈接[3-4],鏈路預測算法可用于發現網絡中的虛假鏈接,還原真實網絡[5]。鏈路預測不僅可以幫助分析網絡中的缺失數據,還可用來發現網絡演化過程中將來可能出現的鏈接[6-7]。O'Madahain等[8]提出局部條件概率模型,在進行預測時充分利用網絡拓撲結構和節點屬性等信息;Lin等[9]根據節點屬性定義節點相似性,從而利用節點相似性進行預測。利用節點屬性可以很好地進行預測,但節點屬性信息很難獲取,即使能獲取到,也不能保證信息的真實性,如社交網絡中很多用戶的注冊信息則不夠真實。Linben等[10]基于網絡拓撲結構分析了幾種指標對社會網絡中鏈路預測產生的效果;Clauset等[11]發現在具有明顯層次結構的網絡中,利用網絡層次結構進行鏈路預測可取得不錯的效果。基于相似性的方法是最基本且最具啟發式的方法,通過利用相似性指標進行鏈路預測,如Adamic等[12]通過分配給較少的相連鄰居更高權重,重新定義CN(Common Neighbor)為Adamic-Adar(AA)得分;Katz[13]基于所有路徑集合,直接對所有路徑求和,對于更長路徑,通過指數衰減賦予更少權重得到Katz得分。還有一些其它相似性指標,包括資源分配指標(RA)[14]、Jaccard指標[15]、Sorensen指標[16]等。基于隨機游走的相似性指標包括重啟的隨機游走(RWR)與余弦相似性(Cos+)。Mohammad等[17]通過使用有監督學習方法,分別在BIOBASE和DBLP兩個數據集上進行測試,都取得了不錯的效果;Backstrom等[18]提出有監督的隨機游走算法,可以自然地將網絡結構中邊與節點級別的信息結合起來;吳祖峰等[19]使用有監督學習方法,使用Adaboost算法對arXiv 論文合作網絡與電子郵件網絡兩個真實數據集進行測試,準確率和召回率都顯著高于當時的主流算法。

基于相似性的鏈路預測是目前運用最多的鏈路預測算法,進行預測前首先需要計算兩個節點之間的相似性,包括CN等基于局部信息的相似性指標、Katz等提出的基于全局信息的相似性指標、Cos+等基于隨機游走的相似性指標。基于相似性的方法憑借其計算簡單、速度快等優點吸引了很多學者關注,但該方法的缺點是只考慮單一相似性指標,而未綜合考慮這3類基于不同信息的相似性指標。

本文在基于相似性的鏈路預測算法基礎上,將鏈路預測問題看作機器學習中的二分類問題,使用有監督學習中的XGBoost算法[20]進行鏈路預測,從而綜合考慮所有相似性指標信息,提高鏈路預測精度。

3 結語

本文基于XGBoost算法進行鏈路預測,與基于單相似性指標算法的鏈路預測不同,基于XGBoost算法的鏈路預測將鏈路預測問題看作機器學習中的二分類問題,模型訓練時選取基于局部信息、基于全局信息與基于隨機游走的相似性指標作為機器學習中的特征,考慮多個指標進行鏈路預測,并且使用AUC作為模型評價準則。經過實驗發現,基于XGBoost的多個指標鏈路預測優于基于單個相似性指標的鏈路預測,而且綜合考慮所有信息相似性指標后進行鏈路預測效果最好。鏈路預測可用于社交網絡中的好友推薦,推薦準確度的提升可提高社交網站用戶的忠誠度。

參考文獻:

[1] GETOOR L, DIEHL C P. Link mining:a survey[J]. ACM Sigkdd Explorations Newsletter, 2005, 7(2):3-12.

[2] LIBEN-NOWELL D, KLEINBERG J. The link-prediction problem for social networks[M]. New York:John Wiley & Sons, Inc. 2007.

[3] VON MERING C, KRAUSE R, SNEL B, et al. Comparative assessment of large-scale data sets of protein-protein interactions[J]. Nature, 2002, 417:399-403.

[4] BUTTS C T. Network inference, error, and informant (in)accuracy: a Bayesian approach[J]. Social Networks, 2003, 25(2):103-140.

[5] GUIMERA R, SALES-PARDO M. Missing and spurious interactions and the reconstruction of complex networks[C]. Proceedings of the National Academy of Sciences, 2009, 106(52):22073-22078.

[6] Lü L, ZHOU T. Link prediction in complex networks: a survey[J]. Physica A:statistical mechanics and its applications, 2011, 390(6): 1150-1170.

[7] 呂琳媛. 復雜網絡鏈路預測[J]. 電子科技大學學報,2010,39(5):651-661.

[8] OMADADHAIN J,HUTCHINS J, SMYTH P. Prediction and ranking algorithms for event-based network data[C]. Proceedings of the ACM SIGKDD 2005. New York: ACM Press, 2005: 23-30.

[9] LIN D. An information-theoretic definition of similarity[C]. Proceedings of the 15th International Conference of Machine Learning,1998: 296-304.

[10] LIBEN N D,KLEINBERG J. The link-prediction problem for social networks[J]. Journal of American Soci Information Science Technology,2007,58(7): 1019-1031.

[11] CLAUSET A,MOOR C,NEWMAN M E J. Hierarchical structure and the prediction of missing links in networks[J]. Nature,2008, 453: 98-101.

[12] ADAMIC L A,ADAR E. Friends and neighbors on the Web[J].? Social Networks,2003, 25(3):211-230.

[13] KATZ L. A new status index derived from sociometric analysis[J].? Psychometrika,1953,18(1):39-43.

[14] ZHOU T,LINYUAN Lü, ZHANG Y C. Predicting missing links via local information[J]. The European Physical Journal B,2009,71(4):623-630.

[15] JACCARD P. étude comparative de la distribution ?orale dans une portion des Alpes et des jura[J]. Bull Soc Vaudoise Sci Nat, 1901, 37:547-579.

[16] S?RENSEN T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on danish commons[J]. Biol. Skr, 1948, 5: 1-34.

[17] HASAN M A,CHAOJI V,SALEM S, et al. Link prediction using supervised learning[C]. The Proceedings of the Fourth Workshop on Link Analysis, Counterterrorism and Security, 2006.

[18] BACKSTROM L,LESKOVEC J. Supervised random walks: predicting and recommending links in social networks[C]. WSDM,2011.

[19] 吳祖峰,梁棋,劉嶠,等. 基于AdaBoost的鏈路預測優化算法[J]. 通信學報,2014,35(3):116-123.

[20] CHEN T,GUESTRIN C. XGBoost:a scalable tree boosting system[J]. KDD '16 Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2016:785-794.

(責任編輯:黃 健)

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 内射人妻无码色AV天堂| 午夜国产在线观看| 伦伦影院精品一区| 欧美中文字幕一区二区三区| 欧美色亚洲| 在线五月婷婷| 内射人妻无套中出无码| 在线观看91精品国产剧情免费| 日韩亚洲高清一区二区| 精品午夜国产福利观看| 亚洲日本www| Jizz国产色系免费| 91探花国产综合在线精品| 免费三A级毛片视频| 日本91视频| 欧美不卡视频在线观看| 91福利国产成人精品导航| 国产成人1024精品| 无码丝袜人妻| 亚洲日韩每日更新| 久久久久中文字幕精品视频| www.91在线播放| 久久女人网| 亚洲欧洲综合| 四虎永久免费地址在线网站| 亚洲日韩欧美在线观看| 国产毛片高清一级国语 | 在线无码av一区二区三区| 超碰aⅴ人人做人人爽欧美 | 国产传媒一区二区三区四区五区| 99性视频| 国产经典三级在线| 国产精品手机视频一区二区| 怡春院欧美一区二区三区免费| 无码专区国产精品第一页| 国产黄色视频综合| 亚洲日韩国产精品综合在线观看 | 亚洲欧美一区二区三区蜜芽| 亚洲国产精品成人久久综合影院| 天天摸夜夜操| 黄色网址免费在线| 国产一区二区网站| 色欲综合久久中文字幕网| 亚洲va在线∨a天堂va欧美va| 青青久视频| 天天色综网| 青青草原国产免费av观看| 国产情侣一区二区三区| 国产精品无码久久久久AV| 亚洲人成日本在线观看| 国产乱人伦偷精品视频AAA| 日韩第九页| 欧美特级AAAAAA视频免费观看| 欧美日韩成人| 久久久久久尹人网香蕉| 亚洲AV人人澡人人双人| 亚洲女同欧美在线| 色婷婷亚洲综合五月| 日韩欧美国产另类| 久久久久无码精品| 小13箩利洗澡无码视频免费网站| 亚洲日本韩在线观看| 国产91av在线| 91成人试看福利体验区| 国产人成在线观看| 在线欧美国产| 日本精品影院| 亚洲h视频在线| 黄色三级网站免费| 国产在线97| 丁香婷婷综合激情| 亚洲成人在线网| 成人毛片免费观看| 国产一区二区视频在线| 成人毛片免费观看| 亚洲一区色| 婷婷综合缴情亚洲五月伊| 凹凸精品免费精品视频| 日韩欧美中文| 福利在线免费视频| 亚洲日韩第九十九页| 特级毛片免费视频|