999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于同構合著網絡的合作者推薦模型研究

2017-05-13 02:34:32杜秀春康文杰
長沙大學學報 2017年2期
關鍵詞:模型

劉 欣, 杜秀春, 康文杰

(1.長沙學院計算機工程與應用數學學院,湖南 長沙 410022; 2.國防科學技術大學計算機學院,湖南 長沙410073)

基于同構合著網絡的合作者推薦模型研究

劉 欣1, 杜秀春2, 康文杰2

(1.長沙學院計算機工程與應用數學學院,湖南 長沙 410022; 2.國防科學技術大學計算機學院,湖南 長沙410073)

隨著社會網絡的快速發展,對同構合著網絡中合著關系推薦問題的研究現已成為一個研究熱點.首先定義了合著關系和同質性;其次給出不同情況下合著關系特征,建立合著關系推薦模型,并提出了不同情況下產生合著關系推薦的算法.實驗表明,通過該模型可為作者推薦適合的合著者.

同構合著網絡;作者相似性;學科相似性;信任度

隨著科學和工程領域的快速進步,合作的趨勢朝著兩個不同的方向發展,一方面,合作的形式日益趨向于多樣化、復雜化;另一方面,合作的范圍突破地域的限制并逐步擴大,跨地區、跨國家之間的合作日益密切而且合作強度不斷增大.這就需要一個合作推薦模型來為科研工作者推薦合作對象,為將來的合作提供一個推薦的平臺.

社會網絡結構和行為共同演化來促進人與人之間的合作[1],尤其是科研合作網絡,這種動態的社會合作網絡結構可以促進合作,網絡節點間鏈路的重連可以促使合作達到很高的水平[2].Brzozowski 和 Roman在惠普公司內部社交網站Watercooler上做了一次評測推薦方案實驗,主要提出類三種推薦方法:基于網絡結構推薦,基于用戶行為推薦和基于用戶檔案相似度推薦,實驗結果表明用戶的社交行為更能反映真實的自我和更容易被推薦者接受[3].與以上結論完全不一致的是,Aiello[4]等人發現標簽能夠刻畫用戶的興趣相似度,不同于以前僅根據結構相似性的是他們考慮了用戶在標簽、圈子、圖書和音樂等這些行為上的相似性.越相似的網絡節點對產生連邊的可能性越大,張千明[5]等人將基于相似性的鏈路預測模型應用于標簽分類問題中,通過相似性計算出未標簽節點與所有已標簽節點標簽的相似度.鏈路預測有望為網絡演化提供一個簡單同一且相對公平的比較平臺[6].類似地,如何刻畫網絡中節點的相似性也是一個重大的理論問題,只有能夠快速準確地評估某種相似性定義,才能進一步研究網絡特征對相似性指標選擇的影響[7].Yizhou Sun[8-10]等人提出了在異構書目網絡中合作關系預測思想并給出了具體的基于元路徑的關系預測模型以及元路徑的拓撲特征.Xiao Yu[11]等人建立基于元路徑的預測模型,并提出用兩相引用概率研究方法來更加高效有用地預測引文關系.Ball 和Newman[12]用極大似然模型研究類采訪獲取的社會網絡關系,發現對于非互惠的邊,大多數是由社會地位低的個體指向社會地位高的個體,而互惠邊通常在社會地位相似的人體之間產生.呂琳瑗[13]利用鏈路預測的方法推斷影響航空網絡演化的重要因素,研究結果表明兩個城市之間是否存在航空線路與它們的經濟水平緊密相關,其中與GDP第三產業關聯更為突出.文獻[14]和[15]對現有推薦系統評價指標進行了系統的闡述,總結了推薦系統評價指標的最新研究進展,從準確度、多樣性、新穎性及覆蓋率等方面進行多角度的闡述,并對各自的優缺點以及適應的環境做了深入的分析.

首先給出了合著關系和同質性的定義;其次給出了不同情況下合著關系的特征;再次建立了合著這推薦模型,并給出了不同情況下產生合作關系的算法;最后通過實驗,并對作者之間的合著者推薦模型進行合理性、正確性分析與檢驗.

1 合著關系的定義

合著關系是已發表的學術論文中作者之間共同署名的關系.合作關系是指社交網絡中人與人之間已合作的關系和潛在的合作關系.潛在的合作關系是指社會網絡中那些還沒有建立合作關系的節點在將來很有可能合作的關系,它既受已合作關系的影響,又受自身屬性的影響.在本文中,合著關系和合作關系是同一種關系,因為本文研究范圍只針對學術論文,對合作關系的預測也只是研究作者將來可能的合作對象.而合作關系定義相對廣泛一些,它不僅包含合著關系,而且包含其他領域的合作關系.

1.1 合著關系的描述

定義(合著關系矩陣):在合著網絡中,我們假設網絡中n個不同的節點,用RM=(R1,R2,…,Rn)′表示節點之間合著關系矩陣,Ri(1≤i≤n)表示第i個節點與其他節點之間的合作關系.則合著關系矩陣表示如下:

其中,節點之間的關系rij(1≤i,j≤n)表示第i個節點與第j個節點之間的合作關系,rij=0表示第i個節點與第j個節點之間以前沒有合作,rij=k表示第i個節點與第j個節點之間合著k次.顯然,rij=rji,這是因為第i個節點與第j個節點之間的合作次數與第j個節點與第i個節點之間合作次數相同.因此RM=(R1,R2,…,Rn)′是對稱矩陣,具有對稱矩陣的所有屬性.

1.2 同質性

同質性是指合著網絡中節點具有相同的屬性或特征,同質性可以分為兩類:作者相似性和學術相似性.

(1)作者相似性(AuthorComparability)是指作者之間綜合能力的相似程度.這種相似程度取決于一個因數,即作者在某會議上發表論文的數量,職位.不同刊物或會議上發表論文可以反映不同的學術水平,發表論文數量的多少表示作者的水平程度高低.所以可以將論文刊物或會議分為四個等級:等級A(A類會議或期刊),等級B(B類會議或期刊),等級C(C類會議或期刊),等級D(EI),等級E(核心期刊),等級F(普通期刊).

作者相似性矩陣:AT=(A1,A2,...,An)′=

Ai(0in)表示作者i,ai,bi,ci,di,ei和fi分別對應于作者在四個等級論文刊物或會議上發表論文的數量,以及它們所對應的影響因子為I1=0.5、I2=0.25、I3=0.125、I4=0.1、I5=0.075、I6=0.05。所以,作者Ai與作者Aj的相似性AC為:

(1)

(2)學科相似性(ProfessionalDisciplineSimilarity): 是指兩個科學家所從事科研領域的相似程度.能否跨學科合作主要取決于其學科之間的可合作程度,我們通過計算歷史合作次數與總次數的比例來定義學科相似度.所以學科與學科的學術相似性AS為:

(2)

這里, 表示學科與學科可能合作程度,表示學科和學科歷史合作次數,表示學科論文總數,因此是隨時間動態變化的.

(3)地域相似性

地域相似性(RegionalSimilarity)是指學校或科研單位所處的地理位置對其與其他合作單位合作的影響.在互聯網高度發展的今天,我們不得不承認很多單位之間作者的合著依然受到其地域和學校級別的限制,例如在湖南,國防科大、中南大學和湖南大學合著比較頻繁,而與其他學校的合著次之,因為地域相同的情況下,與學校的級別也有很大的關系.我們將這類特性公式化如下:

(3)

Ld(Ai,Aj)表示地域差,同一城市取值為0,同一省份取值為1,同一國家為2,不同國家為3.max(|Ld(Ai,Aj)|)表示最大地域差為3.Sd(Ai,Aj)表示單位級別差,985高校或國家重點單位為4,211高校為3,一本類高校為2,二本類高校為1,其他為0.如果高校級別相同,此時Sd(Ai,Aj)=0,因此RS(Ai,Aj)=|Ld(Ai,Aj)|/max(|Ld(Ai,Aj)|)表示地域相似性只與地域有關。

2 合著關系的特征

在合著網絡中,任意兩個節點之間的合作都存在三個關系,即(1)直接合著關系、(2)間接合著關系和無合著關系.無合著關系又可以分為可達路徑合著關系和不可達路徑合著關系

(1)直接合著關系

直接合著關系就是指兩個作者直接合作完成學術研究、論文撰寫及共同署名發表過至少一篇以上論文.如圖1,作者a與作者b合作1,2,…,k次.

圖1 直接合著關系

(2)間接合著關系

圖2 作者A和作者B有k個共同合作者的情況圖

間接合著關系就是指兩個作者沒有共同署名發表過論文,但他們可能有共同合作者,該作者跟他們都存在直接合著關系.如圖2所示,k個共同合著者中只要有一個合著者介紹就會促成作者a和作者b之間的合作.

(3)無合著關系

無合著關系是指排除直接合著關系和間接合著關系情況之外的關系,可能存在如下兩種情況.

①可達路徑合著關系

路徑可達是指在合著關系網絡中總能找到一條以上路徑從作者a到達作者b.圖3顯示作者a要與作者b合作,需要有k個合著者的共同引薦.

圖3 作者A經k個作者傳遞推薦和作者B建立關系圖

②不可達路徑合著關系

不可達路徑合著關系就是找不到一條路徑可以從作者a到達作者b.但也存在合作的可能性且受到作者相似度、學術相似度和地域相似度的影響.如果作者水平相當、且在同一地域,他們的合著幾率會大很多,是合著推薦的最佳人選.如圖4,作者a與作者b所在的網絡隔離,作者a或作者b也可是是孤立節點.

圖4 作者a和作者b在兩個相互隔離的網絡中

3 合作者推薦模型

基于給出的合著網絡基本性質(即同質性)與合著關系特征,便可以建立合著關系推薦模型來解決不同情況下合著者推薦問題.針對前面描述的四種合著關系,可給出在不同關系下的合著推薦計算方法.而推薦合著的概率也與作者之間的信任度有關,下面給出每種情況下信任度的計算方法.

3.1 直接合著關系的推薦模型

定義(信任度):在合著網絡中,信任度(Trustdegree)表示作者A對其合著者的信任程度,其與作者的合作次數、能力和影響力有關,能力可以用作者發表論文水平來衡量,而影響力通過與該作者合著的人的平均度來度量.因此,信任度TD:

(4)

3.2 間接合著關系的推薦模型

間接合著關系中作者之間的信任度與推薦者和作者相似性有很大的關系,在合著網絡中,推薦者的介數(Betweenness)越高,推薦概率越大.同樣,作者越相似,被推薦的概率越大.因此,推薦概率與介數和作者相似性有關.推薦概率被定義如下:

(5)

這里,pk(Ai,Aj)表示共同合著者k推薦作者i和作者j之間合著的概率,Betw(Ak)表示作者k的介數,Betwmax表示所有作者介數的最大值,AC(Ai,Aj)為作者i與作者j之間的作者相似性.

推薦者越多,作者之間的信任就越大.而且只要有一個推薦成功就成功,因此,信任度TD:

(6)

3.3 無合著關系的推薦模型

無合著關系的推薦主要依賴三點,作者相似性,學術相似性和地域相似性.地域相似性越大,信任度越小.所以,信任度TD:

(7)

這里,當存在可達路徑合著關系時,α=1表示需要n個推薦者傳遞推薦促成作者i和作者j合作.當存在不可達路徑合著關系時,α=0.

4 實驗

為驗證合作關系模型,采集了某科研單位科研工作者以及相關合作者80名,論文206篇,從中挖掘相關合著者信息對可能的合作關系進行研究.

首先隨機選出18個節點并給出它們的作者相似性因素,用于計算作者相似性.不難發現圖中節點71為孤立節點,這樣可計算節點71與其他節點之間的信任度,信任度越高,被推薦的概率越大.這里先給出所有作者的相似矩陣列表如(表1),根據此表可以算出作者相似性.

表1 作者相似矩陣表

表2 區域相似性表

圖5 作者學術水平圖

根據表1計算得出作者的學術水平圖,如圖5,再根據作者的學術水平可以得出作者71與其他作者之間的作者相似度,如圖6地域相似性與作者所處的地理位置有關,表2顯示作者集{71,73,80}為一個地區,學校等級為1,而作者集{1,3,17,33,40,55,63,79}為地區2,學校等級為3,兩個集合之間的地區差為1,學校等級差為2,所以他們中作者的區域相似性為(1/3)2+1=1/27.如圖6,帶三角形的域相似性,帶菱形的線表示作者相似性,帶正方形的線為學術相似性.

圖6 作者71與其他作者之間的作者相似性和學術相似性

由于作者71是孤立節點,沒有跟其他節點合作過,所以公式(7)中為0.通過作者相似性,區域相似性,學術相似性,我們可以根據公式(7)計算作者71與其他作者之間的信任度,并將其較大的值作為合著推薦者.如圖7所示,節點71與其他節點之間的信任度從高到低依次是33、19、61和56等,因此我們推薦這些節點作為作者71的合著者.

圖7 節點71與其他節點之間的信任度

5 結論

本文通過對同構合著網絡的研究,建立合作可能性預測模型并給出了合著關系矩陣和合作信任度的計算方法,通過對不同情況下合著關系特征的分析,提出了在同構合著網絡圖中推薦可能合作者的思想,經實驗結果表明該模型的確能夠為科研工作者推薦可能的合作對象提供一個很好的平臺,為今后科學家之間的合作找到了一條捷徑.

[1]FehlK,vanderPostDJ,SemmannD.Co‐evolutionofbehaviourandsocialnetworkstructurepromoteshumancooperation[J].Ecologyletters, 2011, (6): 546-551.

[2]RandDG,ArbesmanS,ChristakisNA.Dynamicsocialnetworkspromotecooperationinexperimentswithhumans[J].ProceedingsoftheNationalAcademyofSciences, 2011, (48): 19193-19198.

[3]BrzozowskiMJ,RomeroDM.whoshouldIfollow?Recommendingpeopleindirectedsocialnetworks[A].Proceedingsofthe5thInternationalConferenceonInformationandKnowledgeManagement[C].NewYork:IEEEPress, 2011:1825-1834.

[4]AilloLM,BarratA,SchifanellaR,etal.Friendshippredictionandhomophilyinsocialmedia[J].ACMTransactionsontheWeb, 2012, (2):9.

[5]ZhangQM,ShangMS,LuL.Similarly-basedclassificationinpartiallylabelednetworks[J].InternationalJournalofModernPhysicsC, 2010, (6): 813

[6]WangWQ,ZhangQM,ZhouT.EvaluatingNetworkModels:ALikelihoodAnalysis[J].EurophyicsLetters, 2012, (2): 5769-5778.

[7]ZhouT,LuL,ZhangYC.Predictingmissinglinksvialocalinformation[J].TheEuropeanPhysicalJournalB-CondensedMatterandComplexSystems, 2009, (4): 623-630.

[8]SunY,BarberR,GuptaM,etal.Co-authorrelationshippredictioninheterogeneousbibliographicnetworks[A].ProceedingsofInternationalConferenceonAdvancesinSocialNetworksAnalysisandMining[C]. 2011: 121-128.

[9]SunY,HanJ,YanX,etal.Pathsim:Metapath-basedtop-ksimilaritysearchinheterogeneousinformationnetworks[J].ProceedingsoftheVldbEndowment, 2011, (11):992-1003.

[10]SunY,NorickB,HanJ,etal.Integratingmeta-pathselectionwithuser-guidedobjectclusteringinheterogeneousinformationnetworks[A].Proceedingsofthe18thACMSIGKDDinternationalconferenceonKnowledgeDiscoveryandDataMining[C].ACM, 2012: 1348-1356.

[11]YuX,GuQ,ZhouM,etal.Citationpredictioninheterogeneousbibliographicnetworks[A].Proceedingsofthe12thSIAMInternationalConferenceonDataMining[C]. 2012: 1119-1130.

[12]BallB,NewmanMEJ.Friendshipnetworksandsocialstatus[J].NetworkScience, 2012,(1):16-30.

[13] 劉宏鯤,呂琳媛,周濤.利用鏈路預測推斷網絡演化機制[J]. 中國科學:物理學 力學 天文學, 2011, (7): 816.

[14] 劉建國,周濤,郭強,等.個性化推薦系統評價方法綜述[J].復雜系統與復雜性科學,2009,(3):1-10.

[15] 朱郁筱,呂琳媛.推薦系統評價指標綜述[J].電子科技大學學報,2012, (2):163-175.

(作者本人校對)

Research on Co-author Recommender Model Based on Homogeneous Coauthor Networks

LIU Xin1, DU Xiuchun2, KANG Wenjie2

(1. College of Computer Engineering and Applied Mathematics, Changsha University,Changsha Hunan 410022, China;2. School of Computer, National University of Defense Technology, Changsha Hunan 410073, China)

With the rapid development of social network, cooperation relationship recommender has become a tend. First, we define coooperation relationship and homogeneity in this paper. Second, the characteristics of coopration relationship in different conditions are given. Third,we build the model of co-author recommender, and propose different methods to recommend the best co-author. Finally experimental data is collected and calculated. Experiments show that the proposed methods are reasonable and effective.

homogeneous coauthor networks; author comparability; professional discipline similarity; trust degree

2017-03-14

湖南省教育廳基金(批準號:14C0095)資助項目.

劉欣(1978— ),男,湖南常德人,長沙學院計算機工程與應用數學學院講師,博士.研究方向:計算機網絡與社會網絡.

TP391

A

1008-4681(2017)02-0062-05

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 波多野结衣一区二区三区四区视频 | 亚洲天堂视频在线免费观看| 四虎成人精品| 久久精品无码一区二区国产区| 精品一区二区三区自慰喷水| 国产高清毛片| 亚洲精品国产综合99| 97一区二区在线播放| 国产第一色| 中文字幕欧美日韩| 国产麻豆永久视频| 国产女人在线| 日韩高清欧美| 曰韩免费无码AV一区二区| 亚洲最猛黑人xxxx黑人猛交| 制服丝袜一区二区三区在线| 日韩精品亚洲一区中文字幕| a欧美在线| 精品国产黑色丝袜高跟鞋| 成人国内精品久久久久影院| 亚洲激情区| 青青青国产精品国产精品美女| 亚洲人精品亚洲人成在线| 久久久久人妻一区精品| 国产精品免费p区| 最新国产在线| 国产在线97| 91久久精品国产| 欧美国产中文| 特级毛片8级毛片免费观看| 中文字幕1区2区| 国产91在线|日本| 69国产精品视频免费| 成人在线不卡| 国产电话自拍伊人| 婷婷综合缴情亚洲五月伊| 伊人久综合| 国产欧美日本在线观看| 五月婷婷亚洲综合| 欧美亚洲日韩中文| 亚洲日本www| 日韩精品一区二区深田咏美 | 香蕉综合在线视频91| 3D动漫精品啪啪一区二区下载| 久久91精品牛牛| 欧美激情二区三区| 91精品国产91久久久久久三级| 国产精品主播| 日韩小视频在线播放| 噜噜噜久久| 幺女国产一级毛片| 999国内精品久久免费视频| 最新亚洲人成网站在线观看| 美女国内精品自产拍在线播放 | 亚洲伦理一区二区| 最新国产网站| 狠狠色丁香婷婷综合| 在线无码av一区二区三区| 精品国产成人a在线观看| 天天色天天综合| 欧美日韩动态图| 18禁高潮出水呻吟娇喘蜜芽| 中文一区二区视频| 亚洲天堂视频网| 自拍偷拍一区| 国产高清无码麻豆精品| 中文字幕亚洲另类天堂| 久久久久无码国产精品不卡| 亚洲精品欧美日本中文字幕| 久久黄色视频影| 国产精品无码AV中文| 手机精品视频在线观看免费| 精品第一国产综合精品Aⅴ| 美女被操黄色视频网站| 色国产视频| 久草网视频在线| 亚洲无码精彩视频在线观看| 久久久精品久久久久三级| 久久婷婷人人澡人人爱91| 亚洲国产精品无码AV| 东京热av无码电影一区二区| 亚洲一区二区三区国产精品|