999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社交網絡中領域專家發現模型研究

2018-09-26 11:30:48高曉波方獻梅
軟件導刊 2018年7期

高曉波 方獻梅

摘要:隨著Web2.0和移動終端設備的發展,社交網絡日益普及,尋找社交網絡中的領域專家已成為研究熱點。微博是當今流行的社交網絡,以新浪微博數據為例,首先按用戶發布的微博主題將用戶劃分為各個領域,然后提出在各領域內計算微博社交網絡用戶權威值的模型。模型充分考慮了用戶發布的微博數目、用戶粉絲數以及粉絲評論、轉發和提及用戶等行為對用戶權威值的影響,最終計算出用戶權威值。實驗結果證實了該領域專家發現模型的合理性與可行性。

關鍵詞:微博;社交網絡;用戶行為;專家發現;領域專家

DOI:10.11907/rjdk.181611

中圖分類號:TP301

文獻標識碼:A文章編號:1672-7800(2018)007-0067-03

Abstract:WiththedevelopmentofWeb2.0andmobileterminaldevices,socialnetworksarebecomingpopular.Howtolocatetheexpertsinaspecificfieldisaresearchfocusinthisarea.SinaWeiboisoneofthemostpopularon-linesocialisingtoolsinChina.ThispapertriestouseamathematicalmodeltodistinguishexpertsfromnormalusersofSinaWeibo.Firstofall,usersaredividedintodifferentfieldsaccordingtotheposts'theme.Andthenthemodel,whichtakesintofullaccountseveraluserbehaviors,includingtheamountofthepostsandcomments,numberoffansandforwardrates,willcalculatetheauthoritativevalueofeachuser.Theresultoftheexperimentverifiestheadvancementofthismodelintherealnetworkenvironment.

KeyWords:microblog;socialnetworking;userbehavior;expertslocating;domainexperts

0引言

據中國互聯網絡信息中心發布的第41次全國互聯網發展統計報告,截至2017年12月,中國網民規模達7.72億,互聯網普及率為55.8%,微博用戶使用率已達到40.9%,知乎、豆瓣、天涯社區用戶使用率均有所提升,表明越來越多用戶通過各種社區平臺進行互動,以獲取和表達觀點,各種網絡社區已成為人們發表言論的重要場所。新浪微博作為我國主流的微博服務提供商之一,一條微博可以包含140字左右的文字,用戶可以在微博中添加URL短地址服務、圖片、音視頻及地理信息等。微博社交網絡的海量數據資源中不僅包含大眾普遍關注的社會信息,也包含了用戶行為特征及熱點事件。社交網絡中用戶的關注、發帖、轉帖、評論等行為蘊含了用戶偏好、用戶權威性等信息。對社交網絡中的用戶行為進行分析,可以評估用戶影響力。

目前活躍在互聯網上的專家主要是通過互聯網平臺相互傳播而形成的具有影響力的意見領袖,他們在互聯網上發表對某個領域的觀點,并得到大量普通網民的關注、支持、轉發、評論,從而形成對民眾的觀點引導和輿論影響。他們的話題之所以受到廣泛關注,主要在于其發表的觀點具有良好的指導性、前瞻性和可靠性,能為普通民眾提供有效的信息指導。社區專家發現已成為國內外學者的研究熱點之一。

近年來,專家發現得到了快速發展,主要集中在知識分享平臺(CQA)、學術文獻專家和信息管理系統中。問答平臺[1]具有明確的問與答關系,答題者具有較為明顯的專家特征,通過研究用戶歷史問答記錄領域知識的相關性,得到用戶的專業知識、聲譽和權威性。周光有等[2]基于用戶局部相似性,實現問答平臺中用戶的主題敏感概率模型進行專家估計;RiahiFatemeh等[3]使用集合概率模型和統計主題模型實現問答社區的專家發現;FermeierRalphf等[4]在wiki中通過語義相似度補充專家本體,實現根據專業知識水平和同行評審協作的專家識別;WuChi-Jen等[5]通過構造P指數評價專家,從而實現領域內的專家發現;NaqviMohsin等[6]提出基于時態關聯規則的專業知識挖掘算法實現學術專家發現。

Web社區中的專家與普通用戶并沒有顯著區別,且零散地分布在互聯網中,這與知識分享平臺和學術專家平臺具有很大區別。目前已有學者研究Web社區中的專家發現,但主要是將Web社區作為一個社交網絡進行分析。SuHang等[7]研究在一個特定領域的社交平臺中進行專家發現,但并不適用于廣義的社區平臺;YinHongzhi等[8]提出通過影響力對專家小組進行識別,但是忽略了領域特征;SmirnovaElena[9]提出用貝葉斯層次概率模型綜合分析社會關系和文本主題,大大提高了專家發現效率,但沒有揭示交互關系與主題特征的邏輯關系,缺乏精確的概率函數;JianJiao等[10]通過構造空間向量模型計算文本相關性,通過改進的PageRank算法計算用戶關注度,實現對專家的綜合排名;LiuYang等[11]研究基于語義知識網絡推理對查詢條件與專家特征進行相關性度量的排序方法;CraigMacdonald等[12]研究專家文檔排名與專家排名的關系,提供基于文檔權重的排序方法;DavoodiE等[13]提出一種基于內容和關系的混合推薦算法,運用社會網絡分析,并考慮用戶經驗背景、知識水平、個人偏好等因素,匹配最合適的專家進行推薦;PhamXH等[14]提出RecSys框架,在發現用戶偏好和判斷的基礎上,匹配知識的特征屬性和具有價值的相關專家。

本文以新浪微博社交網絡為研究對象,判斷一個用戶是否是專家(意見領袖),通常需要綜合利用微博用戶多方面信息,如用戶活躍度、用戶標簽、用戶評論及轉發微博、用戶關注的用戶群及關注該用戶的用戶群等?;谖⒉┯脩糁g的關注、轉發、評論等關系構建微博社區的用戶行為交互關系網絡,按照用戶發布微博所屬主題將用戶劃分到各個領域,從真實微博社區中提取各領域用戶的相應數據,根據模型計算用戶權威值,排名靠前的用戶即是篩選出的相應領域專家(意見領袖)。

1社區用戶交互關系網絡圖

社交網絡已成為網絡信息傳播的重要途徑,為廣大用戶提供了開放、自由的虛擬討論空間。在各社區平臺提供了不同主題類別,社區用戶可針對感興趣的主題發表微博,用戶間的交互方式有評論、轉發等關系,通過這些關系建立用戶之間的交互關系網絡圖G=(U,E)。其中U表示網絡中的節點集合,即社區用戶;E表示網絡中的邊集,etij∈E表示用戶Ui和Uj間存在關系t(t可以是評論、轉發、提及等)。

圖1給出的是微博社區用戶交互關系的一部分。微博社區中每個用戶有檔案信息(包含用戶發布的微博數等信息)和社會關系信息,兩個用戶間的交互關系可以是單向的,也可以是雙向的。圖1中,用戶U5有1個單向交互關系(如所發微博被用戶U7評論過)和3個雙向交互關系(如U5和U4在所發微博中都提及到對方),U6和U7間既有單向交互關系(U7對U6的微博進行評論),也有雙向交互關系(U6和U7相互轉發對方微博)。

本文以新浪微博社交網絡為研究對象,通過網絡爬蟲抓取2016年9月10日-2017年5月12日的數據,構建社區用戶間的交互關系網絡。

2Web社區領域專家發現模型

本文提出的社區領域專家發現模型首先通過LDA主題模型[15],抽取用戶微博主題,將主題分配給各個類別,并通過微博主題分類將用戶分為不同類別,在各類別領域不僅考慮用戶所發微博數目和用戶社會關系(關注歷史),還考慮用戶間的交互行為(評論、轉發及提及)。模型提出的專家權威值包含兩部分:用戶初始權威值與粉絲影響力。

2.1LDA主題模型

LDA是一種文檔主題生成模型,也稱為一個三層貝葉斯概率模型,可用來識別文檔中的主題信息。LDA生成方法如下:

Chooseparameterθ~p(θ);

ForeachoftheNwordsw_n:

Chooseatopicz_n~p(z|θ);

Chooseawordw_n~p(w|z);

其中θ是一個主題向量,向量的每一列表示每個主題在文檔中出現的概率;p(θ)是θ的分布;N表示要生成文檔的單詞個數,w_n表示生成的第n個單詞w;z_n表示選擇的主題,p(z|θ)表示給定θ時主題z的概率分布;p(w|z)表示給定z時w的分布。其圖模型如圖2所示,其中D表示文檔總數,Nd表示文檔d中的單詞總數。

獲取用戶所發微博,按LDA模型找出微博主題。主題可能有多個,通常一個人在擅長領域會發布較多微博,因而本文選取其中出現概率最大的一個主題,也即取出一個用戶最擅長的,并最終分配到對應的8個類別:娛樂、科技、商業、運動、教育、新聞、生活、閑聊。

2.2領域用戶權威值初始化

利用LDA模型將用戶分配到相應領域,然后可以分領域計算各領域內的用戶權威值。一般而言,高權威用戶的粉絲較多,發布的微博也較多,因而對用戶權威值進行初始化時,需要充分考慮這兩方面信息。

定義1(關注→)新浪微博中,如果用戶Ui關注了用戶Uj,記為Ui→Uj,則用戶Uj稱為用戶Ui的關注好友,用戶Ui稱為用戶Uj的粉絲。

用戶的初始權威值使用公式(1)進行計算。

式(1)中,Auth(Ui)表示用戶Ui的初始權威值,F(G,Ui)表示微博社交網絡中用戶Ui的粉絲數目,max(F(G,.))和min(F(G,.))分別表示用戶的最大粉絲數和最小粉絲數,N(G,Ui)表示用戶Ui發布微博數目,max(N(G,.))和min(N(G,.))分別表示用戶發布的最大和最小微博數目。α、β為調節系數,且α+β=1。初始權威值越大,說明該用戶影響力越大,越有可能是需要尋找的專家。

2.3粉絲用戶影響力

在新浪微博中,一條微博受到關注,除微博內容本身和發布微博的用戶影響力外,還與微博傳播網絡中粉絲用戶的影響力有關。

定義2(用戶交互系數Ci,j)Ci,j為用戶Ui和該用戶粉絲Uj之間的交互系數,表示用戶Uj對用戶Ui微博的評論頻率及用戶Uj在自身微博中轉發或@Ui(提及用戶Ui)的微博比例。Ci,j的值由公式(2)進行計算。

式(2)中,Ti和Tj分別表示用戶Ui和用戶Uj發布的微博數量??紤]到微博的時效性,Ti和Tj選取用戶最新發布的至多200條微博。Rj,i表示用戶Uj對用戶Ui微博的評論次數,Rtj,i與Mj,i分別表示用戶Uj轉發與提及用戶Ui的微博次數。γ為正整數,用來線性放大用戶間的行為交互影響。

用戶的最終權威值由用戶初始權威值和粉絲權威值兩部分構成。

3實驗

3.1實驗數據

本文實驗數據來自新浪微博2016年9月10日—2017年5月12日的數據,去掉一些無效和空信息后,有191037個用戶的2753208條微博信息,以及微博評論信息、轉發信息和所有用戶的關注好友信息及粉絲信息。

對用戶發布的微博使用LDA主題模型進行分類,將微博用戶分為8個領域,考慮到粉絲數少的用戶影響力較小,因而本文只選取粉絲數在120個以上的用戶。

3.2實驗結果

使用公式(1)計算各領域用戶的初始權威值,這里α取0.8,β取0.2,然后使用公式(3)計算每個用戶的最終權威值,本文使用P@10及MAP評估專家發現結果,結果如表1所示。

4結語

Web社區中各專家的專業程度、影響力等各不相同。本文以新浪微博數據為例,首先按用戶發布的微博主題將用戶劃分為各個領域,然后提出在各領域內計算微博社交網絡用戶權威值的模型,模型提出用戶的最終權威值由用戶初始權威值和粉絲權威值共同決定。實驗結果驗證了算法的合理性與可行性。

參考文獻:

[1]LIUDR,CHENYH,KAOWC,etal.Integratingexpertprofile,reputationandlinkanalysisforexpertfindinginquestion-answeringwebsites[J].InformationProcessing&ManagementAnInternationalJournal;,2013,49(1):312-329.

[2]ZHOUG,LAIS,LIUK,etal.Topic-sensitiveprobabilisticmodelforexpertfindinginquestionanswercommunities[C].ACMInternationalConferenceonInformationandKnowledgeManagement.ACM,2012:1662-1666.

[3]RIAHIF,ZOLAKTAFZ,SHAFIEIM,etal.Findingexpertusersincommunityquestionanswering[C].Proceedingsofthe21stInternationalConferenceCompaniononWorldWideWeb.ACM,2012:791-798.

[4]SCHAFERMEIERR,PASCHKEA.UsingdomainontologiesforfindingexpertsincorporateWikis[C].Proceedingsofthe7thInternationalConferenceonSemanticSystems.ACM,2011:63-70.

[5]WUCJ,CHUNGJM,LUCY,etal.Usingweb-miningforacademicmeasurementandscholarrecommendationinexpertfindingsystem[C].Proceedingsofthe2011IEEE/WIC/ACMInternationalConferencesonWebIntelligenceandIntelligentAgentTechnology,2011:288-291.

[6]NAQVIM,USMANA,BATOOLS,etal.FindingscientificexpertsofACMcategoriesbasedontemporalassociationrulemining[C].ComputerNetworksandInformationTechnology(ICCNIT),2011InternationalConferenceon.IEEE,2011:273-277.

[7]SUH,TANGJ,HONGW.LearningtoDiversifyExpertFindingwithSubtopics[M].AdvancesinKnowledgeDiscoveryandDataMining.SpringerBerlinHeidelberg,2012:330-341.

[8]YINH,CUIB,HUANGY.FindingaWiseGroupofExpertsinSocialNetworks[C].InternationalConferenceonAdvancedDataMiningandApplications.Springer-Verlag,2011:381-394.

[9]SMIRNOVAE.Amodelforexpertfindinginsocialnetworks[C].Proceedingsofthe34thInternationalACMSIGIRConferenceonResearchanddevelopmentinInformationRetrieval.ACM,2011:1191-1192.

[10]JIAOJ,YANJ,ZHAOH,etal.Expertrank:anexpertuserrankingalgorithminonlinecommunities[C].NewTrendsinInformationandServiceScience,2009.NISS'09.InternationalConferenceon.IEEE,2009:674-679.

[11]YANGL,HUZ,LONGJ.Serviceofsearchingandrankinginasemantic-basedexpertinformationsystem[C].ServicesComputingConference(APSCC),2010IEEEAsia-Pacific.IEEE,2010:609-614.

[12]MACDONALDC,OUNISI.Theinfluenceofthedocumentrankinginexpertsearch[J].InformationProcessing&Management;,2011,47(3):376-390.

[13]DAVOODIE,KIANMEHRK,AFSHARCHIM.Asemanticsocialnetwork-basedexpertrecommendersystem[J].AppliedIntelligence,2013,39(1):1-13.

[14]PHAMXH,JUNGJJ,NGUYENNT.Integratingmultipleexpertsforcorrectionprocessininteractiverecommendationsystems[M].ComputationalCollectiveIntelligenceTechnologiesandApplications.Berlin:Springer,2012:31-40.

[15]BLEIDM,NGAY,JORDANMI.Latentdirichletallocation[J].JournalofMachineLearningResearch,2003,3:993-1022.

(責任編輯:黃?。?/p>

主站蜘蛛池模板: 一级一级一片免费| 精品亚洲欧美中文字幕在线看| 小蝌蚪亚洲精品国产| 国产高清免费午夜在线视频| 国产激情第一页| 黄色网站在线观看无码| 国产免费怡红院视频| 久久久无码人妻精品无码| 国产视频资源在线观看| 免费国产不卡午夜福在线观看| 91青青草视频| 国产丝袜精品| 91口爆吞精国产对白第三集| 91九色视频网| 国产十八禁在线观看免费| 久操中文在线| av天堂最新版在线| 亚洲午夜福利精品无码| 麻豆AV网站免费进入| 搞黄网站免费观看| 国产精品区视频中文字幕| 日韩在线1| 成人在线亚洲| 久久亚洲综合伊人| 亚洲v日韩v欧美在线观看| 2021国产精品自产拍在线| 亚洲国产中文精品va在线播放| 日韩亚洲综合在线| 无码综合天天久久综合网| 黄色三级网站免费| 国产亚洲精久久久久久无码AV| 日韩欧美国产成人| 成人精品亚洲| 伦伦影院精品一区| 日本午夜影院| 亚洲天堂久久新| 亚洲swag精品自拍一区| 尤物在线观看乱码| 狠狠亚洲五月天| 亚洲精品人成网线在线| 国产精品太粉嫩高中在线观看| 中文字幕永久在线观看| 国产特级毛片aaaaaaa高清| 欧美黄网站免费观看| 国产精品自在在线午夜区app| 色九九视频| 欧美日韩一区二区在线免费观看| 亚洲香蕉伊综合在人在线| 毛片免费在线视频| 亚洲国产成熟视频在线多多| 欧美成人影院亚洲综合图| 国产精品开放后亚洲| 国产又粗又猛又爽| 亚洲高清资源| 亚洲三级影院| 亚洲美女操| www.国产福利| 亚洲天堂777| 亚洲 日韩 激情 无码 中出| 欧洲极品无码一区二区三区| 波多野结衣久久高清免费| AV不卡在线永久免费观看| 精品国产一区91在线| 国产精品手机在线观看你懂的| 国产精品高清国产三级囯产AV| 一区二区三区四区精品视频| 日韩区欧美区| 日本少妇又色又爽又高潮| 高清无码不卡视频| 欧美精品v日韩精品v国产精品| 国产欧美日韩视频一区二区三区| 玖玖精品视频在线观看| 高清码无在线看| 久久www视频| 亚洲中文字幕久久无码精品A| 国产真实乱人视频| 欧美日韩免费观看| 色悠久久久久久久综合网伊人| 国产中文一区二区苍井空| 色综合久久综合网| 亚洲妓女综合网995久久| 伊人AV天堂|