999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情感分析的社交網(wǎng)絡(luò)意見領(lǐng)袖的識別:以情感分類為手段

2017-11-24 05:39:52蔣瀾,林娜娜,劉陽,史雪琪,陸詩慧
教育教學(xué)論壇 2017年47期

蔣瀾,林娜娜,劉陽,史雪琪,陸詩慧

摘要:在社交網(wǎng)絡(luò)中進(jìn)行意見領(lǐng)袖的挖掘?qū)π畔鞑ヅc演化的深度分析、輿情監(jiān)控和引導(dǎo)具有重要意義。結(jié)合情感分析,挖掘在專業(yè)知識領(lǐng)域受到大眾支持的正面意見領(lǐng)袖是本項目研究重點(diǎn)。實(shí)驗(yàn)對比發(fā)現(xiàn),Leader-PageRank算法能夠結(jié)合社交網(wǎng)絡(luò)的用戶交互,更有效客觀地識別在專業(yè)領(lǐng)域中的正面意見領(lǐng)袖。

關(guān)鍵詞:社交網(wǎng)絡(luò);意見領(lǐng)袖;情感分析

中圖分類號:G640 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2017)47-0043-02

近年來,隨著微博、微信等社交媒體的興起,社交網(wǎng)絡(luò)的規(guī)模與影響力不斷地擴(kuò)大,產(chǎn)生了一批具有社會輿論號召力的大V,這些能夠引導(dǎo)社會輿論趨勢,傳播公共信息,推薦商業(yè)產(chǎn)品的網(wǎng)絡(luò)節(jié)點(diǎn)被稱為意見領(lǐng)袖。而情感分析能夠判別社交網(wǎng)絡(luò)用戶間的情感傾向,作為意見領(lǐng)袖的一種挖掘方法,具有一定的科學(xué)依據(jù)。本文將結(jié)合情感分析,探討在專業(yè)領(lǐng)域中具有正面影響力的意見領(lǐng)袖。

一、基于情感分析的意見領(lǐng)袖識別

基于情感分析的意見領(lǐng)袖的識別方法研究框架分5步:(1)數(shù)據(jù)收集;(2)文本預(yù)處理;(3)主題帖與評論特征提取;(4)主題帖分類與情感計算;(5)構(gòu)建關(guān)注情感綜合矩陣;(6)利用Leader-PageRank算法,計算意見領(lǐng)袖值。

二、主題帖分類

本文研究的社交網(wǎng)絡(luò)主體是垂直類社交網(wǎng)絡(luò)汽車論壇,關(guān)注汽車知識類主題帖,如汽車信息、汽車維修等。我們采用LDA主題模型對主題帖名進(jìn)行分類,它能擴(kuò)展短文本的特征項,在一定程度上解決短文本的特征稀疏問題。LDA模型的基本思路是:挑選主題帖的有效內(nèi)容作為長文檔來訓(xùn)練LDA主題模型,得到隱含主題詞的概率分布;將主題帖名帶入到隱含主題模型中,得到主題詞,增加到主題帖名的特征向量;將特征向量帶入SVM算法分類器進(jìn)行分類,提取汽車相關(guān)的主題帖。

三、文本情感極性分類

1.文本分類研究。文本的情感極性分析是對帶有主觀情感的文本進(jìn)行語義分析,將文本分為正面、中立、負(fù)面三個類型。評論文本中帶有的情感傾向能反映用戶對主題帖和作者所帶有的情感。但基于情感詞語語義分析的方法需要借助情感詞典,維護(hù)成本較高,不適合在研究中使用。因而,本文采用基于統(tǒng)計自然語言的方法對文本評論進(jìn)行分析。常用的統(tǒng)計自然語言方法的情感分類器有:支持向量機(jī)(SVM)、樸素貝葉斯(NB)、最大熵(ME)等。本文采用支持SVM作為文本情感分類器。

2.文本特征提取。在主題帖中,評論多為正面或中立,負(fù)面評論少容易導(dǎo)致統(tǒng)計結(jié)果的不準(zhǔn)確。本文在基于統(tǒng)計自然語言的方法上,針對實(shí)際不均衡分類方法提出了改進(jìn)的統(tǒng)計量法。統(tǒng)計量法假定特征項t與文檔類別c之間符合具有一階自由度的卡方分布。而針對不均衡集的改進(jìn)CHI特征方法中t對于c的CHI統(tǒng)計值的公式(1)如下所示:

(1)

N為訓(xùn)練所用樣本集中所有的文檔總數(shù);A為屬于c類且包含特征t的文檔數(shù);B為不屬于c類但包含特征t的文檔數(shù);C為屬于c類但不包含特征t的文檔數(shù);D為不屬于c類也不包含特征t的文檔數(shù);α為面向小樣本類特征項的選擇傾向因子;M為所有的樣本類別總數(shù);mt為特征t在訓(xùn)練集中所出現(xiàn)過的類別數(shù)目。此方法能剔除“負(fù)相關(guān)”特征項的影響,保留小類特征項并加入識別因子,提高比重少但對分類貢獻(xiàn)較大的特征項權(quán)重。

3.文本分類器算法。支持向量機(jī)(SVM)算法是基于統(tǒng)計學(xué)原理的一種機(jī)器學(xué)習(xí)算法,通過尋求結(jié)構(gòu)化風(fēng)險最小來提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險和置信范圍的最小化的一種分類算法。支持向量機(jī)為二元分類算法,設(shè)線性樣本集T={(x1,y1),……(xi,yi)}∈(X×Y)i,其中xk∈X∈Rn,yk∈Y={-1,1},n維空間中線性判別函數(shù)的一般形式為g(x)=(w.x)+b。如果分類面對所有樣本進(jìn)行了正確分類,那么應(yīng)滿足約束條件yk(w.x+b)+b-1≥0,k=1,……,i最優(yōu)分類面應(yīng)使兩類樣本決策面的最小距離■最大,在約束條件下最小化Φ(w),即■w.w。再采用lagrange乘子法可以算出原問題優(yōu)化問題的對偶形式,約束條件為:

■a■y■=0,a■≥0,k=1……,i(6)

然后對lagrange函數(shù)的系數(shù)αk進(jìn)行求解下列函數(shù)的最大值

?專(a)=■?墜■-■■■ykyj?墜■?墜j(xkxj)(7)

這是二次函數(shù)最優(yōu)解的問題。若?墜k*為最優(yōu)解,則

W*=■yk?墜■*x■(8)

其中等式必須滿足?墜■(yk(w.xk+b)-1)=0 k=1,…i,求解上述問題后得到最優(yōu)分類函數(shù)為

f(x)=sgn■w*.x*+b*=sgn■ykak(xk·x)+b(9)

4.Leader-PageRank算法。傳統(tǒng)PageRank可用于社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力的計算,但忽略了用戶間的互動情況。Leader-PageRank算法考慮了社交網(wǎng)絡(luò)中用戶評論關(guān)注情況,增加了用戶間的情感屬性。邊權(quán)重公式如下(2):Wij=■+F■(2)

Wij為節(jié)點(diǎn)j對節(jié)點(diǎn)i的綜合權(quán)重;■e■為節(jié)點(diǎn)j對節(jié)點(diǎn)i所有回帖評論的情感傾向綜合,單條正面評論取值1,中立評論取值0.5,負(fù)面評論取值為-2;nij代表節(jié)點(diǎn)j對節(jié)點(diǎn)i所有評論交互次數(shù);Fij為節(jié)點(diǎn)j是否關(guān)注節(jié)點(diǎn)i。Wij的取值范圍為[2,-2],概括了社交網(wǎng)絡(luò)中用戶之間的關(guān)系。將Wij代入到Leader-PageRank的公式中,具體計算如公式(3)所示。

LPR(i)=■+d■j∈R(i)LPR(j)■(3)

LPR(i)是節(jié)點(diǎn)i的Leader-PageRank值;d為阻尼因子0.85;N為總數(shù);R(i)為指向節(jié)點(diǎn)i的所有集合;

■|W■|為節(jié)點(diǎn)j鏈接出去的邊的所有權(quán)重絕對值總和。對Leader-PageRank多次迭代,得到基于用戶關(guān)注與互動情況的社交網(wǎng)絡(luò)正面意見領(lǐng)袖排名。

四、實(shí)驗(yàn)與分析

我們在汽車之家網(wǎng)上論壇中選取了100名用戶,并且基于上述主題帖分類和情感分類的結(jié)果,我們共提取汽車相關(guān)的主題帖314條,共提取這些主題帖下的互動評論9346條,抽取樣本評論3216條,其中負(fù)面回復(fù)數(shù)為小類別集,占樣本集的7.11%。利用Leader-PageRank算法算出他們的意見領(lǐng)袖值。

通過對比Pagerank算法的值,我們可以分析出結(jié)合情感分析的Leader-Pagerank算法的客觀性。如用戶N054,它在Pagerank算法中的意見領(lǐng)袖值排名第十,但在Leader-Pagerank中意見領(lǐng)袖排名躍居第一,說明該意見領(lǐng)袖雖然在社交網(wǎng)絡(luò)結(jié)構(gòu)中的影響力不大,但它發(fā)表了許多專業(yè)性的主題帖且收獲了許多的正面評價,因此意見領(lǐng)袖值發(fā)生了巨大的變化。

本文基于情感分析特征對社交網(wǎng)絡(luò)中意見領(lǐng)袖的識別的問題進(jìn)行研究。該算法不僅充分考慮了用戶的顯性能力:信息傳播過程中的活躍度,更加注重對用戶在信息傳播過程中信息質(zhì)量、效果及評論人的認(rèn)可度等隱性能力的綜合考量。然而本文仍然存在一些不足,如搜集的數(shù)據(jù)比較少,不能更加準(zhǔn)確地比較情感分析的優(yōu)勢。

參考文獻(xiàn):

[1]鈕亮.基于粗糙集_AHM的新浪微博意見領(lǐng)袖挖掘[M].電子科技大學(xué)學(xué)報,2016,(1).

[2]肖宇,許煒,夏霖.一種基于情感傾向分析的網(wǎng)絡(luò)團(tuán)體意見領(lǐng)袖識別算法[J].計算機(jī)科學(xué),2012,39(2):34-37.

主站蜘蛛池模板: 国产精品真实对白精彩久久 | 永久免费无码成人网站| 日本影院一区| 中文字幕无线码一区| 亚洲精品在线影院| 欧美全免费aaaaaa特黄在线| 一本大道无码日韩精品影视| 欧美三级自拍| 麻豆精品国产自产在线| 天天摸天天操免费播放小视频| 一本一道波多野结衣一区二区 | 国产在线视频导航| 欧美色视频在线| 亚洲高清无在码在线无弹窗| 777午夜精品电影免费看| 婷婷综合色| 香蕉网久久| 日本人又色又爽的视频| 第一页亚洲| 国产真实二区一区在线亚洲| 亚洲日本中文字幕乱码中文| a天堂视频在线| 日韩欧美中文字幕一本| 老司机精品久久| 久久黄色影院| 香蕉蕉亚亚洲aav综合| 蜜芽一区二区国产精品| 久久久久亚洲AV成人网站软件| 国产成人调教在线视频| 亚洲综合久久一本伊一区| 丝袜高跟美脚国产1区| 国产成人精品第一区二区| 高清色本在线www| AV片亚洲国产男人的天堂| 九九热在线视频| 99热最新网址| 欧美一级夜夜爽www| 免费99精品国产自在现线| 久久永久视频| 54pao国产成人免费视频| 日本精品影院| 久久精品这里只有国产中文精品 | 亚洲成人在线网| 黄色成年视频| 国产 在线视频无码| 5555国产在线观看| 亚洲一区二区精品无码久久久| 欧美国产综合视频| 国产网友愉拍精品| 最新精品久久精品| 欧美影院久久| 亚洲欧州色色免费AV| 日韩无码精品人妻| 日韩欧美成人高清在线观看| 69国产精品视频免费| 久久久久久午夜精品| 国产三级精品三级在线观看| 欧美精品导航| www.99精品视频在线播放| 1级黄色毛片| 亚洲IV视频免费在线光看| 国产精品无码久久久久久| 国产成人h在线观看网站站| 欧美一道本| 欧美色综合网站| 国产91高跟丝袜| 久久青草精品一区二区三区| 91精品免费高清在线| 波多野结衣亚洲一区| 波多野结衣一区二区三区四区| 亚洲中久无码永久在线观看软件| 日韩精品成人在线| 狠狠做深爱婷婷久久一区| 4虎影视国产在线观看精品| 谁有在线观看日韩亚洲最新视频| 成人福利视频网| 亚洲AV无码久久精品色欲| 久久精品国产在热久久2019| 色综合a怡红院怡红院首页| 九九九久久国产精品| 色偷偷综合网| 综合社区亚洲熟妇p|