999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的網(wǎng)絡(luò)輿情觀點(diǎn)挖掘方法研究

2011-12-31 00:00:00張兆年
大觀周刊 2011年38期

摘要:隨著互聯(lián)網(wǎng)的不斷普及和發(fā)展,互聯(lián)網(wǎng)延續(xù)了突發(fā)公共事件和熱點(diǎn)話題此起彼伏的狀態(tài),網(wǎng)民的表達(dá)意愿和參與意識持續(xù)高漲,踴躍發(fā)聲建言,在一系列突發(fā)事件上,“新意見階層”進(jìn)一步凸顯出網(wǎng)絡(luò)輿論的巨大能量,從而形成網(wǎng)絡(luò)輿情。本文從網(wǎng)絡(luò)輿情的概念出發(fā),引出觀點(diǎn)挖掘在網(wǎng)絡(luò)輿情中的應(yīng)用,基于本體構(gòu)建了一個(gè)觀點(diǎn)挖掘系統(tǒng),提取網(wǎng)絡(luò)輿情評論中的正面和負(fù)面評論,并進(jìn)行比較。該系統(tǒng)能夠?yàn)橛脩籼峁└訙?zhǔn)確的情感傾向性分析結(jié)果

關(guān)鍵詞:觀點(diǎn)挖掘 本體 網(wǎng)絡(luò)輿情

1、網(wǎng)絡(luò)輿情的概念

中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2011年1月發(fā)布的《第27次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[1]顯示,截至2010 年 12 月,中國網(wǎng)民規(guī)模達(dá)到4.57 億,我國網(wǎng)民規(guī)模已占全球網(wǎng)民總數(shù)的23.2%。網(wǎng)絡(luò)新聞?dòng)脩粢?guī)模達(dá)3.5億人,博客及論壇的用戶規(guī)模也分別達(dá)到2.9億和1.4億。如此龐大的受眾群體和如此豐富的應(yīng)用,使得大量進(jìn)步、有益的信息得以共享,同時(shí)也給不少反動(dòng)、低級的言論提供了傳播途徑,使之成為引發(fā)群體性事件、社會(huì)突發(fā)事件等的重要隱患。

劉毅將網(wǎng)絡(luò)輿情[2]定義為:“由個(gè)人以及各種社會(huì)群體構(gòu)成的公眾通過互聯(lián)網(wǎng)表達(dá)和傳播,對自己關(guān)心或與自身利益緊密相關(guān)的各種公共事務(wù)所持有的多種情緒、意愿、態(tài)度和意見交錯(cuò)的總和”。網(wǎng)絡(luò)輿情通常是來源于社會(huì)現(xiàn)實(shí)事件,而人們將表達(dá)和傳播對該事件意見的場所拓展到了互聯(lián)網(wǎng)上,從而形成強(qiáng)大的網(wǎng)絡(luò)輿論勢力。網(wǎng)絡(luò)輿情的主體是參與討論的網(wǎng)民,而其客體則是網(wǎng)絡(luò)輿情事件本身或者公共事件;另一方面網(wǎng)絡(luò)輿情又具有直接性、突發(fā)性、偏差性,因此,進(jìn)行網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)建設(shè)、防范負(fù)面網(wǎng)絡(luò)輿情危害社會(huì)于未然,顯得特別重要。挖掘這些輿情觀點(diǎn)可以為輿情管控工作提供有效的參考依據(jù),并且能及時(shí)了解民眾的心聲。

2、觀點(diǎn)挖掘及其研究現(xiàn)狀

觀點(diǎn)挖掘由傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)演變而來。觀點(diǎn)挖掘(Opinion Mining)又稱為文本意見挖掘或情感傾向性分析等,涉及到自然語言處理、信息檢索、數(shù)據(jù)挖掘等多個(gè)研究領(lǐng)域。觀點(diǎn)挖掘旨在抽取網(wǎng)絡(luò)文檔中所評論對象的屬性和組成要素,用以判定評論是正面的、負(fù)面的或中立的。網(wǎng)絡(luò)輿情是觀點(diǎn)在網(wǎng)絡(luò)上的表達(dá),因此可以使用觀點(diǎn)挖掘技術(shù)對網(wǎng)絡(luò)輿情進(jìn)行分析。

目前觀點(diǎn)挖掘主要從文檔、句子、特征三個(gè)級別進(jìn)行分析,其方法主要有語義相關(guān)度計(jì)算和機(jī)器學(xué)習(xí)方法。語義相關(guān)度計(jì)算大多基于極性詞典進(jìn)行,計(jì)算主體的褒貶程度,比較有代表性的研究是Turney提出的PMI-IR方法。但是,人們通常對于某一話題進(jìn)行觀點(diǎn)表達(dá)的時(shí)候除了對總體上的評價(jià)外,還包括對其中某個(gè)部分或者特性的評價(jià),特征級別的觀點(diǎn)分析主要是應(yīng)用于產(chǎn)品特性的抽取和對特性發(fā)表觀點(diǎn)的抽取,Hu和Liu(2004,2005)提出一些抽取產(chǎn)品特征及觀點(diǎn)的方法。Liu, Wu和Yao(2006) 研究觀點(diǎn)搜索的問題,他們的目標(biāo)是搜索產(chǎn)品的具體特征和并且在產(chǎn)品評論中找到它們。

在機(jī)器學(xué)習(xí)方法方面,代表性的研究是Pang等人以Usenet上的電影評論作為語料進(jìn)行了研究,采用了不同的特征選擇方法和機(jī)器學(xué)習(xí)方法(樸素貝葉斯,最大熵和支持向量機(jī))進(jìn)行挖掘比較,結(jié)果顯示支持向量機(jī)取得比較好的結(jié)果。Chaovalit和Zhou (2005)比較了語義傾向方法和機(jī)器學(xué)習(xí)方法,將兩種方法用于電影評論,發(fā)現(xiàn)機(jī)器學(xué)習(xí)方法更加可靠。

3、基于本體的觀點(diǎn)挖掘系統(tǒng)

3.1 本體的概念

本體(Ontology)通常被稱為領(lǐng)域模型(Domain Model)或概念模型(Conceptual Model),是關(guān)于特定知識領(lǐng)域內(nèi)各種對象、對象特性以及對象之間可能存在的關(guān)系的內(nèi)容理論。本體已經(jīng)成為知識工程、知識管理、自然語言處理、智能信息集成等各方面研究的熱點(diǎn)。

3.2 觀點(diǎn)挖掘系統(tǒng)總體設(shè)計(jì)

目前基于計(jì)算詞語和種子詞集相似度的情感分析研究不夠充分,因此本文提出了一個(gè)高效的結(jié)合分析方法。這個(gè)方法加入了領(lǐng)域本體,可以更好地識別領(lǐng)域詞匯;使用有指導(dǎo)的機(jī)器學(xué)習(xí)技術(shù)從文檔中抽取觀點(diǎn)和特征,加強(qiáng)接下來的分類任務(wù);在情感分類方面使用較為高效的支持向量機(jī)(SVM)在特征級別將文檔歸為正面、負(fù)面。利用上述思想設(shè)計(jì)基于本體的觀點(diǎn)挖掘系統(tǒng),系統(tǒng)的結(jié)構(gòu)如圖1:

圖1 觀點(diǎn)挖掘系統(tǒng)整體架構(gòu)

系統(tǒng)主要關(guān)注特征級別的情感分類,詞性標(biāo)注、情感特征識別、情感特征為三個(gè)關(guān)鍵模塊:

(1)詞性標(biāo)注

使用哈爾濱工業(yè)的大學(xué)的LTP工具將每個(gè)文檔進(jìn)行分詞處理,并對每個(gè)詞使用POS (part-of-speech)標(biāo)簽標(biāo)注(如動(dòng)詞、名詞等)。

(2)識別情感特征

已有的語言結(jié)構(gòu)具有信息交換及檢索上的不足,因此在這個(gè)系統(tǒng)中,首先使用FCA分析方法構(gòu)建一個(gè)領(lǐng)域概念結(jié)構(gòu)即本體,然后使用領(lǐng)域本體抽取特征。

(3) 情感分類

在情感分類中,我們使用線性的SVM在特征級別進(jìn)行情感分類,通過線性可分的超平面將特征歸為正面或負(fù)面。

(4)性能衡量

我們使用精確度和召回率評價(jià)系統(tǒng)的性能,計(jì)算方法如下:

同理可得負(fù)面特征的精確率Pnegative和召回率Rnegative。

4、結(jié)論

隨著互聯(lián)網(wǎng)用戶迅速增長,網(wǎng)民使用互聯(lián)網(wǎng)對輿情事件發(fā)表意見的參與性越來越強(qiáng),而表達(dá)的網(wǎng)絡(luò)輿情觀點(diǎn)也越來越多,如何敏銳地從這些觀點(diǎn)中挖掘出有用的信息,做出有效地判斷并對輿情事件進(jìn)行監(jiān)測預(yù)警研究是當(dāng)前迫切需要解決的重要問題。本文對網(wǎng)絡(luò)輿情的特點(diǎn)和挖掘方法進(jìn)行了分析,根據(jù)所分析的因素,構(gòu)建系統(tǒng)對輿情事件的觀點(diǎn)進(jìn)行挖掘,為危機(jī)預(yù)警提供了幫助,為社會(huì)管理者提供了管理依據(jù)。

參考文獻(xiàn):

[1] 中國互聯(lián)網(wǎng)絡(luò)信息中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告 ,2011

[2] 劉毅.網(wǎng)絡(luò)輿情研究概論[M].天津: 天津人民出版社, 2007

[3] Turney, P. Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews[J]. In Proceedings of the meeting of the association for computational linguistics (ACL’02) (pp. 417–424), 2002.

[4] Bo Pang and Lillian Lee. Using very simple statistics for review search: An exploration. In Proceedings of the International Conference on Computational Linguistics (COLING), 2008. Poster paper.

主站蜘蛛池模板: 97精品伊人久久大香线蕉| 国产91色在线| 国产视频久久久久| 亚洲第一黄色网址| 97成人在线视频| 国产全黄a一级毛片| 国产情侣一区二区三区| 免费无遮挡AV| 女人18一级毛片免费观看| 欧美性精品不卡在线观看| 97视频免费看| 性视频久久| 成人av手机在线观看| 国产毛片高清一级国语 | 国产欧美精品一区二区| 欧美一级一级做性视频| 直接黄91麻豆网站| 国产一在线观看| 五月激情综合网| 免费国产一级 片内射老| 国产成人精品一区二区| 国产人在线成免费视频| 老司国产精品视频91| 依依成人精品无v国产| 天天躁狠狠躁| 茄子视频毛片免费观看| 国产肉感大码AV无码| av在线手机播放| 怡红院美国分院一区二区| 草草影院国产第一页| 国产欧美日韩18| 制服丝袜一区| 国产精品99r8在线观看| 午夜无码一区二区三区在线app| 在线观看亚洲精品福利片| www.精品国产| 久久超级碰| 亚洲国产日韩视频观看| 亚洲天堂网在线视频| 国产h视频在线观看视频| 67194亚洲无码| WWW丫丫国产成人精品| 成人a免费α片在线视频网站| 九色免费视频| 国产精品免费p区| 99视频精品在线观看| 久久精品国产在热久久2019 | 沈阳少妇高潮在线| 毛片基地美国正在播放亚洲| 青青青视频91在线 | 亚洲中文字幕97久久精品少妇| 亚洲日本中文字幕天堂网| 99久久精品无码专区免费| 国产中文在线亚洲精品官网| 制服丝袜在线视频香蕉| 色欲综合久久中文字幕网| 欧美日韩国产综合视频在线观看| 无码内射在线| 亚洲毛片网站| 欧美一道本| 国产精品99在线观看| 91在线播放国产| 美女免费精品高清毛片在线视| 午夜少妇精品视频小电影| 亚洲成a人片| 国产一级视频在线观看网站| 九色在线观看视频| 福利视频一区| 国产91视频观看| 国产亚洲成AⅤ人片在线观看| 伊人查蕉在线观看国产精品| 欧美成人二区| 欧美成a人片在线观看| 国产在线无码av完整版在线观看| 天天干伊人| 国产爽妇精品| 欧美日韩精品综合在线一区| 91精品日韩人妻无码久久| 91无码人妻精品一区| 国产爽妇精品| 美女免费黄网站| a毛片在线免费观看|