999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡輿情熱點新聞發現技術研究

2017-10-13 13:56:05黃克敏魏洪凱馮建鞏
網絡安全技術與應用 2017年6期
關鍵詞:用戶實驗

◆黃克敏 先 科 李 帥 魏洪凱 馮建鞏

?

網絡輿情熱點新聞發現技術研究

◆黃克敏 先 科 李 帥 魏洪凱 馮建鞏

(貴州航天計量測試技術研究所 貴州 550000)

隨著互聯網逐漸邁入移動化時代,智能手機和平板電腦等智能設備的廣泛使用成為移動互聯網時代的重要標志。網絡新聞在成為移動互聯時代重要信息來源的同時,網絡熱點新聞則成為網絡輿論和社會輿論的重要源泉。因此,對網站發布的網絡新聞內容進行監管及時發現熱點新聞評論內容意見的傾向性,準確把握網絡輿論動向顯得尤為重要。為了實現熱點新聞的發現及對不同領域熱點新聞分級監管的需求,需要建立熱點新聞發現規則及對熱點新聞按照報道內容的不同進行領域分類。熱點新聞發現及分類技術是網絡輿情檢測系統中的一項重要技術。本文在研究新聞結構及特點的基礎上,針對大眾和政府部門都比較關注的熱點新聞,在深入研究新聞結構和特點的基礎上改進熱點新聞發現算法,并通過大量實驗樣本對改進算法的有效性進行了驗證。

網絡輿情;新聞結構;熱點新聞;熱點新聞發現規則

0 引言

互聯網是一把雙刃劍。一方面,互聯網為人們的生活、工作、學習、娛樂帶來巨大的便利;另一方面,一些不法分子利用熱點新聞事件的巨大影響力發表不當言論,煽動群眾情緒,制造社會動蕩,極大影響社會公共秩序和社會穩定。因此,為互聯網建立一個合理的監管機制,對非法的網絡言論進行監管。通過對熱點新聞評論的內容進行意見挖掘進而掌握輿論傾向性,對不良的網絡輿論導向進行合理引流和正確引導,無論是對于維護社會穩定,打擊利用網絡違法犯罪活動,還是對凈化網絡環境,保護公民的身心健康都具有重要意義。

當前,對網絡熱點事件發現及評論傾向性研究已成為信息安全研究中信息內容安全研究的一個重要部分。本文在研究網絡新聞結構和特點的基礎上建立熱點新聞特征規則,研究并改進熱點新聞發現算法,并對網絡熱點新聞進行發現;為了方便對不同領域的熱點新聞事件進行分級監管,需對發現的熱點新聞進行領域劃分,以方便輿情系統中對不同領域的熱點新聞事件的網絡評論做傾向性分析,掌握網民的網絡輿論傾向,對公共的輿論進行正確及時的引導,減少消極輿論傾向帶來的負面影響,從而確保互聯網內容安全,使互聯網這把雙刃劍真正做到趨利避害。

1 網絡輿情熱點新聞發現技術研究

1.1網絡新聞結構

無論是網站根據用戶對新聞閱讀數或參與討論的評論數,還是百度風云榜根據用戶搜索量作為判斷熱點新聞事件的標準都不能體現普通新聞事件轉換為熱點新聞事件的發展趨勢的強度及過程,因此存在一定的不合理性。由于本節針對手機客戶端的新聞APP產生的新聞進行熱點新聞的發現,因此首先要分析新聞的結構。下面以鳳凰新聞APP新聞“大學生掏鳥案被告父親自首稱9次行賄辦案人員”為例,分析新聞結構,其新聞內容如圖1所示。

由圖1可知,新聞內容包括新聞標題、新聞來(轉載)源、新聞發布的時間、新聞評論數目、新聞正文內容等部分組成。

由圖2 可知,新聞評論包括熱門評論和最新評論。熱門評論主要是指評論點贊數超過一定數目的評論數。熱門評論包括熱門評論數、評論者的頭像、評論者的昵稱、評論距當前時間、評論內容、評論點贊數,如果開啟允許地理位置分享的話,還會有地理位置信息。最新評論和熱門評論包括的部分幾乎相同,就不再做過多介紹。

1.2熱點新聞判別標準

由于熱點新聞能夠在短時間內吸引網民的關注、引起網絡輿論熱議,形成以一定的輿論傾向,因此對熱點新聞進行判斷檢測顯得尤為重要。根據哪些條件判斷當前新聞是否為熱點新聞。表1中選取部分參數作為判斷新聞是否為熱點新聞的參考標準:

圖1 新聞內容

圖2 新聞評論

表1 判斷熱點新聞的參考參數

1.3 熱點新聞發現算法

影響熱點新聞因素可以分為兩個方面:一個是從媒體角度考慮;另一個是從網民角度考慮。目前常用關注度來描述某事件當前的狀態和熱度,即某事件被關注的程度。百度借助百度指數描述某個關鍵詞用戶關注度(用戶熱度)和媒體關注度(媒體熱度)來表示某個關鍵詞的重要程度,因此本文借用百度指數的思想用熱點新聞的關注度描述當前新聞被關注的程度,用媒體關注度和網民關注度來表示熱點新聞關注度。本文提出的熱點新聞發現過程為:首先對參數進行定量化表示,在此基礎上提出熱點新聞發現算法,并用實驗對算法有效性進行檢驗。

1.3.1媒體關注度的數學描述

媒體關注度指新聞被媒體報道關注的程度。某一新聞被媒體報道越多或重復轉載性越高,說明該新聞受媒體關注程度越高;新聞只有被報道且為大眾所熟悉并引起廣泛關注才能成為熱點新聞,因此媒體對新聞從普通新聞到成為熱點新聞起著重要的推動作用,對于這種推動作用用媒體關注度表示。用來衡量媒體關注度的標準主要包括:單位時間新聞報道數(新聞報道頻率)、新聞報道持續時間、新聞報道總數,以上三個標準都是針對某一段時間內的統計量或計算量。

在話題的熱度分析中,Khoo Khyou Bun提出TF*PDF(Term Frequency*Proportional Document Frequency)算法用于熱點話題的發現,此種方法并沒有考慮特征項出現的頻率因素。因此本文在TF*PDF基礎上,將某一段時間內新聞報道時間越多則該新聞越重要這一事實考慮在內,提出改進媒體關注度計算方法,其方法的數學描述如下所示:T(i,t)為某段時間t內,信息i在網站上的媒體關注度。1式中指數描述的是某一信息報道數量越多,該新聞的PDF越大;新聞報道的時間越多則新聞越重要。公式如下:

RF(t)數學表達式為:

(2)

其中,時間t是任一時間段,如幾個小時、一天、一周等;RF(t)為在時間段t內新聞i的報道總數,即新聞i報道的頻數;RT(t)為在時間段t內報道的新聞i的總數;TR(t)為時間t內有新聞i報道時間,以天為計算單位;TS(t)從第一條新聞報道到當前統計的時間間隔;N為新聞i報道總數。

1.3.2用戶關注度的數學描述

用戶關注度指新聞被用戶關注的程度。影響用戶關注度主要有三個參數:新聞閱讀數、新聞評論數、單位時間評論數。新聞閱讀數用RN(Reader Number)表示,新聞評論數用CN(Comment Number)表示。新聞閱讀人數越多說明用戶對此新聞越感興趣。新聞評論人數越多說明新聞受關注程度和重要程度越高。

新聞評論數和新聞閱讀數對熱點新聞形成所起的作用大小不同,應該對其設定不同的權重。通常情況下如果用戶對某個新聞比較感興趣,則會在閱讀后對新聞進行評論,所以認為新聞評論人數對熱點新聞的形成比新聞閱讀數更要要,應賦以較高的權重。本文經過多次試驗發現新聞閱讀數的權重是新聞評論數兩倍時,熱點新聞的發現效果達到最佳。因此得到用戶關注度的計算公式如下3式所示:

其中a為:

(4)

計算公式為:

計算公式為:

(6)

其中: 表示在時間段t內用戶對新聞i的關注度;表示對新聞i評論人數所占的比例;λ為動態調整因子,用于平衡相關因子對公式的影響;表示新聞i閱讀人數所占的比例;CN為時間段t內新聞評論數;時間段t為任意一段時間:可以為幾個小時、一天、一周等。

熱點新聞關注度用媒體關注度和用戶關注度表示。因上面討論媒體關注度和用戶關注度的數學描述,所以熱點新聞關注度應將媒體關注度計算公式和用戶關注度的計算公式結合起來。因此得到熱點新聞關注度的計算公式如下7式所示:

公式中參數a和b為調整參數,主要作用是調整媒體關注度和用戶關注度的數值因子差異,防止出現因一方數值過大把另一方給淹沒的可能性。

1.3.3熱點新聞的獲取實驗

利用采集的新聞和評論數據作為實驗數據源,利用熱點新聞發現算法作為熱點新聞發現方法,通過實驗驗證熱點新聞發現算法的有效性。

(1)實驗數據源

實驗選擇從騰訊網站采集的2016年11月和12月兩個月的新聞數據,其數據大小如表2所示。

表2 熱點新聞發現數據源

(2) 實驗方法和步驟

為了保證公式7中用戶關注度T(i,t)中的值隨著用戶閱讀數和評論數增加,用戶關注度呈現正相關變化,對數的底數a>1,此處λ值取λ=1。另外新聞的評論中并沒有直接給出評論閱讀數,此處把新聞評論數和點贊數之和作為新聞的閱讀數。

首先需要對媒體關注度和用戶關注度的權值因子:即公式7中的a和b進行確定。通過隨機選取11月份和12月份各500條新聞數據及對應的評論,對式子中a、b值進行從[0,1]遍歷,遍歷步長為0.01,并對篩選出的結果進行統計,最終選擇篩選出結果時所對應的a和b值。

其次利用公式12對熱點新聞關注度計算,最后對實驗結果的結果進行統計分析,將得到的熱點新聞與同時間段內百度搜索風云榜新聞排行數據對比。

(3) 實驗結果

根據(2)的實驗方法,得出7式子中a=0.65,b=0.27,此時發現熱點新聞發現效果最佳。

按照上述實驗步驟,最終得到實驗數據如表3所示。

表3 熱點新聞發現結果統計表

將上述實驗發現的熱點新聞與同一時間段內的百度搜索風云榜排行新聞對比可知此種方法與百度風云榜熱點新聞的重合度在85%以上,說明此方法有效。

[1]劉星星,何婷婷等.網絡熱點事件發現系統的設計[J].中文信息學報,2008.

[2]宋雙永,李秋丹,路冬媛.面向微博客的熱點事件情感分析方法[J].計算機科學,2012.

[3]王國華,鄧海峰,王雅蕾等.網絡熱點事件中輿情關聯問題研究[J].情報雜志,2012.

[4]龔凱,唐明,尚明生等.在線熱點事件的時空演變規律[J].物理學報,2012.

[5]焦超,劉功申.網絡突發熱點事件的熱點分布[J].信息安全與通信保密,2012.

猜你喜歡
用戶實驗
記一次有趣的實驗
微型實驗里看“燃燒”
做個怪怪長實驗
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 色偷偷av男人的天堂不卡| 91国内外精品自在线播放| 九色视频一区| 华人在线亚洲欧美精品| 国产在线无码av完整版在线观看| 国产白丝av| 亚洲h视频在线| 国产伦精品一区二区三区视频优播| 国产不卡国语在线| 国产高清无码麻豆精品| 久久精品人妻中文视频| 色久综合在线| 欧美伊人色综合久久天天 | a级毛片免费播放| 日韩欧美中文字幕在线韩免费| 久久精品中文字幕免费| 91无码视频在线观看| 亚洲专区一区二区在线观看| 综合色天天| 十八禁美女裸体网站| 国产国产人成免费视频77777 | 国产地址二永久伊甸园| 亚洲欧洲日产国码无码av喷潮| 久久男人资源站| 日本黄色a视频| 国产午夜精品鲁丝片| 极品国产一区二区三区| 精品视频在线一区| 天天做天天爱夜夜爽毛片毛片| 久久久久久久97| 日本欧美视频在线观看| 强乱中文字幕在线播放不卡| 中日韩欧亚无码视频| 欧美www在线观看| 正在播放久久| 婷婷综合色| 国产国语一级毛片| 在线毛片免费| 欧美综合区自拍亚洲综合绿色| 久久这里只精品国产99热8| 亚洲日韩Av中文字幕无码| 精品第一国产综合精品Aⅴ| 综合天天色| 久久久久久高潮白浆| 久久午夜影院| 久久九九热视频| 免费观看国产小粉嫩喷水| 精品国产自在在线在线观看| 国产成人精品2021欧美日韩| 婷婷六月在线| 午夜国产精品视频| 中文字幕乱码二三区免费| 在线观看国产黄色| 一级爆乳无码av| 精品色综合| 精品夜恋影院亚洲欧洲| 国产毛片高清一级国语 | 成人午夜视频网站| 亚洲福利片无码最新在线播放| 欧美午夜一区| 色婷婷啪啪| 99热这里只有成人精品国产| 国产精品美女免费视频大全| 91成人在线观看视频| 亚洲成人在线免费观看| 亚洲无线视频| 一区二区三区四区在线| 91网址在线播放| 玖玖精品在线| 亚洲人成成无码网WWW| 欧美日韩精品在线播放| 怡红院美国分院一区二区| 黄色网在线| 九九热这里只有国产精品| 夜夜高潮夜夜爽国产伦精品| 大香网伊人久久综合网2020| 人妻精品久久无码区| 东京热av无码电影一区二区| 国产精品自在在线午夜区app| 国产午夜福利亚洲第一| 亚洲乱伦视频| 亚洲精品无码AⅤ片青青在线观看|