999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的微博熱點話題預測

2017-09-04 15:08:59張貴紅李中華
現代電子技術 2017年15期
關鍵詞:網絡技術數據挖掘

張貴紅+李中華

摘 要: 微博熱點話題受到多種因素的影響,具有強烈的非線性變化特點,為了獲得理想的微博熱點話題預測結果,提出基于數據挖掘技術的微博熱點話題預測模型。首先對當前微博熱點話題的研究現狀進行分析,指出當前微博熱點話題預測模型的局限性,然后采用數據挖掘技術,即支持向量機對微博熱點話題進行建模與分析,最后采用仿真實驗對微博熱點話題的預測性能進行分析。結果表明,數據挖掘技術可以描述微博熱點話題的變化特點,提高了微博熱點話題的預測準確性。

關鍵詞: 數據挖掘; 網絡技術; 微博話題; 預測模型

中圖分類號: TN911.1?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)15?0052?04

Abstract: The micro?blog hot topic affected by various factors has the characteristic of strong nonlinear change. In order to obtain the ideal forecasting results of micro?blog topic, a micro?blog hot topic forecasting model based on data mining technology is proposed. The current research status of micro?blog hot topic is analyzed to point out the limitations of the current micro?blog hot topic prediction model. The data mining technology (support vector machine) is used to analyze and model the micro?blog hot topic. The simulation experiment is used to analyze the forecasting performance of the micro?blog hot topic. The results show that the data mining technology can describe the change characteristic of micro?blog hot topic, and improve the forecasting accuracy of the micro?blog hot topic.

Keywords: data mining; network technology; micro?blog topic; forecasting model

0 引 言

隨著互聯網的不斷發展,出現了微博熱點話題,指人們對某個問題的議論和評價。微博熱點話題有直接性、突發性、偏差性等變化特點,傳播速度快,影響大[1]。一些負面的微博熱點話題會對國家安全、社會穩定性產生不利影響,而微博熱點話題預測可以了解將來變化態勢,因此微博熱點話題的預測成為網絡輿情研究領域中的重要研究方向[2?3]。

微博熱點話題建模與預測主要采用時間分析方法,它們將微博熱點話題歷史樣本看作按時間變化的數據,可以劃分為傳統方法和現代方法兩種類型[4],傳統方法有指數平滑、線性回分、灰色模型等[5?7],微博熱點話題預測精度低,這主要是因為微博熱點話題受到多種因素的作用,其中人為因素影響最為嚴重,具有強烈的時變性,傳統模型無法準確描述該變化特點,其應用范圍受到一定的限制[8]。現代方法主要采用數據挖掘技術,有神經網絡、支持向量機等[9?11],獲得比傳統模型更加理想的預測結果。神經網絡要求收集大量的微博熱點話題歷史數據,否則預測結果不可靠;相對于神經網絡,支持向量機要求的微博熱點話題樣本相對較少,且預測結果要優于神經網絡,實際應用范圍更廣[12]。在實際應用中,要獲得理想的微博熱點話題預測結果,首先選擇支持向量機核函數,并且估計其參數,當前采用遺傳算法、粒子群優化算法等進行參數估計,但它們自身存在不可克服的缺陷,如收斂速度慢、易找到局部最優解,對微博熱點話題預測結果產生不利影響[13]。

為了獲得理想的微博熱點話題預測結果,提出基于數據挖掘技術的微博熱點話題預測模型,采用支持向量機構建微博熱點話題預測模型,并采用量子粒子群優化算法確定支持向量機的參數,結果表明,本文模型提高了微博熱點話題的預測精度。

1 量子粒子群優化算法和支持向量機

1.1 量子粒子群優化算法

設粒子的位置和速度向量分別為和粒子和種群的最優位置分別為和在粒子對問題求解過程中的第代,粒子的位置和速度向量更新方程為:

為了分析量子粒子群算法的優越性,采用兩個函數進行仿真測試,函數具體定義為:

兩個函數的仿真測試結果如圖1所示。可以發現,相對于粒子群優化(PSO)算法,QPSO算法的速度顯著加快,獲得了較高的收斂精度。

1.2 支持向量機

采用函數將訓練樣本映射到高維空間中,支持向量機的回歸方程為:

2 數據挖掘技術的微博熱點話題預測步驟

Step1:采集具體一個微博熱點話題變化的歷史樣本,并去除一些奇異的數據點。

Step2:初始化粒子群,每一個粒子的位置表示支持向量機參數。

Step3:將微博熱點話題的訓練樣本輸入到支持向量機進行學習,估計粒子的適應值得到粒子群的最優位置

Step4:對粒子群進行分群,最優適應值的序號為相應的最優解為,。

Step5:更新和(),計算并與比較,確定

Step6:更新粒子的適應值,更新子群的與種群的最優解。

Step7:根據最優粒子群位置得到支持向量機的最優參數。

Step8:根據最優參數建立微博熱點話題預測模型。

基于數據挖掘技術的微博熱點話題預測流程如圖2所示。

3 仿真測試

3.1 數據源

為了分析基于數據挖掘技術的微博熱點話題預測性能,采用VC++ 6.0編程實現微博熱點話題預測模型,選擇“薄熙來案”作為微博熱點話題預測對象,選擇最后50個微博熱點話題對模型的泛化能力進行測試。

對微博熱點話題數據進行歸一化處理,具體為:

式中和為最小值和最大值。

選擇BP神經網絡和粒子群優化支持向量機(PSO?SVM)進行對比實驗,采用微博熱點話題預測精度作為性能分析指標。

3.2 結果與分析

本文模型的微博熱點話題預測結果如圖4所示,從圖4可以發現,本文模型能夠對微博熱點話題的變化特點進行精確刻畫,微博熱點話題的預測誤差很小,預測結果十分穩定,而且預測結果可靠,預測結果可以為網絡輿情管理者提供有用的信息。

本文模型與對比模型的微博熱點話題預測精度見表1,對比發現:

(1) BP神經網絡的微博熱點話題預測誤差最大,這表明BP神經網絡不能對微博熱點話題的變化特點進行準確建模,預測精度低。

(2) 相對于BP神經網絡,PSO?SVM的微博熱點話題預測誤差下降,主要是由于支持向量機的非線性建模能力更優。

(3) 相對于BP神經網絡和支持向量機,本文模型的微博熱點話題預測結果有了明顯的改善,有效降低了微博熱點話題的預測誤差,獲得了十分理想的微博熱點話題的預測結果。

4 結 語

微博熱點話題是當前網絡輿情研究中的焦點,由于受到多種因素的作用,變化十分復雜,導致當前微博熱點話題預測精度低,為此,提出基于數據挖掘技術的熱點話題預測模型,采用數據挖掘技術中的支持向量機對微博熱點話題進行分析和建模,并對支持向量機的參數進行優化,實驗結果表明,本文模型獲得了十分理想的微博熱點話題預測結果,預測結果可靠,具有廣泛的應用前景。

參考文獻

[1] 王來華.輿情研究概論:理論?方法和現實熱點[M].天津:天津社會科學院出版社,2007.

[2] 劉志明,劉魯.微博網絡輿情中的意見領袖識別及分析[J].系統工程,2011,29(6):8?16.

[3] 毛佳昕,劉奕群,張敏,等.基于用戶行為的微博用戶社會影響力分析[J].計算機學報,2014,37(4):791?798.

[4] 許曉東,肖銀濤,朱士瑞.微博社區的謠言傳播仿真研究[J].計算機工程,2011,37(10):272?274.

[5] 張一文,齊佳音,方濱興,等.基于貝葉斯網絡建模的非常規危機事件網絡輿情預警研究[J].圖書情報工作,2012,56(2):76?80.

[6] 郭浩,陸余良,工宇,等.基于信息傳播的微博用戶影響力度量[J].山東大學學報,2012,47(5):78?83.

[7] 韓忠明,張玉沙,張慧,等.有效的中文微博短文本傾向性分類算法[J].計算機應用與軟件,2012,29(10):89?93.

[8] 傅向華,劉國,郭巖巖,等.中文博客多方面話題情感分析研究[J].中文信息學報,2013,27(1):47?55.

[9] 方薇,何留進,宋良圖.因特網輿情傳播的協同元胞自動機模型[J].計算機應用,2012,32(2):399?402.

[10] 聶恩倫,陳黎,王亞強,等.基于K近鄰的新話題熱度預測算法[J].計算機科學,2012,39(6):257?260.

[11] 張晨逸,孫建伶,丁軼群.基于MB?LDA模型的微博主題挖掘[J].計算機研究與發展,2011,48(10):1795?1802.

[12] 廉捷,周欣,曹偉,等.新浪微博數據挖掘方案[J].清華大學學報(自然科學版),2011,51(10):1300?1305.

[13] 路榮,張腸,楊青.社交網絡中新聞趨勢的預測分析[J].中文信息學報,2012,26(6):85?90.

猜你喜歡
網絡技術數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
網絡技術對高校教育管理的影響及對策
科教導刊(2016年27期)2016-11-15 21:02:47
電視媒體與網絡媒體融合研究
淺析網絡技術在高校體育教學中的應用發展
體育時空(2016年9期)2016-11-10 20:51:55
計算機網絡技術與電子信息工程點滴談
計算機網絡技術對物流信息化的影響
網絡環境下成人學習的有效性探究
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 久久精品亚洲热综合一区二区| 91麻豆国产在线| 精品国产免费观看一区| 亚洲an第二区国产精品| 国产一级毛片网站| 亚洲天堂网在线播放| 日韩黄色大片免费看| 五月天福利视频| 精品视频一区二区三区在线播| 国产免费一级精品视频| 中文字幕在线日本| 国产精品观看视频免费完整版| 青青操国产| 国产一区二区三区日韩精品| 在线观看国产精品日本不卡网| 国产手机在线ΑⅤ片无码观看| 久青草国产高清在线视频| 中文字幕有乳无码| 女同国产精品一区二区| 丁香五月婷婷激情基地| 免费欧美一级| 欧美精品一区在线看| 国产爽妇精品| 91精品福利自产拍在线观看| 欧美人人干| 亚洲综合久久成人AV| 欧美中文一区| 91精品人妻一区二区| 狠狠色综合网| 国产精品xxx| 欧美在线视频a| 91精品伊人久久大香线蕉| 国产精品亚洲天堂| 久久久波多野结衣av一区二区| 99精品国产自在现线观看| 欧日韩在线不卡视频| 亚洲成人动漫在线| 欧美精品啪啪| 亚洲黄网在线| 久久夜色撩人精品国产| 国产一区二区影院| 国产福利免费视频| 亚洲Va中文字幕久久一区 | 欧美翘臀一区二区三区| 97在线碰| 亚洲小视频网站| 久久黄色视频影| 国产va视频| 亚洲乱码在线播放| 日韩欧美中文字幕在线韩免费 | 丝袜美女被出水视频一区| 久久久久亚洲AV成人网站软件| 欧美有码在线| 在线观看欧美国产| 免费国产高清精品一区在线| 国产亚洲精品自在线| 亚洲午夜片| 高清免费毛片| 国产丰满大乳无码免费播放| 日韩成人高清无码| 精品人妻AV区| 在线无码av一区二区三区| 韩日免费小视频| 一本久道久久综合多人| 正在播放久久| 99九九成人免费视频精品| 国产人在线成免费视频| 国产精品久久久久鬼色| 国内a级毛片| 国产无码网站在线观看| 日本三级精品| 丁香婷婷激情网| 亚洲区第一页| 国产日韩欧美在线播放| 91原创视频在线| 青青草一区二区免费精品| 伊人丁香五月天久久综合| 国产97色在线| 欧美日韩专区| 亚洲不卡影院| 午夜啪啪网| 日韩无码视频网站|