999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡的微博話題預測及分析

2017-05-17 09:05:05張琳
數字技術與應用 2017年3期

張琳

摘要:提出了基于神經網絡的微博話題預測與分析系統,介紹了此系統的整體結構與流程,并說明了該系統具有抓取話題信息及其相關內容、建立數據庫、熱門話題預判等功能,從各個角度表明該系統對商業情報分析、行業調研、信息安全、網絡輿情預警十分具有研究意義,本文對系統其中的數據處理和分析這一流程進行了重點闡述,并法分別闡述了固定權重、函數構建和神經網絡這三種算法的主要內容、公式以及它們優缺點,并且對神經網絡訓練這一過程進行了仿真結果分析。我們采取三種算法相結合的方法來進行數據處理,對話題熱度進行預判,可以綜合三種方式的優點,避免一些缺點。系統將這三種方式相結合,使其更加貼近人類思考方式,提高預測準確度。

關鍵詞:話題熱度;權重;神經網絡

中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9416(2017)03-0082-02

1 引言

近幾年,社交網絡飛速發展,各大社交媒體的用戶量呈指數性上升,微博也成為人們獲取和發布信息的重要渠道,其熱門話題也已經成為了網絡熱點的風向標。微博話題預測與分析,可向用戶提供了解熱門信息的渠道,還能節省時間;對于網絡社交媒體網站的管理人員來說,可以幫助他們更好的了解用戶群體的喜好;對于企業來說,能幫助他們迅速了解市場動向,為業務決策提供數據支持和指導[1];對于政府來說,有助于了解民眾關注點與文化道德傾向,為施政方向提供參考等等。本文提出了將神經網絡的思想應用在話題預測中,使微博話題更有預見性,提高預測準確度。

2 系統結構

系統的整體結構如圖1所示。首先從新浪微博開放接口中獲取并識別出話題信息,建立話題數據庫,并通過網絡爬蟲技術從微博搜索中抓取到與話題有關的微博數據,均進行特征提取[2]后分類存入話題相關數據庫中,對這些數據處理和分析后作出預判哪些話題為熱門話題,哪些為非熱門話題。本文將主要闡述數據處理分析這一過程中用算法實現對熱門話題的預判這一流程。

3 神經網絡

3.1 固定權重計算

權重,即將話題熱度分為閱讀量、轉發量、增長率等影響因子,為其中每種影響因子分配各自的系數。最終將各項影響因子與其系數相乘再進行累加可得到話題熱度。這種方式的優點是劃分精細,可根據測試后數據增減影響因子,改動系數,但其缺點明顯,自適應能力差,所需數據量太過龐大。其計算公式為:

(1)

式(1)中,T表示話題熱度,表示權重,表示影響因子。

3.2 構建函數計算

根據各項數據之間的關系,可以簡單地抽象為一個熱度得分與權重的線性關系,得分越高,對應權重在有限范圍內同比上升。這種方式需要在前期獲取大量數據進行測試和構建函數模型,最后得到話題熱度。利用這種方式,我們可以在一定程度上進行簡單的話題預測模擬。其具有較為清晰的邏輯,編程較為簡單的優點,缺點是需要大量的真實數據來構建函數模型。其計算公式為:

(2)

式(2)中,T表示話題熱度,表示權重上限,表示權重下限,表示此話題下內容條數上限,此話題下內容條數下限,表示當前內容條數。

3.3 神經網絡算法

神經網絡算法是指讓機器模擬邏輯性的思維,根據邏輯規則進行推理的過程。人工神經網絡按照一定的學習準則,自發發現環境特征和規律性,減少下次犯錯的可能性,達到高準確度的理想狀態[3]。其優點是模擬人類思考的方式,對話題熱度預測的方式更加人性化,自適應力強,通過大量的訓練課提高預測的準確性,但它的編程比較困難,邏輯比較復雜。神經網絡訓練公式:

(3)

式(3)輸入樣本X根據誤差e對權重A不斷調整,直到e接近零;表示權重變化率,其取值不能過大或過小,過大會影響權重的穩定,過小會使調整權重時收斂太慢。

3.4 概述

我們的方法綜合利用了以上三種思想。我們首先將話題的閱讀量、評論數、粉絲數按照一定比例賦予固定的權重,存入基本庫,得到熱度基值;而對于一些比較抽象的影響因子,例如名人效應、時效性、內容生動性、國家政策等沒有明顯劃分標準的因素,我們首先利用一些少量的數據來構建一個簡單的函數,提取內容特征來并建立附加庫,再通過神經網絡算法思想利用訓練數據來不斷調整權重,豐富并完善附加庫,最終得到熱度附加值。最后,將熱度基值與熱度附加值相加得到話題熱度。

4 測試結果與分析

4.1 神經網絡算法應用

輸入訓練數據,先根據當前的權重計算,看誤差是否達到訓練要求,若沒有則對權重進行調整,直到誤差接近于零,計算出的結果與訓練數據的結果一樣,然后再進行下一組數據的讀取,重復以上步驟,直到所有結果達到訓練要求。其神經網絡算法流程圖如圖2。

4.2 模擬結果與分析

如圖3,在做神經網絡訓練預測時,我們采取兩個點做回歸分析。橫坐標為目標值target,縱坐標神經網絡輸出。為防止過擬合,我們運用matlab對數據劃分成三分,trainning表示訓練,validation表示驗證,test表示測試,最后統計了整體狀況all,只有trainning數據參加訓練,其他兩組數據不參加訓練,用于檢驗。訓練進行時,目標target和訓練test數據之間的誤差會越來越小,validation數據和目標之間的誤差也越來越小,曲線也越來越接近對角線。

5 結語

本文對微博熱門話題預測進行了分析,針對數據處理及分析這一過程中的算法問題進行研究,綜合應用了固定權重法、構建函數法和神經網絡算法這三種算法。若要提高預測的準確度,我們還需考慮更多影響因子與劃分標準,需要更多數據加以測試與改進,優化我們的算法,使其有更多的應用價值和更加廣泛的應用平臺。

參考文獻

[1]姚婧.中文微博的話題檢測和預警[D].上海:上海交通大學,2012:1-2.

[2]劉月杰.基于中文微博的話題趨勢預測[D].北京:北京郵電大學,2013:1-3.

[3]梁野.郭寧寧.基于機器學習的網絡媒體熱點話題預測研究方法與實現[J].微型機與應用.2014.33(15).

主站蜘蛛池模板: 欧美一区二区自偷自拍视频| 欧美一区二区自偷自拍视频| 91偷拍一区| 国模在线视频一区二区三区| 女人18毛片久久| 免费一级成人毛片| 亚洲国产91人成在线| 毛片免费在线| 国产青榴视频| 丝袜亚洲综合| 国产成人综合日韩精品无码首页| 久热中文字幕在线观看| 1769国产精品视频免费观看| 亚洲精品日产精品乱码不卡| 国产91在线免费视频| 国产精品人成在线播放| 超碰91免费人妻| 国内99精品激情视频精品| 国产原创第一页在线观看| аⅴ资源中文在线天堂| 国内丰满少妇猛烈精品播| 香蕉视频在线观看www| 91精品国产自产在线老师啪l| 国产情侣一区| 亚洲人成日本在线观看| 亚洲人成影院在线观看| 亚洲欧洲日韩国产综合在线二区| 中文字幕丝袜一区二区| 国产无吗一区二区三区在线欢| 国产高清又黄又嫩的免费视频网站| 国产精品丝袜在线| 国产精品无码作爱| 国产自视频| 97超级碰碰碰碰精品| 国产精品永久不卡免费视频| 国产99在线观看| 亚洲高清中文字幕在线看不卡| 无码一区18禁| 免费一级成人毛片| 亚洲三级视频在线观看| 欧美视频在线第一页| 久久夜色精品| 国产黄色视频综合| 亚洲精品无码成人片在线观看| 永久成人无码激情视频免费| 亚洲第一区精品日韩在线播放| 中文字幕日韩欧美| 在线观看的黄网| 在线观看国产网址你懂的| 毛片网站在线播放| 欧美在线精品一区二区三区| 最新国产午夜精品视频成人| 香蕉国产精品视频| 日韩性网站| 欧美高清国产| 美女免费精品高清毛片在线视| 毛片最新网址| 亚洲成在线观看 | 农村乱人伦一区二区| 国产精品永久免费嫩草研究院| 青青操国产| 一级不卡毛片| 久久77777| 国产精品熟女亚洲AV麻豆| 色综合天天娱乐综合网| 亚洲无码高清一区二区| 国产高潮视频在线观看| 狼友视频国产精品首页| 免费一极毛片| 国产va在线| 91综合色区亚洲熟妇p| 国产理论最新国产精品视频| 久久大香香蕉国产免费网站| 日韩资源站| 老司机精品99在线播放| 免费人成网站在线高清| 97精品伊人久久大香线蕉| 久久综合激情网| 婷婷亚洲天堂| 玖玖免费视频在线观看| 国产午夜人做人免费视频中文| 国产成人综合日韩精品无码首页 |