羅平 武斌



摘? 要: 為了有效解決輿情數據傳播中特征挖掘技術面臨的特征挖掘滯后問題,設計基于人工智能的網絡輿情大數據傳播特征挖掘系統。設計網絡信息傳感提取模塊,利用O/I順向電流指向性電路節點端口和電機控制性匹配結構構建外圍控制電路以及帶狀數據分布式交互接口。設計輿論數據人工智能入網協議來轉換當前的網絡數據格式,并對其進行輿情二次語義處理。文中使用人工智能技術,依靠Hadoop平臺內部學習庫中的Ma_Orduse算法和K?means算法通過有效數據文本聚類獲取特征鍵值,以中樞結構的形式傳遞回中央控制器,實現當前網絡輿情大數據傳播特征挖掘。實驗數據表明應用該挖掘系統后,輿情數據特征讀入延遲降低32%,讀出延遲降低27%,可以有效緩解特征挖掘滯后問題。
關鍵詞: 輿情大數據; 特征挖掘; 人工智能; 系統設計; 數據分析; 語義處理
中圖分類號: TN911?34; F272? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)04?0176?04
AI?based propagation feature mining system for network public opinion big data
LUO Ping, WU Bin
(Shanghai University of Finance and Economics Zhejiang College,? Jinhua 321013, China)
Abstract: An AI?based propagation feature mining system for network public opinion big data is designed to effectively solve the lag problem of feature mining faced by the feature mining technology of public opinion data propagation. The network information sensing and extraction module is designed, and the peripheral control circuit and banded data distributed interactive interface are constructed with O/I forward current directivity circuit node port and motor control matching structure. The artificial intelligence network protocol of public opinion data is designed to convert the current network data format and carry out the secondary semantic processing of public opinion of it. The characteristic key values are obtained by effective data text clustering by means of the Ma_Orduse algorithm and K?means algorithm in the internal learning library of Hadoop platform with the artificial intelligence technology, which are transferred back to the central controller in the form of central structure to realize the feature mining of current network big data transmission of public opinion. The experimental data show that the application of the mining system, the read?in delay of public opinion data features is reduced by 32%, and the read?out delay is reduced by 27%, which can effectively alleviate the lag problem of feature mining.
Keywords: public opinion big data; feature mining; artificial intelligence; system design; data analysis; semantic processing
0? 引? 言
網絡輿情具有極強的復雜性、擴散性、跨越性,對于其監管和特征判定也勢必需要更為先進的思維模式和更為完備的數據挖掘系統[1]。
傳統化的網絡輿情大數據傳播特征挖掘一直面臨著特征挖掘滯后的問題,很難在部分惡性輿情擴大化前進行有效的遏制。在現有技術無法對其進行有效升級和改善的情況下,勢必需要引入新型技術作為支持動力。人工智能作為與大數據同時出現的集成化網絡技術手段,從研究伊始就奠定了二者密不可分的協作關系。應用人工智能對網絡輿情大數據進行有效的監管和特征挖掘,是現代復雜網絡環境下較為可行的數據特征挖掘監管升級方案。人工智能所特有的數據時間智能化和數據擬合智能化,可以利用時間軸進行網絡輿情數據傳播遏制,改善滯后性問題[2]。
1? 人工智能輿情大數據傳播特征挖掘系統
1.1? 網絡信息傳感提取模塊設計
網絡信息傳感提取模塊主要作為當前特征挖掘系統初始信息獲取區域存在。該模塊可以為系統提供大量的網絡傳感信息流,作為系統后續操作的原料。在實際工作中,提取模塊主要通過將輸入端接口電路和PC端網絡數據傳感器相連,獲取初始網絡信息流節點編號后,根據中央控制器獲取當前網絡信息的初始編碼值和地址編碼,再利用系統內設的數據存儲器完成信號動態數據存儲,采用無線射頻的方式建立傳輸電流、CAN傳輸總線以及RS 485傳輸串口,為主控區進行信號傳輸。其詳細結構如圖1所示。
外圍電路由采集器輸入接口電路、繼電器控制電路、串口電路和CAN總線電路合成[3]。其核心構建包括O/I順向電流指向性電路節點端口,電機控制性匹配結構,采集獲取電路時鐘,以及一個可以保證16線程的外部電源數據轉換器,4個多線程緩沖性路徑接口及其核心數據傳感器。提取模塊內部為中央控制器,與FLASH存儲器相連,具有明確的獨立控制區。外部通過端口與外圍電路相連。相關大數據工作人員可以根據其內部的傳感器,建立輿情大數據的網絡空間映射子集,方便后續管理[4]。中央控制器示意圖內部結構圖見圖2。
中央控制器內部各個原件與多條帶狀數據分布式交互接口聯通[5]。因為不同的輿情大數據需要基于大量的數據點擊周期和數據訪問次數,多條帶交互接口設計可以保證提取模塊在進行日常輿情數據提取中,同時進行數據的讀入和讀出,在一定程度上提高了數據進出效率[6]。此外針對當前輿情數據圖片、視頻、文字形式多樣化特征,在中央控制器上設置三類不同的數據接口,即:MP/MC,OVLY,DROM。以上三類不同的數據接口可以滿足現代網絡環境下全部數據形式的提取和傳輸要求。當中央控制器成功獲取數據以后,根據模塊內部的數據傳輸結構,直接傳遞給FLASH存儲器,獲取數據寄存值,再通過存儲器內部獨有的傳輸接口進行傳輸。因為傳感提取模塊獨有的數據專業化特征,可以對采集制定進行不斷重復并在此基礎上施加條塊指令和傳輸指令,每個指令均根據64位傳導數據進行傳導。
1.2? 輿論數據人工智能入網協議
網絡信息傳感提取模塊雖然可以讀入和讀出大量的網絡信息,但是不能直接與人工智能相關分析數據相連。從網絡屬性上來看,當前的網絡數據屬性為線上網絡,也就是基礎網絡;而人工智能分析則需要基于已知網絡,也就是局域網絡。二者無法直接進行對接,所以設計增設入網協議,改變當前提取網絡數據的網絡屬性,為后續輿情傳播特征挖掘提供條件[7]。
具體轉換方法是利用一定網絡藍本,確定并保證當前數據信號的隨機網絡代碼,將其與當前人工智能網絡協議的載波進行同步,從而實現網絡屬性變化和對接。上述過程可以將其近似的看作是一種大量駁雜的網絡數據通信信號二維判定過程。根據當前無線數據信號離散傅里葉變換規則,數據傳輸信號在進入局域網時,信號源的時域和頻域會呈現幾何倍數關系。這一特征可以應用于入網協議制定中。設計將數據傳輸協議直接連入系統傳感提取模塊的中央控制區,在當前無線網絡內建立端口。設中控區信號接收序列為[x(n)],信號控制端的數據序列為[y(n)],則設計入網協議的最終函數算法為:
[?xy(n)=r=1Nx(r)·y(r-n)]? ?(1)
式中:[n]表示當前入網協議信號數據的測量關系指數;[r]為當前數據信號可執行性定義域;[?]為當前提取信息數據頻域的測量關系值[8]。
根據入網協議,需要對當前信息數據的傳輸信號快速進行信號傅氏變換和局域網絡偽隨機碼的智能轉換,獲取當前轉碼的阻隔值。其變換公式如下:
[G(s)=U(s)E(s)=kP1+1TIs·TDs]? ?(2)
式中:[kP]表示數據變換的偽隨機比例系數;[TI]表示當前數據常數量;[TD]表示當前數據可變換常數。
由式(2)將當前采集數據傅里葉變換下的偽隨機碼直接導入,并與區域網絡下人工智能網絡數據載波同步。如果所有的網絡代碼值均小于代碼值,則可以直接進行入網操作。
1.3? 實現輿情大數據傳播特征挖掘
入網協議將數據與局域網絡下人工智能相關分析數據相連后,即可對其進行輿情二次語義處理,進行數據挖掘。二次處理包括預處理和分析挖掘處理。
1) 一次處理。需要對人工智能下的采集數據以及局域網頁信息進行去重和去噪處理,選擇文本特征形式并將文本向量進行初始化或者格式化操作,獲取局域輿情文本數據向量集,其工作流程如圖3所示。
局域網絡屬性數據會保留原始數據域名格式,需要清洗數據HTML源代碼,保留數據自身內容摘要等信息。為了便于后續分析,系統額外使用MAP_reduce分詞處理技術,提取當前輿情數據詞頻特征,最終構建詞頻特征向量集合,將其保存到HDFS分布式文本庫中,一次處理完畢。
2) 二次處理。其包括用于消除特征延時性的時間序列模型和傳播特征分析挖掘[9]。構建網絡輿情信息時間序列模型可以最大限度完成傳播特征排序,抵消數據延遲。設當前多維的隨機變量[Ui],則當前數網絡數據為[U=U1,U2,…,UN]。設網絡輿情數據在路由鏈路層數據值域期間的關聯性特征為:
[pUθ=k=1KαkGUuk,k]? ? ?(3)
式中,[α]和[u]分別表示網絡輿情數據獨有的特征序列波特率和響應頻率。根據式(3)計算下的公式性特征,可以直接按照時間節點建立時間序列。
輿情傳播特征分析是二次予以處理的核心,主要負責完成輿情信息的高度識別、跟蹤輿情話題、評估輿情導向等。二次處理過程包括人工智能下的特征聚類算法,該算法可以將一次處理時獲取的信息文本向量進行匯總,并對輿情數據特征進行挖掘,識別主要輿情話題。將傳播特征信息提取后,更新數據向量文本,判斷二者之間的關聯性。如果關聯性達到一定的預設標準則可以將其劃分為一類情感傾向話題中。
系統的使用人工智能技術包括Hadoop平臺。該平臺內部學習庫中的Ma_Orduse算法和K?means算法可以實現有效數據文本聚類[10]。只需要將一次處理獲取的文本向量集進行有效錄入,并預設聚類數據中心迭代中值條件,即可完成數據聚類,并獲取文本特征信息及中心點。
此外系統引入的MAP函數,可以將文本向量集劃分成不同的小塊數據集合,并將其直接發送到人工智能下各數據節點的子程序中,直接進行計算任務。計算獲取的特征鍵值會以中樞結構的形式傳遞回中央控制器,從而實現當前網絡輿情大數據傳播特征挖掘。
2? 實驗數據分析
實驗數據分析可以驗證當前系統的實際性能,提取特征數據為后續開發奠定基礎。設計實驗以傳統數據挖掘系統為對比樣本,通過驗證輿情數據特征讀入和讀出延遲,分析判定設計系統的實際性能。
2.1? 輿情數據特征讀入延遲對比
為了體現實驗公正,設計選用完全相同的2臺計算機進行數據特征挖掘,數據庫采用最新的BIRD數據庫,關鍵詞摘要的提取為多項提取。圖4為實驗對比系統輿情特征數據讀入延遲對比結果。
圖4顯示了當前兩種數據傳播特征挖掘系統進行輿情數據特征讀入時的對比延遲。實驗隨機選取5組進行驗證。根據數據資料顯示,傳統挖掘系統的輿情數據特征讀入延遲要明顯高于本文設計的挖掘系統,經過數據統計可以判定其相差比例達到32%。
2.2? 輿情數據特征讀出延遲對比
按照上述方法和實驗環境進行輿情數據特征的讀出操作,驗證對比延遲。為了更為清晰地明確數據結果,設計將對比延遲比例圖轉換為比例表的形式進行對比,其結果如表1所示。
根據表1數據可以看出,在輿情數據特征讀出延遲對比中,本文設計的特征挖掘系統同樣優于傳統挖掘系統,其特征延遲要比傳統系統降低27%,進一步驗證了實驗預測。
3? 結? 語
網絡輿情大數據傳播特征挖掘對當前網絡環境監管和輿論分析具有重要意義。為了解決傳統挖掘系統延遲過高的問題,設計了新型挖掘系統。該系統以人工智能為核心進行特征挖掘,進行輿情二次語義處理,可以有效降低延遲。
注:本文通訊作者為武斌。
參考文獻
[1] 王艷,王慧.基于快速Spark人工智能架構的大數據挖掘算法[J].黑龍江工業學院學報(綜合版),2018,18(5):85?89.
[2] 張雙獅,夏一雪,蘭月新,等.面向大數據的涉警輿情分析與決策方法研究[J].傳播與版權,2018,59(4):185?189.
[3] 王冰純,毛妍捷,孫濱頤,等.基于大數據背景下的人工智能客服系統[J].電子測試,2018(13):74?75.
[4] 詹劼,周純玉.基于大數據的人工智能教育系統設計分析[J].數碼世界,2018(1):146.
[5] 李亞,張小平.基于人工智能的網絡評卷系統的初探[J].中國戰略新興產業,2018(28):126.
[6] 汪應.基于“人工智能+大數據”智慧校園虛擬校園卡創新與實踐[J].傳播力研究,2018,2(31):244.
[7] 陳德旺,章明亮,沈鏞.智慧地鐵:基于大數據與人工智能的新型地鐵系統[J].智能城市,2018,4(19):17?19.
[8] 高塔.探究如何利用大數據挖掘技術推動人工智能發展[J].中小企業管理與科技(下旬刊),2018(5):149?150.
[9] 孫華,賈曉婷.大數據時代人工智能在計算機網絡技術中的應用[J].信息與電腦(理論版),2018(9):133?135.
[10] 洪學銀,李亞娟.大數據背景下人工智能在計算機網絡技術中的應用研究[J].信息與電腦(理論版),2018(21):124?125.