聶瓊,陶杰,吳凡
(蘇州農業職業技術學院,蘇州215008)
隨著進入21 世紀的智能化、信息化的時代,互聯網發展迅速,網絡已經成為我們每個人學習、生活、工作不可或缺的一部分。人們可以匿名在網絡上發表和傳播自己的言論和觀點,活躍程度已達到很高。對于國內外發生的大事件就會馬上形成相關的網絡輿論,通過網絡進行傳播,對社會、政府、學校形成不同程度不可忽視的影響。
網絡輿情對于高職學生的思想和行為有著更為深刻的影響,網絡輿情監控是我們構建和諧校園和健康網絡環境的重要環節。對于突發事件發生后,有效地收集事件相關信息,跟蹤事件發展態勢,并且報告相關部門進行有效對應處理等,是一個目前有效處理網絡輿情的對策。因此,高校網絡輿情監測系統的設計就非常有必要,為學校相關部門提出有效的措施,避免事件的危害性進一步發酵爆發和傳播。
高職網絡輿情監測系統的主要作用就是針對學校學生對于熱點和突發事件的網絡輿情情況進行傳播信息采集。監聽其傳播過程和把握傳播規律,做好輿情分析,整理信息并作出準確、科學、有效的判斷。依據輿情數據,進行相應的針對性的判斷和監測,并提供針對性的預案分析,避免事態升級,危害加大。
高職網絡輿情監測系統的設計原則為實用性強,功能簡單,易于使用,可靠性高的原則。系統支持百萬級以上的海量數據,并且可進行擴展和定制。
高職網絡輿情監測系統主要完成的任務如下:
(1)網絡能夠監測并且覆蓋學校關注的范圍,能夠監測到與學校相關業務范圍。
(2)全面監測網絡上的新聞、論壇、微信、QQ、貼吧、微博等國內大型網絡媒體,能夠做到全面監測。
(3)能夠24 小時無障礙不間斷自動監測,做到學校輿情信息實時監控。
(4)準確發現學校學生關注熱點輿情,自動進行分析和判別,并且能夠溯源,掌握各條輿情的傳播路徑、傳播時間等,并將這些信息生成分析報告。
(5)對于重要輿情事件能夠進行實時監聽和及時預警。
(1)信息采集系統
高校網絡輿情的傳播來源和表現形式比較多元化,而且高校大學生對于校內外突發事件及重大事件關注度比較高,討論熱烈。本系統的信息采集系統主要對于通過互聯網進行信息傳播的微博、微信、QQ、論壇、博客、貼吧、新聞等信息來源進行監測,通過關鍵字提取、要素采集、全文檢索、自動去重、分區存儲等方式進行信息采集和檢索。使系統采集程序采集到所需數據,形成高校網絡輿情信息數據庫。
(2)網絡輿情分析系統
網絡輿情分析系統主要完成網絡輿情的信息處理和分析過程。信息處理和分析過程是整個系統中非常重要并且核心的一個環節,在這個過程中通過網絡輿情信息的摘要、要素和主題進行過濾后,進行數據的自動分類、自動聚類、自動排重等處理。最終再進行轉載分析來確定信息來源,并且最終再進行輿情預判來進行分析數據,為管理者提供判斷依據和預警分析。
(3)網絡輿情服務系統
網絡輿情服務系統主要面向輿情管理人員、輿情使用人員、輿情維護人員。管理人員、使用人員和維護人員可以對輿情信息進行全文檢索、輿情分類,同時還可以追蹤每條信息的信息來源,對查詢的信息數據進行統計分析、熱點分析,最終生成網絡輿情報告。對于使用者和管理者通過報告可以進行判斷并且進行信息預警,從而對于高校管理者作出正確判斷和及時措施的有利依據。
本系統的系統整體架構如下圖1 所示。高校網絡輿情系統包含采集系統、網絡輿情分析系統和網絡輿情服務系統等部分。網絡采集系統設置采集規則,通過爬蟲技術對微博、微信、QQ、博客、貼吧、論壇等信息來源進行采集,并將采集的結果進行過濾、分類、聚類、排重等操作,并且還對轉載過程進行分析,對輿情信息進行輿情預判。將最終經過處理之后的結果進行統計分析,生成統計報告。

圖1 網絡輿情系統架構圖
網絡輿情系統的數據流來自數據信息采集系統,從互聯網中采集指定網站或者App 地址庫,加入種子URL 初始化待爬隊列后再進行源代碼處理。將用戶所需的信息通過關鍵字提取、要素采集的方式進行收集,然后進行格式轉換并且分區存儲。與此同時提取新的URL 進行過濾、去重,加入到種子URL 初始化待爬隊列中。系統的數據流程圖如圖2 所示。

圖2 系統數據流程圖
高職網絡輿情監測系統的界面主要包含首頁、輿情監測、輿情分析、輿情服務等欄目,包含了系統中信息采集、信息數據處理分析、信息管理等用戶所需的功能。用戶可以在首頁文本框內輸入監測網址、主題、關鍵字、時間范圍等,就可以得到關鍵字相關的帖子的關鍵字的數量、來源以及變化趨勢圖和趨勢預測。案例搜索發展趨勢結果如圖3 所示。
隨著經濟和社會的發展,網絡的應用所占比重越來越大,高職院校信息安全的任務也越來越艱巨,只有對高職院校網絡輿情做好實時監測和管理,在有突發狀況來臨的時候才能做到全面有效并且快速的數據采集,發現輿情危機情況出現時,做好預警工作,并且向領導者做好匯報,及時采取處理措施,以防事態嚴重化。

圖3 發展趨勢圖