黃肖峰
(1.中國鐵道科學研究院 研究生部,北京 100081 2.中國鐵路信息技術中心,北京 100844)
鐵路總公司輿情監測管理系統設計
黃肖峰1,2
(1.中國鐵道科學研究院 研究生部,北京 100081 2.中國鐵路信息技術中心,北京 100844)
介紹鐵路總公司輿情監測管理系統的設計與實現,介紹系統建設目標,給出系統的總體結構和系統功能,并簡要介紹系統使用的HADOOP和全文檢索這兩大關鍵技術,對系統上線后的效益做出展望。
門戶網站;系統設計;虛擬化;HTML5
現階段隨著我國鐵路改革,鐵路實現了“政企分開”,鐵路總公司全方位走向市場,為順應市場潮流,總公司推出了一系列利民措施,例如:網絡購票、電話訂票、實名制、貨運電子商務等一系列服務措施,但同時也帶來一系列的詬病,在社會中產生不同輿論的聲音。因此在改革的過程中,為了更好地了解社情民意,根據民意不斷改進鐵路工作和服務質量,亟須加強對互聯網鐵路相關輿論的輿情監測管理。
充分運用現代信息技術,構建基于大數據的鐵路總公司輿情監測管理系統,通過對互聯網海量信息中與中國鐵路相關的輿情監測、輿情分析、輿情處置、效果評估等,可以為綜合實現輿情采集監測分析處置與導控全生命周期的閉環管理提供重要支持。
充分運用現代信息技術,構建基于大數據的輿情服務平臺,通過對互聯網海量信息中與中國鐵路相關的輿情監測、輿情分析、輿情處置、效果評估、輿情報告、輿論引導、新媒體宣傳、新聞宣傳以及網評員隊伍管理,提高輿情采集監測的及時性和準確性,提高分析互聯網輿情問題的能力,規范輿情處置協同工作的流程,提升輿情處置與輿論引導、新媒體宣傳的成效,加強輿情人才隊伍建設,為中國鐵路總公司及時了解互聯網鐵路相關社情民意、引領輿論向導、進行科學決策,綜合實現輿情采集監測分析處置與導控全生命周期閉環管理提供重要支持。
建設目標包含以下幾個方面。
1.1 提升輿情信息采集的廣度和深度
實現包括新聞網站、論壇、博客、微博、微信公眾賬號、移動新聞客戶端、QQ群等媒體中輿情信息的全面采集。
1.2 提升輿情信息挖掘分析的水平
全面提升鐵路輿情信息的深度挖掘和分析的能力,實現輿情事件多維度的、全面的、深度分析與持續的追蹤,同時能夠及時有效的提供預警通知服務。
1.3 建立輿情處置工作協同協作與規范化體系
建立一套科學的、高效的、標準的、規范的輿情事件處置流程體系和覆蓋全路兩級的立體式輿情事件監測、上報、研判、分析和協調處置的規范化流程。同時對于整個過程進行全面監控和審計,為日后人員績效考核和相關責任人的追究提供依據。
1.4 提升重大輿情事件應急指揮的能力
以實際業務為主線,建設符合我國鐵路輿情分析導控工作信息的展示中心、應急指揮中心,實現所有輿情監測分析信息集中展示、線上聯合研判、協調指揮、應急處置過程審計等功能,從而全面提升全路在面對重大負面輿情事件時應急協調指揮與處置的效率。
1.5 建立輿情處置與輿論引導的評估體系
整體提升全路輿情處置與輿論引導、新媒體宣傳的效果,建立對中國鐵路相關輿情事件應急指揮與處理、輿論引導、新媒體宣傳等工作成效,以及輿情從業人員隊伍工作績效的綜合評價體系。
1.6 提升輿情人才隊伍整體能力
借助全路綜合評估體系,建立系統的、統一的從業人員人才隊伍管理平臺,全面的提升中國鐵路行業輿情相關人才隊伍的能力水平。
1.7 建立輿情工作知識化無形資產的管理和有效利用
充分借助歷史輿情工作中積累的成功理論、方法、處置方案和失敗經歷,借助數字化存儲技術,實現輿情工作中知識化無形資產的管理,綜合提高知識在全路范圍內的快速傳播和有效利用,為中國鐵路新聞宣傳與輿論引導提供有力支撐。
鐵路總公司輿情監測管理系統采用統一、安全、平臺化設計,從實戰的業務角度、考慮行業特色,構建一個覆蓋全路的互聯網輿情采集、監測、分析、處置與導控的全生命周期閉環管理平臺。系統底層采用Hadoop技術架構,實現平臺分布式的采集、存儲、智能分析和數據庫。系統整體技術架構如圖1所示。

圖1 系統整體技術架構
系統采用面向服務的思想,利用松散耦合的分層方式將系統整體總體架構分為4個層次,分別是基礎設施層、鐵路輿情大數據中心、應用層和展現層。各層之間的界限清晰,功能明確,具有較高的可配置性和伸縮性。
2.1 基礎設施層
最底層主要為整個系統平臺提供基礎的硬件、網絡、數據管理和操作系統等底層的軟硬件支撐。在此之上通過虛擬化,實現對服務器硬件設備的最大化利用和有效的管理。具體包括對于中國鐵路總公司以及各鐵路局與應用系統相適應的機房消防改造、網絡升級、安全加固、海量存儲建設、服務器等硬件的利舊和采購。
2.2 鐵路輿情大數據中心
基礎設施層之上,通過在Hadoop架構之上構建分布式的采集、分布式全文檢索、分布式智能分析,為上層應用提供基礎的應用支撐,同時通過Hbase數據庫實現互聯網所采集數據的有效存儲和管理,從而構建鐵路輿情大數據中心。
2.3 應用層
應用層作為整個業務平臺系統的核心,采用面向服務的思想,由7個應用子系統(互聯網輿情采集監測分析與處置支撐系統、輿論引導系統、新媒體宣傳管理系統、輿情從業人員隊伍管理系統、效果評估系統、視頻會議系統、移動APP客戶端)和輿情工作門戶組成,同時利用Web Services技術為其他外部系統提供基于SOAP的遠程方法調用接口,用以完成未來與中國鐵路總公司其他系統之間的數據交換和同步,并基于多年業務數據的積累,構建鐵路輿情預案庫、案例庫、網站庫、行業庫和人物庫,形成屬于鐵路總公司的知識管理體系。
2.4 展現層
在展現層,通過輿情監測導控信息門戶為中國鐵路總公司及各鐵路局輿情監測分析人員、高層領導、網評員等提供輿情信息、各類輿情分析圖表、輿情分析報告、效果評估等信息的展示和圖形化操作界面。
整個系統包含7大模塊,覆蓋輿情信息的獲取、瀏覽、研判分析和處置、輿論引導、新媒體正面宣傳、成效評估和報告決策支持等環節,具體功能包括:
(1)獲取敏感信息:面向互聯網實時收集包括新聞網站、論壇、博客、微博、微信公眾賬號、移動新聞客戶端等媒體的信息。
(2)輿情瀏覽:通過多級應用平臺對涉及鐵路相關敏感信息、輿情信息的監測瀏覽。對于負面敏感信息、重大輿情事件,可通過平臺進行上報。
(3)研判分析與處置:基于輿情監測分析處置支撐系統,實現輿情的深度分析,直觀的為用戶提供多維度各類輿情分析圖表。通過輿情處置流程,實現輿情事件處置指令下發、審批、處置反饋、上報,及整個過程全面監控與審計。
(4)輿論引導:加強互聯網輿論引導,實現輿論引導指令管理、網評主題管理、網評文章管理、網評文章的實時監測,以及對輿論效果的評估。
(5)新媒體正面宣傳:實現目前新媒體平臺信息發布的人工管理、分散管理向信息化管理轉變,建立新媒體宣傳稿庫,提高管理效率和科學化水平。
(6)成效評估:通過輿情采集、監測和監控審計功能,對于日常輿情處置和輿論引導、新媒體宣傳工作實施監測,并基于效果評估和人員績效考核模型,實現綜合評估。
(7)報告決策支持:對于日常監測、處置和重大輿情事件應急指揮相關分析結論、處置過程、處置結論、引導效果評估、人員績效評估,都可通過輿情綜合報告功能自動生成相應匯總的報告。
4.1 Hadoop系統架構

圖2 Hadoop框架示意圖
如圖2所示,Hadoop框架中最核心的設計就是:MapReduce和HDFS。MapReduce用簡單的一句話解釋就是“任務的分解與結果的匯總”。Hadoop分布式文件系統(HDFS,Hadoop Distributed File System),為分布式計算存儲提供了底層支持。
4.1.1 MapReduce
MapReduce是一個高性能的批處理分布式計算框架,用于對海量數據進行并行分析和處理。與傳統數據倉庫和分析技術相比,MapReduce 適合處理各種類型的數據,包括結構化、半結構化和非結構化數據。數據量在 TB 和 PB 級別,在這個量級上,傳統方法通常已經無法處理數據。MapReduce 將分析任務分為大量的并行 Map 任務和 Reduce 匯總任務后進行處理。
4.1.2 HDFS文件存儲
HDFS是運行在通用硬件上的分布式文件系統,它提供了一個高度容錯性和高吞吐量的海量數據存儲解決方案。HDFS 通過一個高效的分布式算法,將數據的訪問和存儲分布在大量服務器之中,在可靠地多備份存儲的同時還能將訪問分布在集群中的各個服務器之上,是傳統存儲構架的一個顛覆性的發展。
4.2 全文檢索
全文檢索是對海量文本數據進行檢索的重要而基礎的技術手段。所有的數據檢索都需要基于獨立的全文檢索系統來實現,不能只依靠數據庫級的檢索,全文檢索的功能是實現各業務模塊的重要資源。獨立的檢索引擎的數據處理能力可以實現TB級的檢索,可以有效的滿足業務支撐,其主要特點如下。
4.2.1 簡潔易用的開發接口
全文檢索技術的核心是全文檢索服務器,全文檢索服務器以Web Service 方式提供服務。應用系統按照Web Service格式標準向服務器發送信息檢索和數據更新等請求,并接收返回結果。用戶可以用多種形式進行廣泛的應用開發,設計出與自身應用程序風格一致的界面或是滿足各種特殊的應用需求,極大地降低和保護了用戶的軟件成本。
4.2.2 采用XML進行數據交換
全文檢索在內部和外部均采用XML進行交換數據的描述,有力地保證了系統的可擴展性與跨平臺性,易于應用開發商的使用。
4.2.3 自動分詞技術
全文檢索引擎以基于中文分詞的混合字詞為索引單位,內嵌的分詞系統采用以詞典為基礎的分詞算法。系統自帶一部通用的系統詞典,用戶可以通過建立用戶詞典來定義新的詞匯,用戶詞典一般包含了某個領域的專業詞匯。系統在自動分詞時將同時參考缺省分詞詞典和用戶詞典中的詞匯。
目前,系統正在緊張的建設當中,相信系統建成后,將有效提高鐵路輿情采集監測的及時性和準確性,提高分析互聯網輿情問題的能力,規范輿情處置協同工作的流程,為中國鐵路總公司及時了解互聯網鐵路相關社情民意、引領輿論向導、進行科學決策提供更好的支持。
[1]王 青, 成 穎 巢乃鵬. 網絡輿情監測及預警指標體系構建研究[J]. 圖書情報工作, 2011(8):56-59.
[2]袁文英. 從7.23甬溫線動車事故看政府如何應對網絡輿情[J].湖南行政學院學報,2013 (1) :20-23.
[3]范晨熙. 基于Hadoop的搜索引擎的研究與應用[D]. 杭州:浙江理工大學,2013.
[4]鄭明杭. 基于HDFS的視頻監控系統軟件設計[D]. 杭州:浙江大學,2013.
[5]田勝利. 針對HBase的MapReduce數據訪問方式的優化[D].長沙:國防科學技術大學,2012.
[6]康 毅. HBase大對象存儲方案的設計與實現[D]. 南京:南京大學,2013.
責任編輯 徐侃春
Public Opinion Inspection Management System of China Railways
HUANG Xiaofeng1,2
( 1. Postgraduate Department of China Academy of Railway Sciences, Beijing 100081, China; 2. Information Technology Center of China Railways, Beijing 100844, China )
This article introduced the design and implementation of Public Opinion Inspection Management System of China Railways, described the building objective, the general structure and function of the System, gave a brief introduction of HADOOP and full text search which were the main techniques used in the System. Finally the article gave a prospective of the benef i t.
portals; system design; virtualization; HTML5
U29∶TP39
A
1005-8451(2015)08-0023-04
2015-01-08
黃肖峰,在讀碩士研究生。