趙瓊,何健,武曉偉,邢小璐
?
大規(guī)模突發(fā)事件決策支持系統(tǒng)的研究與實現(xiàn)
趙瓊,何健,武曉偉,邢小璐
摘 要:為應(yīng)對各類異常事件,政府已經(jīng)擁有比較完善的匯報機制如安全巡防員、110報警電話等,也有比較健全的各類應(yīng)急預(yù)案。但是對于大規(guī)模異常事件,由于事件的復(fù)雜性和突發(fā)性,使得決策者很難判斷事件的真實情況,因此,啟用相應(yīng)應(yīng)急預(yù)案是一個復(fù)雜的決策過程。大規(guī)模突發(fā)事件決策支持系統(tǒng)通過學(xué)習(xí)大規(guī)模突發(fā)事件的警報內(nèi)容,利用社交網(wǎng)絡(luò)上的相關(guān)信息,建立大規(guī)模突發(fā)事件信息分析模型及實時監(jiān)測系統(tǒng)。在突發(fā)事件發(fā)生之后,對于相關(guān)信息進行即時分析,抽取各類觀點并計算其可信度,為政府應(yīng)急機構(gòu)提供即時、客觀、全局的決策依據(jù)。
關(guān)鍵詞:大規(guī)模突發(fā)事件;決策支持系統(tǒng);政府應(yīng)急機構(gòu)
隨著我國城市化進程的不斷加速,城市人口密度增大,結(jié)構(gòu)趨于復(fù)雜化。新興大中城市在給市民帶來生活便利及就業(yè)崗位的同時,也更容易面臨各種大規(guī)模突發(fā)事件,其中既包括海嘯、地震、臺風等自然災(zāi)害,也包括大規(guī)模恐怖襲擊等人為災(zāi)害。這些大規(guī)模突發(fā)事件通常具有如下特性:(1)成因相對復(fù)雜(尤其是人為災(zāi)害);(2) 涉及城市面積相對較廣;(3)各區(qū)域受影響嚴重程度不同,所需應(yīng)對資源類別、數(shù)量也各不相同。我國雖然已有比較完善的突發(fā)事件匯報機制(如安全巡防員、報警電話等),也有比較完備的災(zāi)害處理預(yù)案,但政府應(yīng)急機構(gòu)在處理此類事件時仍會面臨決策困難的問題。
在應(yīng)對大規(guī)模突發(fā)事件時,利用信息化技術(shù)建立大規(guī)模突發(fā)事件決策支持系統(tǒng),通過對社交平臺的分析了解輿情和事件實時狀況,結(jié)合對大規(guī)模歷史事件的學(xué)習(xí),使政府應(yīng)急機構(gòu)盡快了解事件的全面情況,可以正確判斷復(fù)雜的形勢,總攬全局、協(xié)調(diào)各方面,及時果斷準確地制定針對突發(fā)事件的對策,盡可能的減小突發(fā)事件造成的危害。
1.1 相關(guān)概念
決策支持系統(tǒng)是綜合運用了管理學(xué)、運籌學(xué)、控制論等多方面知識,借助于計算機科學(xué)技術(shù)實現(xiàn)的信息化的系統(tǒng)。
決策支持系統(tǒng)能夠幫助決策者準確全面地認識事件情況,將計算機的知識封裝,把分析技術(shù)與傳統(tǒng)的數(shù)據(jù)存儲和檢索方式結(jié)合起來,使非計算機專業(yè)人員能夠簡易便捷的使用該系統(tǒng)。決策支持系統(tǒng)雖然能夠為決策者提供有效及時的信息,但并不代表決策者的意愿,系統(tǒng)并不一定能夠為決策者提供最優(yōu)的解決方式,但是能夠為其提供較為良好的方案,讓決策者參考方案,得出最終的決定。
在實現(xiàn)的過程中,決策支持系統(tǒng)包含了知識庫管理系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、模型庫管理系統(tǒng)等多方面的知識,將這幾個方面結(jié)合起來,應(yīng)用到多個方面,如人口管理、產(chǎn)業(yè)動態(tài)、宏觀經(jīng)濟監(jiān)測等。
1.2 研究水平及發(fā)展趨勢
在我國,國家公布了一些舉措和方案,能夠在突發(fā)事件發(fā)生時提供指導(dǎo)性方針。自2006年成立國務(wù)院應(yīng)急辦以來,發(fā)布了一系列以《國家突發(fā)公共事件總體應(yīng)急預(yù)案》為代表的應(yīng)急預(yù)案,使得應(yīng)急進入“國家”層面,在全國建立起了規(guī)范有效的應(yīng)急框架體系,對于突發(fā)事件的處理卓有成效。但是由于缺乏信息流通的平臺和有效的信息分析,決策者有時不能全面準確地判斷形勢,使得決策還是存在瑕疵,在許多時候都無法對局勢做出最佳的處理。
在國外,許多國家的政府都有自己的應(yīng)急機構(gòu)。例如,美國的聯(lián)邦緊急事務(wù)管理署,俄羅斯的緊急情況部。以美國為例,其面對突發(fā)事件的預(yù)案已經(jīng)非常成熟。聯(lián)邦跨部門運作計劃(Federal Interagency Operational Plans)闡述了聯(lián)邦政府如何分配資源和保證其國家準備目標(National Preparedness Goal),國家準備目標是指在面對會對國家造成巨大的威脅和危害時,預(yù)防(Prevention)、保護(Protection)、減緩(Mitigation)、反應(yīng)(Response)、恢復(fù)(Recovery)的能力。其中的聯(lián)邦跨部門運作計劃的反應(yīng)篇(Response Federal Interagency Operational Plans)可以作為突發(fā)事件發(fā)生后,聯(lián)邦政府采取行動的指南。
但是從歷史上大規(guī)模突發(fā)事件的情況來看,可以發(fā)現(xiàn)國內(nèi)外的政府應(yīng)急機構(gòu)缺少可以在短時間內(nèi)整合信息和分析信息的平臺。在面對突發(fā)事件時,短時間內(nèi)決策者只能得到相對局部、片面的信息,無法做出相應(yīng)的決策。
隨著近年來互聯(lián)網(wǎng)的發(fā)展,社交網(wǎng)絡(luò)(如人人、微博、微信等)因為能夠充分滿足人們的交友需求而受到青睞。在大規(guī)模突發(fā)事件爆發(fā)后,很多目擊者更傾向于通過社交網(wǎng)絡(luò)向公眾傳遞事件現(xiàn)場及自身狀況。這對于災(zāi)害情報收集提供了新的渠道,而且該渠道收集的信息往往更及時。為此,我國已有很多政府及企業(yè)采用輿情系統(tǒng)來動態(tài)地發(fā)現(xiàn)、監(jiān)測及追蹤網(wǎng)絡(luò)輿情。這些系統(tǒng)通過采集各大新聞網(wǎng)站及社交網(wǎng)站,從海量文本信息中提取一段時間內(nèi)最熱門的人或事,以及某個具體事件在一段時間內(nèi)的變化過程,包括關(guān)注數(shù)量,正負面情緒等。
然而由于網(wǎng)絡(luò)輿情仍需要一定形成時間且現(xiàn)有輿情系統(tǒng)單純從在線資料中抽取事件信息,這些系統(tǒng)均存在時效問題。而突發(fā)事件發(fā)生后的前30分鐘是政府最需要了解情報的階段,對災(zāi)情做出正確的判斷有助于各項工作開展,然而大規(guī)模輿情形成并被探測到往往所需時間更多。因此,在大規(guī)模突發(fā)事件發(fā)生時雖然有一定有用的災(zāi)害描述被傳上網(wǎng)絡(luò),但由于輿情系統(tǒng)本身的局限卻無法及時為災(zāi)害應(yīng)對負責人提供相關(guān)信息。
2.1 系統(tǒng)目標
大規(guī)模突發(fā)事件決策支持系統(tǒng)為了能夠盡快的對當前事件作出反應(yīng),當災(zāi)害初期具體成因還不明確時,利用網(wǎng)絡(luò)輿情得到的信息,再結(jié)合報警信息及歷史事件的知識庫,對大規(guī)模突發(fā)事件進行綜合判斷,得出決策支持結(jié)果。
為了以最快速度將大規(guī)模突發(fā)事件的詳細面貌呈現(xiàn)在決策者的面前,以幫助決策者進行決策,減少因決策不當而造成的不必要的經(jīng)濟損失或人員傷亡,減少大規(guī)模突發(fā)事件對于社會安定的影響,本項目將重點研究以下問題:
(1)學(xué)習(xí)現(xiàn)有報警、災(zāi)害匯報數(shù)據(jù),得到突發(fā)事件發(fā)生時信息的特征。
(2)研究從已有警報信息中提取關(guān)鍵詞,獲取關(guān)聯(lián)詞等技術(shù),以便到網(wǎng)絡(luò)中尋找相關(guān)信息,準確收集事件警報信息。
(3)研究為各種災(zāi)害信息(包括報警以及網(wǎng)絡(luò)信息)分類,生成小結(jié),同時研究計算其可信度與支持度的技術(shù)。
(4)開發(fā)一個自動化決策支持系統(tǒng):自動從報警信息中發(fā)現(xiàn)事件并在網(wǎng)絡(luò)中豐富事件描述,最后自動形成事件描述,對于相互矛盾的描述,每類呈現(xiàn)可信度與支持度。
2.2 系統(tǒng)架構(gòu)
為了避免時效性過低、系統(tǒng)負載過大等問題,目標系統(tǒng)以報警信息(110、巡防員或應(yīng)急反應(yīng)人員等報警)為基礎(chǔ),當確認大事件發(fā)生之后再從互聯(lián)網(wǎng)查找更多描述以豐富事件具體內(nèi)容,并形成事件簡報。系統(tǒng)的基本模型,共分為準備、監(jiān)測和匯報3個循環(huán),如圖1所示:

圖1 大規(guī)模突發(fā)事件決策支持系統(tǒng)架構(gòu)圖
準備循環(huán)的目的是學(xué)習(xí)歷史警報信息形成突發(fā)事件資料庫。歷史警報既包括正例(大事件中的報警內(nèi)容),也包括反例(普通事件的報警內(nèi)容)。機器學(xué)習(xí)可分為兩種,監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)準確性較高,但伴隨著較高的人力投入以及僅能識別人為確認的信息;非監(jiān)督學(xué)習(xí)恰好相反。為了發(fā)揮這兩種學(xué)習(xí)算法的優(yōu)點,“重大事件學(xué)習(xí)模塊”同時運用兩種學(xué)習(xí)方法:利用監(jiān)督學(xué)習(xí)來準確發(fā)現(xiàn)已知事件;同時采用非監(jiān)督學(xué)習(xí)來發(fā)現(xiàn)一些隱性(之前未曾發(fā)生或未被掌握)重大事件。“重大事件資料庫”中包含各種已知及未知事件的語言特征供發(fā)現(xiàn)模塊評價當前警報。為了進一步提高準確度,準備循環(huán)可以根據(jù)人工反饋進行進一步學(xué)習(xí)。
監(jiān)測循環(huán)主要根據(jù)重大事件資料庫的語言特征對最近一段時間的報警信息進行分析以判斷警報涉及內(nèi)容是否為重大事件。如果確認為重大事件,則抽取目標事件的特征(如事件名稱、發(fā)生地點、發(fā)生時間等),并以此特征啟動重大事件匯報循環(huán)。
為保證警報系統(tǒng)核心“重大事件匯報模塊”的通用性,匯報循環(huán)既可以由事件發(fā)現(xiàn)模塊啟動,也可以由人工輸入目標事件特征來手動啟動。考慮到報警人的局部視野及情感偏差,僅從報警內(nèi)容中了解事件全貌往往不夠。因此警報系統(tǒng)從互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)及新聞媒體中豐富事件描述。為了更高效的從互聯(lián)網(wǎng)獲得信息,系統(tǒng)具有統(tǒng)一的搜索接口。當確認事件發(fā)生時,系統(tǒng)可向搜索接口提供相應(yīng)關(guān)鍵詞及篩選條件(地點、時間等),由搜索接口獲取相應(yīng)的新聞、博文及討論內(nèi)容。匯報模塊從這些文本中抽取相應(yīng)主題(不同人,不同地點對于事件嚴重情況的描述)以及這些主題的支持度和可信度。根據(jù)這些主題,匯報模塊利用摘要生成工具為事件決策者還原事件的全貌。考慮到重大事件往往是一個演進的過程,匯報循環(huán)應(yīng)可以根據(jù)決策團隊的反饋(或是新的報警內(nèi)容)來更新目標事件特征,然后重復(fù)信息搜索及主題、摘要提取過程,為決策者提供實時事件更新。
為了完成該系統(tǒng),需要搜索引擎技術(shù)、實體名識別、句法分析、語義分析、文本模型(包括文本表示、權(quán)重和相似度計算等)、文本分割、文本聚類及類排序、指代關(guān)系處理、自動摘要等技術(shù)。其中一些關(guān)鍵技術(shù)的具體研究方案如下:
3.1 實體名識別
實體名識別是查詢分析中非常重要的模塊。它包含了兩個部分:1.如何發(fā)現(xiàn)一個實體名,即如何判斷一個字符串是否代表一個實體。2.標志該實體名,即當發(fā)現(xiàn)實體名后,將該實體名分為哪一類別。實體名分為名字(姓名、地名、機構(gòu)名)、數(shù)字(日期、時間、百分比和貨幣)兩大類。目前中文實體識別的方法主要有:基于規(guī)則的方法、基于統(tǒng)計的方法、規(guī)則和統(tǒng)計相結(jié)合的方法等。
應(yīng)用于各類型的系統(tǒng)和研究中的自然語言處理的各種形式模型種類繁多,包括基于短語結(jié)構(gòu)語法的形式模型、基于合一運算的形式模型、基于依存和配價的形式模型、基于格語法的形式模型、基于詞匯主義的形式模型、語義自動處理的形式模型、系統(tǒng)功能語法、語用自動處理的形式模型、概率語法、Bayes公式與動態(tài)規(guī)劃算法、N-元語法和數(shù)據(jù)平滑、隱馬爾可夫模型(HMM)、統(tǒng)計機器翻譯的形式模型。
在本系統(tǒng)的實現(xiàn)中使用基于機器學(xué)習(xí)的實體名識別方法。通過積累,在擁有經(jīng)過詞性標注和實體名識別的中、英文語料庫的基礎(chǔ)上,進行比較充分的機器學(xué)習(xí)。在系統(tǒng)實現(xiàn)過程中使用了兩種方案:其一是用神經(jīng)網(wǎng)的方法。實體名識別的實質(zhì)可認為是一個函數(shù),它以各種特征信息為輸入?yún)?shù),輸出值為特定的實體名類型。這種判決函數(shù)很容易聯(lián)想到用神經(jīng)網(wǎng)來實現(xiàn),只要給定足夠的樣本,使神經(jīng)網(wǎng)充分地學(xué)習(xí),一旦學(xué)習(xí)過程完成后,對任意給定的輸入,即可求得相應(yīng)的輸出;其二是基于自動標注的方法,用隱馬爾可夫模型方法進行初始的標注,再利用錯誤驅(qū)動的方法加以修改。
3.2 基于知識庫的語義分析
系統(tǒng)研究了實用意義下的語義分析,通過語義分析獲得雖然是淺層的但是卻很有價值的信息。實現(xiàn)的方法是通過知識庫來進行語義標注。
根據(jù)國際ACE會議的定義,事件抽取需要找到相應(yīng)的觸發(fā)動詞,發(fā)生的時間、地點,參與的人物等信息,一般一個事件范圍不超過一個句子。大規(guī)模事件抽取方式利用語義角色標注可以很好的完成,系統(tǒng)能夠找出每個事件對應(yīng)的觸發(fā)動詞,然后標注出它的各種語義角色作為事件的參數(shù),并根據(jù)參數(shù)的特點,進一步確認是否為需要的事件。在實際應(yīng)用中,參數(shù)往往是較長的人名、地名、機構(gòu)名、時間和數(shù)字等,因此,對這些實體的識別變得異常重要,實體的識別準確率提高,語義角色標注的性能也將隨之提高。
3.3 文本模型
文本模型是大規(guī)模文本處理非常基本的因素,確定了文本模型也就基本確定了文本的內(nèi)部表示、權(quán)重和相似度計算,以及文本的排序策略。系統(tǒng)采用經(jīng)典的向量空間模型作為本項研究的文本模型,并針對本項任務(wù)進行必要的改進。
系統(tǒng)在文本表示、權(quán)重計算和相似度計算改進原有的文本模型,對互聯(lián)網(wǎng)中的大規(guī)模文本進行數(shù)據(jù)挖掘,選取特征項為詞項是常用的選擇,這樣文本是一個非常高維度的向量,使用SVD奇異值分解、LDA主題模型對文本進行降維處理。
在權(quán)重計算上,一方面根據(jù)文檔本身的結(jié)構(gòu)化信息,如標題、顯示風格等和網(wǎng)頁中的鏈接信息來修改基本的權(quán)重公式;另一方面則研究了文本長度的歸一化方法。
實時性是大規(guī)模文本處理的基本要求,這就決定了不能采用過于復(fù)雜的相似度計算方法。目前,系統(tǒng)根據(jù)向量的余弦相似度公式來計算文本之間的相似度。該計算公式未考慮特征項之間的相互作用,而只是簡單地把它們累加在一起,也就是說,不同的特征項被認為是正交的。在本系統(tǒng)中使用組合方法生成彼此更獨立的特征項,其中包括了自動聚類、線性變換和詞匯語義索引技術(shù)。
3.4 文本聚類
文本聚類是一種無監(jiān)督的機器學(xué)習(xí)算法,它將相似的文本分到一個組中,每一個組叫做一個類。類中的文本是相似的,類間的文本是不相似的。文本聚類的方法有很多種,有以K-MEANS為代表的劃分方法,BIRCH的層次方法,以及一些概率模型的方法。
在系統(tǒng)中多次用到了聚類的方法,例如,對歷史的報警信息進行聚類,對互聯(lián)網(wǎng)上的海量文本進行聚類等等。為了對不同的信息進行聚類,系統(tǒng)對現(xiàn)有的方法進行了改進,如對微博使用短文本聚類。面對大數(shù)據(jù)量、高維特征等問題,通過犧牲精確度的概率方法以及降維方法來完成分析。
大規(guī)模突發(fā)事件決策支持系統(tǒng)的研究與實現(xiàn),能夠應(yīng)用在政府應(yīng)急機構(gòu)中,為政府處理大規(guī)模的突發(fā)事件提供強有力的支持,達到及時了解事件情況,通過對歷史突發(fā)事件的學(xué)習(xí)和參考,對當前的局勢做出準確的判斷。雖然系統(tǒng)目前仍然存在著一些不足,如在實現(xiàn)過程中警報數(shù)據(jù)的來源目前是一些非準確數(shù)據(jù)等,但是大規(guī)模突發(fā)事件決策支持系統(tǒng)仍然具有重要的現(xiàn)實意義,值得深入的探索。
參考文獻
[1] 曾思軼.我們有備而來——細數(shù)我國災(zāi)害應(yīng)急機制的形成過程[J].百姓, 2008 (6):6-10.
[2] 曾平輝,王海軍.公共危機下政府應(yīng)急機制的缺失及對策探析[J].惠州學(xué)院學(xué)報,2007,27(5):40-44.
[3] Federal Emergency Management Agency [EB/OL]. (2014-12-11).https://www.fema.gov/
[4] EMERCOM of Russia [EB/OL]. (2014-12-11). http://en.mchs.ru/
[5] Security Homeland. Response Federal Interagency Operational Plan [G/OL]. 2014,8.
[6] 馮志偉.自然語言處理的形式模型[M].中國科學(xué)技術(shù)大學(xué)出版社,2010,3,4
Research and Implementation of Large-scale Emergencies Decision Support System
Zhao Qiong, He Jian, Wu Xiaowei, Xing Xiaolu
(Software School, Public Performance and Information Research Center, Fuan University, Shanghai 201203, China)
Abstract:In response to various anomalous events, the governments already have perfect emergency mechanisms such as security scouts, 110. They also have all kinds of contingency plans. However, for large-scale emergencies, it is difficult to know the real situation of them for policymakers due to the complexity and suddenness. So the process of choosing a suitable contingency plan is very complicated. Large-scale Emergencies Decision Support System has the function of monitoring and analysis on large-scale emergencies through machine learning and public opinion monitoring. Once the emergencies happen, the system can do real-time analysis through the relevant information. Thus all kinds of opinions can be extracted and credibility can be calculated. The system can provide immediate, objective and global information for the government to make policy accordingly.
Key words:Large-scale Emergencies; Decision Support System; Government Emergency Institution
收稿日期:(2015.04.21)
作者簡介:趙 瓊(1991-),女,復(fù)旦大學(xué),軟件學(xué)院,復(fù)旦大學(xué)公共績效與信息化研究中心,碩士研究生,研究方向:電子商務(wù)與電子政務(wù),上海,201203 何 健(1989-),女,復(fù)旦大學(xué),軟件學(xué)院,復(fù)旦大學(xué)公共績效與信息化研究中心,碩士研究生,研究方向:電子商務(wù)與電子政務(wù),上海,201203武曉偉(1992 -),男,復(fù)旦大學(xué),軟件學(xué)院,復(fù)旦大學(xué)公共績效與信息化研究中心,碩士研究生,研究方向:電子商務(wù)與電子政務(wù),上海,201203邢小璐(1991 -),男,復(fù)旦大學(xué),軟件學(xué)院,復(fù)旦大學(xué)公共績效與信息化研究中心,碩士研究生,研究方向:電子商務(wù)與電子政務(wù),上海,201203
文章編號:1007-757X(2016)01-0051-03
中圖分類號:TP311
文獻標志碼:A