錢昭勇 陳梅
摘 要
處理突發事件需要多個部門相互合作,現階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數據方面。本文針對城市突發事件應急系統中的數據挖掘技術進行研究。
【關鍵詞】數據挖掘 應急系統 突發事件
1 背景及相關技術介紹
現階段,地理信息技術得到了廣泛應用,由此使得各個行業存儲了海量的數據,以上數據對指導和推動行業的發展起到了重要作用。下面通過相關技術介紹,為研究數據挖掘技術在突發事件應急系統中的應用奠定理論基礎。
1.1 突發事件可視化表達
地理信息系統(GIS)立足于地理空間數據庫的基礎上,基于計算機軟、硬件技術,對數據實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統。在實際生活中,GIS被廣泛運用到突發事件應用系統可視化表達中。
1.2 數據挖掘技術
數據挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區域進行區分,由此來辨別全局的分析模式和數據屬性間的關聯。聚類分析也即從給定的數據集中搜索數據對象之間的有價值聯系。在數據分析中,通過聚類分析,將數據被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數據挖掘的其它技術將被運用到聚類分析的結果上。一般來講,利用聚類算法,挖掘突發事件中的海量數據,發現突發事件高發或頻發區域,同時,對某些事件的相關信息進行分析。
1.3 突發事件應急系統數據的模型設計
通常來說,城市突發事件空間信息模型包括以下概念。第一,地理位置。突發事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經度以及維度。第三,地域。它主要描述一個具體的地理空間內容。第四,中心地區。城市突發事件空間信息中地域的中心區域。第五,區域范圍。描述城市突發事件影響的空間的范圍。第六,行政區劃。描述事件發生地所屬的行政區劃。
2 突發事件應急系統數據挖掘算法設計
突發事件應急系統的數據庫存儲海量歷史數據記錄,通常來說,每條記錄屬性超過數十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數據記錄規范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統精確地理坐標的轉換,同時,要實現其他屬性數據在格式、內容上的變換,對轉換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現突發事件應急系統數據庫地理信息自動精確轉換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發事件關聯的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數據返回最準確的匹配結果。首先它在街道級別的地址范圍內進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內進行搜尋,直到找到匹配結果為止。最后,完成匹配的地址數據建立空間坐標,從而能夠在地圖上表示出此地址數據所代表的空間位置。
2.2 GeoCoding應用
對城市突發事件空間信息進行編碼的時候,由于許多空間數據記錄是非標準的,結果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數據庫中保存的地址數據的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數據屬于街道地址級別抑或是城鎮級別,或者是區域級別。
(2)精確度問題?;跀祿熘械刂窋祿磉_的地理準確度。假設試圖定位到電纜、犯罪現場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發事件空間數據分析平臺的實現
3.1 數據層
在數據層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現算法和基礎功能,為上層應用提供支撐,城市突發事件空間分析平臺設計以開源的數據挖掘包WEKA作為基礎,可提高設計、實現效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現與業務相關的功能模塊,為應急系統提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統研究與開發[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數據挖掘技術預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協雄,雷汝煥,曹長修.現代數據挖掘技術研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術學院 貴州省貴陽市 550025endprint
摘 要
處理突發事件需要多個部門相互合作,現階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數據方面。本文針對城市突發事件應急系統中的數據挖掘技術進行研究。
【關鍵詞】數據挖掘 應急系統 突發事件
1 背景及相關技術介紹
現階段,地理信息技術得到了廣泛應用,由此使得各個行業存儲了海量的數據,以上數據對指導和推動行業的發展起到了重要作用。下面通過相關技術介紹,為研究數據挖掘技術在突發事件應急系統中的應用奠定理論基礎。
1.1 突發事件可視化表達
地理信息系統(GIS)立足于地理空間數據庫的基礎上,基于計算機軟、硬件技術,對數據實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統。在實際生活中,GIS被廣泛運用到突發事件應用系統可視化表達中。
1.2 數據挖掘技術
數據挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區域進行區分,由此來辨別全局的分析模式和數據屬性間的關聯。聚類分析也即從給定的數據集中搜索數據對象之間的有價值聯系。在數據分析中,通過聚類分析,將數據被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數據挖掘的其它技術將被運用到聚類分析的結果上。一般來講,利用聚類算法,挖掘突發事件中的海量數據,發現突發事件高發或頻發區域,同時,對某些事件的相關信息進行分析。
1.3 突發事件應急系統數據的模型設計
通常來說,城市突發事件空間信息模型包括以下概念。第一,地理位置。突發事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經度以及維度。第三,地域。它主要描述一個具體的地理空間內容。第四,中心地區。城市突發事件空間信息中地域的中心區域。第五,區域范圍。描述城市突發事件影響的空間的范圍。第六,行政區劃。描述事件發生地所屬的行政區劃。
2 突發事件應急系統數據挖掘算法設計
突發事件應急系統的數據庫存儲海量歷史數據記錄,通常來說,每條記錄屬性超過數十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數據記錄規范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統精確地理坐標的轉換,同時,要實現其他屬性數據在格式、內容上的變換,對轉換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現突發事件應急系統數據庫地理信息自動精確轉換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發事件關聯的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數據返回最準確的匹配結果。首先它在街道級別的地址范圍內進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內進行搜尋,直到找到匹配結果為止。最后,完成匹配的地址數據建立空間坐標,從而能夠在地圖上表示出此地址數據所代表的空間位置。
2.2 GeoCoding應用
對城市突發事件空間信息進行編碼的時候,由于許多空間數據記錄是非標準的,結果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數據庫中保存的地址數據的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數據屬于街道地址級別抑或是城鎮級別,或者是區域級別。
(2)精確度問題。基于數據庫中地址數據所表達的地理準確度。假設試圖定位到電纜、犯罪現場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發事件空間數據分析平臺的實現
3.1 數據層
在數據層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現算法和基礎功能,為上層應用提供支撐,城市突發事件空間分析平臺設計以開源的數據挖掘包WEKA作為基礎,可提高設計、實現效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現與業務相關的功能模塊,為應急系統提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統研究與開發[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數據挖掘技術預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協雄,雷汝煥,曹長修.現代數據挖掘技術研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術學院 貴州省貴陽市 550025endprint
摘 要
處理突發事件需要多個部門相互合作,現階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數據方面。本文針對城市突發事件應急系統中的數據挖掘技術進行研究。
【關鍵詞】數據挖掘 應急系統 突發事件
1 背景及相關技術介紹
現階段,地理信息技術得到了廣泛應用,由此使得各個行業存儲了海量的數據,以上數據對指導和推動行業的發展起到了重要作用。下面通過相關技術介紹,為研究數據挖掘技術在突發事件應急系統中的應用奠定理論基礎。
1.1 突發事件可視化表達
地理信息系統(GIS)立足于地理空間數據庫的基礎上,基于計算機軟、硬件技術,對數據實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統。在實際生活中,GIS被廣泛運用到突發事件應用系統可視化表達中。
1.2 數據挖掘技術
數據挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區域進行區分,由此來辨別全局的分析模式和數據屬性間的關聯。聚類分析也即從給定的數據集中搜索數據對象之間的有價值聯系。在數據分析中,通過聚類分析,將數據被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數據挖掘的其它技術將被運用到聚類分析的結果上。一般來講,利用聚類算法,挖掘突發事件中的海量數據,發現突發事件高發或頻發區域,同時,對某些事件的相關信息進行分析。
1.3 突發事件應急系統數據的模型設計
通常來說,城市突發事件空間信息模型包括以下概念。第一,地理位置。突發事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經度以及維度。第三,地域。它主要描述一個具體的地理空間內容。第四,中心地區。城市突發事件空間信息中地域的中心區域。第五,區域范圍。描述城市突發事件影響的空間的范圍。第六,行政區劃。描述事件發生地所屬的行政區劃。
2 突發事件應急系統數據挖掘算法設計
突發事件應急系統的數據庫存儲海量歷史數據記錄,通常來說,每條記錄屬性超過數十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數據記錄規范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統精確地理坐標的轉換,同時,要實現其他屬性數據在格式、內容上的變換,對轉換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現突發事件應急系統數據庫地理信息自動精確轉換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發事件關聯的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數據返回最準確的匹配結果。首先它在街道級別的地址范圍內進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內進行搜尋,直到找到匹配結果為止。最后,完成匹配的地址數據建立空間坐標,從而能夠在地圖上表示出此地址數據所代表的空間位置。
2.2 GeoCoding應用
對城市突發事件空間信息進行編碼的時候,由于許多空間數據記錄是非標準的,結果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數據庫中保存的地址數據的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數據屬于街道地址級別抑或是城鎮級別,或者是區域級別。
(2)精確度問題?;跀祿熘械刂窋祿磉_的地理準確度。假設試圖定位到電纜、犯罪現場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發事件空間數據分析平臺的實現
3.1 數據層
在數據層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現算法和基礎功能,為上層應用提供支撐,城市突發事件空間分析平臺設計以開源的數據挖掘包WEKA作為基礎,可提高設計、實現效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現與業務相關的功能模塊,為應急系統提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統研究與開發[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數據挖掘技術預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協雄,雷汝煥,曹長修.現代數據挖掘技術研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術學院 貴州省貴陽市 550025endprint