居亞凱++邵一駿
摘 要:智慧城市是未來城市的發展方向,建設過程中需整合、挖掘和利用各類數據,通過計算機技術中的數據挖掘技術,對城市的經濟社會發展統計數據進行智能化處理,為政府的智慧城市建設提供決策參考。
關鍵詞:智慧城市;數據;智能化
IBM提出“智慧的地球”概念,指出地球上幾乎任何東西都可以實現數字化和互聯,進而向整個社會提供更加智能化的服務。隨后在“智慧的地球”概念基礎上,IBM正式提出“智慧城市”愿景,其具備四大特征:全面透徹的感知、寬帶泛在的互聯、智能融合的應用以及以人為本的可持續創新。
智慧城市是未來的城市的發展方向,當我們把智慧城市比喻成一個巨人時,為這個巨人全身提供氧氣、輸送營養的血脈是大量的數據及整合、處理這些數據的智能化數據庫。因此,如何構建這套智能化數據庫,是智慧城市建設的重中之重。
一、數據背后的故事
“房屋租賃價格指數超過100,與人口流動指數超過100是否有關聯?”“固定資產投資連續3年增長,是否與人口增長、財政收入增長和出口額下降有關聯?”……經濟社會發展統計數據背后隱含著豐富的、對決策咨詢有重要意義的規律。
一方面,經濟社會發展統計數據庫能為各級黨委和政府管理、決策提供基礎數據支持,為各部門實現信息資源共享提供切實保障,如今各省、市、區級統計局基本建成了統計信息系統,基于不同的應用和數據庫平臺,基本實現了統計數據的網上直報、查詢和下載等功能;另一方面,現有的統計系統中,錄入、查詢和統計作為普遍的功能,而對于存在著若干的規則與聯系的大量數據缺乏利用,實質上這些規律背后蘊含著關鍵的發展趨勢,為決策提供重要參考。
因此,將數據“智能化”從而適用于智慧城市應用體系,是有現實和長遠意義的。
二、智能化的手段
要實現數據智能化,必須運用計算機領域的相關技術,依托數據庫方面的決策支持技術,通過數據采集、模型構建、數據分析和方案設計等人機交互程序,為決策支持提供支撐[1]。
以某市智慧城市建設的數據庫為例,分析智能化數據庫的需求,在系統用例圖和基于J2EE平臺的系統架構設計基礎上,對系統的功能、數據倉庫和相關接口進行設計,并對內嵌的查詢算法——FP-Growth算法進行編制,為開發“經濟社會發展統計智能化數據庫”提供設計框架。
該系統不僅實現登錄、查詢、錄入等功能,最重要的是利用數據挖掘技術,從各類數據中挖掘出具有決策參考價值的數據集,比如“人口增長、財政增收”、“房地產投資減速、出口額增長”等有關聯的數據集,為智慧城市建設提供參考。
三、智能化的設計思路
據了解,現有的經濟社會發展統計數據庫在分析數據、輔助決策等功能上尚存在缺憾,而在引進智能化數據庫的相關技術后,對原有查詢、錄入的數據進行抽取、過濾和裝載,形成數據倉庫,利用相關數據挖掘技術,生成有參考作用的一系列數據項,形成一套智能化數據庫系統。
圖1 數據智能化的流程圖
四、智能化的應用
在了解了設計思路和核心算法之后,如何實現數據智能化是關鍵,在下圖(圖1)中演示了實現關聯規則挖掘的流程,也就是實現數據智能化的流程。
從流程圖里可以對FP-Growth算法挖掘模塊的使用過程進行了解,此模塊的相關設計有以下幾個考慮:1、有專供用戶登錄的數據挖掘主界面;2、有分別用以填寫最小支持度和設置目標范圍的統計數據下限值的輸入框;3、有一段程序代碼,用以按設置的下限值調用數據庫中已有數據;4、有一段FP-Growth算法的程序代碼;5、有一個頁面,用以顯示關聯規則挖掘結果。
在關聯規則挖掘模塊中,有兩個關鍵流程:設置最小支持度、設置經濟社會統計數據下限。其中設置數據下限是關鍵步驟,是對符合條件的頻繁項進行進一步刪選,刪除下限以下的頻繁項數據類,剩下的數據類用以構建FP-Tree的項,最終挖掘出的頻繁項集是具有決策參考意義的:在某數據值(如市級財政收入800億元、區縣級人均收入18000元和區縣級新增企業數300家)以上的數據是有關聯性的,可以同時選擇。
五、結束語
數據智能化是一個逐步完善、長期堅持的過程,期間要經歷數據共享規整、用戶需求完善、系統效率提升等必要步驟。同時一旦智能化數據庫設計、開發成功,隨即而來的是統計數據的歸口統一,這要求事先要理順機制體制,將分散在全市各部門的數據進行規范統一上報。
[參考文獻]
[1]史忠植 知識發現 北京:清華大學出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等譯 數據挖掘概念與技術(Data Mining Concepts and Techniques) 北京:機械工業出版社 2004 29-36.
本文得到寧波大學科研基金的資助,特此致謝!
摘 要:智慧城市是未來城市的發展方向,建設過程中需整合、挖掘和利用各類數據,通過計算機技術中的數據挖掘技術,對城市的經濟社會發展統計數據進行智能化處理,為政府的智慧城市建設提供決策參考。
關鍵詞:智慧城市;數據;智能化
IBM提出“智慧的地球”概念,指出地球上幾乎任何東西都可以實現數字化和互聯,進而向整個社會提供更加智能化的服務。隨后在“智慧的地球”概念基礎上,IBM正式提出“智慧城市”愿景,其具備四大特征:全面透徹的感知、寬帶泛在的互聯、智能融合的應用以及以人為本的可持續創新。
智慧城市是未來的城市的發展方向,當我們把智慧城市比喻成一個巨人時,為這個巨人全身提供氧氣、輸送營養的血脈是大量的數據及整合、處理這些數據的智能化數據庫。因此,如何構建這套智能化數據庫,是智慧城市建設的重中之重。
一、數據背后的故事
“房屋租賃價格指數超過100,與人口流動指數超過100是否有關聯?”“固定資產投資連續3年增長,是否與人口增長、財政收入增長和出口額下降有關聯?”……經濟社會發展統計數據背后隱含著豐富的、對決策咨詢有重要意義的規律。
一方面,經濟社會發展統計數據庫能為各級黨委和政府管理、決策提供基礎數據支持,為各部門實現信息資源共享提供切實保障,如今各省、市、區級統計局基本建成了統計信息系統,基于不同的應用和數據庫平臺,基本實現了統計數據的網上直報、查詢和下載等功能;另一方面,現有的統計系統中,錄入、查詢和統計作為普遍的功能,而對于存在著若干的規則與聯系的大量數據缺乏利用,實質上這些規律背后蘊含著關鍵的發展趨勢,為決策提供重要參考。
因此,將數據“智能化”從而適用于智慧城市應用體系,是有現實和長遠意義的。
二、智能化的手段
要實現數據智能化,必須運用計算機領域的相關技術,依托數據庫方面的決策支持技術,通過數據采集、模型構建、數據分析和方案設計等人機交互程序,為決策支持提供支撐[1]。
以某市智慧城市建設的數據庫為例,分析智能化數據庫的需求,在系統用例圖和基于J2EE平臺的系統架構設計基礎上,對系統的功能、數據倉庫和相關接口進行設計,并對內嵌的查詢算法——FP-Growth算法進行編制,為開發“經濟社會發展統計智能化數據庫”提供設計框架。
該系統不僅實現登錄、查詢、錄入等功能,最重要的是利用數據挖掘技術,從各類數據中挖掘出具有決策參考價值的數據集,比如“人口增長、財政增收”、“房地產投資減速、出口額增長”等有關聯的數據集,為智慧城市建設提供參考。
三、智能化的設計思路
據了解,現有的經濟社會發展統計數據庫在分析數據、輔助決策等功能上尚存在缺憾,而在引進智能化數據庫的相關技術后,對原有查詢、錄入的數據進行抽取、過濾和裝載,形成數據倉庫,利用相關數據挖掘技術,生成有參考作用的一系列數據項,形成一套智能化數據庫系統。
圖1 數據智能化的流程圖
四、智能化的應用
在了解了設計思路和核心算法之后,如何實現數據智能化是關鍵,在下圖(圖1)中演示了實現關聯規則挖掘的流程,也就是實現數據智能化的流程。
從流程圖里可以對FP-Growth算法挖掘模塊的使用過程進行了解,此模塊的相關設計有以下幾個考慮:1、有專供用戶登錄的數據挖掘主界面;2、有分別用以填寫最小支持度和設置目標范圍的統計數據下限值的輸入框;3、有一段程序代碼,用以按設置的下限值調用數據庫中已有數據;4、有一段FP-Growth算法的程序代碼;5、有一個頁面,用以顯示關聯規則挖掘結果。
在關聯規則挖掘模塊中,有兩個關鍵流程:設置最小支持度、設置經濟社會統計數據下限。其中設置數據下限是關鍵步驟,是對符合條件的頻繁項進行進一步刪選,刪除下限以下的頻繁項數據類,剩下的數據類用以構建FP-Tree的項,最終挖掘出的頻繁項集是具有決策參考意義的:在某數據值(如市級財政收入800億元、區縣級人均收入18000元和區縣級新增企業數300家)以上的數據是有關聯性的,可以同時選擇。
五、結束語
數據智能化是一個逐步完善、長期堅持的過程,期間要經歷數據共享規整、用戶需求完善、系統效率提升等必要步驟。同時一旦智能化數據庫設計、開發成功,隨即而來的是統計數據的歸口統一,這要求事先要理順機制體制,將分散在全市各部門的數據進行規范統一上報。
[參考文獻]
[1]史忠植 知識發現 北京:清華大學出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等譯 數據挖掘概念與技術(Data Mining Concepts and Techniques) 北京:機械工業出版社 2004 29-36.
本文得到寧波大學科研基金的資助,特此致謝!
摘 要:智慧城市是未來城市的發展方向,建設過程中需整合、挖掘和利用各類數據,通過計算機技術中的數據挖掘技術,對城市的經濟社會發展統計數據進行智能化處理,為政府的智慧城市建設提供決策參考。
關鍵詞:智慧城市;數據;智能化
IBM提出“智慧的地球”概念,指出地球上幾乎任何東西都可以實現數字化和互聯,進而向整個社會提供更加智能化的服務。隨后在“智慧的地球”概念基礎上,IBM正式提出“智慧城市”愿景,其具備四大特征:全面透徹的感知、寬帶泛在的互聯、智能融合的應用以及以人為本的可持續創新。
智慧城市是未來的城市的發展方向,當我們把智慧城市比喻成一個巨人時,為這個巨人全身提供氧氣、輸送營養的血脈是大量的數據及整合、處理這些數據的智能化數據庫。因此,如何構建這套智能化數據庫,是智慧城市建設的重中之重。
一、數據背后的故事
“房屋租賃價格指數超過100,與人口流動指數超過100是否有關聯?”“固定資產投資連續3年增長,是否與人口增長、財政收入增長和出口額下降有關聯?”……經濟社會發展統計數據背后隱含著豐富的、對決策咨詢有重要意義的規律。
一方面,經濟社會發展統計數據庫能為各級黨委和政府管理、決策提供基礎數據支持,為各部門實現信息資源共享提供切實保障,如今各省、市、區級統計局基本建成了統計信息系統,基于不同的應用和數據庫平臺,基本實現了統計數據的網上直報、查詢和下載等功能;另一方面,現有的統計系統中,錄入、查詢和統計作為普遍的功能,而對于存在著若干的規則與聯系的大量數據缺乏利用,實質上這些規律背后蘊含著關鍵的發展趨勢,為決策提供重要參考。
因此,將數據“智能化”從而適用于智慧城市應用體系,是有現實和長遠意義的。
二、智能化的手段
要實現數據智能化,必須運用計算機領域的相關技術,依托數據庫方面的決策支持技術,通過數據采集、模型構建、數據分析和方案設計等人機交互程序,為決策支持提供支撐[1]。
以某市智慧城市建設的數據庫為例,分析智能化數據庫的需求,在系統用例圖和基于J2EE平臺的系統架構設計基礎上,對系統的功能、數據倉庫和相關接口進行設計,并對內嵌的查詢算法——FP-Growth算法進行編制,為開發“經濟社會發展統計智能化數據庫”提供設計框架。
該系統不僅實現登錄、查詢、錄入等功能,最重要的是利用數據挖掘技術,從各類數據中挖掘出具有決策參考價值的數據集,比如“人口增長、財政增收”、“房地產投資減速、出口額增長”等有關聯的數據集,為智慧城市建設提供參考。
三、智能化的設計思路
據了解,現有的經濟社會發展統計數據庫在分析數據、輔助決策等功能上尚存在缺憾,而在引進智能化數據庫的相關技術后,對原有查詢、錄入的數據進行抽取、過濾和裝載,形成數據倉庫,利用相關數據挖掘技術,生成有參考作用的一系列數據項,形成一套智能化數據庫系統。
圖1 數據智能化的流程圖
四、智能化的應用
在了解了設計思路和核心算法之后,如何實現數據智能化是關鍵,在下圖(圖1)中演示了實現關聯規則挖掘的流程,也就是實現數據智能化的流程。
從流程圖里可以對FP-Growth算法挖掘模塊的使用過程進行了解,此模塊的相關設計有以下幾個考慮:1、有專供用戶登錄的數據挖掘主界面;2、有分別用以填寫最小支持度和設置目標范圍的統計數據下限值的輸入框;3、有一段程序代碼,用以按設置的下限值調用數據庫中已有數據;4、有一段FP-Growth算法的程序代碼;5、有一個頁面,用以顯示關聯規則挖掘結果。
在關聯規則挖掘模塊中,有兩個關鍵流程:設置最小支持度、設置經濟社會統計數據下限。其中設置數據下限是關鍵步驟,是對符合條件的頻繁項進行進一步刪選,刪除下限以下的頻繁項數據類,剩下的數據類用以構建FP-Tree的項,最終挖掘出的頻繁項集是具有決策參考意義的:在某數據值(如市級財政收入800億元、區縣級人均收入18000元和區縣級新增企業數300家)以上的數據是有關聯性的,可以同時選擇。
五、結束語
數據智能化是一個逐步完善、長期堅持的過程,期間要經歷數據共享規整、用戶需求完善、系統效率提升等必要步驟。同時一旦智能化數據庫設計、開發成功,隨即而來的是統計數據的歸口統一,這要求事先要理順機制體制,將分散在全市各部門的數據進行規范統一上報。
[參考文獻]
[1]史忠植 知識發現 北京:清華大學出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等譯 數據挖掘概念與技術(Data Mining Concepts and Techniques) 北京:機械工業出版社 2004 29-36.
本文得到寧波大學科研基金的資助,特此致謝!