








[摘 要]在智慧城市的建設過程中,大量運行數據伴隨著城市管理事部件的處置產生并積累。為分析此類數據,本文利用聚類分析技術,以溫嶺市太平街道為例,對數據進行挖掘分析,產生輔助管理者決策的有用信息,探究應用于智慧城市建設的新知識,提升浙江省智慧城市建設的水平和效能。
[關鍵詞]聚類分析;智慧城市;城市管理
doi:10.3969/j.issn.1673 - 0194.2016.22.085
[中圖分類號]F275;F224 [文獻標識碼]A [文章編號]1673-0194(2016)22-0-02
伴隨著城市化迅猛的發展,城市管理中事件與部件量呈現指數型增長的態勢。城市管理各部門固有的單一直線的管理模式面臨挑戰,部門間信息流通不暢、協同性差的狀況已不能滿足現代化城市管理的要求。為解決這一難題,近年來,政府通過大推動智慧城市建設,將信息化技術應用于城市管理,采用將城市分區網格化管理,利用數字化傳輸技術,產生城市管理多方聯動效應,提升城市的管理水準和效率,力求實現長效科學管理城市。
1 智慧城市現狀
智慧城市是在發達的互聯網、物聯網基礎上建立的,構建應用云計算技術的城市管理平臺是必需配置。智慧城市的根本目的是應用信息技術,實現城市范圍內多部門多行業多群體的數據融合,其智慧性就體現在對城市管理運營數據的創新應用,即對數據的分析應用度決定了智慧城市的成熟度。從大量數據中可以發現知識、提升智能、創造價值,依托數據分析,為政府管理決策提供強大的支持,提高城市居民的生活品質,提升企業的核心競爭力,即城市管理可以從經驗治理轉向科學治理。
目前,浙江省大部分城市已建立智慧城市(數字化城市管理)信息平臺,多部門實現信息數據共享、協同管理合作,實現以信息化手段對城市管理中公用設施、市容環境和環境秩序等的監管。在智慧城市建設過程中,信息系統經歷數據采集、數據錄入、數據審核與數據庫更新,積累了大量紛雜而珍貴的信息數據。這些數據是平臺運行的靈魂和價值所在,從海量的原始數據中分析挖掘實用、全面的信息,并通過數學知識建立模型,綜合運用數據分析及挖掘技術,提煉能幫助進行復雜決策的價值信息,促進城市管理應用的知識發現,提升浙江省智慧城市建設的水平和效能。
2 聚類分析概述
聚類分析方法作為一種定量研究法,常用于探究龐大數據信息中所隱含的分類規則,以純數據的視角,給出具有經驗和更準確、細致的專業判斷,也能夠結合其他多種數據挖掘技術,找出更深層次的隱含信息,大大提高數據挖掘的效率與效應。聚類分析主要是對多個樣本或多個指標進行定量分類的一種多元統計分析方法。其中對樣本進行分類并命名為Q型聚類分析,另一種R型聚類分析則是對指標進行分類。聚類分析通過將數據分組成為多個簇,相似的數據對象構成同一聚類簇,不同簇中的數據相異程度較大。因此,最重要的聚類標準即為數據對象屬性同簇相似、簇間相異。
首先需要將原始數據及數據標準化,一般給定具有m個指標的變量,進行n次觀察,可以將某個樣本的觀測值看出Rm空間中的一個點,因此這n個樣本就構成了Rm空間中的n個點,聚類的關鍵在于定義Rm空間中兩個點xi=(xi1,xi2,…,xim)和xj=(xj1,xj2,…,xjm)的距離,Q型聚類分析常常采用 Minkowski距離或Euclidean距離,用于度量樣本間的距離,其定義為:
Minkowski距離(p階):
Euclidean距離(歐式距離),即當Minkowski距離p=2時情形:
當空間中各指標存在相關性時,采用斜交空間距離或相似系數來度量兩個樣本直接的親疏程度。主要用于指標變量的分類,即R型聚類采用。其相似系數主要為夾角余弦,其定義為:
夾角余弦:
在聚類分析的某個中間過程,當一個類別有兩個及以上樣本時,需要和另外的類聚成新的類,這就需要解決類與類之間的距離定義。這和前面的距離不一樣,前面是空間中兩個點的距離,而這里是兩個類別之間的距離,類中的元素大于等于兩個。
設兩個類Gp和Gq中分別有S和t個樣本,它們的重心是對應指標的平均值,分別記為和,兩個類之間的距離用D(p,q)表示。常采用類間距離為組間平均法,即定義:
本文主要采取系統聚類和K-均值聚類進行數據分析。系統聚類主要將空間數據實體組成一棵聚類樹,通過反復聚合或分裂獲取滿足條件的空間聚類結果。明確距離的定義選取歐式距離;確定類間的距離使用組間平均法。讓每個樣本自成一類,即n個樣本共建立n個類。進而得n×n維的距離矩陣。通過矩陣合并最近距離的兩個樣本歸納一個新類,重新計算類別間的距離,得到新的距離矩陣,再重復直到所有類歸為一類為止。K-均值聚類是最簡潔和高效率的非系統聚類方法,先預設最終的分類數N0,隨機生成N0個初始聚類中心點,通過設置最大迭代步驟和收斂誤差標準,計算每個樣本到聚類中心點的距離,以距離最小原則將全部樣本劃入N0個類中,此時聚類中心變成新的群中心,重復迭代直至聚類中心不再變化,或達到預設的最大迭代步驟和收斂誤差標準時,終止計算。最終得到每個樣本所屬的類別和相應類別的聚類中心。
3 溫嶺市太平街道事部件數據分析
溫嶺市是浙江省為數不多的縣級智慧城市建設試點市。太平街道為溫嶺市政治、經濟和文化中心,下轄東輝社區、繁昌社區等14個社區,總面積為34.7平方千米,常住人口為9.6萬人。
城市管理案件數據是溫嶺市太平街道城管監督員巡查時上報的案件,現分析2014年全年數據,可以發現案件種類繁多,案件大類12種,屬于事件類型的大類有6種,屬于部件類型的有6種;每一大類又可分為種種小類,為簡化指標,統計時按如下指標。
利用SPSS軟件進行簡易操作,其描述性統計見表2。
將數據標準化處理后進行系統聚類,得其平均連結(組間)和樹狀圖分別見表3和圖1。
進而采用K-均值聚類分析方法,得到分析結果,見表4、表5。
從聚類分析的結果可得,太平街道各社區城市管理現狀存在較大的差異,事部案件發生數分布很不均勻。如果根據各社區城市管理狀況把14個社區分為3類。第一類:東輝社區、繁昌社區、月河社區等10個社區。第二類:錦屏社區1個社區。第三類:方城社區、尚書房社區、西園社區等3個社區。
從以上結果結合聚類圖中的合并距離可以看出第三類方城社區、尚書房社區、西園社區等3個社區城市管理總體情況優異,發生的案件數總體偏少;第二類錦屏社區發生的案例數偏多,應加派管理人員,重點監督;第一類東輝社區、繁昌社區、月河社區等10個社區情況總體相仿,應采取同一管理模式應對。
4 結 語
基于聚類分析的方法對智慧城市數據進行分析,實現從地理空間的角度,探究城市管理事部件產生的特征及規律,為城市管理中案件發生作出預警,為管理者提供決策依據,從而提升城市整體管理水平,促進智慧城市的健康發展和科學管理。
主要參考文獻
[1]王靜遠,李超,熊璋,等.以數據為中心的智慧城市研究綜述[J].計算機研究與發展,2014(2).
[2]司守奎,孫璽菁.數學建模算法與應用[M].北京:國防工業出版社,2013.
[3]魏海洋.城市案件空間聚類技術研究[D].北京:北京建筑大學,2015.