王建虎 吳昊
摘 要:本文基于筆者多年從事數字城市理論的相關研究,以數字城市中涉及的關鍵技術為研究對象,論文探討了元數據與海量數據處理、數據倉庫與數據挖掘、數據融合與虛擬現實、互操作與超鏈接等現代信息技術四項關鍵技術,全文是筆者長期研究基礎上的理論心得,相信對從事相關工作的同行能有所裨益。
關鍵詞:數字城市關鍵技術元數據數據融合
中圖分類號:P2 文獻標識碼:A 文章編號:1672-3791(2012)06(b)-0010-02
從廣義上講,“數字城市”是指信息化的城市,它與城市國民經濟和社會信息化的概念是一致的。所謂“數字城市”或城市的信息化是指在城市的生產、生活等活動中,利用數字技術、信息技術和網絡技術,將城市的人口、資源、環境、經濟、社會等要素數字化、網絡化、智能化和可視化的全部過程。“數字城市”或城市信息化的本質是要將數字技術、信息技術和網絡技術滲透到城市生產、生活的各個方面,通過運用這些技術手段,把城市的各類信息資源整合起來,再根據對這些信息處理、分析和預測的結果來管理城市,以促進城市的人流、物流、資金流和信息流的通暢和高效運轉。
1元數據與海量數據處理
建立元數據的主要任務是制定元數據標準、開發元數據的操作工具和建設元數據庫。制定元數據標準其內容應包括以下部分:主題內容與適用范圍、參考標準、術語、元數據層次結構、元數據分級、元數據內容和元數據擴展原則與方法。開發元數據的操作工具是編寫一系列軟件,這些軟件須具備元數據的輸入、編輯、查詢、檢索和顯示等功能。建設元數據庫要依據元數據標準來收集、整理元數據,并利用元數據的操作工具將數據錄入建庫。元數據對數據的生產者、管理者和使用者都十分有用,它是溝通上述三者之間的橋梁,在實現“數字城市”的信息共享中占有重要地位。
“數字城市”涉及的數據巨大而浩瀚,它不僅有空間數據,而且有非空間數據,這些數據來源廣泛、種類繁多、形式各異、結構復雜并且數量十分龐大,其數據量至少要以Tb級來計算,因此,人們把如此大量的數據比喻作海量數據。海量數據處理技術是對海量數據進行快速、高效地存取、運算和傳輸的技術,它是實現“數字城市”的重要基礎,也是支撐“數字城市”的關鍵技術之一。近年來該項技術的研究與開發已取得了較大的進展。目前,直接針對海量數據處理的技術解決方案有兩種:一種是硬件的解決方案,它是采用高性能的并行計算機,通過多個CPU的并行計算來提高數據處理的速度。另一種是軟件的解決方案,它是采用基于小波變換的算法,通過對數據的高效壓縮與解壓來提高數據處理的效能。此外,針對海量數據處理的輔助技術解決方案也有兩種:一種是數據組織的解決方案,它是采用分布式存儲管理,通過將集中式數據存取化為分散式數據存取來提高數據存取的效率;另一種是通訊網絡的解決方案,它是采用超高速光纖網,通過大幅度增加通信信道的帶寬來提高數據傳輸的速率。上述海量數據處理的各種技術解決方案,僅單一地運用其作用是有限的,必須綜合起來運用才能發揮最佳的效果。
2數據倉庫與數據挖掘
數據倉庫的主要任務是:將分布在不同地點、不同單位的數據庫中的內容不同、類型不同、結構不同、格式不同的原始數據,首先進行標準化、過濾與匹配、凈化、標明時間和確認數據質量的處理;然后根據任務的需要,再對這些數據進行集成與分割、概括與聚集、預測與推導、翻譯與格式化、轉換與再影像的處理;最后進行數據倉庫的建模、數據的概括、數據的聚集、數據的調整與確認、建立結構化查詢和創建詞匯表。數據倉庫對于“數字城市”的建設具有十分重要的支撐作用,因為它是“數字城市”整合信息資源的重要載體,也是“數字城市”實現信息共享的基礎平臺。
數據挖掘有三大技術支柱,它們分別是數據庫技術、人工智能技術和概率與數理統計學。數據庫技術是支撐數據挖掘的基礎,它通過對數據的存儲與管理為數據挖掘提供數據源。目前數據庫技術正由傳統的數據庫向數據倉庫發展,而數據倉庫則把數據挖掘作為其數據處理的重要功能,這兩者的結合既給數據挖掘帶來了便利,又使數據倉庫的決策支持能力得到了增強。人工智能技術是支撐數據挖掘的核心,它為數據挖掘的知識發現提供模擬機理。概率與數理統計學是支撐數據挖掘的算法,它為數據挖掘的分析預測提供數學方法。數據挖掘的知識發現大致可分為:關系發現、模式發現和趨勢發現。數據挖掘能發現的知識有以下幾種:廣義型知識、特征型知識、差異型知識、關聯型知識、預測型知識和偏離型知識。
數據挖掘如何從大量的數據中來挖掘知識,其根本的途徑就是建模。建模實際上是根據已知的情況經抽象建立其數學模型,并將該模型應用于對未知情況的求解。數據挖掘的應用一般須經歷確定數據挖掘對象、準備數據、建立模型、數據挖掘、結果分析和知識應用這樣幾個階段,這些階段在具體實施時可能要反復多次,并需要業務人員和管理人員的相互配合。數據挖掘技術從一開始就是面向應用的。它把人們對數據的應用從簡單的統計分析,擴展到微觀、中觀乃至宏觀的預測分析;從低層次的信息查詢,提升到高層次的知識發現;從而使數據挖掘具備了決策支持的能力。
3數據融合與虛擬現實
GIS的空間數據是多種數據的重要體現,其按數據結構可分為柵格數據和矢量數據,按表現形式可分為數字高程模型(DEM)、數字正射影像圖(DOM)、數字柵格地圖(DRG)和數字線劃地圖(DLG)。GIS空間數據融合的主要內容有柵格數據之間的融合、柵格數據與矢量數據之間的融合和矢量數據之間的融合。柵格數據之間的融合是指遙感影像之間的復合,這一技術已經成熟,應用也較普遍。柵格數據與矢量數據之間的融合是指遙感影像圖與數字線劃圖的疊加,這種融合相對簡單,常用的GIS軟件都能實現。矢量數據之間的融合是指數字線劃圖之間的融合,這種融合對多種矢量數據的融合來說比較復雜。因為它不僅要融合其中的圖形數據和屬性數據,而且要融合圖形數據各元素之間的拓撲關系,此外還要融合圖形數據與屬性數據之間的鏈接關系,這是全世界都在進行攻關的難題。
虛擬現實系統主要由顯示子系統、檢測子系統和模擬子系統三大部分組成。顯示子系統也叫輸出裝置,它的功能是進行感覺信息的合成,以滿足身臨其境的要求。檢測子系統也叫輸入裝置,它的功能是把操作信息傳遞給電腦,以滿足交互作用的要求。模擬子系統是虛擬現實系統的核心部分,它的功能是實現虛擬環境的描述和構筑,以滿足仿真客觀世界的要求。虛擬現實系統的技術基礎是高級三維圖形技術、問題求解工具、多媒體、網絡通訊、數據庫、信息系統、專家系統和面向對象的智能決策支持系統等技術的集成。虛擬現實系統有三種應用類型:一種是視頻映射系統。它是指使用常規計算機的顯示器來表達虛擬世界的應用技術系統。另一種是沉浸式系統。它是指運用頭盔式、手套式、盔甲式的傳感器及顯示器,使人的視覺、聽覺和觸覺沉浸在虛擬世界中的應用技術系統。還有一種是分布式虛擬系統。它是指利用互聯網技術將存放在不同地點、不同單位分布式數據庫中的數據加以集成,再經過虛擬現實技術的加工處理與顯示,然后通過遙測、遙控技術把用戶的感覺與真實世界結合在一起。
4互操作與超鏈接
互操作是信息共享和系統集成的基礎,它是指異構環境下兩個或兩個以上的實體,盡管它們實現的語言、基于的模型和執行的環境不同,但它們都可以相互通訊和協調運行,以完成某一特定的任務。這些實體包括應用程序、處理對象和系統運行環境等。互操作是一個比較復雜的問題,它既需要基礎理論的研究與核心技術的開發,又需要各個組織機構之間的協調與配合。互操作對軟件業來說意味著界面的開放,它要求軟件的生產者開放其數據的內部結構,以便系統的建設者能夠開發用于互操作的接口。在地理信息系統領域,OpenGIS的規范是開放界面的重要進展。互操作對用戶來說意味著在各系統之間可自由地交換數據,并能協調地進行數據處理。互操作的技術問題可以從網絡鏈接、數據模型和應用程序三個方面來說明。網絡鏈接涉及到傳輸介質、交換設備和通訊協議,它的互操作須解決各通訊協議之間的接口問題。數據模型既有同構數據又有異構數據,它的互操作須解決異構數據之間的轉換問題。各系統的應用程序是多種多樣的,它的互操作須解決在網絡環境下各應用程序協調進行數據處理的問題。互操作在“數字城市”的建設中占有顯著地位,它是“數字城市”實現信息共享和系統集成的重要技術途徑。
超鏈接起源于萬維網,它是萬維網的精華和魅力所在。因特網的普及得益于萬維網的超鏈接技術,它將世界各地的網站通過IP地址超鏈接起來,建立了分布在不同地點各網站之間的聯系,把本來處于孤立狀態的大量信息點組成一個有機的整體,使人們在任何時間、任何地點都能共享網站上的信息資源。超鏈接的概念是定義一個定位點,它指明了一個網頁的確定位置,便于超鏈接跳轉時的定位。超連接就象一個信息向導,它帶領訪問者在萬維網里瀏覽用戶所需要的信息。萬維網能夠超鏈接的是超文本信息。未來的“數字城市”將擁有龐大的信息資源,它也需要超鏈接技術將這些資源聯系起來。從硬件技術和網絡協議上來說,超文本鏈接的問題已經解決,但是“數字城市”涉及的信息種類繁多,結構復雜、環境各異,特別是地理空間信息,它的超鏈接遠沒有超文本鏈接那么簡單,還需技術人員對現有的超鏈接技術作進一步地開發,以便用戶能利用新的超鏈接功能在“數字城市”的信息海洋中盡情遨游。如此看來,超鏈接是人們對“數字城市”進行信息瀏覽的重要技術支撐。
5結語
綜上所述,元數據與海量數據處理、數據倉庫與數據挖掘、數據融合與虛擬現實、互操作與超鏈接等現代信息技術都是支撐“數字城市”的關鍵技術,它們對于“數字城市”的實現均具有重要作用。在建設“數字上海”的過程中,如何根據本市信息化的現狀和目標,將這些關鍵技術進行集成并加以有效應用則是一項極具挑戰性的工作。
參考文獻
[1] 武漢市委研究室課題組.關于構建武漢“數字城市”的思路與對策[J].學習與實踐,2001(5).
[2] 鄭劍宇.數字城市與數據倉庫[J].上海城市管理職業技術學院學報,2005(4).