向隆剛,王星星,龔健雅
城市傳感網觀測數據的多層次摘要模型
向隆剛,王星星,龔健雅
(武漢大學測繪遙感信息工程國家重點實驗室,湖北武漢430079)
隨著傳感設備和無線通信的融合與發展,傳感網技術應運而生,并廣泛應用于自然、社會環境特征與現象的觀測,目前已經發展成為實時感知小至周邊環境、大到整個地球的一種不可或缺的手段,是智能化獲取、管理和分析自然、社會信息的重要途徑。在此趨勢下,城市管理者開始部署多種多樣的傳感器設備,作為城市信息化發展和智慧城市建設所必備的基礎設施,用以全方位、全天候采集城市信息。目前,城市傳感網系統及其觀測數據量迅猛增長,且數據采集方式及應用軟件不盡相同,導致了傳感器觀測數據海量、多源、異構的特點。作為一種資源,傳感器觀測數據可以不斷地被重復使用,充分發揮其在綜合應用中的潛在作用,是對傳感網巨額投資的回報。因此,如何從已有海量數據資源中快速、便捷地發現和訪問可用資源,提高傳感器觀測資源的發現率和利用率,是用戶面臨的最突出的問題之一。
近年來,伴隨著國家科技部實施的科學數據共享工程,我國相繼構建了部分學科和行業的科學數據技術共享平臺和一批國家級科學數據中心,但仍未形成綜合性強、集成度高的共享系統。盡管目前已出現一些數據共享技術,且在一定程度上緩解了“信息孤島”“信息獲取鴻溝”和“信息理解鴻溝”的危機[1]。但共享內容較單一,共享程度有限,共享的層次較低,各種傳感器觀測數據集成及其相關遠程數據查詢、加載、分析等問題仍不能得到很好的解決。在諸多研究成果中,一種被普遍理解和認同的模式就是利用元數據的標準化來統一管理分散的數據資源,并通過網絡實現數據共享與服務[2]。
目前,與傳感器觀測數據集成共享相關的國際標準主要有兩個:一個是在傳感器觀測數據的信息模型方面,開放地理空間信息聯盟( Open Geospatial Consortium,OGC)和國際標準化組織/地理信息技術委員會( International Organization for Standardization/ Technical Com-mittee,ISO/TC211)合作發布了ISO 19156 Observations&Measurements( O&M)[3],采用XML模式描述傳感器觀測數據;另一個是在傳感器觀測數據的服務方面,OGC發布了傳感器觀測服務( sensor observation service,SOS)[4],圍繞傳感器注冊與發現,以及傳感器數據操縱,從操作層面進行了規范。O&M僅限于在元數據層次上提供傳感器觀測數據的描述模型,而SOS僅在元數據和數據體兩個層次上為傳感器觀測數據摘要提供參考,難以有效滿足綜合性應用對于傳感器觀測數據的多層次、多類型信息的集成共享需求。
本文將傳感器觀測數據的集成共享看作是一種針對數據源的摘要,取其摘錄要點之意,并認為元數據摘要的粒度過粗,而數據體摘要的粒度過細,在這兩個摘要層次之間還存在著其他摘要層次,即從元數據( metadata)、采樣( sampling)、統計( statistics)、過濾( filtering)和語義( semantics)共5個層次來考慮傳感器觀測數據的摘要模型。
數據共享的程度反映了一個地區、一個國家的信息發展水平,數據共享程度越高,信息發展水平越高[5]。早在20世紀50年代,數據共享思想即被提出。1957年,國際科聯成立了世界數據中心( WDC),使數據采集、數據存儲交換和數據使用等國際化。近年來,科學數據管理和應用的發展趨勢表現為充分發揮計算機和通信網絡的功能,在共同遵守的數據共享原則下建立全球性和區域性的數據網絡和數據中心結點[1]。國內外發展顯示,分布式網絡環境下的數據共享已經成為空間信息系統領域的一個重點[6]。在諸多研究成果中[1,6-7],實現分布式異構空間數據共享的方式大致分為以下5種:使用數據轉換器或中介格式進行轉換、直接數據訪問模式、公共接口訪問模式、開放式數據庫互接模式、WebGIS數據共享模式。
為了真正實現Web環境下傳感器資源的集成共享,研究界已經開展了大量工作,并取得了許多成果。其中,OGC和ISO在傳感器描述模型與服務標準方面作出了杰出貢獻,大大推動了基于傳感網的數據獲取與系統建設的步伐。
在數據模型方面,不少國家和國際性組織已經發布了實施元數據內容標準,并開發了許多元數據操作工具。現有的地理空間或傳感器相關元數據標準主要有如下8種[8]: NASA GCMD Keywords、NASA GCMD Directory Interchange Format ( DIF)、FGDCRemote Sensing Extension、ISO 19115、ISO 19115-2 ( 2007)、ISO 19130( 2008)、ISO/TS 19130-2( 2010)、NGA CSM。在此基礎上,OGC SWE( Sensor Web Enablement)工作組制定了一系列傳感網標準規范:傳感器建模語言( sensor model language,SensorML)、觀測與量測( observations&measurements,O&M)、傳感網通用數據模型( SWE common data mode)、時間模式標識語言( event pattern markup language,EML)等。
在數據服務方面,與傳感網觀測數據密切相關的是OGC所提出的可擴展的、能無縫集成各種在線地學處理和位置服務的框架,即OWS( OGC web service)。OGC目前制定并建議的web services規范有: web map service ( WMS)、web feature service ( WFS)、web coverage service( WCS)等,它們分別對柵格數據、矢量數據提供了操作的接口。更重要的是,OGC提出了傳感器觀測服務SOS,專用于在網絡環境下,以標準方式接入和訪問傳感網平臺及其觀測數據,如: RegisterSensor方法用于注冊傳感器資源,GetCapabilites和DecribeSensor方法分別用于獲取傳感器資源的概述和詳述信息,而InsertObservation和GetObservation方法分別用于寫入和讀取傳感器觀測數據。
1.傳感器分類
本文面向智慧城市[9-10]應用,將傳感器分為3大類,即分別用以觀測環境變量、監控安保事件和獲取流動信息的數值傳感器( quantitative sensor)、視頻傳感器( video sensor)和位置傳感器( position sensor),分別描述如下。
數值傳感器通常部署于固定位置之上,用于定時收集土壤、水文和大氣等方面的信息,是感知自然環境及其變化的重要手段。數值傳感器往往觀測得到數值型數據,如溫度、氣壓、水位等,也可以是經過加工處理的類別型數據,如針對PM2.5的觀測可以輸出優、良、輕度污染、中度污染、重度污染和嚴重污染6個類別。數值傳感器通常與傳感器觀測服務搭配使用,以利用其InsertObservation方法接入觀測數據到業務系統中。
視頻傳感器通常部署在固定位置上,具有視頻攝影和靜態圖像捕捉等基本功能,在交通監控、保全監控方面起著重要作用。視頻傳感器是常見的一類傳感器,其Web服務多見于流媒體或網絡文件。固定式攝像頭監控范圍是一定的,部分攝像頭可自動旋轉調整監控范圍。視頻傳感器平臺多按文件方式組織觀測數據(即視頻文件),以單個視頻文件作為最小的觀測項。視頻傳感器數據可以是一集視頻,也可以是成套或成系列的視頻。顯然,視頻數據既有空間屬性又有時間屬性。
位置傳感器用于記錄人、動物及其他移動對象在移動過程中的時間、位置信息,分為車載式和便攜式等。位置傳感器通常觀測得到時空點序列數據,即軌跡,每個軌跡點至少包括日期、時間、經度、緯度、海拔信息,有的還包含速度等信息。車載式位置傳感器常用于記錄行車軌跡,而便攜式位置傳感器,如手機、手表等,用于記錄個體遠足、騎車、跑步或其他戶外活動等出行信息。此外,在移動對象上集成位置傳感器與環境傳感器,一次觀測可同時得到位置數據和環境監測量。
2.摘要模型
針對多源、異構、海量的傳感器觀測數據資源,本文提出一種基于多級摘要的集成共享模型,其描述框架如圖1所示。針對原位傳感數據、視頻傳感數據、位置傳感數據3種不同數據類型,從元數據、采樣、統計、過濾及語義5個維度進行摘要。元數據摘要能夠使用戶很清晰地了解和認識數據資源的名稱、內容、用途、覆蓋范圍等基本屬性;統計摘要描述數據的集中趨勢、離散程度及數據分布等統計特征;采樣摘要描述數據的采樣類型、方法及其他采樣信息;過濾摘要描述數據過濾方法及結果描述;語義摘要描述數據所對應的現實世界中的事物所代表的概念的含義。傳感器觀測數據摘要模型從不同維度描述觀測數據源的不同視圖,方便用戶從多個層次觀看和理解數據源。
圖2是傳感器觀測數據摘要模型的UML結構。基類傳感器數據摘要( SD_Abstraction)有3個子類,即數值傳感器數據摘要( QSD_Abstracti-on)、視頻傳感器數據摘要( VSD_Abstraction)和位置傳感器數據摘要( PSD_Abstraction)。整個模型聚集了元數據摘要( SD_Metadata)、統計摘要( SD_Statistics)、采樣摘要( SD_Sampling)、過濾摘要( SD_Filtering)、語義摘要( SD_Semantics) 5個抽象類,以及摘要總體信息( SD_GeneralAbstraction)一個實體類。傳感器數據摘要總體信息包括數據摘要的版本、創建時間、更新時間、聯系信息及部署信息等必要信息。

圖1 基于摘要的傳感器觀測數據共享平臺架構

圖2 傳感器觀測數據多級摘要模型UML結構
3.摘要模型的5個維度
傳感器觀測數據摘要模型的分層體系敘述如下。
( 1)元數據摘要( metadata abstraction)
元數據摘要位于傳感器觀測數據多級摘要模型的最底層,是模型中唯一必選的摘要層次。元數據摘要主要回答以下問題:“數據集內容(‘什么’) ?”“覆蓋特定的地區(‘何處’) ?”“特定的日期或時段(‘何時’) ?”,以及“了解更多情況或訂購數據集的聯系方(‘誰’) ?”。
近年來,不少國家和國際性組織紛紛發布地理空間或傳感器相關元數據標準,但仍沒有任何一個標準可以完全覆蓋針對特定應用的元數據元素。為避免重新創建元數據元素,本文引用現有的標準并擴展新的元數據元素,以滿足特定需求。參考《地理信息元數據》( GB/T 19710—2005)[11]、ISO 19115-1: 2014[12],選定如下7個抽象實體作為傳感器觀測數據摘要中元數據摘要的子集(其描述框架如圖3 ( a)所示)。
1)元數據基本信息:數據內容、用途、格式等。
2)標識信息:數據集名稱、關鍵詞、瀏覽圖、限值信息、維護信息等。
3)數據質量信息:位置和屬性精度、數據完整性等。
4)覆蓋范圍信息:區域空間范圍、垂向覆蓋范圍、數據時間范圍等。
5)參照信息:空間參照(地圖投影、坐標系、垂直基準、水平基準)、時間參照等。
6)負責方信息:負責單位、負責人、職務、職責、聯系方式等。
獲取信息:數據獲取方式、可提供的數據格式、是否在線提供、數據價格等。
( 2)統計摘要( statistics abstraction)
統計摘要位于傳感器觀測數據摘要模型的中間層,是從數據統計方面進行摘要,描述傳感器觀測數據的統計特征。
統計摘要聚集全局統計和局部統計兩個抽象實體,其描述框架如圖3( b)所示。全局統計是對數據集整體得到的信息進行統計,而局部統計是對數據集中部分數據或單一觀測項的統計。常用的描述性統計量有:
1)描述數據集中趨勢的統計量:均值、眾數、中位數、P分位數等。
2)描述離散程度的統計量:方差、標準差、最大值、最小值、變異系數、全距等。
3)描述數據分布的統計量:峰度、偏度、直方圖等。
( 3)采樣摘要( sampling abstraction)
采樣摘要位于傳感器觀測數據摘要模型的中間層,是從數據采樣方面進行摘要,描述觀測數據的采樣間隔和采樣方法等有關信息。
根據采樣的方式將采樣摘要分為如下4個子集(其描述框架如圖3( c)所示) :
1)時間采樣:以定量時間間隔采樣。
2)空間采樣:以一定空間間隔采樣。
3)時空采樣:從時間、空間兩方面采樣。
4)頻域采樣:從頻率方面采樣。
( 4)過濾摘要( filtering abstraction)
過濾摘要是傳感器觀測數據多級摘要模型的中間層,是從數據過濾的角度定義摘要,描述過濾謂詞、過濾結果等相關信息。
OGC發布的Filter Encoding標準[13]為數據提供XML編碼的過濾表達。該標準將過濾謂詞細分為比較謂詞( comparison predicate)、時間謂詞( temporal predicate)和空間謂詞( spatial predicate) 3類簡單謂詞,以及可用于連接簡單謂詞構成復合謂詞的邏輯謂詞( logical predicate)。據此,過濾摘要的描述框架如圖3( e)所示,簡單謂詞種類如下:
1)時間謂詞有after(之后)、before(之前)、during(在……期間)和tequals(在……時)。
2)比較謂詞有less than(小于)、greater than(大于)、equal to(等于)和not equal to(不等于)。
3)空間謂詞有bbox(包圍盒)。
4)邏輯謂詞有and(與)、or(或)和not(非)。
( 5)語義摘要( semantics abstraction)
語義摘要在模型中位于最高層,是對傳感器觀測數據進行摘要的最高級別。數據的含義就是語義( semantic),可以簡單地看作是數據所對應的現實世界中的事物所代表的概念的含義,以及這些含義之間的關系,是數據在某個領域上的解釋和邏輯表示。語義摘要從語義的角度對數據進行摘要,具有如下4個子集(其描述框架如圖3( d)所示) :
1)點語義:單個數據點在現實世界中的含義,如最高溫、最高水位等。
2)段語義:連續多個數據項的語義,如溫度上升、海拔下降等。
3)幀語義:單幅圖像的語義,如視頻中的首尾幀、關鍵幀等。
4)體語義:多個數據項構成一體形成新的語義,如案發現場子視頻。
目前,集成共享研究主要集中在元數據和數據體兩個層次上開展標準制定與應用開發,前者僅從數據源抽取元數據,而后者需從數據源拷貝數據體。隨著城市傳感器觀測數據的不斷累積,訪問和利用多源海量觀測數據資源的復雜性成倍增加,僅從元數據和數據源兩個層次上進行數據資源共享很難滿足實際綜合應用的需求。本文提出的摘要模型從不同層次和維度上展示傳感器觀測數據的不同視圖,方便用戶觀看和理解數據源。以全國PM2.5觀測數據為例:首先,用戶查看數據的元數據摘要可以了解其內容、覆蓋范圍、數據的生產和發布等信息;其次,查看統計摘要可以了解全國空氣質量的平均值、最小值及最大值等統計特征;再次,查看采樣摘要可以了解PM2.5數據在觀測時的采樣時間間隔和距離間隔等相關內容;然后,查看過濾摘要可以了解空氣質量嚴重污染發生的地區、時間或局部地區的空氣質量情況等信息;最后,查看語義摘要可以了解空氣質量最嚴重或空氣質量發生突變等情況。

圖3 各級摘要結構
在智慧城市和應急響應等綜合應用中,單一種類傳感器數據及其業務平臺是難以勝任的,有必要集成共享多源傳感器數據資源。本文從摘要這一嶄新角度討論傳感器觀測數據的集成共享問題,用于在多個層次和角度上集成共享多源異構的傳感網業務系統,指導智慧城市和應急指揮等綜合應用在合適層次上集成所需的摘要信息,滿足綜合應用對于傳感器觀測數據集成共享的多層次、多類型摘要需求。通過獲取數據摘要,用戶不必陷入數據泥潭中即可查看數據源信息。此外,一次摘要,即便工作繁重,但可供多次查詢分析之用。較之傳統的元數據或數據體集成共享,摘要模型不僅支持更多可用的信息層,而且提供更為豐富多樣的信息項。
今后將在本文的基礎上,從兩方面進一步開展研究工作:①增加傳感器類型,如遙感傳感器,將更多傳感器納入到描述模型之中;②制定傳感器觀測數據的摘要服務接口,并通過擴展SOS和WCS等空間信息服務,在傳感器觀測數據的網絡訪問方面開展實踐。
[1] 鄭文鋒.面向服務的空間數據共享[D].成都:成都理工大學,2008.
[2] 王卷樂,游松財,謝傳節.地學數據共享中的元數據標準結構分析與設計[J].地理與地理信息科學,2005,21( 1) : 16-21.
[3] ISO/TC 211.ISO 19156: 2011.Geographic information—Observations and Measurements[EB/OL].( 2011-12-11)[2014-08-01].http:∥www.iso.org/iso/catalogue_ detail.htm? csnumber=32574.
[4] Open Geospatial Consortium.OGC 12-006 OGCSensor Obse rvation Service Interface Standard[EB/OL].( Version 2.0).( 2012-09-10)[2014-08-01].https:∥portal.opengeospatial.org/files/? artifact_id=47599.
[5] 范志堅,方源敏,汪虹.GIS數據的標準化與數據共享[J].中國建設信息,2007( 24) : 60-62.
[6] 鐘珞,潘媛媛,徐勇,等.分布式異構空間數據共享研究[J].計算機應用與軟件,2005,22( 10) : 52-54.
[7] 李楊,李天文,崔晨,等.多源空間數據集成技術綜述與前景展望[J].測繪與空間地理信息,2009,32( 1) : 102-106.
[8] 胡楚麗.對地觀測網傳感器資源共享管理模型與方法研究[D].武漢:武漢大學,2013.
[9] 李德仁,邵振峰,楊小敏.從數字城市到智慧城市的理論與實踐[J].地理空間信息,2011,9( 6) : 1-6.
[10]李成名,劉曉麗,印潔,等.數字城市到智慧城市的思考與探索[J].測繪通報,2013( 3) : 1-3.
[11]中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會.GB/T 19710—2005地理信息元數據[S].北京:中國標準出版社,2005.
[12] ISO/TC 211.ISO 19115-1: 2014 Geographic Information—Metadata[EB/OL].( 2014-06-19)[2014-08-01].http:∥www.iso.org/iso/catalogue_detail.htm? csnumber=53798.
[13] OGC.OGC 09—026r1 and ISO 19143: 2010( E).Open-GIS Filter Encoding 2.0 Encoding Standard[S].Wayland,MA: USA Open Geospatial Consortium,2010.
A Multi-level Abstraction Model for City Sensing Observation Data
XIANG Longgang,WANG Xingxing,GONG Jianya
針對海量、多源、異構的城市傳感網觀測數據,從摘要這一嶄新角度討論數據資源的集成共享問題,提出了一種城市傳感網觀測數據的多層次摘要模型。該模型從元數據、統計、采樣、過濾和語義共5個層次描述觀測數據源的不同視圖,方便用戶觀看和理解數據源,可用于在多個層次和角度上集成共享多源異構的傳感網業務系統,指導智慧城市和應急指揮等綜合應用在合適層次上集成所需的摘要信息,滿足綜合應用對于傳感器觀測數據集成共享的多層次、多類型摘要需求。
傳感器;觀測數據;集成共享;摘要
王星星
P237
B
0494-0911( 2015) 11-0039-05
向隆剛,王星星,龔健雅.城市傳感網觀測數據的多層次摘要模型[J].測繪通報,2015( 11) : 39-43.
10.13474/j.cnki.11-2246.2015.0342
2014-11-30;
2015-03-13
國家863高技術研究發展計劃( 2012AA121401) ;國家自然科學基金( 41471374)
向隆剛( 1976—),男,博士,副教授,研究方向為軌跡數據處理、分析與挖掘,虛擬地球系統,實時GIS技術和非關系空間數據庫等。E-mail: geoxlg@ whu.edu.cn