◎ 呂玉曉 廣州海事測繪中心
?
基于關聯數據云的專題海圖及航行指南設計
◎ 呂玉曉 廣州海事測繪中心
摘 要:本文從分析了海事測繪非海圖數據資料及建設海事測繪數據云的必要性,提出了基于關聯數據云的專題海圖、航行指南生產發布平臺架構,并詳細描述了建立數據關聯方法和生產平臺的功能需求。
關鍵詞:航海出版物 關聯數據云 信息類型要素 元數據
2007年5月, Chris Bizer and Richard Cyganiak 向 W3C SWEO 提交的一個項目申請 Linked Open Data Project 中提出來的關聯數據(Linked data)概念。Linked data 提出的目的是構建一張計算機能理解的語義數據網絡,而不僅僅是人能讀懂的文檔網絡,以便于在此之上構建更智能的應用[1]。海事測繪數據現在主要以圖和網絡服務來展現,卻沒有充分建立起數據與數據的關聯,這極大地制約了數據的分析統計及價值挖掘。專題海圖和航行指南等航海出版物擴充了海圖上的航海資料,它載有在海圖上和其他航海資料中沒有的、但是安全航行所必需的參考資料。它們的信息大多基于不同的邏輯關系,如港口地域關系、管理等級關系,進行統計分析,而且與海圖資料密切相關,結合引用。所以構建海事測繪關聯數據云,對生產和完善門類齊全、層次豐富、形式多樣、用途廣泛的現代民用航海圖書序列有重要的意義。
海事測繪除生產港口航道序列圖外,也進行專題海圖及其它新型航海圖書(航行指南等)的制作,從而收集和積累了很多不同于海圖上的要素或者擴充屬性,見圖1。這些數據資料是對海圖內容有意的補充和擴展:如更詳細的碼頭、水下地形資料;管理機構、引航服務、船舶代理、油水服務等各種港口支持系統;各類實時的水文、海流、風向、風速;準確的航行指引;關鍵位置的實景影像、多媒體資料。現在它們以各種形式存儲于關系數據庫、文件數據庫、數據服務、文檔中。
3.1海量測繪數據亟需被轉變為重要價值

圖1. 海事測繪非海圖數據分析
經過多年測量、數據收集、數據庫建設,海事測繪積淀了海量的基礎地理數據及眾多非地理類數據:如圖片類、文檔類、視頻、音頻數據。大數據分析有三大要素:數據本身,數據分析以及結果的呈現。擁有數據本身并沒有實際意義,數據本身就已存在,重要的是如何處理、分析數據并呈現重要信息,以將數據轉變為重要價值。如在制作航行指南的過程中發現,只有把各種助航標志、錨地、碼頭、航道、氣象水文信息、港口支持系統、海圖數據、航法規則、管理規定等,通過各種邏輯關系,同港口、航道、權威機構等互相關聯起來,建立起關聯數據網絡,才能實現信息數據的快速檢索和價值提取,才能實現智能航行指南的制作以及基于數據庫更新的快速更新,而不僅僅是文檔中的各種文字、表格、圖幅的復制和黏貼。
3.2打造海事測繪產品升級版,必須夯實數據基礎
根據中國海事航海保障“十三五”發展規劃,我們未來五年應致力于“豐富海事測繪產品與服務類型。出版、發行包括專題海圖、港口航行圖集、高密度水深電子海圖、數字正射影像圖(DOM)、三維景觀圖(DRG)、3D電子海圖等在內的各種航海圖書產品,形成‘門類齊全、層次豐富、形式多樣、用途廣泛’的現代民用航海圖書序列。”而要達到這一目標,必須對多源數據進行標準化存儲、整合、挖掘,開展定性和定量的空間特征、時態特征和通航環境效應的分析評價和變化預測。只有建立起多源的關聯數據云,特別是將發布數據服務與互聯網結合起來,建立一個關聯開放數據云,才為打造升級版的產品夯實基礎,從而為航海者提供多樣化、體驗式服務,切實為智能航海提供信息支持。

圖2. 航海信息關聯數據云架構
專題海圖中的海事轄區示意圖的主要內容是以權威機構從屬關系提取的航行相關信息;航海出版物尤其航行指南中的主要內容則是以某個港口,某條航路為邏輯關系提取的信息。所以生產專題海圖和航行指南的關鍵是建立信息與要素之間的關聯(圖2)。
建立要素之間的關聯,可以利用電子海圖下一代產品規范S-101 中添加的信息類型[2]要素。信息類型是數據集中可識別的信息部分,可以與其他物標共享。信息類型具有屬性,但是與幾何沒有關系約束;信息類型可以與其他信息類型互相引用。
如果信息適用于多個要素,又不能使用屬性編碼這些要素,否則會導致正文信息屬性明顯重復,那么必須使用信息類型Information(信息)。信息類型要素與要素之間是一種關聯關系,在數據庫中利用 FOID 進行主外鍵關聯。
另外,隨著IHO海洋保護區產品規范(S122)和無線電信號產品規范(S123)的開發和S-101基線版本的校對,IHO航海出版物標準工作組(SNPWG)的文本信息數據模型簡化為一種通用模型。修改后的模型將信息和文本描述這兩個復雜屬性被組合成一個屬性,保留原有的屬性名稱“信息”;新的“信息”屬性包含一個指示文本位置的屬性和一個可選的小標題編碼屬性;引入新的復雜屬性“文本內容”,其中包含新的“信息”屬性加上其他描述內容和提供指向網絡資源的子屬性。該信息模型可以在不同的IHO產品規范中使用,包括航海出版物數據集,同時模型也允許捕獲文本的附加細節信息。這意味著任何信息屬性都可以確定它的數據來源,包括網絡資源地址。
最后關鍵一點,以上各種數據的建設都需要建立完善的元數據(Metadata)庫管理機制,元數據,又稱中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。建立元數據庫,一方面這是未來 S-100 標準及產品體系建設的重要基礎和要求,另一方面可以為數據挖掘分析提供條件。
5.1數據庫管理發布子平臺
以ArcGIS平臺軟件為基礎,實現海事測繪多元和專題數據的建庫、管理、維護、編輯、更新等基本操作,實現海事測繪成果資料的全面數據庫管理,平臺的功能主要包括基礎地理信息建庫管理子系統、海事測繪歷史數據管理子系統、海事測繪元數據管理子系統、海事測繪成果質量檢驗子系統等內容。平臺建成后,其數據資料能夠滿足內部生產、管理的查詢、調用、統計分析、下載需要;能夠為外部多平臺系統提供標準接口和服務供快速查詢、檢索、調用。
5.2專題圖生產子系統
以基礎地理信息數據庫驅動,以ArcGIS為基礎,以一張要素齊全的專題海圖樣圖為實例,完成生產專題海圖的所有本地化過程及開發,實現基于數據庫的專題海圖的高效生產,同時編制完成制圖生產作業指導書。具體開發內容包括進行符號設計和制圖規則設計,建立符號庫及制圖規則;開發規則同步工具;專題海圖版面設計工具及快速出圖模塊。
5.3智能航行指南生產子系統
完成數據庫分類型、分區建設,用元數據、信息類型要素等將所有數據關聯,建立基于網絡的關聯數據云,實現智能航行指南和航行百科的生產,打造“手段多樣、平臺豐富、形式多元、需求驅動”海事測繪產品體系升級版。
海事測繪收集和積累眾多數據資料,很多要素通過海圖展示,另外一些是對海圖內容有意的補充和擴展。將它們以數據庫的方式存儲管理起來,并通過S-100標準及產品體系中的信息類型要素、信息屬性模型、元數據方式,有效地關聯起來,構建航海信息關聯數據云。在此基礎上,實現智能航海出版物的生產,為提供E航海海事數據服務集奠定基礎。
參考文獻:
[1]http://baike.baidu.com/link?url=o9jlujS 7vM_Bq3VF9e4efrPdK0BBvO2qnyBZDbR-Qkz p0xu4MUM71KsUzgcj3y9p1GJHL9S5H5r7lnD 9vyQUEa#1.
[2]S101_Data Classification and Encoding Guide Final Baseline. IHO TSMAD(傳輸標準維護與應用開發)工作組,2014, 447.