杜蕾
(遼寧省基礎測繪院,遼寧錦州 121003)
元數據在自然資源中必不可少。無論是在4D產品的生產的生產建庫還是在國土工程中,元數據的使用特別廣泛。元數據(Metadate)又稱中介數據、用來描述數據的數據。主要是描述數據的屬性的信息,用來支持指示存儲位置、歷史數據、文件的生產時間,數據源、等功能。它是一種電子目錄,是一種應用,是實際生產中必不要可少的一個成果,簡單的說元數據就是電子文件的“身份證”記錄地理信息數據的行動軌跡。
隨著電子科技的進步,數字產品在地理信息系統得到了廣泛應用,這個以電子數據為主的數字時代,對于電子文件的存儲查找,要求越來越多,便用于計算機進行分析和使用成為時代發展的一種趨勢。
事物雖然抽象但總是以各種方式可視,這種世界里的電子文件,給文件的管理工作提出了更高的要求。現在在計算機內,對文件進行造假、修改、刪除、查找變得輕而易舉,因此電子文件的歸檔和檢索顯得尤為重要。
在地理信息系統里元數據主要是檢索、管理與維護分布在不同地方的地理信息(包括基礎地理信息數據、測繪檔案、地理信息服務、地理信息應用系統)的一項關鍵技術。采用一致的元數據接口,并基于統一的信息模型,即相同的元數據內容和結構,采用各種客戶端應用系統,通過一致的方式對各種資源進行搜索。
為了按照某種規范進行信息交換,把規范的消息格式轉換為通用格式,實現信息交換是元數據的一個重要功能。元數據常見文件包括矢量文件和柵格數據文件等。比如在地理國情數據中外業調查軌跡,這一數據就記錄在元數據中,當外業人員設定好調查路線,按既定路線行走時,在拍照調查時就會有對應的相片的時間和GPS定位,這樣就不便于后期造假。
元數據存放著有關的數源、數據分層、產品歸屬、空間參考系、生產日期、數據源、數據質量、數據精度、數據評價、數據更新、圖幅接邊、使用單位等多方面的信息。元數據一般以圖幅、縣區為單位進行記錄。元數據內容中所列出的元數據項,是元數據文件中都必須要提供的項目,不應有空項。有值時,必須如實記錄;無值時,記為“無”;值未知時,記為“未知”。其中某些無數據項的值可以根據不同的作業方法、產品需要或用戶要求進行選擇和增加,允許有缺省。
元數據命名應規范,方便使用者簡單明了地知道是什么內容的元數據,起名時應帶有與上下文有關的前綴名稱,如GF1202003081456.XML,可通過影像元數據查找影像的飛行時間,飛行高度等。也可通過建立查詢條件語句,檢索盡可能支持分類的內容,元數據必須貫穿于生產過程的各個環節中與數據同步采集,以便保持原數據的真實性。
完整的元數據通常有一個數據集,數據集下面應當包含許多子集,以地理國情元數據為例,元數據為一個數據庫的形式存在,某某縣區的元數據中,除了有縣區代碼外還要出現作業員、檢查員、調查員、使用影像、調查人員、使用國情數據等,在制作時按照“必要、可行”的原則,重點選取地理國情監測中各個生產環節需要記錄的內容,結合實際生產,去掉部分不必要的和生產過程中難以填寫的內容,對每個數據集統一技術要求,信息不必重復采集。
地理國情元數據數據庫主要包括成果數據基本信息,數據源、數據采集、數據編輯整理、外業調繪核查、質量檢查、成果驗收、負責單位以及成果總體精度等方面,按照統一的技術要求和有關數據進行生產。每個內容里分別設置相關的數據項,如補充影像數據情況包括補充影像資料類型、補充影像拍攝時間、補充影像分辨率、補充影像波段數、補充影像數據源標識,這樣在使用進就可以了解到補影像的基本情況。
元數據相當于數據的電子檔案,是通過計算機磁盤等設備進行存儲,與普通紙質檔案相對應,相互關聯,區別于一些客觀存在存放在電腦里的檔案實體。元數據是用來描述數據的數據,相當于文件檔案。
元數據電子檔案的優勢具有方便人工識讀、存儲的密度高、信息與載體之間可以分離性、多種信息媒體的繼承性的特點。
元數據具有電子檔案的真實性和完整性,它可以確保長期可讀,具有查詢、檢索、發現、管理描述等基本功能,使用起來快捷方便、直觀、一目了然。
可以通過元數據明確的定位到相關位置,了解電子數據的相關信息。在地理信息中1:10000基礎測繪中的元數據是以單幅圖的形式存在的,在上千幅圖中想要找到一幅圖,只能在元數據的圖號中搜索圖號,就可以看到圖幅相關信息,如圖幅生產時間、坐標系統、用何影像和何方法制作,存放地點及所想了解的相關信息等,這樣就可以方便使用者在一個MDB文件中找到單幅圖的相關信息。
通過元數據的信息做大數據分析,對數據的生產年代、格式、內容等進行分析、評估,查看數據存在的意義,是否應該做更新處理。
根據提供的描述信息對一類的數據進行提取方,這樣可以方使對基礎數據做橫向對比。
元數據中的某一數據信息發生變化可以通過檢索到指定位置立即更新。
元數據具有數字化屬性的特點,決定了它可以采用不同格式、不同的內容建立,為使用者提供嚴密的語法結構和通用的擴展機制。
元數據規范了數字化數據、信息的表達和使用,對電子檔案資源的共享做好了鋪墊,實現了共享互補,不但能夠節約數據成本,而且提高了資源的利用效率,同時對電子文件進行數據分類和歸并提供依據。
元數據在使用過程中應規范管理,以免被人改動,造成不必要的損失。