袁野
裝備試驗領域已經產生了海量試驗數據,但大都局限在自產自用,甚者還停留在對單個型號裝備單次試驗任務的分析評估,裝備試驗數據工程建設需求已經迫在眉睫。
1引言
元數據是關于數據的數據,其實質是對潛在信息資源對象的描述。構建元數據是大數據工程中數據標準化的重要活動,其目的是將數據轉化為信息,解決數據管理和數據工程中的實際問題,為分析應用提供數據服務。國內軍事領域對元數據構建的研究雖然有了一些進展,但裝備試驗領域的元數據構建仍然需要一些能夠指導工程建設的針對性研究。
2裝備試驗元數據構建原則
元數據構建要針對裝備試驗數據的現狀:一是數據資源時空分散,二是數據管理起步低,遵循“頂層規劃,業務牽引,底層構建,定期修訂”的原則。①頂層規劃:規范構建流程、規則,編制核心元數據標準和元數據描述框架,配發元數據注冊系統軟件。②業務牽引:以業務需求驅動構建,以維護數據可發布、可發現、可管理、可訪問、可理解、可操作和可信賴作為最基本的業務目標,此外還有關于數據關聯分析、深度挖掘應用的業務目標。③底層構建:在發布的元數據名錄基礎上,授權數據提供方和用戶方根據業務需求對元數據進行擴展,新建元數據元素或元數據實體或代碼表,或者對現有的進行適當修改。④定期修訂:建立元數據使用頻次統計規則,定期對符合共識的、常用的元數據編制規范和著錄規則,提高元數據質量。
3裝備試驗元數據構建流程
元數據本身就是數據,同樣遵循數據的生命周期,如圖1所示。

在數據描述階段,需要對國內外元數據標準進行深入研究分析,制定元數據的描述框架,制定構建元數據的目標、原則和范圍,形成注冊和審核規則,并整合到元數據注冊軟件系統中。
在數據獲取階段,制定元數據需求管理計劃,通過元數據注冊系統,從各個資源對象的提供方和用戶方收集大量自定義的元數據元素和元數據實體。在數據處理階段,通過元數據注冊系統集成的統計分析工具,對獲取的元數據進行預處理,篩選掉不符合規則的無效數據,然后按照業務類別分別組織專家會議,對第一手元數據進行審核討論,之后對審核通過的元數據元素整理、編目,形成具有層次結構的元數據名錄。
數據應用階段,通過元數據注冊系統發布元數據名錄,對不同用戶授權訪問權限,數據提供方和使用方從中選用合適的元數據描述試驗數據資源對象,待發布運行一段時間后最終形成元數據規范和著錄規則,作為后續工作的基礎。如果現行的元數據描述框架、規范或者著錄規則無法滿足應用需求,則進入下一個數據生命周期,逐漸完善元數據本身和規范。
4裝備試驗元數據描述框架
如下表,設計了一個裝備試驗元數據描述框架,依據該描述框架,可以生成元數據的元數據整合到元數據注冊系統中。用戶以此框架創建元數據,元數據注冊系統以此框架為依據檢查元數據的合規性。

5結束語
元數據構建是一項長期的活動,裝備試驗數據資源對象的數據類型有結構化的測試測量數據,也有非結構化的文檔、圖像、音頻、視頻、模型和軟件等,需要分別編制專門的元數據規范和著錄規則,如何保證元數據質量、如何評估元數據質量也是需要考慮的問題,這些都還有待后續具體研究。