基于近似匹配模型的元數據檢索方法

2020-06-04 12:55:32陳孝文郭威林樹鴻

數字技術與應用 2020年3期

陳孝文郭威林樹鴻

摘要：本文提出一種基于近似匹配模型的元數據檢索方法。引入三層架構模式，設計元數據檢索框架;計算元數據與近似表格關聯值，建立兩者映射關系;劃分元數據匹配類型，處理檢索結果，提供用戶結果推送。設計實驗，驗證提出方法證明有效的縮短數據響應時間，更具市場價值。

關鍵詞：近似匹配模型;元數據;檢索方法;適配

中圖分類號：TP391 文獻標識碼：A 文章編號：1007-9416（2020）03-0098-02

元數據又稱中間數據或中介數據，為描述數據衍生的一種數據形式，主要用于表達數據集合的屬性，提供數據集的儲存位置、資源定位、信息檢索、歷史數據查詢等功能。在使用中將元數據歸屬于電子目錄，為了滿足數據的最終傳輸目的，需要在數據傳輸過程中采用元數據表達方式描述數據特征[1]。核心數據集合是元數據在市場中最為廣泛的一種表達方式，盡管元數據在多個行業中具備了廣闊的應用前景，但目前針對元數據的在線檢索仍延用傳統的數據庫檢索方式，導致大批量數據集在檢索過程中對于資源對象檢索的覆蓋率較低。

1 基于近似匹配模型的元數據檢索方法

引入三層架構模式，結合近似匹配模型在元數據檢索中的應用，設計元數據檢索框架。如圖1所示。

根據圖1表述信息，將元數據檢索按照結構功能分成三層。其一為應用層，主要提供用戶實施元數據檢索進入端口。其二為服務層，作為元數據檢索的核心，引入多服務器組織模式，定義用戶訪問檢索通道權限，對網絡實施安全控制，配備身份注冊端口，此外提供數據備份管理功能[2]。其三為數據層，包含多個數據庫，用于存儲不同數據代理身份信息、多元化元數據表達形式，提供元數據管理渠道。

1.1 建立元數據與近似表格映射關系

基于上述搭建的元數據檢索框架，結合近似匹配模型理論依據，根據數據實際需求，對指定數據實施標準化描述，建立元數據標準樹，分析數據集中節點數據，并將節點統一歸類值信息對象閾值范圍內，以此即可定義信息對象與標準數據數的關系。依照數據關聯方式，計算表格數據與元數據聯系值。計算公式如下。

（1）

公式中：表示為元數據與近似表格的連接值;表示為數據集中數據節點數量;表示為檢索中數據偏轉角度;表示為元數據特征表達方式;表示為數據集橫向數據值;表示為數據集縱向數據值。根據上述公式，實施數據一次匹配，記錄有關節點數據，獲取特征數據節點。統一元數據格式，剔除無用點信息，建立兩者有效的映射關系。

1.2 劃分元數據匹配類型

假定應用層用戶在實施元數據檢索時僅提出終端數據，無明確數據所屬類型，可按照元數據劃分標準，實施數據集預處理操作，得到初期數據匹配信息，整合數據集合中近似值，將與查詢樹有關的數據集合對用戶匹配值實施數據預處理操作，配對嵌入數據值，并以元數據描述的方式匹配代價最小的終端元數據。同時，將缺少的類型部分按照閾值所屬模式以資源對象方式反饋給用戶。剩余數據按照Ma數據模式實施匹配數據匹配操作，循環上述操作直至輸出用戶滿意數據。

1.3 檢索結果處理與推送

基于上述輸出的終端數據，下述將出數據評估方式，整合數據中節點個數，結合用戶興趣模型，按照檢索中關鍵數據、數據類別等方式評價數據組。分析元數據在數據集合中的空間分布特征，并采用多終端服務器的方式對數據目錄獲取直接檢索數據，結合空間數據具有的異構性特點，獲取數據中潛在的聯絡基礎。此外在使用中，結合數據庫在其中發揮的作用，實時備份關鍵數據，避免由于網絡異?；蚱渌蛟斐蓴祿z索失效，將滿足檢索要求的元數據集合按照用戶瀏覽歷史實現推送，完成基于近似匹配模型的元數據檢索方法設計。

2 仿真實驗

提出仿真實驗，模擬實驗所需環境，使用JAVA計算機語言搭建B/S結構實驗平臺，引入野外實驗調查組獲取的數據集，采用元數據對數據集實施特征描述，并以xml.格式文件存儲至指定數據庫中，遵循元數據劃分標準，提出下述檢索要求：定義實驗參數，數據集數量規模為s，元數據檢索深度為d，數據集合中節點數量為n;定義多組不同數據量，按照查全率定義數據終端輸出結果。

根據實驗結果，可得出如下實驗結論：隨著S數據量的增多，實驗組數據響應時間上升相對平穩，具有一定檢索規律，相對傳統的元數據檢索方法，本文設計的方法在實際應用中，可有效的縮短數據檢索響應時間，進而起到提升元數據檢索效率的作用。

3 結語

本文從3個方面，基于近似匹配模型，開展了元數據檢索方法的研究。并通過設計仿真實驗的方式驗證了本文提出的方法，在實際應用中可有效的縮短數據響應時間，起到提升元數據檢索效率的作用。盡管本文的研究已經取得了初步的成績，但仍缺乏大量數據為其提供支撐，以此在后期發展中，應加大該方法在元數據檢索中的應用，為技術的應用提供真實的數據支撐。

參考文獻

[1] 白雪，李廣利，牛愛菊.Alma環境下電子資源元數據的管理及對用戶的影響——以北京師范大學圖書館為例[J].新世紀圖書館，2019（05）：49-52.

[2] 姚蘭，金鈺博，顧佳良.云環境下基于動態聚類及相似樹查詢的無線體域網隱私數據檢索算法研究[J].計算機與數字工程，2019，47（02）：360-366+441.

Abstract：This paper proposes a metadata retrieval method based on approximate matching model. Introduce a three-tier architecture model to design a metadata retrieval framework; calculate metadata and approximate table association values to establish a mapping relationship between them; divide metadata matching types， process retrieval results， and provide user results push Design experiments to verify that the proposed method proves that the data response time can be shortened effectively and has more market value.

Key words：approximate matching model; metadata; retrieval method; adaptation

數字技術與應用2020年3期

數字技術與應用的其它文章: 虛擬仿真實驗中心平臺建設探索; 面向時空數據的多粒度結構化表示; 淺析移動醫療App在慢性病患者健康管理中的應用進展; 大數據時代下的企業計算機信息化建設方法探討; 基于實訓平臺的軟件測試人才培養實踐與探索; 基于“互聯網+”技術的第三次全國國土調查的技術探究分析