司 莉,潘秋玉(. 武漢大學信息資源研究中心,武漢 43007;. 武漢大學信息管理學院,武漢 43007)
基于多語本體的語義查詢擴展研究*
司莉1,潘秋玉2
(1. 武漢大學信息資源研究中心,武漢 430072;2. 武漢大學信息管理學院,武漢 430072)
查詢擴展是改善信息檢索結果的有效方法。針對用戶獲取多語言信息的需求以及當前跨語言信息檢索存在的翻譯歧異性問題,提出一種基于多語本體的語義查詢擴展方法,介紹其基本原理、查詢擴展模型及實現過程,使跨語言信息檢索從字符匹配變成語義層面的匹配,實現跨語言信息檢索中的查詢擴展,以提高多語言信息檢索的查全率和查準率。
查詢擴展;多語本體;跨語言信息檢索
查詢擴展作為提高信息檢索性能的關鍵技術,自20世紀60年代提出以來就逐漸受到關注。尤其是近年來,在計算機技術、云計算、物聯網、用戶創造內容等多重因素的推動下,Internet已成為一個海量且仍在迅猛增長的信息庫,與此同時,網絡信息語種的多樣化和網絡用戶分布的國際化日益顯著,實現多語言信息組織與檢索,使用戶方便獲取多語言信息,成為信息檢索系統發展的趨勢之一。然而,不同語言概念之間的準確對應始終是制約多語言信息檢索的瓶頸。由于本體表達概念語義和推理的能力較強,可消除自然語言理解中的歧義,并能根據相關概念進行推理,在多語言信息檢索中實現基于本體的語義查詢擴展,將有效提高多語言信息檢索的查全率和查準率,從而促進全球知識交流與共享?!?br>