李曉瑛 李軍蓮 李丹亞
(中國醫學科學院醫學信息研究所,北京 100020)
知識組織系統(Knowledge Organization System,KOS)是對人類知識及結構的規范組織和語義闡述[1],包括一般意義上的同義詞環或術語表,傳統文獻數據庫系統所使用的敘詞表,檢索引擎中采用的分類表與自動擴展詞表,網站導航輔助資源瀏覽的分類結構,用于信息系統互操作的一體化語言系統,網絡環境下以概念為基本單元的本體,以及語義網絡和知識圖譜等[2]。其中,一體化語言系統又稱一體化情報檢索語言,能夠通過統一整合若干部知識組織系統,實現相同知識內容的一致組織與有機關聯,從而更好地發揮優勢互補效應,標志著知識組織系統從單一類型走向多種類型的融合協同發展[3]。
早在1984年,美國國立醫學圖書館(U.S.National Library of Medicine,NLM)便通過整合上百部生物醫學領域的知識組織系統而形成一種大型知識組織工具,命名為一體化醫學語言系統(Unified Medical Language System,UMLS)[4]。UMLS廣泛用于不同健康醫療信息系統、生命科學數據、生物醫學文獻資源,以及相關領域計算機系統之間的語義互操作和知識內容關聯。此外,NLM基于UMLS開發了語義知識發現工具(Semantic Knowledge Representation,SemRep)[5],并在輸入文本數據格式上與PubMed文獻服務系統建立了無縫銜接,易于從MEDLINE大規模生物醫學文獻資源中發現隱含的知識,有助于構建知識圖譜、開發智能系統和提供知識服務。在我國,代表性的一體化語言系統包括醫學分類主題一體化系統[6]、中文一體化醫學語言系統(Chinese Unified Medical Language System,CUMLS)[7]、中醫藥一體化語言系統[8],以……