安 歡,張華敏,符永馳,李 兵中國中醫科學院中醫藥信息研究所,北京100700
?
中醫古籍知識庫發展現狀及古籍養生知識庫的構建思路*
安歡,張華敏,符永馳,李兵△
中國中醫科學院中醫藥信息研究所,北京100700
分析中醫古籍知識庫構建的研究現狀,探討如何全面、準確、規范地表達養生古籍知識,并提出構建中醫古籍養生知識庫的思路與設想。
養生古籍;古籍數字化;中醫養生;知識庫
中醫古籍內容豐富,是中醫學的寶貴財富[1]。古籍的特殊性使現代人在中醫古籍的檢索利用方面存在諸多障礙,中醫古籍數字化較好地解決了古籍保存與利用之間的矛盾[2-3]。目前,隨著計算機、人工智能的迅猛發展,中醫古籍數字化資源組織形式開始由基于字詞檢索的全文數據庫開發轉向基于知識單元概念檢索的知識庫系統建設[4-5]。因此構建中醫古籍養生知識庫,能促進中醫古籍中養生知識更好地被挖掘和利用,為中醫養生的研究提供支撐。
知識庫是人工智能和數據庫結合的產物,知識庫中存儲的知識是高度結構化的符號數據,用戶可以進行深層次的知識挖掘,實現由書目到全文等多個知識點的關聯檢索,也可以由一個作者檢索到其他相關作者[6-7]。隨著中醫古籍數字化的廣泛開展,許多中醫藥高校和科研院所都建立了中醫古籍數據庫,如中國中醫科學院信息所的中醫古籍資源數據庫、南京中醫藥大學和浙江中醫藥大學的古籍數據庫等,此外還包括一些專題數據庫,如中醫古籍養生數據庫、溫病大成數據庫、古籍本草有毒重要數據庫等,為我們構建中醫古籍知識庫提供了一定的基礎[8]。在方法上,一些研究者提出基于本體、知識元、知識聚類和知識組織的古籍知識庫構建方法[9-10]。
1.1中醫藥古文獻知識庫中醫藥古文獻知識庫是中國中醫科學院醫史文獻研究所基于知識元的方法構建的中醫古籍知識庫系統,該系統通過專家解析標注形成以知識元為關聯的知識網絡,進而實現中醫古籍知識庫中知識的有效查詢和發現知識。目前該系統包括中醫古籍本草知識庫、中醫古籍方劑知識庫,以及張仲景、陳士鐸、新安醫學、婦科、醫案、蒙醫藥等6個中醫古籍專題知識庫[11]。
1.2基于知識組織的本草古籍知識系統該系統基于本草古籍的體例結構、知識特征確定古籍中本草知識的分類,在此基礎上對各類本草古籍知識進行系統梳理,然后基于本草古籍原文,以藥物為核心,提取名稱、性味、歸經、功用、主治等各類本草古籍知識。通過對原文的解析、關聯,形成以藥物為核心的知識體,以設定的語義類型和語義關系為基礎對各類知識之間的概念關系進行分析,定義知識之間的語義關聯并形成關聯詞表,從而構建成本草古籍的知識庫。
1.3基于本體的溫病古籍知識庫該系統首先確定溫病古籍中知識的本體類,提取中醫溫病古籍中所蘊含的疾病、病因病機、癥狀體征、證候、治則治法、方劑等相關概念、術語和詞匯,并進行規范,通過對概念、關系的分析進行知識的映射,將溫病古籍知識明確、規范地表達,構建中醫溫病古籍本體框架。基于溫病古籍本體,設計和構建了溫病古籍知識檢索系統,實現溫病古籍知識的可視化深度檢索與利用[12]。
1.4方劑古籍知識庫該知識庫包含30余部方劑類古籍文獻,在分析方劑知識特征的基礎上,對存在于古籍文本中方劑知識體、知識元的各種形式進行系統梳理。通過對方劑知識中各種概念間關系的研究,定義各種語義關系,將中醫古籍方劑知識領域各種語義關系分別納入關聯含義和關聯對象兩種分類體系下,以進一步實現對語義類型和語義關系的精確化定義。通過語義關系關聯起中醫古籍方劑知識語義網絡,從而構建起以知識元為核心的知識表示體系[13]。
2.1書目選取及數字化加工數字化是古籍數據庫和知識庫構建的基礎,因此首先要選擇有代表性的中醫養生古籍進行整理和分析,并進行數字化加工處理,獲取中醫養生古籍的原文圖像和文本化數據。
2.2古籍養生知識的獲取與規范基于養生古籍原文,按照不同類型的養生知識,參考相關標準及規范,制定數據提取和分類的原則,基于原文提取、梳理養生古籍知識的概念類型和概念關系,構建中醫古籍養生知識框架。
2.3語義類型和語義關系的定義參考中醫藥一體化語言系統中語義類型設定和語義關系提取的方式,結合古籍養生知識體系的特點,系統整理、分析養生的知識表示和組織方法,歸納和定義養生古籍中各類中醫養生知識的概念類型、概念關系,建立中醫古籍養生知識體系中涉及的概念與概念、概念與名詞之間的內在聯系,構建古籍中醫古籍養生知識語義網絡,形式化表示中醫古籍養生知識。
2.4中醫古籍養生知識的語義關聯參考語義本體或知識組織的方法,對養生理論、服食、起居、導引、情志、針灸、推拿按摩等各類養生知識進行關聯和整合,基于養生知識的概念類型及其內部之間的概念關系進行語義關聯,形成古籍養生知識關聯詞表。
2.5設計并構建中醫古籍養生知識庫知識庫構建的系統構架、數據表和整體框架設計,開發和構建適合于養生知識表達的知識檢索模塊,使用戶能夠通過簡單的檢索得到所需專題的養生知識,實現養生古籍中的知識化檢索與服務。在知識庫構建過程中可利用到本體構建工具,如Protege。知識庫的架構可采用Jena框架。
中醫養生古籍集歷代養生學說之精華,記載有特色、系統、全面的養生理論。雖然養生古籍已經有了一定的數字化基礎,但是深度的開發和利用不足。從中醫古籍數字化資源建設發展歷程看,利用現代信息技術進行中醫古籍整理的手段正在逐步完善,對中醫古籍知識的計算機表達也有了創造性的突破,中醫古籍知識庫的建設已成為古籍數字化未來的發展方向。設計并構建中醫古籍養生知識庫,為中醫古籍專題知識庫的發展起到一定的作用。
[1]高越敏,胡濱.古醫籍助讀(五)——標格資于詁訓[J].浙江中醫學院學報,1986,5(5):42-44.
[2]李兵.中醫古籍數字化整理方案研究[D].北京:中國中醫科學院,2009.
[3]任玉蘭,李政,梁紅,等.中醫古籍數字化建設與知識服務模式的構建[J].世界科學技術:中醫藥現代化,2013,15(1):45-48.
[4]楊繼紅.基于本體的中醫古籍敘詞表構建方法研究[D].北京:中國中醫科學院,2008.
[5]佟琳,劉寨華,唐丹麗,等.中醫古籍“孤島現象”及其對策[J].河北中醫藥學報,2010,25(4):6-8.
[6]楊繼紅.中醫古籍數字化資源建設概述[J].現代情報,2008,28(5):136-138.
[7]劉毅.中醫古籍數字化與知識挖掘[J].圖書館工作與研究,2010,32(12):92-94.
[8]李兵,符永馳,張華敏,等.中醫藥行業古籍數據庫的建設與服務[J].西部中醫藥,2014,27(2):85-87.
[9]賈鳳旭.基于知識類聚的古籍知識庫構建方法[J].圖書館學刊,2015,24(5):45-48.
[10]羅晨光,山川,王珊.基于本體的古籍知識庫建設初探[J].現代圖書情報技術,2007,23(4):8-11.
[11]漆勝蘭.2004-2014年中醫古籍數據庫建設研究進展[J].中國中醫藥圖書情報雜志2015,39(1):60-62.
[12]李兵,張華敏,符永馳,等.基于語義關聯的溫病古籍知識檢索系統的構建研究[J].遼寧中醫雜志,2012,39(12):2403-2404.
[13]丁侃.基于知識元的中醫古籍方劑知識表示研究[D].北京:中國中醫科學院,2012.
Construction Idea of Ancient Books Database for Health Care and Current State of TCM Ancient Books Database
AN Huan,ZHANG Huamin,FU Yongchi,LI Bing△
Institute of Information on Traditional Chinese Medicine in China Academy of Chinese Medical Sciences,Beijing 100700,China
Current state of TCM ancient books database construction was analyzed to explore how to express the knowledge in ancient books about health care fully,accurately and regularly,simultaneously,the thinking and fancy of TCM ancient books database construction were raised.
ancient books about health care;digitized ancient books;TCM health care;data base
R212
A
1004-6852(2016)06-0158-02
2016-02-21
國家中醫藥管理局中醫藥行業科研專項項目(編號201507006-02);中國中醫科學院基礎科研業務費自主選題項目(編號ZZ080318)
安歡(1989—),女,碩士研學位。研究方向:中醫古籍的保護與利用研究。
△李兵(1983—),男,博士學位,助理研究員。研究方向:中醫藥古文獻整理與利用研究、中醫藥信息學研究。