趙凱 王華星 施娜



摘要 知識圖譜與自然語言處理技術和搜索技術的結合越來越廣,成為了近年知識服務領域研究的新熱點。目前知識圖譜在中醫藥領域的應用主要集中在可視化分析,尚無能夠支持自然語言處理領域和知識服務領域的中醫知識圖譜。本研究使用了Neo4j圖數據庫構建了基于《傷寒論》桂枝湯類方的小型知識圖譜,可以實現對桂枝湯類方的證、方、藥的可視化分析以及檢索等功能。研究結果證明了這種方法的可行性,并為今后將中醫類知識圖譜與深度學習技術相結合應用的開發奠定了基礎。
關鍵詞 知識圖譜;圖數據庫;傷寒論;桂枝湯;自然語言處理;Neo4j;中醫類方;方證
Abstract In recent years,the increasingly wide combination of knowledge graph,natural language processing as well as search technique has become a new hotspot in the field of knowledge service.Nowadays,the application of knowledge graph in the field of traditional Chinese medicine(TCM)is mainly focused on visual analysis.There is still no TCM knowledge graph that can support the fields of natural language processing and knowledge service.In this paper,Neo4j graph database is used to construct a small knowledge graph based on Guizhi Decoction associated formulas in Treatise on Cold Damage,which can realize functions of visual analysis and searching on syndromes,formulas and medicines of Guizhi Decoction associated formulas.Results of the study prove the feasibility of this method,and lay the foundation for future development of the combination of TCM knowledge graph and deep learning technology.
Key Words Knowledge graph; graph database; Treatise on Cold Damage; Guizhi Decoction; Natural language processing; Neo4j; Chinese medicine formula; Formula and syndrome
中圖分類號:R222 文獻標識碼:A doi:10.3969/j.issn.1673-7202.2019.10.019
傳統AI技術如深度學習,如果沒有預先標定好的高質量的大規模數據集,在面對錯綜復雜的臨床醫學決策時往往也束手無策,這時候,來自現實世界的經驗和知識就顯得格外重要。各種機器學習算法雖然在數據的預測能力上很好,但是在描述能力上非常弱,而知識圖譜對于數據的描述能力非常強大,恰好填補了這部分的空白。知識圖譜在國內還屬于一個比較新興的概念,是2012年由谷歌公司首次提出。知識圖譜本質上是一種語義網絡的知識庫,是一種基于圖的數據結構,由節點和邊組成,主要用來描述真實世界中存在的各種實體概念以及之間的關系。在知識圖譜里,每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關系”。……