張云琪
(南京中醫藥大學中醫藥文獻研究所 江蘇省南京市 210023)
肝病是指發生在肝臟的病變,是臨床的常見病,中醫在肝病治療方面有明顯的療效。《中醫臨床病證大典肝病篇》(以下簡稱“病證大典”)擬整理歸納歷代中醫藥經典文獻中與肝病相關的論述,便于廣大師生和中醫醫療工作者總結學習肝病臨證經驗。但是中醫藥經典文獻數據量大,從中尋找相關的肝病數據比較困難。本文利用J2EE設計和開發了一個肝病中醫文獻抽取解析及數據協同化管理軟件,該軟件利用模式匹配技術,對中醫藥經典文獻中的文獻資料進行抽取和解析,能把與肝病有關的病名、病因、病機、病證、治法、用方、用藥、醫話醫案等相關數據自動提取出來,提高了“病證大典”的數據采集效率。同時,如果依次設置“病證大典”出版文字段落的樣式,重復性工作很多,且容易出現錯漏,不易檢查。本軟件通過Spire.Doc組件批量設置格式,然后把相關數據導出,直接得到排版好的Word文檔,為編寫工作提供了很大的便利。
假設有子串P,字符串T,現在要從T中找到所有與P相同的子串索引,這就是模式匹配。考慮到模式匹配在實際使用時的復雜性,結合中醫藥文獻的特點,必須選用合適的模式匹配算法,達成能夠自動、精確地抽取解析數據的目標。
Spire.Doc for Java是對Word文檔進行操作的Java組件。使用它可以將許多Word文檔任務(如創建文檔、編輯文檔等)集成到Java應用中,以實現預設定格式并對文檔批量化處理的功能。……