摘要:巴蜀中醫藥古籍是極具地方特色的珍貴民族文化遺產和精神財富,為我國中醫藥事業的發展增添了光輝篇章。目前,巴蜀中醫古籍存在存藏狀況不清、整理研究欠缺、古籍所蘊含的知識傳承推廣艱難等問題。巴蜀中醫古籍知識庫集書目、全文數據、深度挖掘利用為一體,以建設綜合性數據集成知識庫、構建可開展深層次知識挖掘的中醫古籍數據平臺為目標,以巴蜀中醫古籍原始文獻庫、巴蜀中醫溫病特色專題庫、巴蜀中醫手稿文獻庫、巴蜀中醫名家處方脈案庫等為建設內容,以期為巴蜀中醫藥研究提供便捷、高效、多樣的檢索與知識發現路徑,促進巴蜀中醫藥學術的傳承和創新發展,同時為同類中醫古籍知識庫建設提供參考。
關鍵詞:巴蜀;中醫;古籍;知識庫;建設思路;設計
中圖分類號:G255.1;G250.74;R2 文獻標識碼:A 文章編號:2096-4110(2024)11(b)-0098-05
Discussion on the Construction of the Knowledge Base of Traditional Chinese Medicine Ancient Books in Bashu
ZHANG Xiaojin1, LIN Ying1, ZHAO Qiong1,2
(1. The Library, Chengdu University of Traditional Chinese Medicine, Chengdu Sichuan, 611137, China; 2. Hospital of Chengdu University of Traditional Chinese Medicine / School of Clinical Medicine,Chengdu Sichuan, 610075, China)
Abstract: The ancient books of traditional Chinese medicine in Bashu are precious cultural heritage and spiritual wealth with local characteristics, adding a glorious chapter to the development of China's traditional Chinese medicine industry. At present, the storage status of ancient Chinese medicine books in Bashu is unclear, and there is a lack of sorting and research. The knowledge contained in ancient books is difficult to inherit and promote. The Bashu Traditional Chinese Medicine Ancient Book Knowledge Base integrates bibliographic data, full-text data, and deep mining and utilization, with the goal of building a comprehensive data integration knowledge base and constructing a traditional Chinese medicine ancient book data platform that can carry out deep level knowledge mining. The construction includes the original literature library of Bashu traditional Chinese medicine ancient books, the special topic library of Bashu traditional Chinese medicine warm diseases, the manuscript literature library of Bashu traditional Chinese medicine, and the prescription book library of Bashu traditional Chinese medicine masters, in order to provide convenient, efficient, and diversified retrieval and knowledge discovery paths for the research of traditional Chinese medicine in Bashu, and promote the inheritance and innovative development of Bashu traditional Chinese medicine academia. At the same time, it provides reference for the construction of similar traditional Chinese medicine ancient book knowledge bases.
Key words: Bashu; Traditional Chinese Medicine; Ancient books; Knowledge base; Construction ideas; Design
巴蜀中醫藥源遠流長,《山海經》中就有先秦巫醫在巴蜀的活動軌跡記載。此后,在巴蜀地區獨特的地域環境下,孕育出眾多巴蜀醫家,其獨特的臨床辨證施治、鮮明的用藥特色、豐富的醫學著作等,促進了我國中醫藥學術理論的創新發展,是獨具特色的寶貴民族文化遺產和精神財富。
2019年,《中共中央 國務院關于促進中醫藥傳承創新發展的意見》提出,要“挖掘和傳承中醫藥寶庫中的精華精髓,加強典籍研究利用”,要“建立國家中醫藥古籍和傳統知識數字圖書館”等。2023年,《“十四五”中醫藥文化弘揚工程實施方案》提出“推動中醫古籍的數字化挖掘”等。在當前國家大力弘揚中華傳統中醫文化的背景下,緊跟巴蜀中醫藥研究發展趨勢,加快推進中醫典籍傳承、文獻的收集整理及數字化信息處理,加大巴蜀中醫藥研究數據支撐平臺建設勢在必行。
1 中醫古籍知識庫研究現狀
信息化和大數據時代的到來,為古籍文獻資源智能處理開啟了嶄新篇章。古籍數字化是指采用計算機技術,將語言文字、圖形,轉化為計算機可識別的數字符號,其目的在于保護和利用古籍,是未來古籍進一步開發、利用和保護的關鍵。隨著信息技術的發展,古籍數字化的內涵不斷豐富,包括對古籍內容的斷句、標點、實體識別及內容分析等[1-3],逐漸從單一的古籍目錄、圖像庫轉為古籍數智庫[4]。
在對古籍的研究中,中醫古籍是最早被關注與研究的對象。目前,中醫古籍數據庫按照內容不同,可以分為醫家專題、地域專題、學科專題等專題數據庫和《黃帝內經》《針灸大成》等專書數據庫,按照數字化深度可以分為書目數據庫、全文數據庫和知識庫。其中,知識庫結合了數據庫與人工智能的特點,可提供專業化、精準化、特性化的古籍文獻的檢索、閱讀及深層次挖掘服務,在信息的高效獲取、知識挖掘、學術傳承等方面具有優勢[5]。近年來,研究者針對中醫古籍知識庫開展了許多有益探索,如鄒曉嵐[6]通過對溫病學派古籍知識多角度描述,構建溫病學派古籍知識檢索系統。盧克治[7]提出基于深度神經網絡對中醫古籍命名實體識別及抽取,構架中醫古籍知識圖譜庫。湯偉平[8]等將本體引入嶺南溫病古籍知識庫的構建,挖掘嶺南地域古籍隱含知識,實現古籍文獻知識提取、推理及發現。李賀等[9]基于本體,對簡帛醫藥抽取實體概念及實體關系,并構建簡帛醫藥文獻知識圖譜。目前,我國中醫古籍數字化資源建設已取得一些可喜成績,部分實現隱性知識的挖掘,但存在中醫古籍知識庫建設標準制定不統一,知識庫資源不足、數據量少及挖掘結果存在局限性等問題。
巴蜀中醫作為中國獨具特色的地域醫學流派,在中國悠久的醫學發展史中占據了舉足輕重的地位。歷經數千年的傳承與發展,巴蜀中醫古籍所承載的學術思想和豐富的臨床經驗,是巴蜀中醫實踐的真實寫照,形成了巴蜀中醫獨特的診療體系和風格,是巴蜀中醫學術傳承與進步的寶貴財富。四川振興中醫工作開展以來,巴蜀中醫藥及其文獻研究都取得了長足進步,但目前巴蜀中醫古籍存藏狀況不清,存在重藏輕用、整理研究欠缺、古籍文獻資源未被深度發掘整理和利用、古籍知識傳承推廣艱難等諸多問題。
2 巴蜀中醫古籍知識庫建設的意義
2.1 促進巴蜀中醫藥文獻深入研究、挖掘利用
信息時代為中醫學術傳承提供了新的路徑。利用現代信息技術將巴蜀中醫古籍文獻中的文字或圖像轉化為可被計算機系統識別的信息數據,建立巴蜀中醫古籍書目數據庫、全文數據庫及知識庫,進而實現海量文獻的整理、存儲、檢索、閱讀、傳輸等,最終達到保護、利用和挖掘文獻知識的目的。巴蜀中醫古籍知識庫平臺的探索構建,不僅是巴蜀特色中醫古籍再生性保護工作的重要內容,更是在中華傳統中醫文獻知識載體改變的前提下,為深入研究、挖掘利用巴蜀中醫文獻開辟了更廣闊的學術研究空間。
2.2 助力中醫古籍知識開放協作、共建共享
目前,中醫古籍文獻數字化已經取得顯著成效,并建立了不同類型的數據庫,很大程度上實現了保護和利用中醫古籍文獻的目的。近年來,在數字人文思想影響下,將語義技術、數據庫技術與特色文獻相結合,開啟了古籍文獻資源智能處理的新篇章,實現共建共享。知識庫作為高效保管知識的工具,在解決海量信息無法得到充分利用的情況下有著現實的意義,是未來中醫古籍研究的發展趨勢。基于地域性流派的綜合性古籍文獻知識庫建設還處于起步狀態,“巴蜀中醫古籍知識庫平臺”將進行積極有益的探索和實踐,注重數據平臺的可持續擴展,為技術的更新升級及文獻的漸次深度挖掘奠定良好基礎。
2.3 推動巴蜀中醫藥的傳承與發展
巴蜀中醫藥在促進中國醫學的學術發展中具有舉足輕重的作用。漢代的涪翁、程高、郭玉,晉代的李常在、李八百,唐代昝殷,宋代本草學家唐慎微等醫家學術著作頗豐,如《玉函經》《經效產寶》《經史證類備急本草》《史載之方》《韓氏醫通》等對后世醫學產生了深遠的影響,形成了獨具特色的巴蜀醫學。在川渝兩省市強勢聯動發展的當下,系統全面收集各個時期巴蜀地區中醫藥文獻資源,建立巴蜀中醫古籍數字平臺,將古籍的特點與現代信息技術的優勢相結合,實現多功能、多層次、多維度的資源服務模式,對發揮巴蜀中醫藥優勢與特色、促進巴蜀中醫藥文化傳承十分重要,對我國傳統古籍文獻的現代化整理與利用具有積極的示范引領作用。
3 巴蜀中醫古籍知識庫的構建
3.1 建設思路
巴蜀中醫古籍知識庫核心內容是依據多層次、細粒度的數字化巴蜀中醫文獻知識點,構建多層級知識標注的文獻知識庫,并圍繞該知識庫挖掘巴蜀中醫文獻的知識傳承和演化脈絡。建設過程主要遵循巴蜀中醫文獻及相關信息資源的數字化、中國古代醫學文獻的多層級語義標注及知識庫構建,基于多層標注中醫古籍知識庫的知識挖掘這一主線展開,以提供綜合性巴蜀中醫研究的數據支撐。
3.2 建設內容
根據內容側重不同,巴蜀中醫古籍知識庫以巴蜀中醫古籍原始文獻庫為主題,涵蓋巴蜀中醫溫病特色專題庫、巴蜀中醫手稿文獻庫、巴蜀中醫古籍修復檔案庫,并拓展延伸建設巴蜀中醫名家處方脈案庫、巴蜀中醫文獻展廳等。
3.2.1 巴蜀中醫古籍原始文獻庫
巴蜀中醫古籍原始文獻庫存儲數字化掃描的原始圖像及其元數據。巴蜀地區名醫輩出,留存了大量的中醫古籍,記載了豐富的中醫知識,具有重要的文獻價值。古籍數字化后,讀者可通過數據庫進行相關文獻的查閱,避免翻動造成古籍損壞,是保護和傳承巴蜀中醫古籍的重要途徑。
3.2.2 巴蜀中醫溫病特色專題庫
溫病是感受溫邪引起的一類外感急性熱病的總稱。現代醫學中許多急性傳染性疾病均屬于瘟病的范疇,如麻疹、傷寒等。溫病學的發展經歷了漫長的過程,有效防治了對人類健康帶來極大危險的感染性疾病。巴蜀中醫溫病特色專題庫的建立,對于“傳承精華,守正創新”,發揮中醫藥防病治病的優勢與作用,增強中醫自信,造福社會,皆有重要意義。
3.2.3 巴蜀中醫手稿文獻庫
稿本是一部書的原始形態,包含作者的早期思維軌跡、思想發展脈絡,是傳承至今未經修改的作者思想呈現載體,具有重要的文獻價值。作為古籍文獻流通的重要補充形式,稿本相較于印刷刻印版本的古籍而言,具有稀缺性、原真性的特點,從而具有重要的學術研究價值。許多中醫書法造詣頗深,其手寫的文獻同時兼具書法價值。巴蜀中醫手稿庫的建立,旨在將“束之高閣”的珍貴原始文獻資料以數字資源方式化身千百,嘉惠杏林,促進中醫藥文化資源的整理及挖掘利用。
3.2.4 巴蜀中醫名家處方脈案庫
醫家手寫的處方、醫案反映了醫家的辯證思路、臨床用藥風格等,是研究巴蜀中醫的重要資源,極具文獻和臨床研究價值。巴蜀中醫名家處方脈案庫的建立,為系統研究巴蜀中醫的學術思想、用藥特色及近現代巴蜀中醫的發展提供文獻支撐,為中醫藥文化提供新的理論依據,推動中醫藥事業的發展。
3.2.5 巴蜀中醫古籍修復檔案庫
受自然條件、保存條件等影響,傳世古籍經歷了戰火、離亂,其中有大量的古籍存在糟朽、絮化、粘連等情況,而當前古籍修復人員嚴重不足,出現古籍傳承保護與利用的矛盾與危機。巴蜀中醫古籍修復檔案庫的建立旨在為古籍修復與保護提供優秀的修復案例和修復檔案,為古籍修復提供優秀的成果借鑒,延續古籍壽命,促進中醫古籍的傳承與發揚。
3.2.6 巴蜀中醫文獻展廳
巴蜀地區名醫輩出,或懸壺巴蜀或外地游歷或收徒傳授或著書立說,為中醫傳承及發展作出了重要貢獻。巴蜀地區中藥資源豐富,中藥種類及道地藥材數量居全國前列。巴蜀中醫文獻展廳旨在通過圖片、音視頻等資料線上展示巴蜀中醫名家風采、信函往來及巴蜀特色中藥材等,以彰顯前賢、鼓勵后學。
3.3 結構設計
對數據進行探索性分析,包括空缺值比例統計、特征分布統計、特征拓展及變量相關性分析等,根據數據探索性分析的結果,對巴蜀中醫古籍數據進行預處理及合理的特征選擇構建知識庫。對主題數據進行管理和維護,以支持后期可能會進行的數據修正和數據更新操作;數據挖掘處理,通過采用傳統數據挖掘方法,如關聯規則、貝葉斯分類等進行關聯、分類知識的發現;統計用數據導出,通過條件篩選,導出指定統計用數據子集等。數據庫平臺設計核心包括數據管理層(資源中心)、數據承載層(平臺支撐)和用戶層。
3.4 技術應用
開發系統中所有應用都是基于JavaEE,擬采用B/S模式的基于網絡的Web應用程序架構。服務器采用Linux操作系統,后臺數據庫使用mysql,使用JAVA語言的MVC開發模式,輔以html語言進行頁面展示,開發工具使用IDEA、Navicat for MySQL、JavaScript等。各用戶通過使用瀏覽器訪問系統服務器,采用用戶身份證實名認證機制和用戶密碼加密等技術,保證數據信息的傳輸安全。前端開發技術采用成熟的Bootstrap、Layui、Viewer實現,json格式實現數據的交換。
3.5 設計特色
目前,各高校圖書館、公共圖書館建設的中醫古籍數字資源庫仍以書目數據庫、全文影像數據庫為主,少數商用數據庫能實現全文檢索,但檢索方式單一,缺乏對古籍內容的深度挖掘,主要側重點還是資源型服務。某些高校圖書館自建的古籍數據庫,“還只能實現單一詞條檢索,雖然查全率有保證,但是查準率太低”[10]。在信息技術飛速發展的今天,從建設資源型服務數據庫轉向提供知識型服務的知識庫是古籍數字化發展的趨勢,也是未來主流技術的發展方向。
3.5.1 知識性服務特色
巴蜀中醫古籍知識庫立足于豐富的巴蜀中醫古籍資源,在做好基本資源型服務的基礎上,通過對中醫古籍進行多層次、細粒度的知識標注,實現知識點的提取,并將各知識點關聯與整合,能夠進行多個維度的關聯檢索。在此基礎上,通過對古籍內容知識的數據分析及預處理,構建知識倉庫,為研究者提供較為深入的知識型服務。這不僅是適應古籍數字化工作的新要求,同時也是落實國家“十四五”規劃提出的“構建智慧圖書館”目標的積極嘗試。
3.5.2 系統功能設計特點
長期以來,各高校圖書館、公共圖書館各自為政,缺乏統一的建設標準,在一定程度上造成了數據資源的重復和浪費[11]。巴蜀中醫古籍知識庫的系統功能模塊在開放共享、資源集成、用戶體驗等方面進行多方有益嘗試。巴蜀中醫古籍知識庫在建設之初,需充分考慮資源共享的需求。系統中預留了OAI-PMH標準元數據共享收割接口、RDF管理接口,以拓展升級古籍元數據共享、大數據整理、知識圖譜展示等功能,為后期實現館際共享、擴充資源庫內容做好準備。在資源建設方面,系統需支持圖片、文字、音頻、視頻等多種資源格式,最大限度地保留了巴蜀中醫古籍資源的完整性、有效性,實現巴蜀中醫古籍資源收集、展示、利用的多樣性特色。此外,針對自學難以領會中醫藥知識內涵的情況,加入音頻、視頻資源,幫助初學者理解中醫藥基礎知識,提升知識庫服務效能。同時,將線上資源延伸到線下,通過線下展廳的數字終端將巴蜀中醫古籍知識庫的資源內容面向公眾進行展示展覽,拓寬服務路徑。
巴蜀中醫古籍知識庫采用本地化部署OCR文字識別軟件,可以較好地保障用戶自身資源和數據的安全。同時,OCR軟件可根據用戶使用情況進行人工智能訓練,自動提升準確率。此外,后臺管理系統增加多個個性化功能,可設置多級管理權限,嵌入古籍著錄、古籍修復等多種管理工具,針對實際需求設計工作流程、定制功能模塊、優化業務流程、提升優化用戶的體驗和觀感,實現古籍內容的增值利用、可視化展示及知識挖掘。巴蜀中醫古籍知識庫的系統設計構想以此為基礎,在實際的操作和運行中,堅持以用戶需求為導向,根據用戶使用體驗及古籍資源分類整理情況不斷做出調整,持續優化和完善相關功能,更好地發揮自身效能。
4 對中醫古籍知識庫構建的建議
4.1 加快中醫古籍知識庫建設標準制定
中醫古籍知識庫作為存儲和利用中醫文獻的數據平臺,對中醫藥的傳承研究工作具有重要價值。構建多層次、多系統認可的,從元數據著錄、數據格式、圖像處理、平臺搭建等方面設立標準的中醫知識庫,有助于更大范圍的資源共建共享,并避免重復和資源浪費,同時為各單位的古籍知識庫建設工作提供規范化指導。
4.2 豐富中醫古籍知識庫建設資源
海量的資源是中醫古籍數據庫建設的基礎,決定數據庫價值的重要因素。目前,中醫古籍主要存于省市各級公共圖書館、高校圖書館,單一館的存儲量有限,且多數善本秘藏易于被“庋藏深閨”。針對這一難題,在數據庫建設時,通過多方合作,擴充數據庫資源,同時探索基于中醫藥文獻本體的知識組織與知識檢索理論、方法,構建實現知識的相關性與智能檢索的綜合性知識庫平臺,是解決上述問題的重要途徑。
5 結束語
巴蜀中醫藥文化作為巴蜀文化的重要組成部分,在中醫的發展和學術研究中具有舉足輕重的作用,孕育了眾多名垂青史的醫藥大家,其臨床經驗及治學方法是極其寶貴的民族文化遺產和精神財富。巴蜀中醫古籍知識平臺的建設,有效解決了長期以來古籍“藏”與“用”的矛盾,用戶足不出戶即可檢索、閱讀、整理、分析所需資源,將有效降低用戶對傳統紙質文獻和藏書館的依賴、大大節省科研成本、提高科研效率、推動巴蜀中醫學的發展和研究,對巴蜀中醫文化的宣傳、普及具有重要意義。同時,基于地域性流派的綜合性文獻知識庫建設的積極有益探索和實踐,極具現實應用價值和指導意義。
參考文獻
[1] 李明杰,楊璐嘉.基于GIS的明代古籍版刻地理信息系統的設計與實現[J].信息資源管理學報,2020,10(3):125-133.
[2] 歐陽劍,梁珠芳,任樹懷.大規模中國歷代存世典籍知識圖譜構建研究[J].圖書情報工作,2021,65(5):126-135.
[3] RUSSO G,AIOSA L,ALFANO G,et al.MAGIC:Manuscripts of Girolamini in Cloud[J].IOP Conference Series Materials Science and Engineering, 2020,949:12081.
[4] 陳濤,楊鑫,夏焱,等.古籍知識庫互聯互通框架研究與設計[J].大學圖書館學報,2023,41(4):58-64.
[5] 李筱穎,李鴻濤,張偉娜,等.基于SWOT-PEST模型的中醫古籍知識庫建設策略分析[J].世界科學技術-中醫藥現代化,2023,25(6):1927-1934.
[6] 鄒曉嵐.溫病學派古籍的知識圖譜構建與應用[D].長春:長春中醫藥大學,2023.
[7] 盧克治.基于中醫古籍的知識圖譜構建與應用[D].北京:北京交通大學,2021.
[8] 湯偉平,許堅,李兵,等.嶺南溫病古籍知識庫構建的思路探討[J].中國醫藥導報,2020,17(11):136-139.
[9] 李賀,祝琳琳,劉嘉宇,等.基于本體的簡帛醫藥知識組織研究[J].圖書情報工作,2022,66(22):16-27.
[10]曹霞,李君.我國高校中醫古籍數字化建設的再思考[J].中文科技期刊數據庫(全文版)圖書情報,2021(6):164-166.
[11]王詠梅,高宇,任書俊,等.安徽中醫藥古籍書目提要數字化建設探析[J].合肥師范學院學報,2023,41(3):5-9.
基金項目:四川省社科聯項目“巴蜀中醫古籍知識庫平臺構建”(項目編號:SC22A025);四川省社科聯項目“蘇軾醫學思想整理研究及知識圖譜構建”(項目編號:SCJJ23ND263);四川學術成果分析與應用研究中心項目“數字人文視野下川派名醫處方箋的整理研究”(項目編號:SCAA24-B07);成都市社科聯項目“成都名中醫處方箋整理及知識圖譜構建研究”(項目編號:2024CS088)。
作者簡介:張肖瑾(1990-),女,山西運城人,碩士,副研究館員。研究方向:館藏文獻資源建設,中醫古籍數字化建設及文獻研究。
通信作者:趙瓊(1972-),女,四川樂山人,博士,教授。研究方向:中醫學臨床及文獻研究。通信郵箱:823691452@qq.com。