, ,
中醫藥信息資源建設是我國中醫藥事業的基礎性工作,也是中醫藥科技創新體系中不可缺少的重要組成部分。
隨著計算機、現代通訊技術和生物醫學信息技術等的飛速發展,中醫藥信息資源數字化已經成為中醫藥事業發展的必然趨勢。本文在介紹我國中醫藥信息資源數字化建設取得成就及存在問題的基礎上,提出了下一步的發展對策和建議。
我國中醫藥信息資源數字化建設始于20世紀80年代[1],經過幾十年的發展,已經取得了不小成就,同時也存在不少問題。
1.1.1 以數據庫為主體的數字化資源類型多樣
中醫藥信息資源數字化產品包括數據庫、知識庫、電子期刊、電子圖書、網站等,而數據庫是目前中醫藥信息資源數字化建設的主體。
首先,建成數據庫數量可觀。我國的中醫藥信息資源非常豐富,根據上海辭書出版社出版的《中國中醫古籍總目》,我國共有中醫圖書13 000余種,其中產生于1911年以前的中醫古籍共8 927種[2]。
范為宇、崔蒙、陳守鵬等參照相關標準,將我國中醫藥資源分為5個一級類目(主題域)、40個二級類目(主類)、143個三級類目(亞類),5個一級類目為:中醫藥事業、中醫、中藥、針灸、古籍[3]。中國大陸地區的代表性中藥主題數據庫見表1。
根據筆者的網絡調研,目前我國有37家中醫藥高等院校圖書館或圖文信息中心已將或者正在將自身中醫藥信息資源進行數字化,如本校學位論文數據庫、教師論文數據庫、館藏目錄數據庫。不少院校建設了特色數據庫,如廣西中醫藥大學的壯醫壯藥數據庫、江西中醫藥大學的江西省道地藥材數據庫、福建中醫藥大學的閩港澳臺中草藥圖譜數據庫、云南中醫學院的云南地產中草藥(民族藥)數據庫及云南少數民族醫藥單驗方數據庫等。

表1 中藥主題數據庫
另一方面,建成了多個具有代表性的數據庫,如中國中醫科學院中醫藥信息研究所的“中國中醫藥數據庫檢索系統”(http://cowork.cintcm.com/engine/windex.jsp),該系統包括中醫藥數據庫48個,數據總量達120余萬條[4]。大力開發中醫藥數據庫,符合信息資源數字化的大趨勢。
1.1.2 資源內容豐富,古籍資源得到有效開發
我國的中醫藥信息資源是一個巨大的知識寶庫,目前數字化建設涵蓋了古代與現代的中醫藥信息資源。其中,古籍資源得到了有效開發,已經建成的中醫藥古籍數字化產品有書目型數據庫、全文型數據庫、圖像型數據庫、圖文型數據庫、古籍知識庫[5]。中國中醫科學院中醫藥信息研究所自2002年至今,已建成中醫藥珍善本古籍多媒體數據庫和中醫藥古籍資源數據庫,實現了部分中醫古籍的數字化保護與利用[6]。其中,“全國中醫藥珍善本古籍檔案管理系統”、“海外古籍書目數據庫”為書目型數據庫,“中醫藥珍善本古籍多媒體數據庫”為圖文型古籍數據庫。
古籍知識庫的建設突破了其他數據庫僅有的閱讀與查詢功能,“用戶可以進行深層次的知識挖掘,實現由書目到全文等多個知識點的關聯檢索,也可以由一個作者檢索到其他相關作者等”[7],為深層次的知識挖掘開辟了新的道路。中國中醫科學院中國醫史文獻研究所中醫古籍數字化研究室的“中醫藥古文獻知識庫”是其中的代表。該知識庫目前已經建成中醫古籍本草知識庫、中醫古籍方劑知識庫,以及張仲景、陳士鐸、新安醫學、婦科、醫案、蒙醫藥等6個中醫古籍專題知識庫[5]。中醫古籍知識庫的開發與應用將促進我國中醫藥信息資源的開發與運用。
1.1.3 建設隊伍擴大,部門合作加強
我國的中醫藥信息資源數字化建設已經形成了多部門參與、協調合作的建設格局。研發隊伍得到了有效擴充。以中醫藥院校圖書館和研究院所為主,中醫醫院、商業機構等也都加入了開發的隊伍。如中醫醫院利用自身的臨床經驗、病歷等資源優勢,開發了數據倉庫和平臺。多部門的加入,使中醫藥信息資源的數字化產品類型更為多樣、內容更為豐富。機構之間的交流與合作得到加強,中醫藥類機構之間合作建設數字化信息資源,如我國已經建立了中醫藥虛擬研究院[8],在研究內容與項目管理等方面具有極大優勢[9]。在虛擬研究院中,組織了全國30余所省級中醫藥院校和研究院所的數百位中醫藥專業人員共同建設數據庫,并研制了中藥科技數據庫的技術規范、操作規程及遠程管理模式,實現了在線人員監控、數據安全管理、用戶權限控制;在虛擬管理控制下,建立了數據加工、初級審校與終審等不同職責管理制度,實現了無障礙遠程辦公,超越了地域限制,成為直觀管理人員與數據的控制臺。同時單位之間資源共享,減少了重復開發,目前很多中醫藥大學的圖書館機構都購買了中國知網、萬方醫學網等電子期刊,以及讀秀、超星等電子圖書[10]。
1.2.1 資源開發深度有待提高
中醫藥信息資源數字化建設在開發的深度上有待提高。具體表現為具有深度挖掘、知識組織等功能的知識庫、數據倉庫、數據分析平臺的建設剛剛起步,僅有中國中醫科學院及其下屬醫院、北京中醫藥大學及其下屬醫院等少數機構開發了一些數字化產品,其他機構尚無具有應用意義的產品。從中醫藥古籍知識庫建成的產品來看,具有挖掘功能的僅有以“中醫藥古文獻知識庫”為代表的少數幾種。萬方醫學網的“中醫藥系統”號稱“可以從癥狀、體征和證候檢索到其與什么疾病相關,可查到同時包含幾味中藥、治療疾病的方劑群,可查到具有某種功效、性味、歸經、藥理作用的中藥,包含有具有君臣佐使、方劑以及配伍等信息的經典方;方劑數據庫中含有病癥對應關系的經典方與方劑歌訣,整理了方劑中加減中藥與癥的關系”[11],但該知識系統主要是整合了萬方醫學網的相關資源,并沒有完全達到知識組織的層面。中國知網的“中國醫院知識倉庫”也存在這方面的問題。
1.2.2 缺少音頻、視頻類產品
目前的數字化中醫藥信息資源以文字為主,音頻、視頻類產品非常少,代表性資源僅有萬方的“醫學視頻數據庫”。該數據庫雖然解決了權威性、版權糾紛等問題,但視頻數量有限且費用較高。單靠看書、閱讀難以參透中醫藥知識,需要輔以口耳相傳等方式,學生大部分時間需要自學,視頻與音頻是自學的重要資源,研發中醫藥的音頻與視頻產品可以促進中醫藥繼續教育的發展。
1.2.3 資源的可獲取性較低
非公開獲取與收費服務削弱了信息的可獲取性。目前權威、綜合的數字化資源多是收費服務,數字圖書館則除了收費之外,還需要安裝特殊的閱讀器,這都影響了資源的可獲取性。該問題主要有兩方面的原因:一是研發這些數字化產品的多為商業機構,收費服務是其生存的必然要求;二是技術標準尚未統一,目前電子期刊基本上采用CAJ或PDF閱讀器,電子圖書出版商多使用自身的閱讀器。數字化產品技術標準的不統一容易導致用戶放棄使用。
加強中醫藥信息資源的深度開發,是中醫藥信息資源數字化建設的當務之急。今后中醫藥信息資源的數字化建設應該從中醫藥文獻的分類與匯總轉向智能分析。一是整理、評估現有資源。目前各建設機構的資源之間存在孤立的現象,首先要整理自身的資源。在此基礎上,對其產品進行相應的質量評估,以確定進一步開發的對象。中醫藥信息資源的深度開發是一項大工程,各單位由于人力和財力的限制,需要有選擇地進行深度開發。二是加強中醫藥信息資源數字化的理論研究。中醫藥與現代科技的融合尚有不少理論問題需要解決,中醫學的知識結構、知識表示、知識獲取等理論尚未取得實質性的突破,這制約了中醫藥信息資源的深度開發。以中醫藥本體研究為例,中醫藥本體的構建非常復雜,僅國家知識基礎設施(CNKI)課題中,中醫本體劃分就有中醫診斷方法、中醫術語、中醫證、中醫脈象、中醫病機等30多個中醫本體類[12]。每一類本體的構建都只能從其子領域進行,工作量巨大。雖然有人進行了基于歷史文獻的中醫藥本體的自動構建研究[13],但其研究進展較為緩慢,理論的滯后制約了應用的發展。
各單位要在了解自身優劣勢的基礎上,開發具有特色的數字化資源。如在教學視頻建設方面,中醫藥高校具有一定的優勢,可攝制更多權威性、高品質的中醫藥課程教學視頻。在道地藥材的數字化建設方面,各地區的信息資源建設機構無疑具有先天的優勢。
任何資源只有用戶使用才能顯示價值。用戶的閱讀習慣、信息需求、知識獲取行為等在不斷變化,需要我們充分了解。只有做好用戶研究工作,才能開發出用戶需要的產品。
中醫藥信息資源數字化能使中醫藥的海量信息得到全面、高效的存儲、采集、利用,有利于中醫藥知識的傳播。目前,我國中醫藥信息資源數字化建設已經取得了一定成就,促進了中醫藥事業發展,但由于中醫藥信息資源的特殊性,今后的數字化建設需要加強資源開發深度,做好用戶研究工作,并注重特色資源的建設。