保麗娟+++劉虹
摘要:概述云南民族醫藥文獻數字化建設的現狀,根據云南少數民族醫藥文獻的特點,提出云南民族醫藥文獻數字化元數據方案應遵循簡潔準確性原則、通用性及針對性原則、共享性與互操作性原則、可擴展性原則、用戶需求原則等設計原則。同時,結合調查研究,描述了云南民族醫藥文獻數字化元數據方案的設計思路。
關鍵詞:云南省;民族醫藥文獻;元數據
doi: 10.3969/j.issn.2095-5707.2014.03.008
Discussion on Metadata Schemes for Yunnan Minority Medical Literature
Bao Lijuan, Liu Hong*
(Yunnan University of Traditional Chinese Medicine, Kunming Yunnan 650500, China)
Abstract: The article overviewed the current situation of digitization of minority medical literature in Yunnan, and proposed that the metadata schemes for Yunnan Minority medical literature should follow the principles of simplicity and accuracy, versatility and pertinence, sharing and interoperability, scalability and user needs according to the characteristics of Yunnan Minority medical literature. At the same time, it also described the design ideas of Yunnan Minority medical literature metadata schemes combining investigation and research.
Key words: Yunnan Province; minority medical literature; metadata
云南民族醫藥文獻資源是云南各少數民族在漫長的歷史繁衍中總結并流傳下來的寶貴醫藥文化遺產,具有珍貴的史料和實用價值。數字化建設是長期保存和有效利用這些資料的最佳手段。
1云南民族醫藥文獻概述
近幾年來,通過政府資助、基金資助、聯盟資助、中央財政支持地方高校等項目,我省民族醫藥文獻數字化工作已經起步,并取得了初步的成果,省內多個民族醫藥科研單位先后開展了云南少數民族醫藥文獻目錄的研究整理、少數民族單驗方的研究整理,少數民族天然藥物的調查研究以及少數民族醫藥文化等多方位的少數民族醫藥文獻研究課題,如云南省藥物研究所主持開發了“云南特色天然藥物共享信息系統”,云南中醫學院主持開發了“云南民族藥物信息系統”、“云南少數民族醫藥單驗方數據庫”、“云南民族醫藥肝病單驗方數據庫”、“云南地產中草藥(民族
基金項目:云南省哲學社會科學規劃項目(QN2013057)
第一作者:保麗娟,館員,研究方向:中醫藥信息管理。E-mail: daibaoauto@163.com
*通訊作者:劉虹,教授,研究方向:中醫藥文獻信息。E-mail: 13700694229@163.com.
藥)數據庫”,云南民族大學主持開發了“民族藥(傣藥)數據庫”等信息系統。這些數據庫都是在云南省各少數民族民間常用的民族藥、單方、驗方等民族醫藥信息資源進行收集整理的基礎上,利用現代信息技術進行數字化加工存儲。這些數據庫提供了方便快捷的檢索查詢功能,生動直觀地反映了云南各少數民族的醫藥資源狀況,為政府、企業、科研單位和醫藥工作者研究、開發、保護和利用云南省的民族醫藥提供比較全面、完整的信息資料。同時也為珍貴的民族醫藥資料提供了存儲平臺,對于深入研究少數民族醫藥理論和開發云南特色民族藥物都具有重要的意義。
盡管如此,云南民族醫藥文獻數字化工程還處于初期階段,有不少問題需要解決,例如數據庫功能結構單一,各數據庫相互獨立,有的數據庫是基于C/S結構模式開發的,嚴重限制了民族醫藥文獻資源的傳播和共享[1];有些數據庫如“云南地產中草藥(民族藥)數據庫”和“云南少數民族醫藥單驗方數據庫”,雖然使用的是同一數字化平臺,但由于缺乏統一規范的元數據方案指導,導致數據庫處于各自獨立的狀態,數據庫結構和元數據元素不盡相同,不能實現資源的整合挖掘,無法發揮數據庫的最大效用。如此參差不齊的元數據規范嚴重限制了民族醫藥文獻資源的傳播和共享利用,不利于知識發現和創新。因而制訂統一規范的云南民族醫藥文獻數字化元數據方案是云南民族醫藥文獻數字化建設的首要問題。
2元數據及業內研究進展
元數據(Metadata)是“關于數據的數據”[2],元數據為多種不同形態的信息資源提供了統一規范的描述方法,是文獻數字化建設中的重要組成部分,民族醫藥文獻元數據就是對民族醫藥文獻資源的內容、屬性及特征進行描述,并對民族醫藥信息資源進行組織、定位和數據管理,以便于信息需求者進行檢索和利用的一種結構化的數據。制訂統一規范的云南民族醫藥文獻數字化元數據方案,有助于實現云南各民族醫藥數據庫系統的互操作和民族醫藥信息資源的共享,達到民族醫藥知識發現和創新以及對民族醫藥信息資源整合的目的。
目前國內還沒有相關的民族醫藥文獻元數據標準,但是關于中醫藥文獻的元數據標準建設已經取得了很大的突破。由中國中醫科學院中醫藥信息研究所于2012年提出的“Traditional Chinese Medicine Literature Metadata(中醫文獻元數據)”作為一項ISO技術規范(Technical Specification)得到成功立項,編號為ISO/DTS 17948,經過中國、韓國、英國、美國等多國專家的多次會議討論和反復修改,該標準的草案已于2013年完成[3],目前該標準已進入編輯出版階段。該標準的頒布,將會對中醫藥及民族醫藥文獻資源數字化規范建設的發展起到極大的推動作用。
3云南民族醫藥文獻數字化元數據方案設計原則
民族醫藥文獻資源不同于一般的中醫藥文獻資源,有大量不同類型的民族醫藥文獻素材,如古籍文獻、論著、民族天然藥物圖譜等傳統文字載體文獻以及各民族在從事醫療活動中的口碑經驗、民間流傳的歌謠和視頻、錄音等非文字載體文獻,并且同時存在民族文字文獻和漢字文獻等情況[4],因此,民族醫藥文獻元數據方案應該在中醫藥文獻元數據標準的基礎上體現出民族醫藥文獻的特征,在設計中應遵循以下原則。
3.1簡潔準確性原則
在元數據設計時應考慮各種層次的使用人員,設計的元數據方案應簡潔,易于理解和掌握,但要保證描述元數據的準確性,能清楚明了的解釋元數據所表示的含義,便于編目人員著錄實踐。例如Dublin Core(都柏林核心元數據)是國際通用的主要應用于網絡信息資源組織的元數據標準,DC結構簡單且易于掌握,許多專業領域的元數據框架都是基于DC建立的,但是民族醫藥文獻有其特殊性,這就需要元數據設計的時候綜合考量各種因素,參考DC元數據標準模式,在保證元數據簡潔易用的基礎上進行準確性的描述。
3.2通用性及針對性原則
由于云南民族醫藥文獻資源類型多樣,載體形式不盡相同,所以在設計元數據時應保證元數據方案的整體通用性,同時也要對不同類型不同載體的文獻元數據有針對性的設計,滿足特殊性資源的特征描述要求。例如DC元數據標準是國際通用的元數據標準,但是它所規定的15個元素不能完全包含民族醫藥文獻的一些類型特征,因此有必要借鑒或復用其他類型的元數據標準,對某些元數據做針對性的設計,例如多媒體類的文獻資源可以參考多媒體資源描述元數據標準MPEG-7等。
3.3共享性與互操作性原則
元數據的共享性和互操作性主要體現在對異構系統間互操作能力的支持[5],即不僅能支持本元數據標準上建立的各相關應用系統所操作,還應為其他民族醫藥資源應用系統所操作,便于實現民族醫藥資源的整合共享。因此,在設計云南民族醫藥文獻元數據方案的時候應保證該元數據能準確表示元素數據的前提下,對其進行其他系統常用元數據的共享和轉換,設計時要充分考慮元數據元素的語義定義及元數據結構等方面的內容。目前,基于語義網格技術的元數據本體模型可以很好的解決不同本體之間的互操作,跨語言、跨文化的互操作,實現數字資源的共享及知識發現等[6]。
3.4可擴展性原則
云南民族醫藥文獻資源非常豐富,并且出版物類型和載體類型多樣,整體的元數據方案只能提供比較廣泛意義上的描述,對于一些具有民族特色的內容不能做到全部描述,但是云南民族醫藥文獻元數據方案要體現出民族醫藥文獻資源的特征,所以需要在標準元數據框架的前提下,根據不同民族醫藥文獻資源的特點,擴展一些必備的元素或元素值,這就要求所設計的元數據方案具有較好的可擴展性。
3.5用戶需求原則
民族醫藥文獻元數據方案設計的最終目的是能夠最大程度地滿足用戶對民族醫藥文獻資源的信息需求,因此在制定元數據時還需要重點考慮各種不同層次、不同類型的用戶需求。設計時應該從用戶的信息需求和應用角度出發,對元數據的結構設計、各字段的設計及元數據語義結構等方面綜合考量制訂,以保證系統對用戶的友好性,提供用戶多層次、多途徑的信息檢索。
4云南民族醫藥文獻數字化元數據方案設計思路
4.1資源對象分析
在設計元數據方案之前,需要對云南民族醫藥文獻資源以及與資源有關的對象進行詳細的調查分析,界定云南民族醫藥文獻資源的范圍,分析各類型文獻資源對象的特點,并調查各層次各類型使用者的需求。
4.2元數據標準規范分析
調查國內外相關領域已經完成的元數據標準,分析元數據內容,考慮可以參考借鑒或者復用的相關標準,避免資源浪費。
4.3建立元數據框架
建立云南民族醫藥文獻元數據的整體框架,確定不同類型元數據方案各部分之間的相互關系和規則。
4.4屬性特征提取
集合民族醫學、情報學、文獻學、計算機信息管理等方面的專家一起討論,結合調研實際和實證研究,從資源利用的角度提出屬性需求以及云南民族醫藥文獻資源的特征需求,明確核心元素,以及需要復用、借鑒、擴展的元素。
4.5制定著錄規則
對不同的文獻資源類型制定相對應的著錄規則以及對元數據元素詳細的描述性著錄細則,充分體現民族醫藥文獻的特征,指導民族醫藥文獻數字化建設。
4.6確定置標方案
確定云南民族醫藥文獻元數據方案的置標方案。目前比較主流的置標方案是基于XML/RDF形式的,這種形式的置標方案有利于數據的長期保存,并且可以實現系統的語義互操作,有利于資源的整合和共享。
5結語
制訂統一規范的云南民族醫藥文獻數字化元數據方案是云南民族醫藥數字化信息資源的整合、共享的基礎性工作,為實現民族醫藥信息資源的深度挖掘、民族醫藥知識發現和知識創新提供技術支持,同時也為其他區域民族醫藥資源的數字化建設和信息資源整合提供參考和交流。
參考文獻
[1]保麗娟,李永強,劉虹.云南少數民族醫藥文獻數字化現狀及思考[J].云南中醫學院學報,2013,36(5):62-64.
[2]Weibel S. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bulletin of the American Society for Information Science and Technology,1997,24(1):9-11.
[3]于彤,崔蒙,李海燕,等.中醫藥文獻元數據標準化研究進展[J].中國數字醫學,2013,8(7):66-69.
[4]劉虹,陳柏君,羅艷秋.云南少數民族醫藥文字文獻述 略[J].云南中醫學院學報,2013,36(3):43-46,48.
[5]陳海燕.CALIS特色數據庫信息資源描述與實踐[J].圖書情報論壇,2008(3):48-50.
[6]畢強,韓毅.語義網格環境下基于元數據本體的數字圖書館互操作研究[J].圖書情報工作,2009,53(15):17-20, 82.
(收稿日期:2014-03-20,編輯:魏民)