□索婭 阿拉坦倉
?
基于蒙古文數字圖書館建設蒙古文文獻共享域之探討
□索婭 阿拉坦倉
民族文獻共享域建設是網絡環境下亟待解決的問題。基于蒙古文文獻數字化已有的成果,建立蒙古文文獻共享域,在理論和實踐上都是一次探索和挑戰。該文在充分發揮蒙古文文獻共享域建設有利條件的同時,針對蒙古文共享域建設的必要性、成果及其不足提出相應的對策。
民族文獻 蒙古文文獻 數字化 共享域 對策
CALIS在三期建設中,按地域、學校類型、共享內容建設共享域或共享聯盟中心。民族文獻共享域是以民族文獻及民族文獻數字產品為依托,建立民族文獻信息資源的整合和服務平臺。
民族文獻是傳承和弘揚民族文化的重要載體,在我國55個少數民族中,就有傣族、蒙古族、藏族、維族、景頗族、彝族等29個民族有與自己的語言相應的文字[1],以這些文字記載的各類型少數民族文獻種類繁多、內容豐富,是中華民族的巨大財富。利用現代信息技術手段將珍貴的民族文獻數字化,是對民族文化傳播和繼承方式的創新,可有效解決保存與使用之間的矛盾,對于民族文獻的利用、傳播、保護以及民族文化的傳承和弘揚都具有重要意義。在蒙古文數字圖書館的基礎上建立民族文獻共享域,是民族文獻在網絡環境下實現共建共享的理想途徑。
在數字化、網絡化快速發展的今天,建立民族文獻共享域是刻不容緩的事情,而且具備了一定的基礎條件。
1.1 民族文獻共享域建設的必要性
首先,民族文獻的收藏與分布較為分散,給研究者帶來了諸多不便。很多研究者為找到所需民族文獻資料,需要跨地區甚至跨國界去查找資料,花費很多精力和時間。第二,民族文獻得不到整合和揭示,嚴重影響了其有效使用,利用率較低。第三,一些珍貴的民族文獻精品由于出版年代久遠,紙張已經開始變脆,急需保護,不宜經常翻閱。第四,從事民族語言和民族學研究的人員較少,導致相應的出版物印數少,再版、重印的機會不多。因此,民族文獻的大規模集成整合、深度加工與增值利用受到廣泛關注,民族文獻數字產品經過共享域的傳播與利用勢在必行。
1.2 民族文獻共享域的建設條件
第一,民族文獻相對集中在少數民族聚居的地區,就拿蒙古文文獻的分布來說,據不完全統計,80%的蒙古文古籍集中在內蒙古首府呼和浩特的四所大型圖書館中[2]。對于現代民族文獻的收藏,民族地區圖書館更是要求完整和系統,由這些圖書館進行民族文獻數字化,條件比較便利。第二,民族文獻管理軟件的已經廣為使用,民族文獻的數字化標準也基本趨于成熟。第三,在民族地區的一些高校圖書館中,民族文獻數字化有了一定的基礎。如新疆大學建立的“新疆大學地方特色數據庫”、內蒙古大學圖書館建設的“館藏蒙古文全文數據庫”、“甘珠爾經數據庫”、“蒙古文期刊全文數據庫”、“全區高校蒙古文聯機合作編目平臺”。
蒙古文數字圖書館是民族地區高校民族文獻整合的典范,在民族文獻數字圖書館建設中發揮著引領示范作用。
內蒙古大學圖書館建設的蒙古文數字圖書館,是由耶理巴文獻管理集成系統、蒙古文圖書全文數據庫、蒙古文期刊全文數據庫、數字甘珠爾經、蒙古學信息網等系列成果構成。并在內蒙古高等教育數字圖書館系統平臺之上,搭建了全區高校蒙古文圖書聯機合作編目平臺,初步實現了蒙古文書目數據的共建、共享。該項目已是內蒙古大學“211工程”三期建設的標志性成果之一。
2.1 耶理巴文獻管理集成系統
耶理巴文獻管理集成系統是能夠適應數字圖書館運作機制的文獻管理集成系統。該系統在國際上首次全面應用蒙古文編碼國際標準的相關技術進行蒙古文文獻管理信息系統的開發;首次采用更加適合數字圖書館運行機制的DC元數據實現的文獻管理集成系統;實現了基于Webservice技術的聯機合作編目系統;國際化的開發方式,實現了對多種少數民族文字的支持;本系統的研究以蒙古文為出發點,蒙古文由于其排版方式獨特,系統實現是最困難的,在解決了蒙古文的相關問題后,實現了對藏文、維吾爾文、滿文等民族文字的支持,攻克了民族文字書寫方向、文字編碼、字母變體、同形異音、文獻排版裝禎形式等復雜性難題。該系統通過在內蒙古地區圖書館蒙古文文獻管理中的廣泛使用,實現了蒙古文文獻的采訪、驗收、編目、典藏、流通、調撥、自助借還等業務流程和蒙古文信息的存儲、檢索、交換及共享的功能。
2.2 蒙古文圖書全文數據庫
該數據庫是內蒙古大學圖書館通過自建和參與國際合作項目CADAL的方式實現館藏近7000種蒙古文現代圖書的數字化。在數據庫的研發制作過程中,嚴格遵循CADAL的文獻資源數字化規則,通過全文掃描、圖像處理、編制檢索系統等過程完成。該數據庫是國內外第一個民族文字現代圖書的大型全文數據庫。
2.3 蒙古文期刊全文數據庫
“中國蒙古文期刊網”由國家教育部民族學科蒙古學文獻信息中心和內蒙古大學圖書館蒙古學及其他學科信息咨詢部建立,于2005年4月開通。目前收集了《內蒙古社會科學》和《中國蒙古學研究》等15種國內學術期刊,全文數據附有論文題目、蒙古文題名、漢譯題名、漢譯內容提要、英譯提名和拉丁轉寫提名等。使用PDF圖像處理辦法,成功解決了在網絡環境下可以查看或瀏覽蒙古文原文數據的難題,讀者不受時間和地點的限制,可以在全球范圍內查閱國內正式出版的蒙古文期刊信息資源。蒙古國出版的一些學術刊物也即將收入本數據庫。蒙古文期刊全文數據庫的建立給蒙古學界的專家學者搭建了一個方便快捷的學習研究平臺,為蒙古學界的專家學者提供服務。
2.4 數字甘珠爾經
《甘珠爾經》被譽為中華文化寶庫中百科全書式的蒙古文古籍巨著,是蒙古文大藏經的組成部分,全書共7大類108卷,約2000多萬字,是佛學和中國古代各門類學科文化研究不可多得的文獻資源,其版本極其珍貴。長期以來由于受保護限制,使這一歷史文獻得不到充分利用。2006年,內蒙古大學圖書館啟動《甘珠爾經》的全文數字化工程,經過全文掃描、制作光盤、磁帶備份、制作檢索系統等多個程序完成。數字化《甘珠爾經》可以在互聯網上提供蒙古文、蒙古文拉丁轉寫和繁體漢文三種檢索形式,供不同國家、不同民族的讀者使用,使中外學者能夠通過互聯網研究和閱讀這一人類文化遺產[5]。
基于蒙古文文獻數字化現有成果建設蒙古文文獻共享域,在理論和實踐上都是一次探索和挑戰。
3.1 蒙古文文獻的數字化模式分析
蒙古文文獻的數字化模式可以分為獨立、聯盟、虛擬三種模式,也就是蒙古文文獻數字化的三個階段:起步、聯合、共建共享。
獨立模式是數字化起步階段的模式,主要是通過自建數據庫來不斷完成數字資源的原始積累,并通過用戶的使用來不斷完善數字化資源。如新疆大學建立的“新疆大學地方特色數據庫”、內蒙古大學圖書館建成的“館藏蒙古文全文數據庫”、“甘珠爾經數據庫”等。目前已有的民族文獻數字資源大多屬于這種模式。
聯盟模式是在完成獨立模式階段的數字化資源積累之后,在互利互惠原則基礎上實現的一種模式。如內蒙古自治區高校蒙古文聯機合作編目平臺就是聯盟模式,它是基于CALIS內蒙古自治區文獻信息服務中心聯合編目的相關標準、依托耶理巴蒙古文文獻管理集成系統建立的,達到了數據標準統一,初步實現了蒙古文書目數據共建、共享。
虛擬中心模式是在聯盟模式的基礎上產生一個中心成員,該成員負責虛擬中心的業務指導,同時負責將各成員的數字化資源元數據收集到中心服務器。目前,民族文獻數字化模式僅有獨立、聯盟兩種模式,虛擬模式還屬于空白。
蒙古文文獻數字化建設在模式的選擇上,無論是依據蒙古文文獻的實際情況,還是依據數字化發展的規律,終將結合各種模式的優點,建立一個既有虛擬中心成員的指導,又有聯盟成員加盟的統籌規劃、共同發展的模式[3][4]。
3.2 建立蒙古文文獻共享域的對策
蒙古文文獻共享域與蒙古文文獻的分布和利用相結合,通過服務平臺的建設,形成一個參建館相互協作、對外統一透明服務,并與CALIS等其他資源體系實現共享的新模式。在這種新模式的建設中,要確定管理運行機制,明確科學合理和持續發展的建設內容。
3.2.1 確定管理運行機制
在建立蒙古文文獻共享域初期,應該從組織管理、組織機構、數據標準、開放數據、成員權益等方面制定詳細的管理運行機制。
組織管理:轉變觀念,組織有力,配備民族文字信息技術復合型高級人才,同時保障一定的研發經費。這些都是開展民族文獻數字化的必要和先決條件。
組織機構:在CALIS管理中心成立一個民族文獻共享域管理組織,并以該組織為核心指導民族文獻的數字化建設。該組織需要由相關的CALIS省中心聯合組成,下轄各聯盟成員。
制定并推薦數據標準:根據民族文獻的國際國內使用情況推薦并制定數字化標準;根據民族文字書寫方向等實際問題制定統一輸入和顯示標準,并在基于Unicode的基礎上,提供相關使用標準。
開放數據:關于開放數據,可通過元數據收割或者開放查詢端口API的形式向成員館內部開放。鑒于目前國內的網絡狀況,可以使用元數據收割方式定時收割聯盟成員的數字化資源。
成員權益:不論在中心擔當何種角色,均有共建的義務和共享的權益。成員不論大小,均有相同的共享資源權利;資源不論多少,均需向中心提交數據等[3][4]。
3.2.2 明確科學合理的建設內容
首先要對蒙古文文獻進行資源整合,在共享域平臺上實現高校乃至各系統圖書館蒙古文文獻紙本館藏、電子館藏和相關網絡資源的數據共享。
其次,提供信息服務。蒙古文文獻共享域是服務于蒙古文文獻研究和教學,以及對國內外專家學者提供蒙古文文獻信息服務的保障體系。共享域中心圖書館提供統一身份認證、公共檢索與資源導航、館際互借、聯機編目等服務。
第三,提供良好的技術支持。共享域中心為各成員館提供涉及系統建設的支持服務。內容包括共享版軟件的中心部署、分配使用等。
第四,做好宣傳培訓服務。蒙古文文獻共享域建設以高校圖書館為主要參建單位,并將延伸到各系統圖書館,開展讀者服務與共享域應用的推廣。共享域中心應面向各成員館、各服務點的管理、技術與服務人員開展培訓工作,建立起支撐共享域的有效運行團隊。
1 鮑玉來.蒙古文文獻數字化理論與技術研究思路[J].科技成果管理與研究,2009,(1):83—86
2 德力格爾.少數民族文字文獻開發利用與數字化管理[M].呼和浩特:內蒙古教育出版社,2007:4—10
3 白海燕.數字資源整合的模式與解決方案[J].圖書情報工作,2005,(10):87—90
4 索婭,阿拉坦倉.高校圖書館人事制度改革的探索與實踐-內蒙古大學圖書館人事制度改革述評[J].大學圖書館學報,2011,(2):27—30
SuoYa Alatancang
Based on the previous results on the digitization of ethnic documents, the construction of the shared domain of ethnic documents has been proposed as an exploration full of challenges of both related theory and practices. The countermeasures on taking advantages and overcoming weaknesses for development of shared domain of ethnic documents have also been presented.
Ethnic Document; Digitization; Shared Domain; Countermeasure
*國家自然科學基金項目“基于領域本體的蒙古文數字資源整合機制研究”(項目編號:71163029)的成果之一。
索婭,ORCID:0000-0002-0176-5983,suoya_lib@126.com。
內蒙古大學圖書館,呼和浩特,010021
呼和浩特民族學院,呼和浩特,010051
2014年11月4日The Shared Domain of Ethnic Documents Based on Mongolian Digital Library