王成平,田宜宣,孫某姑,曾慶雅
(1.西南民族大學:a.民族語言文字信息處理重點實驗室,b.中國語言文學學院,四川成都 610041;2.四川省雅安市名山區政府辦,四川雅安 625100)
我國的古文獻學源遠流長,其任務是研究中國古文獻產生、發展的歷史,介紹中國古文獻研究、整理的歷史概況,總結歷史古文獻學家的經驗和戰果,為古文獻研究和整理提供借鑒作用[1]。民族古籍文獻典籍體例嚴密,特色鮮明,內容豐富,全面反映了中華民族輝煌燦爛的文化。在信息化時代應重視我國少數民族文獻的發展,以建設民族古籍文獻為核心要務,傳承民族文獻文化,最終實現民族文化的發揚和傳播。
彝文古籍文獻種類頗多,卷帙浩繁,體系龐大,內容豐富。它作為彝族歷代先民留給子孫后代的文化遺產,是一筆巨大的珍貴的知識財富,是認識和了解彝族古代社會歷史與傳統文化的主要載體。然而,在各種自然和人為的因素,彝文古籍文獻的長期保存、流通與利用受到了嚴重的制約和威脅。即使進入信息化時代,各種因素對彝文古籍文獻的自然損壞和人為被壞等不利因素仍然存在,針對現有的彝文古籍文獻有必要進行搶救與保護[2]。本文通過梳理彝文古籍文獻現有成果,結合當前時代背景,對彝文古籍文獻數字化博物館建設作一些探討,并在此基礎上探討民族古籍文獻進一步發展的方向。
彝族是中華民族大家庭中人口較多、分布較廣的一員。據2010年統計,彝族人口有900多萬,分布在滇、川、黔、桂四?。▍^)。1980年國務院以[1980]70號文件批準推行《彝文規范方案》。2010年11月全國彝語術語標準化工作委員會審定通過了滇川黔桂民委、民語委根據滇、川、黔、桂四?。▍^)彝學學會提出的《關于進一步完善規范彝文的建議》[3]。規范彝文方案的實施加速了彝文的傳播和數字化建設的步伐,特別是在西南民族大學沙馬拉毅教授為首的彝語言信息處理團隊的推動下,彝文正式步入信息化的道路,以彝文為載體的數字文本資源迅速發展,使得古老的彝文成為了數字化時代煥發出活態的民族語言文字。然而,古彝文數量多,同意異字、同字異意且不同類型文獻表意不一等現象也多,用規范彝文方案解讀彝文古籍文獻存在著艱巨的翻譯工作量和誤解、誤讀等諸多情況,且國內彝文文獻專業在高校開設較少,導致彝文古籍文獻專業研究人員斷層,進一步限制彝文古籍文獻的解讀和翻譯等工作的建設。再者,彝文古籍文獻分布廣、類型多、文字不統一等因素嚴重制約了彝文古籍文獻數字化發展,使得部分彝文古籍文獻未得到充分的開發利用,而且由于原生性保護存在很大的局限性,彝文古籍文獻趨向瀕危狀態。因此,亟需出臺新的策略解決彝文古籍文獻傳承和保護面臨的困境。
民族古籍文獻數字化建設是當下國內外對民族古籍文獻進行保護和傳播的重要途徑,對民族古籍、古典文獻的傳承和發展具有劃時代的意義。針對彝文古籍文獻,需要借助通用彝文字,并借鑒國內外保護文獻的思路,結合現有的彝文信息化技術,促進并實現彝文古籍文獻數字信息化建設、數字化保護乃至傳承。
目前,國內外均有不同層次地創建了語言文字庫、文獻庫,乃至影像庫或數字化博物館。1990年美國國會圖書館成功開啟美國數字圖書館時代。1992年聯合國教科文組織發起的“世界記憶”工程首次將數字化技術帶入到全球文化遺產的保護工作之中。1995年,包括美國博物館、法國盧浮宮在內的多家歐美博物館著手開展數字化存儲項目等工程,數字化技術的運用范圍愈加廣闊。2015年挪威文化中心對全球范圍內31個國家和地區59座語言文字主題博物館的調查,列出了45個語言網站、語言資料庫,以及30個紀念碑和83個世界范圍內的語言性節日。中國語言主題類博物館有4個,僅次于德國和美國,與法國并列第三。語言文字為主題的數字化博物館包括National Museum of Language、Musée des langues,du langage et de la linguistique、Museum of the Alphabet、Museu da LínguaPortuguesa、中國文字博物館等數字化館藏[4]。
除此,其他文獻典籍數字化館藏,如:國家典籍博物館,是我國第一家國家級古籍文獻博物館,開創了國內全圖書、文獻典籍的閱覽新形式。成吉思汗文獻博物館則是以成吉思汗文化為主題,集齊圖書、圖片與繪畫、文物與紀念品及研究成果為一體的,具有收藏、展示、傳承、研究和傳播功能的陳列型博物館。2017年,蒙古文字文獻博物館在內蒙古成立,其是第一家以少數民族——蒙古文字文獻為主的專題型博物館。國內古籍文獻數據庫有北京書同文數字化技術有限公司的書同文古籍庫,其內容含有《四部叢刊》《中國歷代石刻史料匯編》《十通》《大明會典》等全文檢索庫。明清檔案文獻網、中華書局有限公司的中華古籍網、大成古籍文獻全文數據庫等也是國內知名文獻數字庫。國內目前涉及彝文古籍文獻的藏館主要以實體館為主,包括滇、川、黔、桂四?。▍^)均有不同規模的彝文古籍文獻館和彝族語言文化博物館,但缺乏以彝族語言、文字、文獻、文化等為主題的數字化博物館。建設數字化博物館是當下發展民族文獻資料、語言文字、文化藝術等載體的更為有效的方式。
彝文古籍文獻涉及諸多種類和領域,包括百科全書類如《西南彝志》、創世史詩如:《勒俄特依》《查姆》《梅葛》《阿細的先基》、占卜類如《哈體特依》教育類如:《瑪牧特依》、《勸善經》、天文類如《宇宙人文論》及譜牒類等類型。它是由多樣化的載體形式存在,有紙質書籍、文書檔案、碑刻、竹簡、金屬等和口耳相傳的口述史料。當下彝文古籍文獻傳世較多,但保留下來的許多文獻破損情況十分嚴重,如傳抄本經時間的推移,部分出現了人為的破損及潮濕、蟲咬、發黃、酸化、腐損等諸多情況。各種類型載體的彝文古籍文獻仍難擺脫繼續破損和亡失的危險[2]。
在社會大趨勢下,彝文古籍文獻必須走出傳統圖書館、文獻館、博物館等傳承制約,開發出數字化博物館。利用網絡建庫、VR/AR影像互動等技術,以多維度數字化博物館的形式,全方位、立體化地面向大眾進行文化資源的傳播和共享,讓彝文古籍文獻得以在信息化時代重新煥發生機。彝文古籍文獻數字化博物館建設工作的開展,有利于彝文古籍文獻通過數字化規范整理的方式使持久性保護,促進彝文古籍文獻資源共享,有效地傳承和發揚彝族文化,為彝文古籍文獻挖掘和分析提供數據支持,同時為其他民族古籍文獻資源數字化開發提供思路和參考。
1.開展彝文字基礎性建設。選取彝文古籍文獻進行光學字符識別工作作為第一階段的研究建設內容。首先提取形狀特征較為相似的各地古彝文字,并進一步錄入,然后進行下一步的實驗。在實驗過程中通過黑盒、白盒的實驗數據測試,對識別質量的評估,根據識別率判定實驗的科學性、合理性以及可行性。注重實驗校驗的準確率、精確率和召回率,高標準、高質量地完成實驗,奠定以光學字符識別為中心內容的彝文古籍文獻數字信息化的研究工作,總結并探索彝文字光學字符識別技術實驗中遇到的困難和經驗,著重分析其中存在的問題,并提出解決思路,附加人工的檢查校注,準確無誤地解讀出彝文古籍文獻。
2.開展彝文古籍文獻的搜集整理。全面實現彝文古籍文獻的搜集和整合??梢酝ㄟ^兩個方式進行彝文古籍文獻分類:一是通過方言區進行分類;二是通過所記載的類別進行分類,如占卜、律算、文學、史詩、傳說等進行各方言區同一故事的整理結合。數字化博物館建設,需要全面、科學地提取彝文古籍文獻數字化展品。彝文古籍文獻,數字化博物館在選擇時應取其精華,尋找比較齊全的古籍文獻展品。
3.多維度建立數字化博物館。采用多媒體技術多維度采集和展示滇、川、黔、桂四省(區)的彝文古籍文獻。彝文古籍文獻的全面信息化需要文字、圖像、音視頻、VR/AR技術等結合,打造立體的數字化博物館。古籍文獻的文字主要依賴光學字符識別技術;圖像的獲取主要靠高清晰度的掃描設備以及拍照設備;音視頻主要采集古籍文獻傳承人的錄音攝影資料,也可找到古籍文獻相關研究者進行數據采集;VR/AR技術將彝文古籍文獻從時間、空間范圍內通過計算機科學技術,模擬仿真后再疊加,將虛擬的信息應用到真實的世界中,讓數字化博物館“游覽者”從視聽感官系統上超越以往傳統的感官體驗,全方位接觸到古老的民族古籍文獻在新時代活力和珍貴的文化價值。這不僅有利于數字化博物館的推廣使用,也利于后臺的管理控制。
彝文古籍文獻數字化博物館是一個面向公眾平臺服務的民族語言文獻類數字化博物館,將利用多媒體、數據庫、Web程序、三維技術、圖像全景技術開發等技術開發,以全方位視角呈現彝文古籍文獻。無論是知識庫、語言庫或博物館,分類檢索管理始終是數據資源庫建設的重點。分類檢索的科學性,將影響到數字化博物館的推廣和使用。人性化的管理和簡便的用戶界面將是數字化博物館建設的核心問題,將最大程度地方便“游覽者”使用博物館,以簡單化的指令查詢和閱覽需要的文獻資源。
1.用戶管理。用戶管理可根據不同的用戶設定不同的用戶權限。用戶權限可分為管理員權限、超級用戶和普通用戶等。管理員用戶是直接面向系統進行布局調試的超級權限所有者;超級用戶是為除去系統管理外的內部信息注入的工作人員的用戶群體;普通用戶是為享有訪問、讀取、閱覽權限的用戶集合。
2.安全管理。彝文古籍文獻數字化博物館是將全力保護彝文古籍文獻信息不被剽竊。制定功能限制,防止機密信息被不法竊取。權限設置將運用數字加密技術防止古籍文獻被“復制”“臨摹”的可能,保護文獻傳承所有人數據資源的安全性。
3.主題界面。數字化博物館以2D、3D技術相結合的方式,全面虛擬文獻博物館。從形式到內容簡介,突出彝文古籍文獻的特點。通過視頻錄像資料作為基礎介紹,可以了解到文獻作品的背景知識;使用導讀,可以明確文獻的解答范圍;通過高分辨率圖片,可以清晰查看更多細節;通過VR/AR虛擬現實技術增加互動和推廣,可以讓“參觀者”全面感受文獻的細節和整體。
1.檢索功能。查詢系統的優劣和快慢是衡量一個數字化博物館活力的評判標準。查詢系統的便利與否,直接影響到數字化博物館古籍文獻閱覽者查詢時的直觀感受。為了服務廣大閱覽者,查詢系統更需人們平時的生活習慣,盡量方便用戶的需求。由此,可以根據文獻的屬性、類別、內容及方言區等制定策略來部署和關聯查詢的關鍵詞。通過AI智能管理,結合云計算,科學創建具有民族特色風格的古籍文獻博物館,將是時代的選擇,同時也將有利于研究者開展相關研究工作,最大便捷地服務大眾。
彝文古籍文獻數字化博物館的建設與運用是一個循序漸進的工程。運用計算機技術、文獻學、語言學等多學科交叉知識來構建,按照統一規劃、標準的原則進行整合管理,融合動靜態網頁形式,結合多媒體、VR/AR虛擬技術等展示方式,多維度呈現彝文為載體的古籍文獻和文化特征。多媒體技術嵌合傳統文獻學是構建彝文古籍文獻數字化博物館的核心工作。隨著數字化技術覆蓋更多國內外民族類博物館,運用新技術、新媒體去了解多元文化將激活更多發展路徑,創建數字化博物館發展走上新臺階,促進更多具有民族風格的多元文化傳播到世界各地。
彝文古籍文獻數字化博物館是一個面向數以萬計的網上“游覽者”開展的一個兼容彝族人文的文獻類數字化博物館。該數字化博物館的建設為彝文古籍文獻呈現活態的良性的發展提供信息化建設的道路。利用現代技術對古籍進行數字化處理,既是保護珍貴古籍的有效方法,也是研究與傳播傳統文化的重要手段。彝文古籍文獻數字化博物館建設,盡量集齊六大方言區的古籍文獻,是國內首個彝族文獻的創新性,也是民族古籍文獻典藏在信息化時代的革命性先例,為保護、傳播、傳承民族文明奠定了數字信息化基石,同時也為其他少數民族古籍文獻乃至其他文化資源保護和傳承起到示范性作用。