南拉才讓,完么措
(1.西藏大學(xué)圖書館,西藏拉薩 850000;2.西北民族大學(xué)社會(huì)科學(xué)院,甘肅蘭州 730000)
藏文距今有著近1 300年的歷史,通過藏文記錄的古籍文獻(xiàn)、古籍著作或譯作等也成了重要的歷史參考資料。藏文古籍文獻(xiàn)作為記錄藏族文化、歷史、科技以及宗教內(nèi)容的重要載體,無論是現(xiàn)在還是將來都將成為研究與傳承藏族文化的重要資料[1]。因此,為保護(hù)藏族文化的更好傳承,建立藏文古籍文獻(xiàn)資源庫顯得十分必要。藏文古籍文獻(xiàn)資源庫的建設(shè),能夠有利于充分挖掘藏文古籍文獻(xiàn)中豐富的科學(xué)文化資源,并對(duì)藏族歷史上的思想文化與科學(xué)成就充分進(jìn)行體現(xiàn)。利用科學(xué)手段對(duì)藏文古籍文獻(xiàn)進(jìn)行開發(fā)處理, 能夠加深人們對(duì)藏族文化的理解。同時(shí)藏文古籍文獻(xiàn)數(shù)據(jù)庫的建立,也是對(duì)藏文古籍文獻(xiàn)資料現(xiàn)代化管理與開發(fā)利用的基礎(chǔ)[2]。數(shù)據(jù)庫作為藏文古籍文獻(xiàn)信息開發(fā)最有效的形式,數(shù)據(jù)庫的建立讓藏文古籍文獻(xiàn)真正走向數(shù)字化與網(wǎng)絡(luò)化,與現(xiàn)代電子信息技術(shù)資源融為一體。在各行各業(yè)信息管理開發(fā)利用向著數(shù)字化發(fā)展的今天,藏文古籍文獻(xiàn)的信息資源也需要滿足這一發(fā)展趨勢(shì)。藏文古籍文獻(xiàn)資源庫的建立,有利于對(duì)珍貴孤本、善本古籍文獻(xiàn)資料的搶救。
藏文古籍文獻(xiàn)資源的屬性, 主要以描述該資源的相關(guān)屬性為主。因此,藏文古籍文獻(xiàn)資源屬性主要以資料學(xué)習(xí)對(duì)象元數(shù)數(shù)據(jù)規(guī)格為中心,同時(shí)針對(duì)不同類型藏文古籍文獻(xiàn)特性建立拓展屬性集,其結(jié)構(gòu)如圖1所示。

圖1 藏文古籍文獻(xiàn)資源庫屬性結(jié)構(gòu)
藏文古籍文獻(xiàn)數(shù)據(jù)庫根據(jù)數(shù)據(jù)類型可分為必須數(shù)據(jù)元素、通用可選數(shù)據(jù)元素、分類數(shù)據(jù)元素三大類。必須數(shù)據(jù)元素在要求中需要與查詢對(duì)象元素保持?jǐn)?shù)據(jù)元素相一致。必須數(shù)據(jù)元素也是其他類型資源必需的屬性標(biāo)注[3]。其中主要包括:標(biāo)示、標(biāo)題、內(nèi)容描述、關(guān)鍵字、貢獻(xiàn)、格式等多類屬性;通用可選數(shù)據(jù)元素主要是針對(duì)各類藏文古籍文獻(xiàn)資源的屬性集合。此類數(shù)據(jù)元素主要根據(jù)使用者與開發(fā)者在工作過程中參考屬性選擇為基礎(chǔ)進(jìn)行選擇使用。其中主要包括古籍文獻(xiàn)版本狀態(tài)、古籍文獻(xiàn)資源字節(jié)數(shù)、古籍文獻(xiàn)資源使用條件描述、適用對(duì)象、位置等屬性描述;分類數(shù)據(jù)元素主要根據(jù)藏文古籍文獻(xiàn)各類資源特點(diǎn), 對(duì)其中某些資源技術(shù)與資源特征密切相關(guān)的數(shù)據(jù)進(jìn)行制定, 并對(duì)其中部分基礎(chǔ)特殊資源進(jìn)行屬性分類。在藏文古籍文獻(xiàn)對(duì)象元數(shù)據(jù)規(guī)范中的最后一個(gè)分類中, 為使用者提供任意資源分類結(jié)構(gòu)。由于無法被任何分類法應(yīng)用,因此這個(gè)分類提供了一個(gè)簡單有效的擴(kuò)展機(jī)制。這可以作為藏文古籍文獻(xiàn)資源的主要分類標(biāo)準(zhǔn),并逐層進(jìn)行細(xì)化。
根據(jù)藏文古籍文獻(xiàn)資源庫屬性結(jié)構(gòu), 整體資源庫采用多層結(jié)構(gòu),且每層結(jié)構(gòu)相對(duì)獨(dú)立。每層結(jié)構(gòu)中相互留有標(biāo)準(zhǔn)接口, 這種結(jié)構(gòu)模式不僅可以確保系統(tǒng)的靈活性、開放性以及可擴(kuò)展性,同時(shí)也更加方便系統(tǒng)整體的接入與管理工作。藏文古籍文獻(xiàn)資源庫系統(tǒng)結(jié)構(gòu),如圖2所示。

圖2 藏文古籍文獻(xiàn)資源庫系統(tǒng)結(jié)構(gòu)
其中, 藏文古籍文獻(xiàn)數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)服務(wù)層主要負(fù)責(zé)數(shù)據(jù)的物理存儲(chǔ)、 數(shù)據(jù)讀取以及數(shù)據(jù)內(nèi)部維護(hù)工作; 系統(tǒng)中存取層主要負(fù)責(zé)對(duì)數(shù)字化藏文古籍文獻(xiàn)獲取、 檢索數(shù)據(jù)庫以及資源調(diào)度等上層服務(wù)進(jìn)行支持; 應(yīng)用服務(wù)層主要負(fù)責(zé)對(duì)包括信息推送、 使用者認(rèn)證、網(wǎng)上參考查詢等網(wǎng)絡(luò)環(huán)境下的應(yīng)用服務(wù)進(jìn)行處理;系統(tǒng)結(jié)構(gòu)中最上層的表示層則主要負(fù)責(zé)使用者檢索與交互,使用者可以通過其界面連接數(shù)據(jù)庫系統(tǒng),同樣也可以通過客戶端軟件進(jìn)行接入。在系統(tǒng)結(jié)構(gòu)設(shè)計(jì)中,需要保持系統(tǒng)開放性[4]。在系統(tǒng)對(duì)藏文古籍文獻(xiàn)進(jìn)行數(shù)字化處理過程中, 根據(jù)制訂的相關(guān)元數(shù)標(biāo)準(zhǔn)以及數(shù)字化處理規(guī)范,對(duì)藏文古籍文獻(xiàn)資源進(jìn)行分裝與標(biāo)引,讓其成為合格的數(shù)字處理對(duì)象。通過數(shù)據(jù)管理工具對(duì)藏文古籍文獻(xiàn)元數(shù)據(jù)、數(shù)字化對(duì)象進(jìn)行存儲(chǔ)與管理。因此,只需要將藏文古籍文獻(xiàn)資源在系統(tǒng)某一層上符合規(guī)定的結(jié)構(gòu)標(biāo)準(zhǔn)進(jìn)行處理, 就能夠?qū)⒉匚墓偶墨I(xiàn)資料與數(shù)據(jù)庫進(jìn)行整合[5]。
以藏文古籍文獻(xiàn)資源庫建設(shè)為基礎(chǔ), 為更加方便使用者使用, 對(duì)藏文古籍文獻(xiàn)資源庫檢索系統(tǒng)進(jìn)行構(gòu)建。以藏文古籍文獻(xiàn)資源庫結(jié)構(gòu)為基礎(chǔ),從而建立一個(gè)智能化信息檢索體系結(jié)構(gòu)模型。模型中主要以使用者界面為基礎(chǔ),從而實(shí)現(xiàn)查詢轉(zhuǎn)換、文檔處理、檢索代理以及處理定制等多種功能[6]。
整體查詢結(jié)構(gòu)系統(tǒng)中主要分為本體文檔預(yù)處理與本體文檔檢索兩部分。本體文檔處理主要包括數(shù)據(jù)源、信息庫、文檔處理器以及本體服務(wù)器等項(xiàng)功能;本體文檔檢索主要包括信息庫、定制處理模塊、本體服務(wù)器、檢索代理、查詢轉(zhuǎn)換器等多項(xiàng)功能。
藏文古籍文獻(xiàn)資源庫的建設(shè)其主要目的是為今后文獻(xiàn)查詢提供便利, 因此無論在內(nèi)容與功能上都應(yīng)以考慮實(shí)際需求為主, 讓使用者能夠更加精準(zhǔn)與方便地進(jìn)行信息獲取,增加其可利用性。在藏文古籍文獻(xiàn)數(shù)據(jù)庫信息檢索模塊中,主要包含輸入模塊、查詢匹配模塊以及查詢結(jié)果輸出三個(gè)子模塊[7]。
查詢輸入模塊主要為根據(jù)使用者需求, 為使用者提供精準(zhǔn)藏文古籍文獻(xiàn)資源定位。其查詢系統(tǒng)主要按照關(guān)鍵詞、 素材內(nèi)容以及內(nèi)容概述三項(xiàng)功能對(duì)資源進(jìn)行綜合查詢。內(nèi)容概述功能中,主要提供使用者利用中文自然語言進(jìn)行需求查詢, 避免了藏文古籍文獻(xiàn)系統(tǒng)與使用者之間的交流障礙,減輕使用者負(fù)擔(dān)。同時(shí)在查詢輸入模塊中, 使用者可對(duì)查詢結(jié)果進(jìn)行文件格式與素材類型分類, 讓使用者能夠?qū)λ栀Y源進(jìn)行更加精準(zhǔn)的定位,有效提高查詢范圍。
查詢匹配模塊主要提供使用者輸入查詢要求改進(jìn)的正向最大匹配法, 從而進(jìn)行有效信息提取以及自動(dòng)分詞與處理。通過對(duì)各項(xiàng)查詢條件進(jìn)行綜合后利用加權(quán)算法與查詢結(jié)果之間的相關(guān)度進(jìn)行對(duì)比, 按照相關(guān)度進(jìn)行排序[8]。
查詢結(jié)果輸出模塊主要功能為按照使用者需求將查詢結(jié)果按照相關(guān)度大小順序輸出給使用者。在查詢結(jié)果中,系統(tǒng)按照用戶素材對(duì)資源實(shí)現(xiàn)超鏈接功能,提供使用者在線瀏覽與下載功能。
藏文古籍文獻(xiàn)資源庫建設(shè)及其檢索研究, 能夠有效實(shí)現(xiàn)藏文古籍文獻(xiàn)資源數(shù)字化,保護(hù)藏文文獻(xiàn)資源。結(jié)合藏文古籍文獻(xiàn)資源特點(diǎn), 建設(shè)資源庫并對(duì)其查詢系統(tǒng)進(jìn)行分析, 實(shí)現(xiàn)對(duì)藏文古籍文獻(xiàn)資源的快速查詢與檢索,更好地滿足使用者需求。