中國的歷史與文化遺產宛如璀璨星河,其中,非物質文化遺產便是其中不可或缺的一顆明星。黔東南苗族侗族自治州位于貴州省東南部,苗、侗、布依、水、瑤、壯、土家等少數民族占據了這里81.1%的人口,他們的身影構成了黔東南多彩的民俗畫卷。黔東南苗族侗族自治州作為全國12個國家級文化生態保護區之一,孕育了聯合國人類非物質文化遺產代表作名錄項目1項(侗族大歌),國家級非遺56項78處,省級非遺218項307處。然而,現代化浪潮中,一些文化遺產正面臨著消失的危險。凱里學院圖書館致力于探討非物質文化遺產剪報數據庫的建設,力求為這些珍貴文化遺產的保護與傳承提供借鑒,讓非遺煥發新生機,助力鄉村振興。
一、非遺剪報數據庫建設基本情況
(一)建設意義
剪報數據庫作為一種重要的信息積累與知識整合平臺,不僅有效地促進了信息的高效利用,更極大地減少了重復勞動的發生。通過系統化的剪報收集、整理與歸類,剪報數據庫將海量的報紙資源轉化為可隨時查閱、反復利用的數字化信息,使信息的使用價值得到了最大程度的釋放和提升。非遺剪報更是這一領域中的瑰寶,它們猶如一幅幅生動的歷史畫卷,真實而細膩地反映了不同時代的社會風貌、民眾生活以及社會變遷的脈絡,對傳承和弘揚優秀文化具有不可估量的價值。通過精心篩選和編纂非遺剪報,我們可以讓后人尤其是年輕一代更加直觀、深入地了解歷史與文化,增強民族自豪感和文化認同感。
本數據庫的核心目標在于全面數字化黔東南地區的非遺報紙資料,旨在構建一個既全面又系統的剪報數據庫。這一數據庫將通過在線平臺進行展示,不僅便于存儲和檢索,還能實現資源的實時更新與共享,有力地提升黔東南非遺的知名度和影響力。借助現代信息技術手段,我們可以對非遺資源進行深度挖掘和精細化處理,進一步揭示其內在的經濟文化價值。這不僅有助于推動非遺與現代社會的緊密融合,也能讓更多人接觸并愛上非遺文化,從而在新的時代背景下煥發非遺的生命力,促進非物質文化遺產的保護與傳承。
(二)建設基礎
自2016年起,凱里學院圖書館收集與整理黔東南非遺報紙資源,制作剪報。八載春秋,已累計完成165期剪報,匯集約1800篇文章,但囿于人力,現仍有4000余份資料未轉化,且剪報收集量持續增長中。
早期剪報制作需要掃描、裁剪、拼接紙質報紙,非常煩瑣。科技進步后,我們能直接從網絡尋找資源,用軟件處理排版,制作更便捷、高效。每期至少八版,以PDF形式上傳供瀏覽。但此類剪報不支持檢索、下載、文獻分析及在線打印等功能,難以滿足需求。因此,剪報數據庫的建設被推上日程,期待能為讀者帶來更加豐富的閱讀體驗與更高科研價值。
二、非遺剪報數據庫建設實踐
本剪報數據庫的建立包括報紙信息加工、構建數據庫框架、確定導航體系、設置分類、數據著錄和審核發布等幾個步驟。
(一)剪報信息的收集
數據采集我們嚴謹細致,制訂實施標準規范,統一剪報格式,細化信息分類,精準表述,為后續處理和檢索奠定基礎。報紙資料來源廣泛,包括黔東南地方、民族類報紙,用網絡搜索引擎查找非遺報紙信息作為補充。收集非遺領域各方面內容,確保全面準確,記錄詳細信息,尊重版權。最大限度地保證為一個全面、準確、易讀的黔東南非物質文化遺產資料庫。
(二)剪報信息的處理與轉換
剪報數據主要存在三種形式。一是紙質報紙掃描得的圖像數據,須確保高分辨率,用OCR技術轉文本,存儲于WORD文檔。二是從報紙數字版下載的PDF文件,每篇單獨保存。三是從網頁復制的新聞報道,經排版后存儲于WORD文檔。初步處理的數據將批量轉化為雙層PDF文件,結合了文本層和圖像層,使得內容既可編輯和搜索,又能保持原始文檔的版面效果。處理和轉換工作完成后,將展開數據清洗,識別并糾正錯誤、重復、不準確或不完整的信息,確保數據準確完整。
(三)數據庫分類導航的建立
非遺作為中華文明的瑰寶,分類方法多樣,本數據庫建立三種導航方式構建其分類體系,分別是地域導航、級別導航和批次導航。其中地域導航又分為三級,一級導航匯聚了黔東南十八個申報單位;二級導航按項目類別分類;三級導航列出具體項目名稱,后續新增項目將根據公告更新。三級導航體系建立好后,數據庫著錄人員只需選擇項目名稱字段,即可將剪報歸入地域導航系統。建立導航體系后,在數據庫中可以根據分類建立字段對非遺項目進行標注和索引,方便用戶快速檢索相關內容(如表1)。
(四)數據庫字段設置
數字化加工前,需要明確數字化標準,主要遵循都柏林核心元數據標準和著錄規范,并在這些標準基礎上進行細化和優化設置標引字段。“都柏林核心元數據”又稱DC(Dublin Core)元數據,是當前圖書館界應用最廣、影響最大的標準化元數據(如表2)。
參考DC元數據標準后,本數據庫中復用了其中6個元素(題名、創建者、主題、描述、日期、來源), 關于已定義的其余剪報知識元要素,目前尚未找到近似的元數據標準,因此,本文自行定義一個元數據標準(FYJB,簡寫為fy)說明,元數據元素共計13個(如表3) 。
這些字段涵蓋了剪報數據庫的基本需求,但具體的設計還要根據實際業務需求進行調整和擴展。此外,還要設置字段的數據類型、長度、約束條件等,以確保數據的準確性和完整性。同時,為了提高查詢效率,可以建立合適的索引。此外,數據庫設計是一個迭代的過程,隨著業務的發展和變化,要對數據庫結構進行調整和優化。因此,在設計過程中應保持靈活性和可擴展性。
(五)數據著錄
完成PDF格式剪報數據的批量上傳后,我們進入數據著錄階段。這一環節對數據庫質量控制至關重要,須持續投入精力。著錄前,制定嚴謹規范并嚴格執行,確保數據質量。規范應詳細規定日期格式、數字精度、文本長度及特殊符號使用等,確保數據真實準確。
著錄過程中,注意細節把控,如字符統一為英文半角,作者名單用半角逗號分隔前三位,關鍵詞選取三至五個用半角分號分隔,項目名稱依據導航體系選擇。秉持“應錄盡錄”原則,確保信息完整,可跳過無相關內容字段。借助自動化工具校驗數據一致性、準確性。數據著錄是數據庫建設的基石,關乎系統穩定性。審核后發布數據供讀者使用。
三、非遺剪報數據庫建設中存在的問題
非遺剪報數據庫作為保護和傳承非物質文化遺產的重要工具,近年來得到了廣泛的關注和發展。然而,在非遺剪報數據庫的建設過程中,仍存在諸多問題。
一是由于非遺剪報來源廣泛,可能涉及各種報紙、雜志、網站等,因此在收集數據時可能會存在遺漏,導致數據庫內容不完整。二是非遺剪報的內容可能涉及不同的主題、地域、時間等,如果整理不規范,會導致數據混亂,難以查找和利用。三是非遺剪報是動態發展的,新的報道和資料會不斷涌現,如果數據庫更新不及時,就無法反映非遺的最新動態。四是非遺剪報數據庫的建設需要相應的技術支持,包括數據采集、存儲、處理、查詢等方面的技術,如果技術支持不足,會影響數據庫的建設質量和使用效果。
四、非遺剪報數據庫建設的應對措施
首先,為了確保非遺剪報數據的全面性和完整性,我們將通過多種渠道進行收集。例如,通過圖書館、檔案館、文化館等實體機構獲取非遺剪報資料;與各大報紙、雜志等媒體建立穩定的合作關系,確保能夠及時獲取到第一手的非遺剪報資料;利用互聯網平臺,進行網絡收集。通過這些渠道的共同努力,我們能夠更好地保留和傳承黔東南非遺文化。
其次,制定統一的數據整理規范非常重要,它涉及對非遺剪報進行分類、標注、整理等工作。我們將根據非遺剪報的內容、來源、時間等關鍵信息進行分類和標注,以便于后續的查找和使用。同時,建立數據質量檢查機制也是必不可少的,它能夠對整理后的數據進行質量檢查,確保數據的準確性。通過規范數據整理和建立數據質量檢查機制,我們能夠提高非遺剪報數據庫的質量和可靠性,為非遺文化的傳承和發展提供有力支持。
此外,為了確保非遺剪報數據庫內容的時效性和新鮮感,我們建立了定期更新機制。這意味著我們會按照一定的時間周期,如每月、每季度或每年,對數據庫進行全面更新。這樣的更新頻率能夠確保數據庫中的內容始終緊跟非遺領域的最新動態和發展趨勢。除了定期更新外,我們還會密切關注非遺領域的熱點事件和話題,一旦發現具有重要性和時效性的剪報資料,我們會立即將其納入數據庫中,確保數據的時效性和完整性。
最后,為了進一步提高非遺剪報數據庫的建設質量和使用效果,我們將積極引進先進的數據采集技術,確保數據的全面性和完整性;采用高效的數據存儲技術,保障數據庫的高可用性和高可靠性;運用智能化的數據處理技術,提升數據的分析和挖掘能力;搭建靈活的數據查詢平臺,使用戶能夠便捷地獲取所需信息。同時,我們會加強技術培訓和人才引進,提高技術人員的專業水平,為數據庫的建設和維護提供有力保障。
五、結語
黔東南非遺剪報數據庫建設意義重大,前景廣闊。展望未來,該數據庫有望在多個領域取得顯著進展和突破。伴隨著AI和自然語言處理技術的發展,非遺剪報數據庫將迎來重大革新,AI和機器學習技術將實現剪報信息的自動化處理與分類,提高工作效率,減少錯誤。數據可視化技術將復雜數據處理結果以直觀圖表和圖像形式展現,有助于用戶理解和利用數據。非遺剪報數據庫將與各領域研究機構、企業、非政府組織合作,推動數據開放共享,為非遺研究、傳承、產業發展提供數據支持,并保護、傳承、推廣黔東南非遺。總之,黔東南非遺剪報數據庫的建設將為保護和傳承這一獨特的文化遺產做出重要貢獻,并成為學術研究、文化傳承與社會應用的重要資源,推動黔東南地區文化的繁榮與可持續發展。
參考文獻:
[1]高夢秦.高校圖書館報紙資源的利用與TPI技術的應用[J].科技情報開發與經濟,2007(33):11-12.
[2]唐月娥,李敏.紅色報紙文獻數字化探索與實踐——以《晉綏日報》為例[J].圖書館雜志,2021,40(11):4-8.
[3]陳帥印,劉桂鋒,劉瓊.基于元數據的數據論文與期刊論文的關聯研究——以全球變化科學研究數據出版系統為例[J].數字圖書館論壇,2022(08):11-18.
(作者簡介:趙冬香,女,碩士研究生,凱里學院圖書館,副研究館員,研究方向:數字圖書館、數據庫建設;龍志鳴,男,本科,凱里學院圖書館,館員,研究方向:圖書管理、古籍整理與保護)
(責任編輯 王玲)