崔陽兵

摘?要:文章分析了數字人文時代圖書館地方文獻的特征,并從地方文獻數據源、地方文獻大數據采集與分析、文獻過濾與價值提取、地方文獻大數據分析結果可視化表達等角度闡述了圖書館地方文獻大數據分析流程,最后提出了地方文獻大數據分析平臺構建策略,以期為相關研究提供參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2020)09-0112-02
關鍵詞:數字人文時代;圖書館;地方文獻;大數據
在信息技術的帶動下,數字人文應運而生,數字人文是指用計算機技術處理和分析傳統的人文研究資料,并將人文學科方法論與計算工具相結合進行人文研究[1]。圖書館作為重要的知識服務機構,在地方文獻資源的搜集、存儲、使用方面發揮著重要作用。使用大數據技術對海量的地方文獻資源進行處理,從中挖掘出有價值的數據資源供用戶使用,可以有效提升地方文獻的使用效率,更有效地發揮出地方文獻的學術價值、歷史價值[2]。同時,數字技術與人文社科研究的有機結合使圖書館的地方文獻資源存儲方式由傳統的紙質存儲向數字化轉變,大數據技術分析平臺的建立也為圖書館地方文獻的量化分析和智能處理奠定了基礎,使圖書館可以為用戶提供更高質量的服務。
1?數字人文時代圖書館地方文獻的特征
數字人文時代的一個重要特征就是將數字技術與人文研究結合在一起,使地方文獻成為重要的數字化資源。大數據環境下,圖書館地方文獻的特征體現在分析對象向數字化方向轉變以及分析方法向智能化和多樣化方向轉變兩個方面。
1.1?地方文獻向數字化方向轉變
圖書館傳統的地方文獻分析首先需要搜集原始資料,為了將紙質載體的地方文獻搜集起來,圖書館員要耗費大量的時間和精力。面對數量龐大、浩如煙海的地方文獻資源,圖書館很難搜集完整,并且傳統的文獻分析方法效率低下、手段落后,很難從地方文獻中挖掘出有價值的資源[3],同時也很難驗證文獻的真實性,從而導致后期用戶在使用地方文獻過程中出現問題。數字人文時代,大數據技術的出現在很大程度上解決了圖書館在地方文獻分析方面存在的問題。依托大數據分析平臺對地方文獻資源進行搜集、分析、挖掘,將傳統的文獻處理方式轉化為大數據數字化分析方式,可以促進分析對象向數字化方向轉變,使分析結果更具真實性、客觀性、可靠性。
1.2?分析方法向數字化和智能化方向轉變
在數字人文時代,地方文獻資源逐步實現了數字化,圖書館對于地方文獻資源的分析方法也逐步向數字化和智能化方向過渡。傳統模式下,圖書館對地方文獻資源的分類對比、邏輯分析主要通過人力完成[4],而地方文獻大數據分析平臺主要通過大數據技術對地方文獻進行分析與挖掘,對挖掘出來的知識資源進行加工和重組,從而發現地方文獻資源背后潛在的規律。數字人文時代,圖書館只有改變原有的地方文獻資源分析理念,才能拓寬研究范圍,為用戶提供更有效的服務。
2?數字人文時代圖書館地方文獻大數據分析的要求
2.1?結合地方文獻的特點進行分析
不同種類的地方文獻資源對數據處理效率、數據處理精準度有不同的要求[5],因此,圖書館在利用大數據分析地方文獻的過程中,需要結合其特點、種類,采用適當的分析方法與分析策略。
2.2?掌握用戶的實際需求
在對地方文獻進行大數據分析的過程中,圖書館只有根據地方文獻的特點制定合理的大數據分析策略,才能提高地方文獻采集、利用、管理的效率和有效性,從而實現地方文獻分析對象、分析策略和分析結果的有機統一;只有根據用戶的實際需求選擇適合的大數據技術標準并構建合理的數據處理機制,才能保障地方文獻資源分析結果的質量[6]。
2.3?規避分析過程中可能出現的風險
大數據背景下,由地方文獻組成的海量資源數據呈現出數據規模快速上漲、數據分散存儲及不同結構種類數據協同融合的趨勢,導致地方文獻資源的管理、分析、存儲、傳輸難度加大。同時,伴隨地方文獻資源規模的不斷擴大和種類的增多,地方文獻資源呈現出價值密度低以及無用數據比例上升的現象。此外,大數據分析平臺的結構、大數據分析人員的技能、數據預測分析軟件的可用性以及用戶滿意度都成為影響圖書館地方文獻大數據分析效率和風險控制的重要因素。
3?數字人文時代圖書館地方文獻大數據分析流程
數字人文時代,圖書館地方文獻大數據分析流程主要由地方文獻數據源、地方文獻大數據采集與存儲、文獻過濾與價值提取、知識發現、地方文獻數據分析結果呈現五部分組成,詳見圖1。
地方文獻數據源主要由圖書館館藏資源、地方文獻數據庫、地方知識文化網站等組成。大數據背景下,圖書館主要通過云計算、云存儲、數據集成等技術對地方文獻數據源進行采集與存儲,在這個過程中要盡可能提高價值密度,降低大數據分析平臺的負荷,同時要對提取的文獻數據資源進行深度挖掘并根據用戶需求進行精準匹配。此外,圖書館還需要將數據資源轉化為可供用戶使用的形式并推送至用戶。
4?數字人文時代圖書館地方文獻大數據分析平臺構建策略
4.1?增強圖書館對地方文獻資源的分析能力
在對地方文獻資源進行分析的過程中,增強圖書館的分析能力是為用戶提供科學高效知識服務的前提和基礎。首先,圖書館要使用大數據技術對用戶使用地方文獻資源的需求、內容、方法、模式進行分析、預測、判斷;其次,圖書館要確保大數據分析平臺在分析地方文獻資源過程中的安全、有效、可控;再次,圖書館應選擇科學高效的算法工具提取地方文獻資源中有價值的部分;最后,圖書館地方文獻大數據分析平臺要具備實時分析能力和可視化分析能力。
4.2?提高大數據平臺的分析、存儲及處理能力
數字人文時代,地方文獻資源的來源具有多樣性,因此,首先,圖書館地方文獻大數據分析平臺應具備良好的智能化管理功能,能對海量地方文獻資源進行采集、存儲、挖掘、運算、分析以及配置;其次,隨著圖書館地方文獻資源總量的快速增長,圖書館應構建滿足大數據平臺實時分析和即時傳輸需求的網絡,保障大數據資源存儲管理的高效、便捷、安全;再次,圖書館要重視提升地方文獻大數據分析平臺的分析能力,在保障大數據資源安全可靠及快速傳輸的前提下,優化大數據分析平臺的結構,使地方文獻大數據分析平臺的運算能力得到有效提升。
4.3?提高地方文獻資源的科學性
數字人文時代,圖書館只有保障地方文獻資源具有較高的可靠性和科學性,才能實現對地方文獻有效的分析,從而使大數據分析結果更加全面和科學。首先,圖書館既要對地方文獻資源進行采集,又要對其進行有效存儲。其次,圖書館應建立科學的地方文獻資源儲存和分析流程,保障地方文獻大數據資源存儲的可靠性和分析的可行性。再次,圖書館應對大數據資源進行有效過濾和深度價值挖掘,構建符合圖書館地方文獻服務需求的大數據資源分析流程。最后,地方文獻資源大數據分析結果應具備可靠性和可用性。可靠性是指保障地方文獻大數據的來源與大數據分析結果是可靠的,在地方文獻大數據分析過程中應避免出現經驗主義的現象[7];可用性是指地方文獻大數據分析平臺提供的分析結果是可用的,能滿足圖書館的服務需求。
5?結語
數字人文時代,用戶對圖書館地方文獻服務的質量、內容和模式都提出了更高的要求。在此背景下,圖書館只有了解用戶需求并對地方文獻資源進行深度挖掘與分析,才能為其提供更有價值的服務。
參考文獻:
[1] 陳紅彥.古籍文本數據格式化比較研究[M].上海:上海遠東出版社,2017:93-96.
[2] 徐俊.論大數據環境下公共圖書館地方文獻數據服務體系的構建[J].圖書館研究與工作,2017(5):60-63.
[3] 王娟.云計算環境下地方高校圖書館區域特色文獻保障體系建設與服務模式探討[J].農業圖書情報學刊,2014(10):24-28.
[4] 王亮亮,齊月.大數據環境下黑龍江地方文獻資源的開發與保障體系研究[J].圖書館學刊,2016(6):42-44.
[5] 孫軍.大數據時代縣級公共圖書館數字化創新發展研究:以阜寧縣圖書館地方文獻數字化建設為例[J].文教資料,2015(20):56-57.
[6] 侯勇,王護寧,徐俊.大數據背景下公共圖書館館藏地方文獻利用的探討:以安徽地方戲曲文獻為例[J].大學圖書情報學刊,2016(3):84-87.
[7] 劉海燕.大數據環境下地方特色數據庫的建設:武漢城市文化文獻數據庫建設探析[J].科技通報,2018(7):280-283.
(編校:周雪芹)