李 琳
(湖南環境生物職業技術學院,湖南 衡陽 421005)
目前,國內圖書館的數字化管理系統依然處于初級嘗試階段,很多圖書館的管理系統就是設計了一系列的查找與相關文獻資料的電子版就對外統稱為數字化管理系統,該操作既顯得不專業又并非真正意義上的數字化圖書管理系統,數字化圖書管理系統(如圖1 所示)應該是一款集精確查找、文獻聯想、相關查詢、模糊查詢、資料統計、大數據分析、同步文獻上傳以及分布式存儲等多種功能于一體的管理系統,并不是簡簡單單的查詢系統就可以代表數字化圖書館管理系統[1]。

圖1 數字化圖書館的技術應用
該文研究的數字化圖書管理系統結合大數據與云存儲的相關技術,實現了6 個優勢功能,包括智能查詢功能、文獻聯想功能、資料統計功能、大數據用戶分析、文獻同步上傳以及云端進度功能等多種系統架構,完成了對數字化圖書管理系統的一次革新。同時該系統將主要解決目前圖書館管理中存在的諸多問題,例如館藏管理混亂、圖書遺失補充、館藏追索困難、館藏圖書分類、孤本善本管理保存以及電子版出借等多種疑難問題。
數字化圖書管理系統研究設計的系統架構可以利用大數據進行整理與分類歸納,實現主動上傳圖書館館藏掃描結果的功能,并可以同步并網吸納相關數據文獻;同時嵌入云計算相應的甄別與計算功能,完善圖書館分類與聯想推送功能,為用戶提供定制的閱讀管理時間表與閱讀相關推薦。此外,外部展示頁面由雙端口組成,管理端口直接對接數字化圖書管理系統管理員及相關負責人,而用戶端口則對接圖書館相應會籍人員。
該文研究的數字化圖書管理系統總共分為以下5 個模塊:圖書館藏管理模塊、基于區塊鏈的會籍管理模塊、云端文獻資料存儲模塊、大數據分析模塊以及智能查詢模塊;這5 個模塊的一體化應用整體構建成了數字化圖書管理系統,下面將一一列舉數字化圖書管理系統的5 個模塊。
數字化圖書館管理系統最重要的模塊就是館藏管理模塊,但是在建設系統之初,很多數字化圖書館都容易走入誤區,片面地強調館藏管理或者單一打造數字化館藏管理是不正確的,但是不可否認,該模塊是數字化圖書館管理系統的核心組成模塊,該模塊的館藏管理分為2 個方面,一方面是針對館藏實體書籍的管理,包括了館藏書籍的位置擺放、書籍的精準定位、書籍的出借等級、書籍的價格、書籍遺失或損壞后的新增以及修復等各個方面。另一方面是館藏圖書的數據化環節,主要包括書籍資料的電子化、其他類型文獻的數據化,特別是針對孤本、善本以及具有紀念價值或者收藏價值的書籍,館藏管理模塊在保存電子文獻資料的同時,還會生成實體書籍的特別保管方式,根據環境和周邊氣候的變化,例如過于干燥、潮濕以及南方梅雨季節等都需要及時對書籍的保存管理方式作出更改[2]。
例如該模塊建立的天氣抓取技術,主要依托在線信息模塊在Linux(Linux,全稱GNU/Linux,是一種免費使用和自由傳播的類UNIX 操作系統)系統下,利用Wireshark(Wireshark(前稱Ethereal)是一個網絡封包分析軟件)抓包工具抓取天氣信息并對數據進行解析處理,得到真正有用的關鍵信息并顯示出來。該模塊下的天氣組件主要分為3 個小模塊:1)實時天氣信息。對時下天氣進行整理整合。2)未來天氣信息預警。針對南方梅雨季節以及北方暴雨季等問題進行防范。3)歷史天氣信息。綜合考量時間段內的天氣預防措施,前端屏幕顯示部分主要生成的是相關解決方案并直接由代碼推送到前端顯示。以未來天氣信息預判抓取為例,首先,創建一個用來通信的套接字文件描述符;其次,可以發送三次握手鏈接請求(TCP 協議);最終,發送請求報文,先在Linux 系統下打開抓包工具,等待抓取,再用火狐打開要查找信息的網址,找到相應報文并復制,一般發送6 種信息,利用sprintf(sprintf 指的是字符串格式化命令)將其拼接起來再發送,并從接收端獲取相應的數據,因為后面還需要對數據進行處理,所以將數據存放到申請的堆區空間里。
在出借文獻資料時,通過會籍人員的加入與共同參與,將建立圖書館區塊鏈社區,屆時建立的社區將會使用通行的通證模式,在會籍人員享受包括出借、文獻保管、電子文獻注釋、文獻捐贈以及時歸還等多種服務后,該服務將產生運算,獲取通證(或積分)可以為會籍獲取更高權限等級和身份識別,并在社區內為高等級會籍開放更稀有書籍的閱覽權限或者學識分享權限,同時社區內頁將直接引入網上書城的模式,部分書籍可以在網上商城出售,靈活地為圖書館產生部分利潤。
每一次的會籍貢獻就是一次區塊鏈的運算,運算后產生的積分就會成為會籍在圖書館區塊鏈社區內的“現金”,可以實現購買書籍、積分租用會議室、開設講座以及積分換取課時等多種功能和應用場景,讓圖書館會籍在圖書館中除了有更好的閱讀環境之外,還可以獲得更加豐富的應用。
該文的數字化圖書館管理系統提出構建或者引入云端文獻資料庫的存儲模塊,該模塊并不僅是某一個圖書館所獨有的,而應該是加入云端文獻資料庫的所有圖書館都共同享有它的使用權利,引入該模塊可以更加全面地豐富館藏,同時該模塊在使用端支持上傳多種模式的文獻資料,包括書籍掃描、書籍電子版、有聲書籍、視頻文獻資料以及紀錄片等多種形式,在通過線上人工智能的審核后,還要通過人工篩選,確保無有毒害性質的資料上載融入云端數據庫[3]。
此外,由于云端文獻庫存在運營、維護以及擴容增量的成本,使用該資料庫應該有2 種收費模式,一種是圖書館的使用費,一種是并入區塊鏈會籍管理模式時,書籍作者或者出版社的廣告費用。存儲模塊的最大優勢就是吸引讀者,將讀者直接轉化為圖書館會籍,并成為圖書館的忠實用戶,借此提升圖書館會籍的用戶黏性。數字化圖書館手機登錄界面如圖2 所示。

圖2 數字化圖書館手機登錄界面
大數據分析模塊是數字化圖書管理系統五大模塊中最具有圖書館館藏特色的模塊組成,它就是通過用戶閱讀數據來為用戶解決閱讀困境,使用電子文獻借閱時,大數據系統會自動為用戶提供生僻字解釋、冷門事件回顧以及特殊歷史事件詮釋等,用戶在閱讀時候,不用刻意查詢資料,所有的問題都可以使用用戶界面端口圈定后直接給予相應的“聯想型”解釋,如果用戶還希望通過進一步文獻查詢解決當下疑問,大數據會根據過往同類型閱讀疑問、閱讀用戶后續相關閱讀以及閱讀用戶的點評進行綜合分析、評定,快速提供相應電子文獻資料快速借閱通道、實體文獻館藏位置以及相關簡介。
另外,大數據在累積用戶的相關資料以及閱讀習慣后,會在固定時間段提醒用戶閱讀,保持閱讀是非常優秀的生活習慣,例如在世界讀書日等具有紀念意義的日期,系統會根據史實資料推薦相關閱讀書籍,同時用戶使用界面也會通過篩選給予例如“歷史上的今天”等多種方式的閱讀引導推薦[4]。根據網絡統計數據顯示,通過關鍵詞引導人類自我閱讀行為的發生概率是沒有關鍵詞引導閱讀的1.3 倍。同時系統在用戶自行閱讀時也會將用戶的閱讀習慣、閱讀速度等數據上傳至云端,系統會根據每個人不同的閱讀方式,為用戶量身定制閱讀方案和閱讀推薦。基于該功能的需求,筆者將嘗試使用Lambda(Lambda 架構是由Storm 的作者Nathan Marz 提出的一個實時大數據處理框架)架構作為該模塊的基本數據架構模型,該架構是大數據系統里面非常重要的架構,大多數的架構都是基于Lambda 架構或者基于它的變種架構。它通過批量 MapReduce(MapReduce 是一種編程模型,用于大規模數據集(大于1TB)的并行運算)作業提供了雖然有些延遲但是結果準確的計算,同時通過Storm 初步展示最新數據的計算結果。主要將數據分析分成了2 個分支:實時流和離線,實時地依照了流式架構,保障了時效性。而批量處理則對數據進行全量運算,保證其最終的一致性。該架構相比于其他傳統架構不僅具有實時功能,而且還具有實現離線的功能,對于數據分析下各種應用場景的涵蓋將做到非常全面,而由于該系統在設計應用之初就是為了實現規模化,因此將大大降低實施構建的成本,也增加了整體系統的實用性。
數字化圖書館最重要的功能就是查詢功能,現有的書名搜索已經不能滿足用戶對文獻資料搜索的需求,智能查詢才是圖書館未來的發展前景,智能查詢包括以下4 個方面。
2.5.1 關鍵詞句搜索
不知道書名,卻因為某一段話或某一個詞語,想要查看文獻資料的人非常多,面對茫茫的數據汪洋,僅使用書名查找已經完全不能滿足目前用戶對圖書搜索的需求,通過關鍵詞句搜索就能滿足用戶查詢文獻資料的需求。
2.5.2 語音搜索
基于當下系統架構的呈現方式還是依靠手機App,通過語音搜索相關文獻就是非常符合需求,也是非常必要的[5]。
2.5.3 多文獻篩選
某一份文獻資料很可能存在多種版本和多種解釋,在未來大數據的應用方案中,用戶在檢索文獻資料的時候,系統可以根據用戶的需求或者關鍵因素,為用戶提供多文獻篩查,確保用戶精準獲取資料,避免出現重復查詢以及反復核對驗證等問題,如果用戶在查詢文獻時產生重復推送多種同類型文獻的現象,也會自動依據文獻產生的時間以及相關作者生成注釋、解析,為用戶呈現關于多版本文獻的精確的不同之處。
2.5.4 智能查詢推介
用戶在查詢相關文獻資料時,用戶使用端口在為用戶提供主文獻資料的同時,還會同步推送其他相關文獻,以歷史書籍為例,用戶在搜索《三國志》這本書籍時,那么將會同步在主書籍資料推送的下端同步推薦同為二十四史的其他相關書籍,名人注解的《易中天品三國》,歷史類四大名著《三國演義》等,這樣方便讀者在探究和了解某一領域知識的同時,能夠更輕易地獲取其他相關知識,并制定接下來的閱讀計劃。
數字化圖書館已經成為現有圖書館未來的發展趨勢,這是不可更改的,數字化圖書館具有館藏保有量大、永久保存等多種優勢,但是不得不提的是現有的實體圖書館依然是不可以完全被數字化線上圖書館所替代的,閱讀是一種技能也是一種生活方式,它從精神層面給人類帶來享受和進步,在數字化圖書館未來的發展趨勢中,主要需要優化的3 個方面即流量變現、館藏追索以及社群管理[6]。
流量變現其實不難理解,在數字化、互聯網化以及物聯網化瞬息萬變的今天,紙質書籍雖然不至于消失,但是已經難以產生可觀的經濟效益,而圖書館的存續不可以一味的指望國家資金的扶持,如何將流量變現就成了一個非常值得探討的問題,技術是流量變現的重要因素,合理地利用大數據算法留存、提升用戶黏性,用戶就會愿意為圖書館提供的各種便捷服務買單,例如一鍵上門送書或者歸還;用戶喜歡私密安靜的閱讀,圖書館提供絕對安靜的個人閱讀室;用戶喜歡集中討論,圖書館就可以提供大眾型閱讀室等。用戶都可以提前在端口預約下單,圖書館依靠大數據計算合理安排用戶與圖書館之間的互動。
依靠大數據以及時下社會的征信系統建立圖書借閱征信系統,一旦用戶借閱不予歸還、損壞不予賠償都將產生比較嚴重的惡劣影響,圖書館依據用戶信用等級出借相應書籍,同時系統也將自動推送通知給違反圖書出借條例的用戶給予提示和通知,如果出借資料比較重要或者出借的書籍價值非常高,還會定期為用戶提示和核查。
閱讀是一種共同愛好,基于該愛好建立的社群是具有高效黏性的,特別是知識講座的傳播效率都非常高,時下“樊登讀書會”的案例已經說明,做好社群管理就是一件非常明智的舉措,甚至可以為圖書館帶來完全不一樣的變革,前文中曾提過,建立區塊鏈會籍管理社區模塊還應該設立用戶之間的溝通窗口,用戶可以使用積分產生積分交易或者書籍交換等行為,建立用戶知識分享窗口。
數字化圖書館可以使用戶足不出戶即可充分地獲取所需的信息。從地域范圍的角度來說,用戶所查詢或獲取的信息并不僅僅局限于一個圖書館,而是沒有地域界限的,可能是全地區或全國的,甚至是全世界的。在數字圖書館時代,信息資源能得到充分的共享;此外,以前許多不能被借閱的珍本、善本等較為珍貴的資料也能以數字信息的形態出現在用戶面前。基于大數據分析模塊下的數字化圖書館并不是日暮西山的行業,而是人類生活必不可缺的精神家園,已經很多人在嘗試探索圖書館未來發展的新出路,例如行業領頭的新華書店、結合咖啡會籍制度的西西弗書店等都是行業翹楚,學會有效地利用技術,特別是云計算、大數據分析以及區塊鏈等技術會很容易將圖書館領向全新的領域,與此同時,技術的發展也是日新月異,AI 技術、生物識別技術也可以與數字化圖書館結合,未來數字化圖書館的發展應該是多樣的,合理使用該數字化圖書館管理系統將為圖書館的數字化發展帶來不可估量的動力。