馮紹卿
【摘?要】圖書館作為我國重要的社會基礎機構,承擔著為群眾提供閱讀服務以及社會教育職能。在現代信息技術快速發展的背景下,數字圖書館建設不斷完善,是當前圖書館的主要發展方向,通過數字圖書館建設能夠為人們提供電子化閱讀服務,從而促進圖書館服務質量提高。但是在數字圖書館建設過程中,對于存儲能力要求較高,必須采用穩定的存儲方式將圖書館館藏資源進行數字化存儲。因此,本文將對面向數字圖書館的多級混合存儲技術進行深入地研究與分析,并提出一些合理的意見和措施,旨在進一步促進我國數字圖書館建設質量提升。
【關鍵詞】數字圖書館;存儲能力;存儲技術;多級混合存儲技術;優化措施
在人們閱讀方式轉變的背景下,傳統圖書館的服務模式已經不能滿足群眾現代閱讀需求,所以近些年來數字圖書館建設取得很大發展,能夠為讀者提供更加優質的電子化、網絡化閱讀服務。在數字圖書館的存儲方式中,傳統的機械硬盤存儲方式雖然成本較低,但是速度較慢,固態硬盤存儲速度較快,但是綜合成本較高,內存虛擬硬盤存儲速度最快,但是存儲成本最高,且如果發生斷電就會出現數據丟失問題。因此,如何將多種存儲方式混合使用,是當前數字圖書館建設需要考慮的主要內容。
1當前數字圖書館主要存儲方式分析
1.1傳統機械硬盤存儲
傳統的機械硬盤存儲是采用磁盤高速旋轉的方式,將磁頭在硬盤中讀取數據的模式,隨著數據量逐漸增加,磁盤的碎片也會提升,磁頭讀取數據所需要花費的時間也會隨之延長,存儲速率就會降低。例如常用的FC機械硬盤,內部傳輸速率相比于普通硬盤更高,采用高密度的磁盤技術,持續性數據傳輸率能夠達到171MB/s,在數字圖書館存儲中具有重要的作用[1]。
1.2固態硬盤存儲
固態硬盤是指采用固態電子存儲芯片陣列而制作的硬盤,內部結構主要包括控制單元、存儲單元,在數字圖書館存儲中有著廣泛地應用,固態硬盤在外形與尺寸方面有傳統機械硬盤基本相同,但是相較于機械硬盤能夠實現耕地成本、更大容量,相比于機械硬盤各方面表現更為出色,但是綜合成本造價較高。
1.3內存虛擬硬盤存儲
內存虛擬硬盤存儲管理和使用較為簡單,能夠降低服務器運行壓力,數據讀寫和存儲速度較快,具有許多優勢。但是,存儲數據為普通數據網絡傳輸模式,容易受到其他流量的影響,當網絡中數據流量較大時,其系統性能將會受到影響,且因為采用普通網絡傳輸模式,容易發生系統數據泄漏和丟失問題,對于數字圖書館系統穩定性和安全性要求較高。
2數字圖書館數字資源基本特征分析
單體讀者訪問數字圖書館資源時具有隨機性和無序性特征,但是圖書館不能要求讀者按照數字圖書館建設訪問資源,因為不同讀者的閱讀方向不同,但是從大量的讀者訪問數據來看,其熱點數據具有一定的規律性,將數字圖書館資源根據其訪問熱度進行劃分,在一定時間范圍內根據相應的條件進行數據遷移,則能夠提高數字圖書館多級存儲能力[2]。在數字圖書館正常運行時,讀者會在任何時間訪問數字圖書館內部資源,在同一時間內有幾率訪問同一資源,但是數字資源的寫入并不是隨時能夠進行,例如,傳統數字圖書館的電子期刊比如知網、維普等,在本地鏡像時以年為時間單位對其進行內部更新,后期更新速度較為緩慢。對于傳統圖書館而言,數字圖書館資源以頻繁讀取為主要模式,偶爾會出現大量數據寫入的問題。因此,采用多級存儲方式的數字圖書館局部與傳統數字圖書館相似,讀者讀取數據按照數據優先訪問規律開展數據遷移,但是因為CACHE、SSD等價格相比于傳統機械硬盤價格更高,且容量較小,所以在數字圖書館多級存儲方式中占比較小。
3數字圖書館多級混合存儲技術應用分析
3.1熱點數據遷移模式
數字圖書館作為一個大規模的數據資源庫,有收藏、推新以及推熱的基本功能,電子期刊、電子圖書以及影視資料等數據將新的資源移動的到高速存儲介質中,將舊有資源或訪問量較少的數字資源移動到低速存儲介質中,通過對數據遷移進行合理化配置,根據遷移配置模型能夠使數字圖書館多級混合存儲技術的應用效果最大化發揮。當前,數字圖書館熱點數據遷移中有存儲卷遷移和文件遷移兩種主要模式,大部分新型儲存器都帶有存儲卷遷移功能,存儲器會將存儲磁盤拆分成為若干個卷,存儲器中的程序會根據卷的熱點程度進行遷移,而不是采用單體數據文件的形式,所以適合采用存儲卷遷移模式。數據遷移模式主要包括:人機交互平臺已手工的方式根據要求將資源存儲到對應的多機存儲區域,還可以采用軟件進行數據遷移,根據相應的算法采用自動化數據遷移方式[3]。通過對數字圖書館熱點數據遷移模式的優化,成本最高的存儲器主要用于訪問較為頻繁、熱點程度較高且價值最好的數字資源存儲,成本適中的用于存儲訪問頻率中等且價值一般的數字資源存儲,傳統機械硬盤用于存儲冷門數據和價值較低的數據存儲,從而能夠對數字圖書館資源存儲進行優化,發揮出多級混合存儲技術的最優效果,提高數字圖書館存儲系統穩定性和實用性。
3.2數據庫建設
圖書館中的數字資源主要包括電子圖書資源、音頻資源、食品資源以及期刊論文資源等幾個類別。因為傳統的紙質閱讀方式已經不能滿足當前讀者的閱讀需要,所以數字圖書資源是其建設的主要核心,需要考慮到圖書資源的基本信息,根據信息建立相應的數據庫。通過建設數字圖書館數據庫的方式,建立數據庫模型,將數字圖書資源根據其基本信息進行數據遷移,并根據資源類型的不同,采用不同的數據庫建設方式,圖書基本表中的信息主要包括:ID號、內部或出版圖書表示、電子圖書書名、作者名、出版單位、出版時間、ISBN編號、頁碼、出版次第、裝幀、開本、書籍分類、附件大小、下載次數、下載地址、錄入者、錄入日期、閱讀次數、熱點因子、遷移目標位置以及存儲介質等。根據圖書基本信息,將其分類錄入到數字圖書館的資源庫中,形成規范化、制度化、標準化的數據庫,從而能夠將多級混合存儲技術優勢最大化發揮,提升數字圖書館存儲系統穩定性和經濟性。
3.3多級存儲混合技術應用流程
1.電子圖書基本表、音頻/食品數據基礎表、期刊論文基本表中存儲的信息,根據表中的瀏覽頻率、下載次數以及讀者在線調查等作為熱點選擇依據,按照數據熱點不同,采用不同的存儲技術。
2.電子圖書輔助表、音頻/視頻數據輔助表、期刊論文輔助表,根據圖書館的實體銷售與網絡數據,收集熱門數據,按照數據熱點不同,采用不同的存儲技術。
3.根據輔助表中的數據引入技術,將其與基本表進行比對,如果輔助表中的數據都可以在基本表中體現,則將基本表中的熱點因子進行調整,如果沒有對應表現,則需要在輔助表中記錄,將其作為圖書館下一步數字資源的主要內容。
4.根據文件大小對文件系統基本表中的熱點因子進行修正,文件數據越大則熱點因子越小,從而根據熱點因子選擇不同的存儲技術。
結束語
綜上所述,本文詳細闡述多種不同存儲技術的優勢和缺點,同分對數字圖書館數據訪問特征進行分析,并提出多項有效的數字圖書多級混合存儲技術的應用方式,希望能夠對我國數字圖書館建設起到一定的借鑒和幫助作用。
參考文獻:
[1]李紅華. 數字圖書館資源的云存儲系統需求與設計分析[J]. 現代科學儀器,2019,(005):29-33.
[2]孟一奇. 基于云存儲技術的數字圖書館館藏資源安全保障體系研究[J]. 中國中醫藥圖書情報雜志,2019,43(002):1-4.
[3]陳桂菊. 面向數字式圖書館的海量文獻數據查詢優化方案分析[J]. 現代科學儀器,2019,000(005):166-168.