魯 昉
(中共貴州省委黨校 信息管理處,貴陽 550025)
大數據環境下的數字圖書館關鍵技術研究
魯 昉
(中共貴州省委黨校 信息管理處,貴陽 550025)
在大數據環境下,大型的數據技術在信息提取等方面得到廣泛的應用,并對信息資源進行有效的管理,但在大數據環境中蘊藏著海量的數據信息,這些信息多樣,而且較為零散、復雜,因此,為信息的存儲和管理等工作增加了不少的難度。在大數據環境下,數字圖書館的發展面臨眾多挑戰。本文圍繞大數據環境下的數字圖書館關鍵技術進行分析。
大數據環境;數字圖書館;關鍵技術
隨著計算機技術、網絡技術等的發展,圖書館也已經進入到了數字化發展階段,在圖書館信息資源整理和管理等工作中,也加大了對數字化技術的應用,促進了信息化服務和數字化服務的實現。數字圖書館使用數字技術、網絡技術等構建信息應用系統,對信息數據進行存儲、檢索、保存等,從數字圖書館自身進行分析,其各項功能的實現都是在以下這些關鍵技術的支持下完成的,數字圖書館利用這些關鍵技術實現新時代的信息化服務。
在數字圖書館中儲存技術,主要是將信息數字化之后的文件保存,在實際工作中,純文本的信息資源,如果只是對數字化技術和信息組織技術應用,根本無法對目前的數字圖書館需求滿足。當前與數字圖書館相關的數據技術,包括有多媒體數據技術、面向對象數據庫技術等,這些數字化技術的特點如表1。

表1 數字圖書館的關鍵數據庫技術比較
數字圖書館的文本智能檢索技術,可以實現跨地域、跨文庫的實現信息資源的檢索,并按照用戶的要求,實施精密文本信息。文本檢索技術可以根據用戶的實際信息需求,對信息進一步進行分析,制定信息檢索方案,根據信息的檢索方案對用戶需求的文本信息先進行分布式的檢索,其次實施精確檢索,提高文本檢索的質量以及文本信息檢索的準確性。常見的文本格式為DOC、TXT、RTF、PDF,圖像格式為BMP、TIF、GIF、WMF、PICT、PCD、 TGA、JPG等,動畫格式為ANI、FLI、FLC,視頻格式為AVI、MOV、MPG等,音頻格式為WAV、MID、AUD等,程序格式為COM、EXT。數字圖書館技術運用這些技術,進行文本信息、圖像信息、音頻信息等的檢索、獲取等,先進行相似性檢索,然后直接從內容中選取相應的文本信息特征,進行信息檢索。
在大數據環境下,數字圖書館成為先進技術應用的一個代表,在數字圖書館中,數據挖掘技術的應用,可以從大量的數據信息中,挖掘出抽象的、潛在的信息,發現數字圖書館中數字數據庫中的核心,為大量數據的有效利用提供幫助。
人與人的興趣、愛好存在差異性,在數字圖書館發展的過程中,每一個用戶都有自己感興趣的信息和內容,但是用戶自己想檢索的文本信息等內容存在局限性,此時,利用識別技術,對用戶感興趣的內容進行識別,獲取用戶可讀的信息,同時,提高上數字圖書館的信息獲取效率,更好的為用戶提供服務。
數字圖書館是在網絡技術、計算機技術等的支持下實現的,所以,其自身的遞送網絡技術是一種網絡體系結構,通過該技術,實現各種信息資源的緩存、復制、發送等。遞送網絡技術的控制可以采用動態流量分配實現,在用戶訪問請求下,引導用戶實施就近訪問,對網絡運行中存在的網絡堵塞問題處理,提高用戶的訪問響應速度。
數字圖書館的一大特征就是知識信息量大而且豐富,這些特征也進一步的說明,信息的知識產權保護是一大難題。當前,產權保護是全社會都在關注的問題,并受到社會結構、倫理等的影響,為了保證數字圖書館中信息資源的安全性,其知識權保護技術,按照網絡瀏覽版權法,對用戶的訪問范圍進行合理的設置,在一定程度下,還可以為用戶提供瀏覽服務,但是不提供復制服務。
主要參考文獻
[1]陳臣.大數據環境下數字圖書館安全威脅與對策研究[J].圖書館工作與研究,2014(11):34-38.
[2]鄭沁.數字圖書館的發展及關鍵技術[J].海峽科學,2012(12):73-74,83.
10.3969/j.issn.1673 - 0194.2015.06.134
G250.76;G252
A
1673-0194(2015)06-0212-01
2015-02-05