關鍵詞:云計算;數字資源;資源整合
摘要:文章分析了目前數字資源整合的現狀,闡述了數字資源整合的內容、方式,重點討論面向云計算環境的數字資源整合的相關理論,結合云計算的特點,提出了云計算環境下的數字資源整合技術的應用與改進。
中圖分類號:G250.7文獻標識碼:A文章編號:1003-1588(2014)11-0126-04
收稿日期:2014-10-21
作者簡介:伏琰(1980-),鄭州大學圖書館館員。
*本文為河南省軟科學研究項目“云計算環境下的數字資源整合與服務模式研究”的階段性成果之一,項目編號:132400410558。1引言
隨著數字化、網絡化環境的形成,數字信息已逐步成為信息傳遞的主流媒體,數字資源組織也成為信息管理領域的主要研究方向和工作內容。據國際數據公司(International Data Corporation,簡稱IDC)2013年3月發布的最新數字宇宙研究報告《大數據,更大的數字身影,最大增長在遠東》[1]顯示,隨著全球范圍內個人電腦、智能手機等設備的普及和新興市場內不斷增長的互聯網訪問量,使數字宇宙的規模在最近兩年翻了一番,達到驚人的2.8 ZB。IDC預計,數字宇宙從現在開始將每兩年翻一番的速度發展,到2020年,地球上人均占有5247GB的數據,數字宇宙規模將達到40ZB。
數字信息迅速發展,3G的普及、無線網絡的發展,激發了人們通過網絡利用數字信息資源的熱情。中國互聯網絡信息中心(CNNIC)2014年7月21日發布的第34次《中國互聯網絡發展狀況統計報告》[2]顯示,截至2014年6月,中國網民規模達6.32億,互聯網普及率為46.9%,互聯網發展重心從“廣泛”向“深入”轉換,各項網絡應用深刻改變網民生活。
云計算技術與智能終端的應用與普及,人們獲取信息知識的行為和方式發生了根本性的變革,網絡,特別是無線網絡成為人們尋求信息知識的重要渠道。但數字資源孤島和數字資源超載成為阻礙有效數字資源獲取的兩大困境。如何利用云計算技術提高數字資源的利用效率,對數量龐大的異構數字資源進行有效的整合、集成與重組,是目前數字資源整合急待解決的難題。
2數字資源與數字資源整合
2.1數字資源及特征
通過網絡以數字形式發布、處理、存取、傳遞和開發利用的信息資源總和通稱為數字資源,數字資源既包括傳統信息資源的數字化,也包括直接以數字化方式生產的數字信息。信息資源的數字化也是信息的集成化、有序化、便利化,包括對文字、圖表、圖形、圖像、音頻、視頻等所有媒體文獻的數字化。在網絡環境中,只有數字化的信息才能成為用戶可利用的信息,網絡環境是數字信息生產、傳播和利用最主要的場合。
數字資源在生產制作方式、發布、存取、傳遞和開發利用等方面與傳統載體文獻完全不同,它具有高度的共享性、局部的有序性、類型的多樣性和資源的動態性等主要特征。數字信息的這些特征對其組織與整合提出了更高的要求,無論是數字資源整合的方法和技術還是管理模式都發生了重大變革。
2.2數字資源整合
數字資源整合是以用戶需求為導向,依據數字資源的屬性特征,按照一定的原則和方法,運用集成技術將分散無序、相對獨立異構資源系統集成在一起,并通過知識組織的技術和方法,將所集成的各種信息資源進行規范、科學地類聚、融合和重組,使其重新組織為一個新的有機整體,形成一個效能更好、效率更高的新的數字資源體系,以供方便、快捷、高效地利用[3]。
首先,在云環境下的數字資源整合不僅要將分散的異構資源集中起來,更重要的是要對數字資源的內容特征和外部特征進行序化和揭示,同時對數字資源之間的關系進行描述,將數字資源進行自動化聚類與分類從而方便用戶獲得按需、易擴展的信息和資源。其次,通過虛擬化技術融合、集成多種數字資源,實現無序信息流向有序信息流的轉換,使之形成更高級的信息產品,促進開發過程各個環節的資源共享、彼此互補,共同創造價值。最后,為整合后的信息資源建立索引形成信息資源云,這就極大地方便了知識服務模型通過數字信息資源索引這個透明接口獲取信息資源從而為用戶提供按需的知識服務。
2.3數字資源整合的基本內容
2.3.1數字資源的優化選擇
優化選擇是數字資源整合的第一步,是在浩瀚的網絡數字信息海洋里發現并確認具有組織、整理和保存價值的信息。由于數字資源易于生成、發布、復制與傳播,在信息生成階段,又缺乏一個完善的選擇、評價制度,故數字信息的質量與價值參差不齊。因此,對數字信息資源進行整理,提高信息資源質量,就必須進行優化選擇。
2.3.2數字資源的分析
數字資源分析是按照一定的邏輯關系,從語義和語法上對選擇過的數字資源進行細化、挖掘、加工整理,通過計算、分析、比較研究,以便創造出更為系統、更能揭示資源本質內容的活動。他是數字資源描述與揭示的前提和基礎,是數字資源整合不可或缺的重要環節之一,對數字資源整合的質量有直接的影響。通過對數字資源的分析和研究,數字資源將更具有使用價值和實踐指導意義。
2.3.3數字資源的描述與揭示
信息描述與揭示是指根據數字資源整合和信息檢索的需要,對信息的主題內容、形式特征、載體形態等進行分析、選擇、記錄的活動。信息描述主要描述信息的外部特征;信息揭示主要揭示信息的內容特征。信息描述與揭示是信息組織的重要內容,在信息組織中起著至關重要的作用。
伏琰:云計算環境下數字資源整合模式研究*伏琰:云計算環境下數字資源整合模式研究*2.3.4數字資源的整理與存儲
數字資源存儲是將經過加工整理序化后的信息按照一定的格式與順序存儲在特定載體中,其目的是為了數字資源管理者和用戶快速、準確地識別、定位和檢索信息,各種光盤檢索系統、網絡信息檢索工具都是信息存儲的方式。信息存儲于各種檢索工具中意味著信息組織過程的終結,也意味著信息檢索和信息服務活動的開始。endprint
整合是對異構規范性資源和非規范性資源的優化組合,是一種創造性的融合和重組資源的過程。其目的是為了整體改進、整合系統的結構和功能,使得數字資源系統能夠發揮最大的作用和使用效率。數字資源整合具有手段自動化、內容綜合化和技術多樣化的特點。作為一個全面、系統的工程,數字資源整合在實施過程中要遵循整體性、連續性、層次性、針對性的原則。
3云計算技術
云計算通過互聯網來提供動態的、易擴展的、虛擬化的資源,是基于互聯網的相關服務的增加、使用和交付模式[4]。目前廣為接受的是美國國家標準與技術研究院(NIST)定義:云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡、服務器、存儲、應用軟件、服務),這些資源能夠被快速地提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。使用云計算技術不僅是對各類資源的簡單匯集,而且為我們提供了一種便捷的管理機制,讓開發者具有透明的獲取資源、使用資源的自由。在“云”服務模式下,資源的整合與調度將以用戶的需求為出發點和立足點,動態自適應性地聚合信息資源與服務系統,全程引導、跟蹤用戶信息行為。通過使用云計算的方法和技術以建立不同渠道、不同來源以及不同載體的資源的整合并形成新的知識的聚合過程,實現知識服務內涵的深化,支持知識檢索和主動的推送服務。
相對于傳統計算,云計算關鍵特性在于:①配置資源動態化。系統動態分配或釋放不同的虛擬或物理資源完全取決于用戶的需求,當需求增加時,可快速匹配可用的資源,為用戶提供彈性的資源;而當用戶不再需要使用某資源時,這些資源可以被快速釋放。云計算是為用戶提供無限使用的IT資源,實現資源的可擴展性。② 服務需求自助化。云計算為用戶提供的資源服務采用自助化的方式,用戶不需要與供應商交互,通過云計算系統為用戶提供一定的應用服務目錄,用戶可以根據自身的需求,選擇一定的服務內容或項目,采取自助服務自己獲得計算資源的能力及繳納購買服務所需的費用。③資源池透明化。對云服務供應商來說,所有的底層資源(儲存、計算、網絡、邏輯等)形成“資源池”,可以被統一管理和調度,各種資源的邊界被打破,異構性被屏蔽起來;對使用資源的用戶來說,不用了解各個系統的內部結構,只關注自己的需求,其所需的資源是無限的、透明的。④網絡化。云計算的服務通過互聯網為用戶提供,用戶通過借助各種不同的終端設備及標準的應用程序訪問網絡上無處不在的云資源與云服務。
4云計算環境下數字資源整合方式
4.1數據整合
數據整合是指對于異構資源系統中的、具有獨立結構的數據在邏輯或物理上有機的集中整合,為用戶提供統一的顯示和查詢,從而實現多種異構資源系統的互聯與共享。資源實體是數據整合的主要對象。根據整合需求的不同,形成了不同的數據整合方式,基于數據倉庫的整合和基于中介模式的整合是其主要表現形態。
數據倉庫組織技術是一種面向復雜的信息分析和高層次決策支持的信息集成與深層次信息組織技術,其顯著特點是可將各類數字信息中大量的歷史與現時信息轉換成公共的數據模型進行集成和組織管理。為了方便用戶查詢信息,數據倉庫還附帶向用戶提供了聯機分析處理和數據挖掘功能,以便在深層次上強化數字信息組織對高層次決策活動的支撐。
基于中間件的異構系統統一平臺式資源整合方式需要在用戶和各異構數據庫系統之間構造一個中間層,用戶通過統一的檢索平臺,發出檢索式,系統通過借助中間層將檢索式翻譯成對應于各個數據庫的檢索語句,同時對多個數據庫進行調用或通過搜索引擎進行資源檢索,各數據庫返回的檢索結果,再經中間層進行歸類、去重、排序后統一推送到讀者面前,從而實現一站式的訪問?;谥虚g件的資源整合系統的設計與實現需要計算機、網絡和數據庫等各項技術的支撐,需要考慮統一跨庫檢索界面、權限管理、去重等多個方面的問題。
4.2信息整合
信息整合的主要對象是信息實體之間的關系,通過某種標準或機制,對不同來源、性質和格式的數字資源進行描述與鏈接,揭示相對獨立的資源實體之間的聯系,從而實現數字資源的全方位整合,使用戶能夠一步到位地獲取所需資源。根據資源整合范圍和應用需求的不同,形成了不同的信息整合方式,其主要表現形態有:基于信息鏈接的整合和基于信息門戶的整合。
通過統一資源定位符(URL)建立的數字資源導航系統能夠有序、有效、合理、有機地整合龐雜的數字資源內的信息實體及其屬性間的內在關系并提供檢索,能夠幫助用戶更全面清晰地了解全部的資源情況,并為用戶迅速找到所需數字資源,根據所定位的文獻類型的不同,可以建立電子圖書、電子期刊、電子版報紙等導航系統?;趯Ш降臄底仲Y源整合系統不能提供內容層面的服務只能定位在數據層面,且對日常維護的要求較高,應變性差,如果數據庫資源系統存儲位置或地址調整改變,都會使導航的鏈接無法正常打開,影響導航的使用效果。
聯機公共目錄查詢系統(OPAC)是讀者查找和利用圖書館資源的重要途徑。OPAC是反映圖書館全部館藏的一個窗口,書目數據是基于OPAC系統的數字資源整合的核心,通過對書目數據的檢索,向一次性獲得目次、全文、音視頻等有關主題的不同載體的館藏信息資源全方位擴展。
4.3知識整合
在信息整合的基礎上,在知識組織體系的支撐下,對內在于資源知識體系中的知識結構及概念關系進行的整合和梳理稱為知識整合。知識整合的主要表現形態是基于本體和基于語義網技術的資源整合方式。
語義網技術通過規范,充分完備地定義和組織數據資源內容,在語義上建立人與計算機之間的理解與合作,從而有效解決語義異構問題,實現自動化的數據資源訪問。由于傳統的基于關鍵字匹配的信息檢索模式信息檢索質量不高,查準率、查全率偏低,而語義網以機器可理解格式描述、發布和訪問數據資源,使用計算機可以理解元數據的語義并進行自動的處理,從而滿足智能主體對各類異構的分布式數字資源進行有效檢索和訪問。語義網通過構建知識網絡,向用戶提示智能知識,實現了數字資源在語義層上的全方位互聯與知識層面輔助查詢,幫助用戶獲得最佳的檢索效果,在更大范圍內實了現資源整合的高級模式,大大地提高了信息檢索的效率。endprint
上述三種方式是資源整合的三個不可缺少的方面,基于數據在邏輯或物理上合并的數據整合是資源整合體系的最低層面,整合在一定程度上解決了異構系統數據共享和互通的問題。但是數據整合僅表現為資源數量上的變化,數據之間沒有關聯?;跀祿系男畔⒄咸幱谫Y源整合體系的中間層面,其對數字資源進行了一定的優化,在數據量綜合的同時也揭示了數據間的關聯,但仍然沒有涉及語義?;跀祿虾托畔⒄系闹R整合處于資源整合體系中最高層,側重于概念和關系的重組,是資源整合的最終目標。在數字資源整合的實踐中,一般是以某一種整合方式為主并兼有、混合其他的整合方式;它們共同構成了一個完整的數字資源整合體系。數據整合、信息整合和知識整合顯示出相互交叉重合并且逐層遞進的數字資源整合的發展過程。
參考文獻:
[1]比特網.IDC最新數字宇宙研究報告顯示中國增長最顯著. [2014-5-10].http://m.chinabyte.com/storage/270/12553270_m.shtml.
[2]中國互聯網絡信息中心.中國互聯網絡發展狀況統計報告.[2014-8-30]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/t20140721_47437.htm.
[3]馬文峰,杜小勇.數字資源整合:理論、方法與應用[M].北京:北京圖書館出版社,2007:46.
[4]百度百科.云計算.[2014-8-30].http://baike.baidu.com/.
[5]謝芳.論高校智慧圖書館的功能與構建[J],圖書館學研究,2014(6):15-20+11.
[6]魏萍.基于云計算的數字圖書館服務模型研究[J].蘭臺世界,2014(2):43-44.
[7]黎春蘭,鄧仲華.面向圖書館的云計算研究綜述[J].圖書館雜志,2014(5):68-77.
[8]王平.云計算在圖書館資源整合與檢索中的運用[J].圖書館學刊,2013(4):115-117.
[9]鄧小燕.基于云計算的數字圖書館建設構想——以數字圖書館推廣工程為背景[J].圖書館研究,2013(5):93-96.
[10]常盛.云計算數據庫查詢算法在圖書館數字服務中的應用[J].數字技術與應用,2013(5):156.
[11]殷紅,劉煒.新一代圖書館服務系統:功能評價與愿景展望[J].中國圖書館學報,2013(5):26-33.
[12]李曉明,姜曉曦.云計算對圖書館基本業務框架的影響研究[J].圖書館建設,2013(10):56-60.
(編校:嚴真)endprint