

〔摘要〕數字資源共享是圖書館提高服務水平、有效利用資源的必要手段。但是目前圖書館的資源建設中,存在資源類型異構、重復建設等問題。為了改進與解決這個問題,實現不同資源庫間數字文獻的開放共享,本文分析了云計算的概念、內涵及特點,探討了將云計算技術應用于圖書館資源建設的方面,包括:IaaS形式的圖書館云服務、SaaS形式的圖書館云服務等,設計了一種實現不同異構資源庫內數字文獻資源開放共享的服務系統可能性,以達到資源的重復利用,開放共享的目的。
〔關鍵詞〕云計算;圖書館;機構庫
〔中圖分類號〕G250.74〔文獻標識碼〕A〔文章編號〕1008-0821(2013)02-0059-04
1圖書館數字資源共享現狀與面臨的問題
1.1圖書館數字資源共享
1.1.1云端開放共享的設想
對于圖書館用戶,其所需應用程序及操作處理并不需要運行在個人電腦、手機等終端設備上,而是運行在大規模綜合性的圖書館服務器集群或者云服務商的云端平臺之中。用戶所處理和存儲的數據也不是存儲在本地計算機上,而是保存在云端的不同存儲庫中心里面。這些存儲庫中心正常運轉的管理和維護也不需要由用戶本人來實現,而是由圖書館云計算服務的提供商來負責,由他們保證足夠強的計算能力和足夠多的存儲資源供用戶使用。在任何時間和任何地點,用戶都可以使用終端設備隨時隨地連接至數字圖書館云端資源庫數據中心。
1.1.2圖書館數字資源共享現狀分析
我國數字資源的開放共享相對歐美國家落后。建國初期,各個地區及院校的圖書館資源數量比較少,彼此之間相互獨立。據調查,它們初步合作始于20世紀60年代,直到20世紀末期,我國才正式實現與國際網絡的互連,從此真正實現與國際區域的信息化合作。此后,國內的數字資源共享建設受到各方的不斷重視與加強,在資源開放共享方面各方做了大量的工作。為了更進一步加強資源的共享建設,由政府組織成立了中國高等教育文獻保障系統(CALLS),專門為我國高校進行資源服務,是高等教育的3個公共服務體系之一,其主要目標是將國內的各高校的圖書館資源加以重新整理,并最終形成統一的對外資源服務。另外,根據國務院的要求與指示,由國內的多個領域的圖書館及單位聯合在2000年6月12日成立了國家科技圖書文獻中心(NSTL),主要任務是依照國內情況,根據不同時期國家科技領域的具體需求,遵照“統一采購、規范加工、聯合上網、資源共享”的基本要求,從國家層面收集、儲藏和不斷發掘各大學科領域的優秀科技文獻資源,并針對不同用戶提供數字資源服務。
機構庫作為一種儲藏技術,是一種通用的學術資源倉儲,主要儲藏科研和學術資源,而且儲存的資源類型多種多樣,比如一項學術資源在正式對外發布之前,以非正式版物形式出現,此時亦可將其保存在機構庫中。相同類型科研報告和類似領域的論文研究也可放在內部子庫之中,其它資源可采用同類方法。
中國知網對學術文獻資源的收錄較為詳細,利用其搜索程序進行標題名為“機構倉儲”的索取請求時,大約可以找到95篇于2004-2008期間的論文。結果中可以看出期刊論文占據了極大的比重,共92份,而學位論文則相對較少,僅僅只有3份,從資源發表年份角度講,我們科研人員對機構庫關注度逐步增加。
1.1.3圖書館數字資源共享的建議
隨著社會信息化的不斷深入發展,未來不管在圖書館建設還是其它機構的資源建設方面必將都采用電子化、數字化實現,這是一個必然趨勢。
不同的院校,都會有自己比較專業、優秀的學科門類,因此,從全校的角度積極創立基于全校的資源管理機構,加快學校在其特色專業方向的數字資源的擴充建設,在信息資源開放共享的大發展趨勢下,各個高校可將自己的特色專業資源貢獻出來與其它院校單位共享,既可避免資源的大幅度重復建設,亦不會因為各自單位資源的專業性而影響其它方向的數字資源的索取,進而實現資源建設的最大化、資源利用的最高效性。
圖書館等資源存儲機構,最好保存多種形式的資源,根據實際需求不斷的優化本館的資源配置。比如,在擁有某一領域的資源后,仍考慮保留一定的紙質版備份,有效抗擊數字化帶來的安全風險。
當前,我國圖書館的總體建設取得了良好的效果,大部分圖書館都已實現了計算機信息化管理,管理及服務效率得到了大幅度提高,同時圖書館在系統軟件、硬件及服務方面都取得很大進步。
雖然我國大部分圖書館都在通過自我建設和購買資源方式不斷的豐富本館的資源量,但是隨著館藏資源的大幅擴充,資源建設方面的問題也日益凸顯,主要問題如圖1所示:11圖1當前圖書館建設主要問題11
1.2.1存儲容量大幅增加
各圖書館根據需求不斷的實施自我建設,其中購買資源是館藏資源量增加的主要渠道。隨著圖書館資源量的不斷擴充,圖書館原有的存儲介質無法提供足夠的容量以供新進資源的保存,從而館方不得不繼續購買新的存儲介質,在一定的時間段內,這些新購買的存儲介質只用于資源存儲而又可能出現較多空余容量,在存儲容量增加的情況下存儲資源的利用率卻沒有得到相應的提高,從存儲介質的利用角度講極不經濟。
1.2.2原有服務系統性能無法滿足新要求
每個圖書館都會開發建設自己的資源服務系統,但是服務系統的更新周期較長,而資源量的變化周期卻相對較短,在圖書館時常擴充館藏資源的情況下服務系統卻沒有相應的改善,因此當館藏資源量達到一定程度時,進行大數據量索取服務必然會對系統性能造成嚴重的挑戰,甚至出現系統服務崩潰的情況而無法滿足服務需求。
1.2.3資源調度管理成本不斷增加
圖書館的館藏資源數量巨大,資源的調度管理由傳統的人工服務演進到今日的電子化服務,管理成本得到了一定的降低,但是服務調度管理系統無法經常實現升級,當資源量足夠大時,系統需要在大量數據資源的調度管理方面做出優化,從而不得不在原有基礎上增加經費投入對調度管理系統進行升級,從而造成調度管理成本的上升。
1.2.4資源內容的重復性建設
從數字圖書館概念的提出到今天,已經有越來越多的圖書館加入數字化建設的隊伍,雖然理念上有了進步,但各圖書館依然是獨立建設自己的資源體系,各館的館藏資源難免會有部分重疊,出現資源的重復性建設,且有部分圖書館不顧實際,忽視本單位的研究領域和特色,盲目進行資源量的數字化擴張,一定程度上,資源建設的效益沒有得到實質性的提高。
1.2.5資源類型的加速異構化
當前大部分圖書館在擴充資源時并不會詳細的關注其它館館藏資源的類型情況,而是但凡覺得需要的資源都直接購買并放置于自己館中,造成各圖書館的資源類型加速異構化,在現有服務系統下給館際間資源共享帶來一定障礙。
2云服務與圖書館數字資源建設的結合
2.1云計算概念及內涵
作為一種新興的服務方式,云計算是多種前沿計算技術相互結合的產物,不僅包括網格計算、分布式計算和并行計算等,也包含虛擬存儲方面的如虛擬化技術和分布式存儲等。云計算能將連接在一起的計算資源進行整合形成巨大的資源池,也會綜合平衡滿足用戶需求前提下所必須的效用計算與負載均衡向用戶提供按需服務。由此可足夠簡化用戶端的軟硬件資源,將其所需的一些基礎軟硬件資源都搬到云端實現,以此降低用戶端設備的性能要求,給用戶帶來很大的惠利。云計算歸納起來主要體現為軟件即服務(SaaS)、平臺即服務(PaaS)、基礎設施即服務(IaaS)3種服務形式。
2.1.1軟件即服務(SaaS)
這種服務模式下,云計算服務商將自己的各種應用軟件部署在相應的云計算平臺上,以實現應用軟件的出租,當用戶需要某些應用軟件時,并不需要在自己的終端上實現安裝,而是根據需要通過網絡向云服務商發送軟件需求,云服務商將根據需求軟件類型、服務質量選擇的優劣、服務時間長短對用戶收取一定租金,進而再將這些應用軟件授權給用戶使用。此方式下,云服務商對應用軟件進行維護和管理,同時軟件運行所需的特定硬件設施環境也將由云服務商提供和管理,用戶可節省大量的軟件購買與管理費用,只需一臺能連入互聯網的瀏覽器并支付一定的軟件租費,即可隨時隨地使用相關軟件。
2.1.2平臺即服務(PaaS)
云服務商將系統開發環境看作一種服務,并以SaaS模式實現開發環境的對外出租。此時服務方將平臺也看作一種軟件,當用戶需要時,云服務方將軟件開發環境、系統平臺和平臺所需的硬件基礎設施一并提供給用戶,用戶可以在只擁有一臺瀏覽器的情況下實現軟件的開發與測試,并通過服務方提供的服務發布平臺將開發出的應用程序開放給其他用戶使用。因此,某種意義上,平臺成為一種服務實際上相對于程序開發測試到部署服務的一種中間件,用戶通過平臺服務可實現業務程序的發布和相關數據庫、業務服務器的托管管理等。
2.1.3基礎設施即服務(IaaS)
IaaS形式下,云計算服務商將其所擁有的硬件基礎設施作為一種計量服務提供給終端用戶,它將計算處理器、存儲介質、內存資源、輸入輸出設備等整合在一起,形成一個虛擬化的龐大資源池,并在此基礎上為相關企業集團客戶或個人客戶提供存儲資源及虛擬形式的服務器等服務,從另一角度看,用戶相當于將硬件托管給云服務方進行管理與維護,并對所租用的硬件設施支付一定的費用。
2.2云計算特點
2.2.1編程模型的優化
MapReduce作為一種強大的編程模型和任務調度處理模型,在對大容量數據操作時,能高效實現任務的并行計算處理,其主要由Google開發實現,編程模型十分嚴格,在此模型下業務程序的編寫也將變的極其簡單。MapReduce的主要原理即:將用戶的輸入任務分解成Map和Reduce兩種方式(Map即映射,Reduce即化簡),再由Map實現對數據部分的分解,分解后的數據彼此互不相關,然后分配給多個不同服務器進行處理,充分利用分布式計算的優勢實現任務的快速分批處理,最后通過Reduce將各個處理結果進行整合并輸出至用戶。
2.2.2海量數據的分布式存儲
云計算為用戶提供大容量存儲資源,可將用戶資源存儲于某一存儲介質上,也可將資源分布式存儲于多個存儲介質上,存儲的同時實現對用戶資料的備份操作,充分保護數據的安全性。在云計算條件下,分布式存儲應用越來越廣泛,使用比較多的為Google的GFS和Hadoop開發的HDFS。
2.2.3虛擬化技術
虛擬化技術是云計算的重要支撐技術。通過虛擬化技術,可將底層的CPU、內存和存儲器等其它硬件一起整合虛擬出多個服務器,而這些服務器不僅與底層的硬件實現隔離,服務器之間彼此也互不影響。通過虛擬化技術,也可將某一個應用資源分離成多個虛擬的資源,實現資源的分解。
2.2.4高度的服務可靠性
云計算能為用戶提供足夠的計算與存儲資源,若其中某個計算節點或存儲節點出現故障時,云可以在極短時間內實現故障修復或存儲備份以確保計算與存儲的可靠性。
2.2.5高度的靈活性與擴展性
云計算可以根據用戶數量及應用業務的大規模增加而動態的增加計算資源和存儲資源,實現動態伸縮以滿足用戶的需求,相對于傳統服務系統,體現了較高的靈活性與拓展性。
2.2.6廉價的按需服務
云計算集群中各個節點并不需要較高的屬性配置,云通過一定的方式將其整合起來提供較強的服務能力,但租費不高,且能根據用戶需求按需提供服務。
3云計算在圖書館數字資源共享的應用
3.1IaaS形式的圖書館云服務
IaaS表示基礎設施即服務。當前大部分圖書館都面臨著硬件資源無法滿足資源存儲需求的局面,不斷的購買硬件設施并不經濟,而利用云計算技術,圖書館完全可不用自己購置所需硬件資源如存儲介質、數據庫服務器等,而通過租用云服務方提供的基礎硬件設施以實現圖書館資源的存儲目標。未來在經常進行館藏資源更新時亦可直接將新進資源放置于云端,極大的降低了圖書館的硬件開支。
通過利用IaaS形式云服務,圖書館資源存儲于云端,館方對數字資源的調度管理則讓步于云服務方,從而降低管理成本。
3.2SaaS形式的圖書館云服務
圖書館設立的服務系統,諸如參考咨詢、資源檢索系統等,傳統條件下一般只適用于本館,一旦面臨館際互借資源共享,則無法提供服務。如果利用云計算技術如SaaS形式的云服務,此類問題可迎刃而解:比如圖書館的參考咨詢,云服務商可提供一個統一的參考咨詢系統,用戶在需要時無需再登錄各個館對應的咨詢服務系統,而通過SaaS可對任意所需的圖書館方進行咨詢服務;同理,對于各館資源進行的各種類檢索需求同樣可由云服務方提供統一的資源索取系統,用戶可據此對感興趣的各個資源庫進行資源索取,既實現了服務的便利高效性,又實現了多館資源的開放共享。
將云計算技術與圖書館資源建設相結合,充分利用云計算技術的優勢,可為圖書館的建設與發展帶來很多實用價值,如圖2所示:
11圖2云計算技術在圖書館的應用價值11
對云計算技術詳細分析后,結合云計算特點及其在圖書館領域的潛在服務優勢,各個館的數字文獻資源可以存儲于云服務方的云端存儲庫內,不同館的數據文獻資源庫也可以托管在云端由云服務方進行維護管理,體現云計算的IaaS服務特性。
另外,數字文獻資源共服務享軟件系統可部署在一定的云計算平臺中,對于那些無力構建自己資源體系的中小院校單位則不用再考慮資源建設問題,而通過支付一定的租金租用此共享服務系統,進而實現對其它館藏資源的索取服務,實現了數字文獻資源的開放共享,亦體現了云計算技術的SaaS服務特性。
4結論
從云服務的角度說,云端數字文獻資源共享服務系統有以下幾方面的應用效益。
4.1資源提供方
不同資源方可以將各種數字文獻資源庫作為共享庫,通過租用服務商的硬件,將其部署在云端,或者直接將自己的資源服務器放置于云端,托付給云服務商管理,體現云計算的IaaS服務特性。
4.2服務商
將數字文獻資源共享系統部署于云端,對各共享庫內的資源進行開放索取,通過收取一定的租金為中小院校提供資源服務,實現資源的開放共享,體現云計算的SaaS服務特性。
4.3客戶方
通過租用服務系統實現對數字文獻資源的索取,無需再去耗費財力、物力建設自己的資源體系,既節約資金,又能共享到很多知名高校的資源。
4.4在實際應用中,需要關注資源方、云服務方、客戶方三方角色關系資源方要借用服務方一定的硬件設施托付自己的資源;服務方要與資源方進行協調,并通過部署自己的資源共享系統實現對不同數字文獻資源庫的開放共享服務;客戶方要經過分析對比考慮此服務是否優質,是否值得自己支付相應的租費。
要協調好三方關系應注意兩個問題:首先,如果將各種數字文獻資源托付給云服務方管理,則服務方的價值、信譽度等如何衡量,目前沒有一個權威的規范的衡量標準。其次,將不同的數字文獻資源存儲在云端,這些資源的安全防范、隱私保護、版權等方面如何保證,當前暫不存在具有強大公信力、影響力的保護措施。但是,隨著數字資源范圍的不斷擴張和資源容量的不斷擴大,數字資源的開放共享必定會順應社會及時代發展的潮流而不斷實現,相信在社會的各種新需求的不斷推動下,云端資源共享的各種問題都會得到合理的解決。
參考文獻
[1]羅佳玲.網絡環境下高校圖書館價值的困境與實現[J].科技情報開發與經濟,2007,(8):12-13.
[2]楊勇,張建中.機構知識庫與高校圖書館知識服務的實現模式[J].情報科學,2009,(3):91-94.
[3]辜清華.對國內外圖書館信息資源共享發展現狀的比較分析[J].四川圖書館學報,2003,(3):34-36.
[4]G.Megan.Involving the Library and Campus Community in Institutional Repository Projects[J].The Serials Librarian,2008,(4):568-576.
[5]朱咫渝.國內外機構庫現狀調查及建設[J].現代情報,2010,(1):72-74.
[6]徐杰鋒.知識庫網格模型的研究[D].杭州:浙江大學,2004.
[7]胡小菁,范并思.云計算給圖書館管理帶來挑戰[J].大學圖書館學報,2009,(4):9-14.
[8]I.Foster,C.Kesselman.The Grid:Blueprint for a New Computing Infrastructure[M].San Mateo:Morgan Kaufmann Publishers,1999.
[9]H.Soonwook,K.Carl.A Flexible Framework for Fault Tolerance in the Grid[J].Journal of Grid Computing,2003,(3):251-272.
[10]于偉,叢欣.云計算和虛擬化網絡硬件平臺解決方案[J].信息安全與通信保密,2010,(4):42-43.
[11]馬曉昊.基于云計算的安全數據存儲服務的研究與實現[D].上海:同濟大學軟件學院,2008.
(本文責任編輯:孫國雷)