●王世慧 杜 偉(濟南大學 圖書館,濟南 250022)
目前現有的研究成果對云計算的定義并沒有達成共識。美國國家標準技術研究院(NIST)認為云計算是一個模型,這個模型可以方便地按需訪問一個可配置的計算資源(如網絡、服務器、存儲器、應用程序及服務)的公共集合。這些資源可被快速提供,并且可使管理成本最小化和服務供應商的干預最小化。這個云計算模型具有按需自助服務以及擁有廣泛的網絡存取平臺和資源池,同時具備快速彈性、服務檢測等五個基本特征。[2]
基礎設施即服務(Infrastructure as a Service,簡稱IaaS) 是云計算的三種服務模型之一,它將硬件(服務器、存儲器及網絡)和相關軟件(操作系統虛擬技術、文件系統)作為服務交付給用戶使用。它是一個主機模式,包括網絡存取、路由服務及存儲。IaaS供應商通常為用戶提供硬件和管理所需存儲的應用程序和運行應用程序的平臺服務,包括帶寬、內存和存儲的調整,具有基于動態服務的價格優勢。IaaS供應商為用戶提供服務器、存儲空間和網絡組件以滿足他們的計算需求,用戶負責部署、管理軟件服務。在一個IaaS環境中,用戶可以運行任何軟件、控制操作系統、Web服務器、防火墻等。它具有快速供應、可擴展、量入為出、自動化管理等優點。Amazon彈性云(Elastic Compute Cloud,簡稱EC2) 和簡單存儲服務(SimpleStorageService,簡稱S3) 是IaaS產品的典型。
IaaS為用戶創建虛擬機并提供運行所需的云計算環境。使用這一技術的前提是創建虛擬機,裝載初始創建所需的軟件和最終運行于云中的軟件,包括用戶定制軟件和正版軟件。創建虛擬機后,將它上傳到IaaS供應商的托管環境,此時配置IaaS供應商提供的所需存儲器。配置完成,虛擬機可以自動尋找并部署可運行于該虛擬機上的硬件,然后開始運行。一旦虛擬機開始運行,IaaS供應商要確保該虛擬機以一個整體健康的狀態持續。運行所需的應用程序的原始存儲歸IaaS供應商所有、維護,監控所有的用戶定制軟件和正版軟件以確保它們的正常運行是用戶的責任。對于沒有時間改寫應用程序代碼的用戶,IaaS是一個將應用程序遷移到云的靈活的、最好的選擇。由于實現IaaS的核心是實現IT設備尤其是服務器的虛擬化,而目前開展IaaS服務所需的虛擬化技術和運營技術相對成熟,因此IaaS被公認為是部署云計算服務的最佳切入點。
圖書館為讀者提供服務以及需要利用有限的資源尋找恰當的解決方案的使命,對他們要采用的云計算服務模型產生深遠的影響。通常圖書館內部缺乏先進的IT管理人員,需要外部或者其他機構提供IT服務支持,以及可以使用基于云的政策、法規來管理圖書館。以上這兩個因素使SaaS(Software as a Service) 和PaaS(Platformas a Service) 更加令人心動,而IaaS方式很難被接受。雖然IaaS對于圖書館來說不是第一選擇,但是許多圖書館一直在研究使用IaaS的新方法,它擁有巨大的市場。Amazon EC2為圖書館IT提供基礎設施,如提供按需使用的虛擬服務器、根據用戶所使用的操作系統(包括Linux及Windows) 配置不同大小的服務器。EC2利用它們的S3服務為機構提供了基本無限的存儲,兼顧數據和服務器的快照能力,在機構的專用網絡中包含EC2服務器的能力。[3]這些措施可以從基礎設施層面解決許多長期困擾圖書館網絡信息管理和服務中存在的問題,如硬件和軟件的更新總是趕不上技術的進步,高薪聘用的IT管理人員始終無法融入圖書館服務團隊等。[4]
當然,目前關于IaaS的批評也有很多。包括政策法規及技術上的問題,比如如何備份及查找存儲在云中的信息,如何保證數據安全和可靠性,如何在一個分散的環境中管理服務等。針對這些批評,云供應商提出相應的措施來解決其中一些問題。如Amazon EC2服務中增加了云服務器與機構網絡之間的專有連接(虛擬私有云)、基于存儲的提供位級快照及整個服務器實例的持續性的彈性塊存儲(ElasticBlock Store,簡稱EBS)及服務器監控機管理工具。Amazon還建立了可運行于它們的云平臺,適用于所有服務的服務水平協議 (ServiceLevelAgreement,簡稱SLA)。[5]這些服務水平協議不僅規定了正常運行時間,而且解決了安全及法律問題。
無論批評還是贊揚,很多用戶還是看好其前景,并給予肯定。許多圖書館將它們的數字館藏、網站、備份圖書館集成系統等服務交付Amazon的EC2或者S3托管。例如哥倫比亞特區公共圖書館使用Amazon EC2服務托管網站、使用Amazon S3服務備份圖書館自動化管理系統等。美國俄亥俄州圖書館與信息合作網(OhioLINK) 使用Amazon’s WebServices托管一小部分它們的數字公共資源,如肯特州的百年收藏,并且正在測試在云中的服務器管理以及DSpace館藏軟件的局限。英國圖書館使用Amazon EC2提供Web全文檢索服務,使用了900GB的磁盤空間。[6]維克森林大學Z.SmithReynolds圖書館自2008年起,一直專注于將圖書館的主要IT遷移到云或托管環境,并于2009年將本館的ILS及其他的一些應用包括網站、發現服務及可以實施的數字圖書館服務遷移到Amazon’sEC2。[7]2009年7月美國國會圖書館與DuraSpace公司的DuraCloud項目的主要目的是檢測云技術在維持數字內容永久訪問上的性能,使一個機構在不需要本地構建IT基礎設施的情況下,通過云計算機提供數據的存儲和訪問。[8]CALIS以基礎實施服務IaaS/HaaS和基礎平臺服務PaaS為基礎,創建了數字圖書館云服務平臺,將分布在互聯網中各個圖書館的資源和服務整合為一體,形成一個可控的自適應的新型服務體系。[9]
圖書館將其主要IT服務移到云或者托管環境之前,需要考慮以下幾個方面:
(1)服務水平協議。服務水平協議是指IT服務供應商和客戶之間就服務提供中關鍵的服務目標及雙方的責任等有關細節問題而簽訂的協議,它是一種衡量一個云供應商服務平臺舒適度的方法。服務水平協議可以作為圖書館選擇IaaS服務供應商的參考,比較各服務供應商的服務水平和服務能力,制定可以確保圖書館正常工作時間、符合圖書館業務特點的具有法律效力的保護條款。
(2) 成本及承受能力。雖然將圖書館IT主要服務遷移到IaaS,可以以極低的成本投入獲得極高的運算能力,克服服務器訪問限制的瓶頸,降低有關的維護費用等,[10]但在遷移之前要充分考慮所需要的人力、技術資源和費用,需要了解云供應商賬單上的每一項服務要素以及其計費方式。如,供應商是基于流量、存儲空間、服務CPU運行時間來計費,還是將這些因素綜合考慮來收費,并且還要充分考慮隨著時間的推移如何看待成本問題,以及圖書館的承受能力。圖書館應當認識到實施云計算不是要舍棄原有的IT基礎設施資源,而是利用云計算系統高效地監控管理現有的和新增的IT基礎設施資源。
(3)安全問題。目前尚未出現針對云計算架構的安全規范和標準?!霸啤笔且粋€虛擬的系統,數據的物理存儲位置可能分布在多個地方,缺乏相應的技術和法規作支撐,數據安全難以得到保障。此外,云服務供應商擁有比云用戶大的權限,可能使用戶的隱私信息難以保護。
(4)圖書館信息人員的知識和能力。圖書館IT服務遷移到IaaS平臺,為圖書館的信息人員提供了便捷的管理功能,同時對他們的知識和能力提出了更高的要求。
圖書館將其主要IT服務向云或托管環境遷移的同時,還要注重將圖書館的關鍵系統向開源選項的遷移。當然這兩個目標并不總是同步的,有一些應用程序肯定不是開源的,但可能在托管環境中工作良好,反之亦然。表1顯示一些已被遷移或者正在向云環境遷移的圖書館服務。預計隨著時間的推移那些未出現在云中的基于PaaS的服務(如圖書館網站、數字圖書館應用程序及機構庫)都可遷移到I-aaS平臺。

表1 當前基于云的解決方案列表
在將ILS和一些其他的應用如網站、發現服務以及可以實施的數字圖書館服務遷移到IaaS時,可采用Amazon EC2。Amazon具有可擴展的服務器解決方案及易用的管理控制臺。例如,許多基于服務器的圖像獲取可以與開源或者專有平臺合作。此外,他們的EBS服務為用戶提供方便設置大容量磁盤空間的能力。最后,Amazon管理控制臺使用戶可以輕松地開始、結束及管理自己的服務器,創建基于卷的EBS的最新發展,使用戶在不丟失實例的情況下停止它們。除此之外,EBS具有快照備份功能,通過此功能,數據可以被存儲在Amazon的S3環境中。通過EBS,用戶可以得到一個備份卷來存儲實例,這樣就不用依賴原始數據的活動。Amazon還有如在EC2服務層設置一個防火墻及彈性IP地址這些長期存在的功能。這些功能簡化了用戶的實施,并使用戶輕松地在開發環境及生產環境之間切換。除了這些功能之外,Amazon提供許多其他功能,包括自動負載平衡、通過虛擬私有云與校園網連接等。[11]
許多IaaS供應商提供的合法的協議集及SLA,令人滿意地解決了圖書館所關心的數據安全和正常工作時間。大多數圖書館早已熟練地使用SaaS模式提供服務,并越來越依賴互聯網連接,因此圖書館將其核心應用基礎設施移出校園網不再有障礙。此外,IaaS供應商提供的可靠、有效的服務使尋找一般問題如服務器配置、備份及記錄的解決方案相對簡單。
圖書館的一些重要應用常常需要專門的軟件或者全局、復雜的配置,通過使用一個基礎設施層的服務,圖書館可以在線使用而無須尋找一個支持基礎技術的正確版本的服務。此外,可以快速安裝新的應用而無須將重心放在確定可用的磁盤空間上,意味著提供基于技術的圖書館服務遠遠快于使用本地硬件。將圖像和數據從它們目前運行的硬件上分離,使圖書館在硬件出現故障時有能力將停機時間減到最少。
當然,將圖書館的關鍵基礎設施移出校園網意味著在因特網出現連接問題時,圖書館將無法提供自己的關鍵服務(例如網站、ILS、發現層)。而解決這一意外的一個完整計劃還沒有制訂,因此可在圖書館配置一個本地機器,提供一個簡單版的圖書館網站及一個圖書館目錄的快照,可運行在圖書館發現層的本地安裝版上。
計算技術的總擁有成本(TCO)可能是困難的,例如,Golden發現,當將電力和管理費用計算在內時,Amazon的定價與內部管理服務器成本相當。[12]但是圖書館經常面臨更換服務器或者大的磁盤陣列的需要,更換硬件的成本與同一時期的EC2和EBS的數據量的成本對比,就有可比性。如Amazon EC2以每小時10美分的價格出售1.0GHz x86 ISA計算單元,增加新的計算單元或運行實例,只需2到5分鐘。[13]通過維克森林大學Z.Smith Reynolds圖書館的實際使用,發現他們的大多數應用可以運行于兩個Amazon EC2小服務器上 (1CPU,1.7GB Ram)。[6]
雖然圖書館向云計算的遷移可以稱作成功,但仍存在一些問題需要解決。首先,雖然許多IaaS供應商提供了好的文檔,工作人員仍需要進行一些額外的培訓,以了解云環境中系統的體系結構及存在的安全問題。其次,雖然某一時期某個IaaS供應商是市場上服務最成熟的,但是市場快速變化,要求圖書館根據變化進行調整以確保使用最新的選項。例如,永久映像的建立是減輕圖書館向Amazon EC2轉換的重要一步,隨著技術的進步,Amazon EC2還使圖書館快速安裝及配置新服務器成為可能,它可以與校園IT服務協調,為用戶提供無縫方式,這要求圖書館及時調整工作策略以適應技術的更新。
總之,IaaS服務降低了成本投入,因為與提供計算能力、存儲及網絡相關的基礎設施并不需要用戶購買和維護。IaaS供應商負責這些資源,客戶只需要支付他們使用時所花費的費用。IaaS的總結見表2。[14]隨著IaaS市場的成熟,我們可以尋找更加實惠和標準的服務,因此,隨著圖書館越來越充分地使用基于I-aaS平臺的應用,分享和配置不同應用目的的服務器變得可能。

表2 IaaS總結
[1] SushilBhardwaj,et al.Cloud Computing:AStudyof Infrastructure as a Service (IAAS)[J].International Journal of Engineering and Information Technology,2010,2(1):60-63.
[2] Peter Mell,TimGrance.The NISTDefinition ofCloud Computing[EB/OL].[2010-11-17].http://csrc.nist.gov/groups/SNS/cloud-computing/.
[3] Amazon Web services.Amazon ElasticComputeCloud(Amazon EC2)[EB/OL].[2010-09-17].http://aws.amazon.com/ec2/#details.
[4]范并思.云計算與圖書館:為云計算研究辯護[J].圖書情報工作,2009,53 (21):5-9.
[5] Amazon Web services.Amazon EC2 Service Level A-greement[EB/OL].[2010-09-20].http://aws.amazon.com/ec2-sla/.
[6] Ellyssa Kroski.Libraries and the cloud [EB/OL].[2011-01-12].http://www.online-information.co.uk/online2010/files/conferencing/50/Kroski,%20Ellyssa.pdf.
[7] Erik Mitchell.Using Cloud Services for Library IT Infrastructure[EB/OL].[2010-08-20].code{4}lib Journal.2010(9):http://journal.code4lib.org/articles/2510.
[8] Libraryof Congress.DuraCloud[EB/OL].[2010-12-12].http://www.digitalpreservation.gov/partners/duracloud/duracloud.html.
[9]王文清,陳凌.CALIS數字圖書館云服務平臺模型 [J].大學圖書館學報,2009(4):13-18,32.
[10]李永先,等.云計算技術在圖書館中的應用探討[J].江西圖書館學刊,2009(1):105-106.
[11] Amazon Web services.Amazon Elastic Block Store(EBS)[EB/OL].[2010-09-17].http://aws.amazon.com/ebs/.
[12] Bernard Golden.The Case Against Cloud Computing,PartFour[EB/OL].[2010-11-17].http://www.cio.com/article/480595/The_Case_Against_Cloud_Com puting_Part_Four.
[13] MichaelArmbrust,et al.AbovetheClouds:ABerkeleyViewofCloudComputing[EB/OL].[2010-10-11].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.pdf.
[14] Keith Pijanowski.Understanding public clouds:I-aaS,PaaS,SaaS[EB/OL].[2010-10-11].http://www.keithpij.com/Home/tabid/36/EntryID/27/Default.aspx.