白莉
〔摘 要〕文章通過高校圖書館個性化信息服務的現狀,闡述了云計算環境下個性化信息服務優勢以及手段,探討了云計算環境下圖書館個性化信息服務的實現。
〔關鍵詞〕云計算;圖書館;信息服務
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)09-0084-03
1 高校圖書館個性化信息服務的現狀
個性化信息服務既是一種信息服務,又是一種個性化服務,以某一個或某一組用戶為核心,根據用戶提出的明確要求提供信息服務,或通過分析用戶的專業背景、研究方向、興趣愛好和行為方式等個人特征,主動向其提供可能需要的信息。簡言之即“在適當的時候向適當的人提供適當的信息。”目前國內現有的個性化信息服務更多的是從圖書館自身的角度進行資源組織和信息服務,大部分都是對圖書及論文的檢索,主要是根據本館的館藏資源來提供服務,而且也無法實現包含所有的數據庫,雖然是以“用戶為中心”服務理念的體現,但實際上仍然忽視了用戶需求。因此,筆者把目前國內的個性化信息服務稱之為傳統的個性化信息服務。傳統個性化信息服務的查詢大都是基于圖書館購買的數據庫資源和Web上公開的信息等的普及,尤其現在海歸的老師越來越多,檢索信息的能力更強。這種服務對他們已有吸引力。而且,傳統的個性化信息服務的技術只能檢索到通過靜態鏈接(URL)直接訪問到的頁面,無法檢索到不具有靜態鏈接(URL)即嵌入在數據庫信息中的網頁,這些無法檢索到的網頁的質量遠遠大于傳統化信息服務能夠檢索到的網頁。如何才能檢索到不具有靜態鏈接(URL)的網頁,我們需用到deep web數據集成。
2 云計算環境下圖書館的個性化信息服務
2.1 云計算的內涵
云計算是分布式處理(Distributed Computing)并行處理(Parallel Computing)和網格計算(Grid Computing)的發展,或者說是這些計算機科學概念的商業實現。云計算與傳統的計算模式相比,具有大量采用虛擬化技術、可被用戶靈活定制,具備動態可擴展性、高可用性、安全性,以及成本低、性價比高等特點。從本質上講,云計算是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。目前亞馬遜、谷歌、微軟、IBM、SUN等IT巨頭,都加入了云計算的行列,云計算作為一種IT基礎設施與服務的交付和使用模式,將會深刻地影響未來互聯網的運作和服務模式,云計算作為一種技術與應用結合的理念,為傳統圖書館和數字圖書館未來的發展,提供了全方位的指導和啟發,也為傳統圖書館提供了一種新的運營模式,圖書館的云時代即將到來[1]。
2.2 云計算環境下個性化信息服務優勢
2.2.1 數據處理量巨大
以較高性能支持TB級數據的數據處理和數據挖掘。而在經典商用數據挖掘工具中,僅能支持1GB數據的挖掘,采用云計算架構后數據處理量達到商用數據挖掘工具的1 000倍。
2.2.2 數據響應時間極短
該原型系統的數據分析、挖掘均為并行化實現,其性能遠遠優于商用數據挖掘工具。處理1.2TB數據的數據處理響應時間在40分鐘級,GB級數據的數據挖掘響應時間是傳統SPSS工具的10倍,可以在有效的時間內處理海量數據[2]。
2.2.3 加速比良好
隨著平臺節點個數增加,并行數據挖掘系統的加速比較好。其中,數據處理接近線性加速比,可以得出結論:基于云計算的數據挖掘算法具有良好的加速比。
2.2.4 成本優勢明顯
廉價PC集群及開源系統可降低IT平臺的處理及存儲成本。PC機+云計算平臺+開源Linux成本在1萬元/節點;小型機的成本在100萬元左右。
2.2.5 可定制
因為基于云計算的原型系統采用插件式的算法封裝,可以靈活的擴展更多并行數據處理、并行數據挖掘算法等功能模塊,根據業務目標對算法進行修改、調整,靈活定制。而商用數據挖掘工具除了支持少量參數之外,其數據挖掘算法和數據處理均為黑盒子,用戶不知道其內部細節,也無從優化[3]。
2.3 云計算環境下實現個性化信息服務手段
2.3.1 信息推送與信息反饋
對于經過過濾得到的信息,系統可以將它推送給相應的用戶。在信息推送時,可以根據用戶的聯系信息,將信息推送到用戶的E-mail、計算機,甚至可以通過短信息、GPRS、CDMA發送到用戶的手機、PDA上。為了減少推送的信息量,并不需要將每條信息都提供全文,有的可以只提供標題、簡介和URL,以便用戶選擇,需要時再上網獲取或者要求圖書館提供全文。為了提高個性化主動信息服務的效果,在推送信息的同時,可以要求用戶對于信息服務的效果提供反饋。考慮到一些用戶特別是沒有申請推送服務的用戶可能不一定喜歡這種方式,在推送信息的同時需要說明如果用戶感覺被打擾,可以隨時取消這一服務。對于提供給用戶的信息,要求用戶做出反饋(不需要、需要或非常需要等)。對這些反饋信息再次進行分析,不斷調整、完善用戶需求庫,逐步逼近用戶的真實需求[4]。
信息推送服務。如果說傳統的專題服務對應智能圖書館的垂直門戶,那么傳統的定題服務,在智能圖書館中對應的就是信息推送了。信息推送服務是一種主動化的服務方式。像廣大用戶熟知的“郵件訂閱”,就是一種典型的信息推送服務。在數字圖書館中,學科館員將不定期地將相關材料發給訂閱用戶。這種服務首先需要知道用戶的個人偏好,當然這可以在用戶的注冊信息中查到。如果用戶感到所獲信息過多過濫,或萌發了其它的信息需求,可以隨時到數字圖書館的個人信息庫中進行更改。信息推送服務是運用推送技術(Push Technology)來實現的一種個性化主動信息服務方式。推送技術又稱“Web廣播”,它是通過一定的標準和協議,在Internet上按照用戶的需求,定期主動傳送用戶需要的信息的一項計算機技術。我們可以把信息推送服務分為兩大類:一類是由智能軟件完成的全自動化的信息推送服務;另一類是借助于電子郵箱、并依賴于人工參與的信息推送服務。首先推出的一種網絡信息服務新技術。最初它是與有關媒體公司合作,利用其信息推送軟件,向因特網上的廣大用戶主動發布各種消息和新聞。推送技術實質上是一種應用軟件,它可以根據用戶的需求,自動從網上搜尋信息,經濟篩選、分類、排序,按照每個用戶的特定要求,將信息傳遞到用戶指定的地點。
2.3.2 信息智能代理服務
智能代理技術是一種能夠完成委托任務的智能計算機系統,能模仿人的行為執行一定的任務,不需要或很少需要用戶的干預和指導。智能代理通過跟蹤用戶在信息空間中的活動,自動捕捉用戶的興趣愛好,主動搜索可能引起用戶興趣的信息并提供給用戶。
2.3.3 信息垂直門戶服務
垂直門戶是和綜合性門戶及水平門戶相對應的概念,它通過匯聚網上某一特定專題信息資源并對其進行挖掘及加工,以滿足用戶基于專業的深入的信息需求。如中國化工網、中國醫藥信息網、中國工程技術信息網等。垂直門戶的特點在于它對網上的專題信息資源進行收集、鑒別、篩選、過濾、組織、描述與評論,組織目錄式索引提供源站點地址,并帶有專業搜索引擎。對數字圖書館來說,垂直門戶可以說是傳統專題服務的延伸。以前此項服務是面向少數個人,現在則服務于一類用戶群體。例如,針對廣大用戶所共同需要的信息,智能圖書館可開辟專門的垂直門戶進行服務,如考研專題頁面、英語專題頁面、編程專題頁面等等[5]。
2.3.4 信息幫助檢索服務
信息幫助檢索是通過研究用戶檢索行為特點,設計相應的檢索智能幫助軟件來幫助用戶進行高效的信息搜索。它通過用戶與檢索系統動態交互來確定其提問,在交互過程中形成相關的判斷,由此來調整他們的目標,形成可視化詞表。該方式將與用戶輸入詞有關聯的詞匯全部顯示出來,供用戶選擇,用戶檢索的信息更準確地切合自身信息需求。
2.3.5 數據挖掘服務
數據挖掘也稱知識發現,是從數據庫中獲取人們感興趣的、隱含的、潛在的知識。DL的數據挖掘是從DL數據庫、數據倉庫和浩瀚的網絡信息空間中發現并提取隱藏在其中的信息,目的是幫助信息用戶尋找數據間潛在的關聯,發現被忽略的要素,而這些信息對預測趨勢和決策行為也許是十分有用的。數據挖掘技術從應用角度劃分,可分為兩類:一是面向數值數據的數據挖掘,常稱數據挖掘(Data Mining);一是面向文本信息的數據挖掘,通常稱文本挖掘(Text Mining)。
在主動信息服務相關技術中,數據挖掘技術目前已經發展得較為成熟,且在許多數據處理軟件中得到較為廣泛的應用。例如Easy web Page watcher,這是款運行于Windows平臺上的監控網頁情況的軟件。可以隨時監控指定的更新或任意的詞語、句子、文本等。如果指定的詞語、句子、文本等突然出現,或者發生變化。Easy web Page watcher將會用E-mail通知用戶[6]。
2.3.6 呼叫中心服務
信息服務中心是一種新近發展起來專門一對一的用戶個性化信息服務系統,在企業界有著廣泛的應用。在基于普適計算的智能圖書館中用戶可通過電話接入、傳真接入、Modem撥號或寬帶接入等多種方式進入DL網站系統,在系統自動語音導航或人工座席的幫助下訪問系統的數據庫,獲取各種咨詢服務或完成相應的事務處理。呼叫中心可以看作是傳統的參考咨詢的演化,它們在本質上是一樣的,只不過運行的環境不同。傳統的參考咨詢工作提供面對面的服務,大型館舍有的還設置了服務熱線。在智能圖書館時代,這些服務變得更加便攜高效。用戶足不出戶,只需訪問咨詢部的網頁,通過電子郵件、瀏覽網頁(列有詳細的常見問題解答)、登錄論壇、聊天室、網站留言等方式,即可獲得詳盡的參考咨詢服務。
3 云計算環境下高校圖書館個性化信息服務的實現
3.1 讓云計算走進圖書館
泛在圖書館作為未來的發展趨勢,可以簡單理解為一種能夠隨時隨地進行信息獲取服務的圖書館,“泛在”二字,指出了未來圖書館服務的便捷性和普遍性,而云計算,恰恰為這種新興的圖書館形式奠定了技術基礎。云計算作為一個廣闊的概念,其對象并不止于計算機,還整合了智能手機、PDA、PSP在內所有的終端服務,為之提供強大的無線功能,在云技術的支撐下,隨時隨地獲取信息不再是遙遠的夢想。目前,我們已經可以通過手機訪問圖書館網頁,但仍然有諸多不便,如手機的網頁格式仍然只有文字和少量的圖片。在未來,隨著無線網絡的普及和資源的真正整合,圖書館會搭著云計算技術的順風車走進千家萬戶,實現“泛在圖書館”的夢想[7]。
3.2 利用云計算提高圖書館個性化服務
云計算簡化了IT架構的實施,給人們提供了一種理想的方式,即IT應用可以像水電煤氣等公用設施一樣,實時定制,隨時取用,按需付費。云計算為圖書館提供了高效率、低成本、安全高、競爭力強的技術,“云存貯”是解決龐大數字資源的存儲和解決知識信息劇增與單個圖書館館藏能力不足這一矛盾的有效途徑;云計算為圖書館用戶提供信息服務泛在平臺;提高了圖書館的信息資源的安全性;云計算提高圖書館信息服務資源的利用率;構建本地化、標準化、低成本、自適應的云解決方案,實現共享。
3.3 提升云計算環境下圖書館信息服務的安全性
同時,云計算實現了優越的在線文件夾及文件存儲,它為用戶提供了安全、可靠、經濟方便的數據存儲中心,用戶不用再擔心數據丟失、病毒入侵等麻煩,同時由于云計算對用戶端的設備要求很低(用戶使用手機、PDA等設備也可以使用圖書館提供的電子資源服務),使用起來也很方便。由于云計算模式提供了強大的無線接入功能,因此未來用戶通過各種相關的終端使用圖書館的電子資源,從而使圖書館資源中心的作用得到最大限度的發揮。
3.4 “云圖書館員”來提供服務
云計算環境下,圖書館建筑物不會消失,我們仍將有許多資料需要照料。建筑物將越來越具有當前的雙重性質,即倉庫與聚會場所,而我們的服務與內容將存在于云中,遠離任何物理場所,圖書館員依托云而非實體圖書館提供服務,成為“云圖書館員”。對于圖書館而言,如果不了解云計算、學習云計算的思想和方法,將會在未來面臨各種基于云計算的技術時,遭到淘汰。
4 結 語
圖書館互聯網應用系統將從云計算中得到最強有力的支持,將成為新一代資源與讀者匹配的基礎核心,而且不僅僅展示圖書館的館藏資源,甚至可以實現各種新型服務的重組和稀缺服務內容的再現。大型云端圖書館將為各類圖書館提供一種個性化選擇,一個充分的空間展示自我能力與需求。為圖書館的資源管理工作提供了方便,為存儲和管理數據資源提供了幾乎無限多的空間,也為圖書館完成各類數據資源服務提供了幾乎無限強大的計算能力。
事實已經證明,云計算本質上是一種全新的更加靈活、高效、低成本、節能的信息運作方式,是自互聯網革命以來IT產業最深刻的變革,也是集信息技術長期發展和積累之大成。中國第二屆云計算大會于2010年5月21日~5月22日在北京舉行,這次大會給中國的云計算發展帶來更大的機遇。在云計算的大趨勢下,不僅包括計算機、通信、互聯網、媒體等內容在內的整個信息服務產業將發生全面重組洗牌,軟件產業結構將面臨大調整,軟件生產組織方式向敏捷、定制化、服務化方向變革,網絡端設備更加多元化和個性化;而且會出現大眾普遍參與、形成群體智慧的新局面,從而對社會的組織形式和人們的生活方式都產生深遠影響。在云計算下的圖書館建設是一個全新的潛在的市場,將云計算技術充分應用到建設圖書館中,從根本上變革傳統的運行機制,使圖書館真正成為現代化、數字化、信息化的圖書信息情報中心。
參考文獻
[1]肖景文.云計算與圖書館關系初探[J].科技情報開發與經濟,2010,(10):73-75.
[2]范并思.云計算與圖書館:為云計算研究辯護[J].圖書情報工作,2009,(9):11.
[3]劉佳,周昕,李賀.圖書館個性化信息服務模式構建研究工作[J].圖書館學研究,2010,(9):81-86.
[4]魏志鵬,李慧佳,祖央.云計算影響下的圖書館信息服務研究[J].圖書館,2010,(2):87-88.
[5]蔡學墉.漫談云計算[J].程序員,2008,(11):50-51.
[6]高曉艷.云計算在圖書館中的應用探究[J].大學圖書情報學刊,2010,(4):60-62,71.
[7]汪洋,蘇建華.云計算給圖書館帶來的發展機遇[J].現代情報,2010,(4):59-61.
(本文責任編輯:孫國雷)