999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字資源發現服務發展趨勢研究

2011-12-31 00:00:00薩蕾溫泉曲云鵬
現代情報 2011年9期

〔摘要〕本文介紹了數字資源發現服務的發展歷程,對國外數字資源整合與搜索服務工具在圖書館的應用進行分析,指出與云計算技術相結合,將是數字資源整合發現服務的未來發展趨勢。論述云服務的定義及其在發現服務領域的優勢,并進一步分析圖書館在云計算浪潮中應起的作用及影響,最后提出標準化的進程決定了云服務在發現服務領域的未來發展。

〔關鍵詞〕數字資源整合;云服務;發現服務

DOI:10.3969/j.issn.1008-0821.2011.09.018

〔中圖分類號〕G250.76 〔文獻標識碼〕B 〔文章編號〕1008-0821(2011)09-0075-05

收稿日期:2011-07-26

作者簡介:薩 蕾(1972-),女,副研究館員,研究方向:數字資源整合、知識組織。

Study on the Developing Trend ofDigital Resources Discovery Service

Sa Lei Wen Quan Qu Yunpeng

(The National Library of China,Beijing 100081,China)

〔Abstract〕The article introduced the progress of discovery service on digital resources,analysed the application of digital resources integration and search service instrument in the library,pointed out that the future trend was to combine the cloud computing to discovery service,discussed the definition of cloud serviceand the corresponding advantages in the discovery service,the article further analysed the function and influence of the application of cloud computing in the library territory.The conclusion has been proposed that the standardization process determines the future development of the cloud service in discovery services.

〔Key words〕integration of digital resourcescloud servicediscovery service

網絡的迅速發展為公共圖書館的信息服務創造了跨越式發展的良好機遇,同時也帶來了近百年來最嚴峻的考驗。公共圖書館致力于進行數字資源的建設,如:將本館特色資源數字化、對外采購學術性資源、對網絡資源進行導航,等等,形成了大量的數字資源,因此,如何對各種分布異構的數字資源進行無縫集成、真正實現一站式資源檢索、提供滿足用戶需求的知識發現服務成為業界研究與實踐的熱點。數字資源整合發現服務的發展經歷了以下幾個階段:

1 從導航到搜索在互聯網發展的早期,一些信息服務者為使用戶能夠便捷地發現網絡資源,提供對各種網絡站點的分類導航。之后,很多學術機構、圖書館等都陸續提供資源導航服務,并逐漸發展為結合知識組織等方法對資源進行整合,為用戶提供知識服務。

隨著網絡資源數量的激增,用戶需求向個性化、多樣化發展,僅以導航來作為知識發現的方式已遠遠無法滿足用戶希望檢索到最全面信息的需要,因應這一發展,搜索引擎產生,并不斷完善,信息檢索與發現領域迎來了飛速發展的階段。

搜索引擎是數據整合的一個初始模型。它利用爬蟲技術將網頁信息搜集到本地,制作索引,用戶利用搜索引擎的檢索界面獲取同檢索詞相關的網頁信息。通過搜索引擎,用戶能夠更方便地發現存在于網絡各處的海量資源,極大地滿足了人們獲得廣泛信息資源的需求。

但是,搜索引擎仍然存在著很多問題,如:

(1)更權威、學術性更強的數字資源往往存在于隱藏在網頁背后的網絡數據庫中,然而,搜索引擎對深層網絡資源的覆蓋度是遠遠不能滿足用戶需求的。Marcia A Mardis指出,即使最有經驗的人使用最強大的搜索引擎也只能搜到網上16%的網頁,網上不可見的網頁是搜索引擎所收錄的網頁的500倍[1]。近年來的研究主要集中在通過整合邏輯鏈接、語義分析、聚類等方法來解決“深層網頁”、“隱藏網頁”中信息資源發現的難題。

(2)由于排序方式的不同,各種搜索引擎對同一檢索需求會返回不同的檢索結果,為提高查全率和查準率,用戶在檢索時就需要查詢多個搜索引擎,極大降低了檢索效率。對解決這一問題的研究主要集中在對頁面排序算法的改進。

(3)對元數據的結合與運用存在問題。Jin Zhang,Alexandra Dimitroff(2005)探討了元數據的運用對網頁的可見性的影響,認為:為提高可見性,不要利用沒有出現在題名或全文中的關鍵詞作為元數據元素的值,在元數據元素中的關鍵詞必須是來自該網頁的[2]。而數據標引的優勢恰恰正是通過提供規范、通用的(尤其是沒有出現在題名或全文中的)關鍵詞或主題詞來增加檢索點,提高檢全率。由此可以看出,搜索引擎對于元數據優勢的利用是存在障礙的,進而影響到了查準率與查全率。

2 從聯邦檢索到云服務為更好地發現深層網絡信息資源,聯邦檢索應運而生。

聯邦檢索(Federated Search),又稱:跨庫檢索、統一檢索、平行檢索、整合檢索等。維基百科中的聯邦檢索詞條引用了Péter Jacsó在2004年發表的文章中的闡述:聯邦檢索包括(1)將一個檢索請求以合適的語法轉換并發送到一組獨立的數據庫或其他網絡資源中;(2)合并檢索結果;(3)以簡潔統一的格式和最少的重復顯示結果;(4)提供一種或自動或由用戶選擇的方法對合并的結果集進行排序[3]。

這是一個以多個分布式異構數據源為對象的檢索系統,向用戶提供統一的檢索接口,將用戶的檢索要求轉化為不同數據源的檢索表達式,并發地檢索本地的和廣域網上多個分布式異構數據源,并對檢索結果進行整合,在經過去重和排序等操作后,以統一結果呈現給用戶。由于其直接對深層網絡數據庫的內容進行索引,因此可以獲取更加全面的信息資源,提高了信息的相關性,方便了用戶的信息獲取;同時,也促進了資源共享。主流聯邦檢索系統包括WebFeat系統、MetaLib系統、Serials Solutions系統、Muse系統等。

圖書館往往擁有多個數據庫,每個檢索系統都有各自的檢索界面和檢索方式,檢索式構造規則、檢索算符、檢索字段等都不盡相同,用戶想找到需要的資源就必須在各個數據庫中重復檢索,數據庫在數據結構、檢索方式、顯示風格等方面的差異使用戶雖然耗費了大量的時間和精力也無法保證查準率與檢全率。聯邦檢索為圖書館提供了有效整合數據庫及本地館藏的整合工具,因而,成為圖書館數字資源的一站式獲取的解決方案。

然而,應該看到的是,聯邦檢索仍存在一些問題。如:返回結果的速度慢,且只返回有限的結果;檢索結果的去重問題;跨庫檢索的效果不如在獨立數據庫中檢索的效果,等等。

隨著聯邦檢索技術的發展,各服務提供商的力量也逐漸壯大,近幾年,廠商之間的兼并和收購現象不斷發生,如:Sirsi和Dynix合并,Ex Libris收購Endeavor,ProQuest收購WebFeat等,軟件供應商實力越來越強,使得他們有能力對檢索系統進行功能整合以提升性能。

在技術發展的推動下,這些因素最終催生了整合模式的變革。

筆者以ProQuest集團推出的Summon服務作為典型樣例,來分析數字資源整合與服務的發展趨勢。

ProQuest集團推出的Serials Solutions系列服務涵蓋2 000多個各種規模與類型的圖書館,是為電子資源訪問和管理推出的產品[4],提供了一整套從基本到高級的電子資源管理解決方案,其中,360Search提供聯邦檢索服務。而盡管360Search已經擁有了很多用戶,但是由于聯邦檢索技術存在的問題以及為滿足資源整合與發現需求的不斷發展,Serials Solutions又推出了另一項產品——Summon服務。

Summon是為了支持大規模獲取來自不同來源的數字資源而設計,被Serials Solutions公司稱為網絡級發現服務(Web-Scale Discovery Services),這一服務資源涵蓋面廣(見圖1),整合了6 800多家內容提供商的內容,包含94 000多份期刊中的文章,收錄超過5億條數據[5]。它以互聯網檢索速度返回按相關度排序的檢索結果,并通過OpenURL鏈接器直接鏈接至全文。

Summon服務被它的創造者稱作“基于互聯網級探索發現服務”,具有以下一些特點:

(1)擁有自有知識庫

①快速檢索

在Serials Solutions現有知識庫的基礎上,Summon建立起自己的獨有龐大知識庫,無論用戶同時檢索多少數據庫,對Summon來說都是在自己的知識庫中的檢索。這樣只需使用一個檢索引擎,而不需要依賴其他供應商的檢索引擎,檢索速度得以大大提高。

②高質量的元數據

對出版物的全文進行索引(而不僅僅是元數據),使用Summon既可利用元數據、也可利用全文數據進行檢索;同時,與內容提供商合作,可以直接獲取最好的元數據。增加了全文索引;將不同來源的元數據進行整合處理,創建出更高質量的記錄;加入來自于Serials Solutions的官方命名數據、被同行評審的狀況以進一步完善元數據,來提高其被發現性。

③資源拓展

在Summon知識庫中的檢索既可以限定在只在本館資源中進行檢索,也可以擴展到在整個Summon知識庫中進行檢索。從而為圖書館的館際互借和采訪工作提供幫助。

(2)提供SaaS(Software-as-a-service,軟件即服務)服務

Summon采用了托管服務模式,由Serials Solutions幫助圖書館維護知識庫中的所有數據及更新。使用這一服務,圖書館不需要再購買軟硬件,也不需要投入人力和時間進行維護,與之相對應的是更快的更新、更方便的共享。符合當今數字資源整合服務的發展趨勢。

(3)Summon沒有與聯邦檢索捆綁,而同類產品多是發現服務與聯邦檢索捆綁在一起的混合模式。

盡管Serials Solutions擁有聯邦檢索產品,但在宣傳其新服務時,仍是將完全脫離聯邦檢索作為Summon的一大優勢。Summon的排序、篩選、分面等功能都是針對全部檢索結果的,揭示的是全部館藏信息,更好地實現了相關性排序。從而克服了聯邦檢索返回結果的速度慢、且不能一次性返回全部結果的不足。

(4)通過OpenAPI,Summon能夠與圖書館任何現有系統無縫集成,也兼容Ex Libris的SFX系統。

從以上對Summon的分析可以看到,資源的發現服務正在由本地走向網絡,這一變化為數字資源整合賦予了新的特點:

①資源整合的范圍不再局限于本地,資源的集成性更為明顯,通過互聯網,用戶可一站式獲取更廣范圍內的資源;

②圖書館用戶按需定制,減少浪費,節約成本;

③圖書館用戶擁有足夠多的自定義權限,在強調共性的同時也可滿足個性需求。

這些特點保證了圖書館在最大程度節省人力的同時有效提升用戶對資源的發現與獲取能力。這種新型服務嘗試采用的新技術被稱作云計算,可以預見,這些變革將為數字資源發現服務在網絡環境下的發展提供強有力的支持。

3 圖書館在云端

3.1 云服務的定義近幾年,隨著網絡的發展、信息服務需求的快速增長,云計算逐漸進入人們的視野,并得到了廣泛的應用。

盡管云計算已進入各個領域,但是對于云計算的定義卻是多種多樣。如:以因特網為中心的軟件、利用因特網幫助用戶獲取技術驅動型服務、使硬件層可以像按需定制計算和存儲能力那樣消費、云是巨大的資源池、是網格計算的用戶界面友好版本、比較寬泛的基于網格的服務系列,等等[6]。

維基百科將云計算定義為一種基于互聯網的計算方式,是通過網絡將龐大的計算處理程序自動分拆成無數個較小的子程序,再由多部服務器所組成的龐大系統搜索、計算分析之后將處理結果回傳給用戶。包括以下幾個層次的服務:基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)[7]。

IBM認為云計算是一種共享的網絡交付信息服務的模式……這種運用方式的核心原則是:硬件和軟件都是資源并被封裝為服務,用戶可以通過互聯網按需地訪問和使用[8]。

從上述的定義可以看出,云計算被賦予了狹義與廣義兩種定義,狹義的云計算是指通過網絡為用戶提供計算能力、硬件、存儲等,而廣義的云計算包括了基礎架構、平臺、應用等,一切都是資源,都可以通過網絡提供服務。此時,云計算作為一種創新技術推動了網絡時代服務方式乃至服務理念的變更。

筆者認為,在圖書館界,廣義的云服務的概念更為適用。在圖書館,技術及基礎設施均服務于信息資源的組織與利用。按照云計算的架構對軟、硬件進行有效的組織,可以獲得大幅度的硬件性能及服務能力的提升,從而,實現以有限的硬件設施去滿足用戶對海量信息的無限需求。

3.2 在圖書館發現服務中引入云服務的必然性網格、SOA、Web Service、P2P、云計算等技術的出現,都為數字資源整合服務提供了新的思路。云計算與圖書館的發現服務相結合的必然性源于:

3.2.1 網絡時代,云計算的優勢明顯

(1)提供無限可能

云計算采用創新的計算模式,通過互聯網為用戶提供豐富的信息服務,并且,具有按需擴展的性能。在網絡時代,信息資源與用戶需求同時近乎無限的快速增長與基礎設施的建設遠遠滯后形成了圖書館信息資源發現服務的瓶頸,云計算的創新架構為解決這一矛盾帶來了可能性。

(2)減少資源浪費

①從云服務使用者的角度來看

供應商負責硬件設施和軟件維護升級工作,用戶所有的是使用權,不需投入資金來購買服務器等硬件設備,不需在本地安裝和管理軟件,不需在過程中進行系統維護與管理,按需定制,由此,大大減少了資源的浪費與重復建設及人力、物力的投入。

②從云服務提供者的角度來看

通過云計算的形式,將數據中心適度集中,供應商通過規模效應來縮減開支。隨著用戶的增加,供應商可以通過負載均衡等技術手段充分利用硬件資源,降低運營成本。

3.2.2 云計算的特點有助于實現圖書館資源發現服務的最理想狀態

在程煥文、潘燕桃主編的《信息資源共享》一書中,將信息資源共享的最終目標概括為:任何用戶(Any user)在任何時候(Anytime)、任何地點(Anywhere),均可以獲得任何圖書館(Any library)擁有的任何信息資源(Any information resource)[9]。上述的5個“任何”也是資源發現服務的最終目標。圖書館將虛擬化與云計算的技術引入數字資源整合發現服務,必然對這一理想目標的最終實現起到巨大的推動作用。本文介紹的幾種結合云計算技術的數字資源整合工具都以海量資源、深度整合、依托網絡為共同的特點,通過云服務,更豐富的數字資源得以在更廣泛的地點被更多的用戶所獲取。

3.2.3 圖書館界越來越關注云計算的發展,并逐漸引入一些云計算的產品應用于圖書館發現服務

對圖書館事業發展的渴求使得圖書館界對各種新技術、新理念都及時給予關注,并吸收其中可利用的部分用于資源的全流程管理之中,云計算也不例外。

近兩年,國內對圖書館與云計算的研究明顯增多起來。筆者在CNKI期刊庫中以“圖書館”和“云”為題名關鍵詞進行檢索,共檢索到研究圖書館云服務相關命題論文137篇,最早一篇出現于2009年。

一些較大的圖書館聯盟都已開始對基于云的服務進行有益的嘗試。在國外,OCLC在2009年宣布實施將圖書館管理服務推向Web級的戰略;在國內,CALIS采用云計算在全國構建分布式的高校數字圖書館云服務平臺,包括中心級云服務平臺、共享域級云服務平臺[10],目前,基本框架已經完成。

對于使用信息的用戶來說,發現是對資源進行利用與再創造的基礎,其重要性不言而喻。因此,在云計算向圖書館信息服務領域發展的初期,就有一系列用于發現服務的產品被相繼推出。如:前文詳細介紹的Serials Solutions的Summon服務、Ex Libris的Primo Central知識庫、OCLC的WorldCat Local服務等國外大型信息服務提供商推出的云服務項目都是面向圖書館用戶,致力于信息資源的發現,并且都已擁有一定規模的圖書館用戶群。在數字資源發現服務領域,云服務作為一種新型的服務方式已逐漸為圖書館界所接受與認可。

3.3 在發現服務領域云計算發展的未來——標準化當云計算技術進入發現服務領域,勢必促進大量異構資源的集中整合及不同資源提供者的合作共建的發展,因此,標準化的進程決定著云計算在發現服務領域的未來。

圖書館為用戶提供的數字資源分為兩種:一種是自建的資源;一種是外購的資源。

3.3.1 對于外購資源

在多個異構實體間實現資源有效發現的關鍵點之一是通過元數據標準的互操作,解決元數據標準間的差異與沖突。這一過程是指建立協調規范、語義映射,并在此基礎上整合多種元數據標準,這一點在圖書館界早就受到重視,并對各種元數據的映射規則進行了大量研究。

3.3.2 對于自建資源

一般依據圖書館業內的統一標準規范,但是不同類型文獻、不同地域間仍存在差異,而近年來,隨著大型區域性合作組織(如:OCLC)乃至全球性的超級聯盟(如:國際圖書館聯盟(ICOLC))的快速發展,更多不同來源的數字資源被整合在一起,越來越集中,因此,標準化的問題日益突出。

可以看出,不論標準化的實現發生在資源整合之前,還是整合之后,對資源的有效發現都是至關重要的。

目前,在云計算領域,標準的制定得到了極大的關注,并已開始進行研究和實踐。成立于2008年的開放云計算聯盟(Open Cloud Consortium,OCC)的研究集中在為不同類型的支持云計算的軟件制定標準和接口,推廣開放的架構,讓由不同組織運營的云計算能夠無縫集成。

然而,應該認識到,云計算的通用標準并不能滿足發現服務的需要,標準的適用程度是決定云計算在發現服務領域是否能找到最佳結合點的因素之一。

在現代圖書館百年的發展中,形成了成熟的圖書館學理論、完善的知識組織體系、統一的標準規范,在傳統的資源查找與獲取中起到了重要的作用,也是圖書館的核心競爭力之所在。在網絡時代,圖書館界一直在尋求將這些經過多年研究實踐的工具應用于數字資源整合,最典型的事例是多個國家圖書館將規范數據發布為關聯數據。

因此,在提供基于信息資源的云服務時,圖書館不應僅局限于作為使用者,而應作為這一服務的主導者參與標準的制定及維護,結合圖書館的既有標準規范制定云服務的相關標準規范,更好地將云計算技術應用于圖書館信息資源服務領域。

在云時代即將來臨之際,如何更好地將云計算技術用于圖書館資源發現與整合,發揮圖書館既有的成熟知識組織體系的作用,為用戶提供更優質更便利的信息服務,以自身的核心競爭力確立圖書館在網絡時代的重要地位,并獲得無限發展的機遇,是圖書館界在這一技術變革期應深入思考的歷史使命。

參考文獻

[1]A.Mardis M.Adding to the Students' tool Box:Using Directories,Search Engines,and the Hidden Web in Search Process[J].Tech Trends,2002,(46):33-38.

[2]Zhang Jin,Dimitroff Alexandra.The Impact of Metadata Implementation on Webpage Visibility in Search Engine Results[J].Information Processing and Management,2005,(41):691-715.

[3]Federated search[EB].http://en.wikipedia.org/wiki/FederatedSearch,2011-04-24.

[4]http://www.proquest.asia/zh-CN/products/brands/plss.shtml[EB].2011-05-10.

[5]http://www.serialssolutions.com/summon-content-and-coverage[EB].2011-05-10.

[6]Jeremy Geelan.Twenty-One Experts Define Cloud Computing[EB].http://cloudcomputing.sys-con.com/node/612375,2011-04-16.

[7]云計算[EB].http://zh.wikipedia.org/wiki/%E4%BA%91%E8%AE%A1%E7%AE%97,2011-04-24.

[8]王慶波,等.虛擬化與云計算[M].北京:電子工業出版社,2009:112.

[9]程煥文,潘燕桃.信息資源共享[M].北京:高等教育出版社,2004:16.

[10]王文清,楊新涯.CALIS三期項目系統集成部署方案與演示[EB].http://www.calis.edu.cn/educhina/attachment/CALISsqxtjs.pdf,2011-04-24.

主站蜘蛛池模板: 欧美国产综合色视频| 老司机久久99久久精品播放| 亚洲精品福利视频| 国产人碰人摸人爱免费视频| 久久国产精品影院| 日韩精品一区二区三区swag| 久久精品亚洲中文字幕乱码| 亚洲国产系列| 亚洲国产精品一区二区第一页免| 国产a网站| 国产在线一区视频| 欧美一级夜夜爽| 国产超薄肉色丝袜网站| 无码中文AⅤ在线观看| 色综合a怡红院怡红院首页| 这里只有精品在线| 五月丁香伊人啪啪手机免费观看| 国产一区二区网站| 无码电影在线观看| 国产香蕉国产精品偷在线观看| 五月激情婷婷综合| 亚洲日韩精品综合在线一区二区| 久久先锋资源| 71pao成人国产永久免费视频 | 国产香蕉在线| 亚洲第一成年免费网站| 久久亚洲国产最新网站| 一级不卡毛片| 婷婷五月在线| 欧美日韩在线国产| lhav亚洲精品| 国产一区二区免费播放| 国产导航在线| 国产噜噜噜视频在线观看| 中文字幕免费在线视频| 国产区免费精品视频| 久久香蕉国产线看观看式| 国产美女精品一区二区| jizz国产视频| 久久精品嫩草研究院| 国产精品思思热在线| 亚洲第一黄色网址| 97成人在线视频| 综合五月天网| 日韩不卡高清视频| 国产成人综合亚洲欧洲色就色| 日韩欧美国产三级| 欧美精品高清| 狠狠综合久久久久综| 少妇精品久久久一区二区三区| 国产日韩欧美黄色片免费观看| 少妇人妻无码首页| 国产91九色在线播放| 国内视频精品| 国产人免费人成免费视频| 久久男人视频| 国产高清又黄又嫩的免费视频网站| 中文字幕无线码一区| av在线无码浏览| 久久国产精品国产自线拍| 四虎成人精品在永久免费| 综合成人国产| 日韩大乳视频中文字幕 | 无码 在线 在线| 亚洲国产亚洲综合在线尤物| 毛片网站观看| 国产欧美日本在线观看| 香蕉网久久| 欧美成人在线免费| 欧美日韩国产精品va| 欧美亚洲一区二区三区导航| 在线综合亚洲欧美网站| 亚洲香蕉在线| 呦视频在线一区二区三区| 久久国产黑丝袜视频| vvvv98国产成人综合青青| 四虎精品黑人视频| 国产熟睡乱子伦视频网站| 日本成人在线不卡视频| 亚洲欧美日韩中文字幕在线一区| 最新午夜男女福利片视频| 日韩激情成人|