蔡 煒
(青島大學圖書館 山東 青島 266061)
區域高校圖書館聯盟信息服務云平臺體系研究★
蔡 煒
(青島大學圖書館 山東 青島 266061)
為了實現高校圖書館聯盟內文獻的共享和共用,利用云計算技術,構建了包括角色層、服務層、工具層和基礎層的面向區域高校圖書館聯盟的區域云服務平臺體系架構,并對資源發現進行了探討,提出了一種層次遞進的檢索模型,在資源語義建模基礎上,給出了基于用戶需求的語義匹配策略。
語義建模;云計算;資源發現;圖書館聯盟
圖書館聯盟是以實現資源共享、互惠互利為目的而組織起來的圖書館聯合體,是數字圖書館的一種發展趨勢[1]。區域性圖書館聯盟是圖書館聯盟中比較普遍的一種,這種聯盟利用地域上的便利,充分發揮聯盟的優勢,在聯合編目、館際互借、公共檢索、集團采購、電子信息資源的建設等活動中相互協作[2],建立起區域性的文獻信息服務體系。國內比較典型的如江蘇省高等教育文獻保障系統、天津高等教育文獻信息中心、河南省高等教育文獻保障系統、山東省網上圖書館共享服務平臺等都是區域性信息資源共建共享機構。
云計算是一種新興的計算模型, 具有可靠性高、數據處理量大、擴展靈活以及設備利用率高等優勢, 正成為信息領域研究的熱點, 包括Google、IBM、Amazon、Microsoft在內的幾乎所有的IT巨頭都將云計算作為未來發展的主要戰略之一[3,4]。云計算旨在由專業計算機和網絡公司建立計算機存儲和計算服務中心,把資源虛擬化成“云”后集中存儲起來,為用戶需求提供服務。對于圖書館應用,云計算作為一種信息共享技術的架構模式,可以將海量的數字信息資源集中在一起,實現數字圖書館的云平臺和云聯盟,為數字資源的真正共享提供了新的途徑。
本文針對區域內高校圖書館聯盟模式,探討云計算模式下信息資源共享服務平臺架構,對云模式下的資源檢索提出了本體建模方法和檢索策略。
隨著圖書館事業的不斷發展,圖書館的各類資源已經覆蓋社會生活每個領域,并不斷地細分、深化和專業化,各高校圖書館根據自身的條件分別擁有其中的部分或全部資源。但由于高校類型不同,圖書館提供的館藏電子資源服務的綜合性和專業性不同,因而形成了電子資源的千種百態。用戶如果要從圖書館中獲取最有價值、最全面的資料,就要面對不同的圖書館、不同的資源檢索系統,無疑增加了用戶的困難。圖書館聯盟的形成實際就是電子資源整合的一種服務方式。云計算在圖書館的應用很適合共享與合作的范式。這種區域圖書館聯盟構成云計算模式,或稱為區域云,具有如下優勢:
(1)區域內各高校通過聯合建立一個共享“云端”,以資源高度共享為基礎,改進現有的用戶服務模式,逐步形成“統一檢索——集成咨詢——實時獲取——知識服務”的服務模式,有效提高高校圖書館的資源利用率及用戶滿意度。
(2)眾多的服務器、存儲器等設備集成在“云端”,其存儲能力和計算能力理論上可以無限增大。在區域云中,各高校圖書館實現了共享資源,避免了電子數據庫資源的重復購買,也不必再考慮硬件費用問題。同時,更方便的終端設備(如4G手機、IPDA等)接入方式提供用戶去訪問區域云內的資源信息。
(3)以區域云平臺為基礎,高校聯盟圖書館可以利用云平臺實現數字資源的整合、組織、導航以及可視化服務,不同類型和規模的高校圖書館可以按需索取相應的服務,滿足用戶的需求。
3.1 云服務平臺架構
云計算的出現對于建立一個統一、開放、靈活的數字圖書館信息服務平臺有著重要作用。本文構建了包括角色層、服務層、工具層和基礎層的四層結構的面向區域高校圖書館聯盟的區域云服務平臺體系架構,可以為用戶提供基于網絡的快捷、安全、價廉的信息服務,并實現地區性圖書館集群的多方協同與共贏,構建一個科學、穩定的平臺體系(如圖1)所示。

圖1 圖書館聯盟區域云信息服務平臺架構
(1) 角色層是資源需求方、資源提供方和方案服務方等各用戶與圖書館聯盟信息服務平臺進行交互的接口。
(2) 服務層是服務平臺的核心功能層。通過人機交互界面用戶對各類信息資源需求、信息資源進行注冊發布,形成云需求和云資源。在工具層各類型工具的驅動下,服務化的信息資源將按用戶需求動態組合為粒度不同的服務模塊,形成相應的區域云服務。
(3) 工具層是服務支持層,主要由資源管理工具集、運行服務工具集和平臺綜合管理工具集等組成。資源管理工具集用于用戶及圖書館需求和資源的注釋、注冊、發布以及分類,主要包括注解工具、注冊工具、分類管理工具和發布工具;運行服務工具集可支持信息區域云服務的網絡化運行,包括智能匹配工具、本體構建工具、運行優化工具、服務評價工具、租賃管理工具、實時監控工具等;綜合管理工具集則為用戶提供安全、可靠和穩定的服務環境支持,主要包括了信息平臺運行管理工具、用戶信息管理工具、安全運行管理工具等。
(4) 基礎層將區域內分布在各高校圖書館的數據庫、存儲類設備、服務器和網絡安全類設備接入區域云服務平臺中,形成云數據庫、云服務器、云存儲和云安全等信息服務平臺運行支撐環境。
3.2 平臺運行模式
云服務平臺既要支持區域內各信息服務角色所擁有的廣域、異構信息資源虛擬集成,又要實現信息資源共享和優化利用、圖書系統網絡化集成運行、信息獲取過程優化,以及遠程維護等基于網絡的信息服務。本文初步建立了圖書信息云服務平臺的運行模式,如圖2所示。

圖2 云平臺服務模式
資源需求方、資源提供方和整體解決方案服務方通過云服務平臺的注冊發布工具,對各自的服務需求信息、信息資源進行虛擬化描述與服務化封裝,并注冊發布到云服務平臺上,形成相應的云需求和云資源;資源需求方調用服務平臺工具集中的智能搜索匹配工具,對其相應的云需求與云資源庫中的信息資源進行智能搜索匹配,形成供需匹配文檔,并反饋至信息供需雙方;待服務確認后,供需雙方則可利用平臺提供的組合調配工具、優化運行工具、交易協同工具、綜合評價工具等服務運行工具對服務進行組合、調配、優化、交易和評價,并將其反饋給服務供需雙方,以便對所提供服務進行實時跟蹤和完善;同時,平臺服務在線監控工具、服務容錯管理工具等對其服務進行運維管控,以不斷優化平臺服務能力。
云服務平臺的構建及運行實現,涉及信息資源的云端接入、信息本體建模、云資源搜索與智能匹配、云服務運行及監控等關鍵技術,就云資源檢索本文提出了一種層次遞進的檢索模型。
云計算模式下的圖書館聯盟涉及到多方面的技術和內容,包括:
(1)圖書館信息資源存儲:通過聯盟應用、網格技術以及分布式文件系統等功能,將網絡中大量各類存儲設備通過應用軟件虛擬地集合起來協同工作,共同對外提供數據存儲和業務訪問功能,即“云存儲”。在云計算模式下,圖書館藏書目數據庫和特色文獻數據庫等資源都可以選擇存儲在區域云中。
(2)圖書館信息資源檢索:云計算具有強大的計算能力,這為圖書館完成大規模用戶同時在線檢索服務提供了可能。用戶通過Google、百度等檢索界面將檢索請求提交給云計算服務器,服務器進行本體演算、機器智能推理匹配等復雜計算,將存儲在云存儲服務器的資源提供給用戶。
(3)圖書館信息資源獲取:基于云計算本身的分布式架構和強大計算能力,用戶從云中獲取數字資源的速度將如同在本地一樣快捷。用戶可以隨時的向云服務器提交獲取資源請求,云計算服務器將通過統一平臺,自動挖掘分布在區域云中各處的數據提供給用戶。為了完成信息資源檢索,系統需具有強大的資源發現功能。本文在信息資源語義建模基礎上,提出了基于用戶需求的資源發現服務和語義匹配策略。
4.1 區域圖書館用戶模型的建立及其語義描述
用戶建模的目的是幫助信息服務系統推測用戶提出的需求,智能、主動地發現用戶所需的資源內容。因此,資源發現服務需要自動地或人工獲取用戶需求信息,用戶需求表達的準確性和合理性直接影響到發現服務的質量。用戶模型所涉及到的用戶知識包括采用檢索關鍵詞表示的用戶需求、隱含的問題空間、用戶的興趣模型及領域知識。用戶模型的主要元素包括用戶的研究方向及領域、愛好、工作部門、職務等基本背景信息。模型采用類來定義層次不同類型的用戶,類屬性用來描述相應類用戶的特征知識,每一個具體用戶對應類的一個實例,可以通過類的繼承和關聯關系來表達模型的層次。
圖3是一用戶模型實例,其中用戶類描述了所有用戶的抽象特征,用戶類又分為圖書館類、部門類以及個人用戶類。
4.2 基于語義的圖書館聯盟文獻資源建模
云模式下的資源模型描述需要從語義層次上來加以研究。語義是建立在一定語法上,反映一定認知結果的數據對象的含義以及關聯關系,是對數據的一種抽象或者更高層次的邏輯描述[5]。文獻信息資源的語義模型可以用于資源的主題搜索、元數據提取和資源語義注釋等資源發現過程。同時,也可用于資源的分類聚類,語義導航、檢索匹配及智能推理等信息資源語義的應用服務。本體是一種可以在語義和知識層次上描述資源的概念建模工具。對于云模式下資源發現服務,可以通過對信息資源的概念抽象,把信息資源組織為一個公共的資源模型,使其成為基于本體的資源語義模型。

圖3 基于類表示的用戶模型圖

圖4 圖書類資源本體實例
構建資源領域本體常采用自頂向下(Top—down)的方法,構建的主要步驟包括:(1)確定領域資源的本體范圍;(2)定義資源概念的語義層次體系框架;(3)建立資源的領域本體;(4)細化、擴展應用本體。圖4是采用有向圖定義的圖書類資源的局部本體。
4.3 基于概念本體的資源語義檢索
高校數字文獻資源分布廣泛,內容和形式復雜,有效的資源發現和服務機制是資源共享服務的基礎。資源檢索是信息服務的一項主要內容,本文采用一種層次遞進的檢索模型(如圖5所示),可以實現精確檢索、基于語義檢索、模糊檢索以及智能推理等功能。首先對用戶需求進行模糊擴展來完成對模糊查詢量的精確化,其次根據資源本體的語義模型實現語義擴展(如:同義擴展、語義蘊涵、語義聯想等),末層采用精確匹配和智能推理技術完成資源的檢索服務。

圖5 層次遞進檢索模型
基于本體的資源語義檢索是一種基于語義匹配過程的資源服務,其檢索步驟為:
Step1:將用戶需求信息和文獻資源信息所包含的概念分別映射到各自對應的本體概念語義模型上,形成用戶需求本體O1和文獻資源本體O2;
Step2:采用后序遍歷分別生成O1和O2各自所包含的概念序列;
Step3:對序列中的每一對概念節點(ci,cj)進行概念本體的語義相似度計算;
Step4:以語義相似度作為量度,從區域云存儲數據庫中找出符合條件的信息資源集合。
語義相似度采用如下計算公式:
Sim=(ci,cj)=
其中,Sim(ci,cj)代表兩個概念ci和cj之間的語義相似程度,li、lj分別是概念ci和cj在概念本體樹中所在的層次,α是調節系數(0<α<1),Dis(ci,cj)是概念ci和cj在概念本體樹中路徑距離長度。
以用戶需求為基本是數字圖書館發展的根本和宗旨。隨著云計算技術的逐漸完善,將云計算技術與方法運用到區域圖書館聯盟信息服務平臺建設中,本文在平臺的結構及相關技術方面做了有益的探討,可以有效提高區域聯盟內軟硬件資源的利用率,構建數字圖書館資源共享體系,提升圖書館的服務質量。
[1]葉素萍.云計算環境下的區域圖書館聯盟建設模式研究[J].河北科技圖苑,2012,25(4):84-86.
[2]張甫.國內區域圖書館聯盟建設與發展研究[J].情報雜志,2011,30(8):138-143.
[3]王德文.基于云計算的智能電網信息平臺[J].電力系統自動化,2010,34(22):7-11.
[4]VAQUERO L M,RODERO-MERINO L,CACERES J,etal.A break in the clouds:towards a cloud definition.ACM SIGCOMM Computer Communication Review,2009,39(1):50-55.
[5]張維明.語義信息模型及應用[M].北京:電子工業出版社,2002.
[6]陳康,鄭緯.云計算:系統實例與研究現狀[J].軟件學報, 2009,20(5):1337-1348.
Research of Cloud Information Service Platformfor Regional University Library Alliance
Cai Wei
To achieve the sharing and reuse of Library alliance literature resources, the paper uses cloud computing technology, and structures regional cloud service platform for regional university library alliance that includes multilevel, such as user layer, service layer, tool layer and support layer. The resource discovery is discussed. A retrieval model of hiberarchy is presented. The semantic matching strategy is given based on resource semantic modeling.
Semantic Modeling; Cloud Computing; Resource Discovery; Library Alliance
本文系山東省藝術科學重點課題“基于SOA架構和多Agent技術的區域高校圖書館聯盟信息服務體系研究”(2013438)的研究成果。
G250.7
A
10.13897/j.cnki.hbkjty.2017.0014
蔡煒(1970-),女,碩士,青島大學圖書館副研究館員,研究方向:圖書館學、文獻學。
2016-12-03 責任編輯:張曉霞)