〔摘 要〕本文提出了一種圖書館讀者信息服務的詳細解決方案——面向讀者的信息服務多代理專家系統,該系統采用了虛擬專用網技術,提供了一種通過公用網絡安全地對圖書館內部專家系統和數據倉庫進行遠程訪問的連接方式,從而大幅度降低了通信費用。內部的專家系統則以B/S網站軟件的形式出現,圖書館管理人員可以通過訪問網站實時了解讀者的借閱狀況,并利用系統的圖書推薦提示可以對潛在流失的讀者實施挽留,將有助于提高圖書館的信息服務質量。
〔關鍵詞〕虛擬專用網;專家系統;多代理;圖書館信息服務
DOI:10.3969/j.issn.1008-0821.20.01.017
〔中圖分類號〕G250.71 〔文獻標識碼〕A 〔文章編號〕1008-0821(20)01-0067-04
A Multi-Agent Expert System of Library Service
Through Virtual Private NetworkNie Zhen1 Wang Huaqiu2 Tang Zhongjun1
(1.Library,Chongqing University of Technology,Chongqing 400054,China;
2.Computer Science College,Chongqing University of Technology,Chongqing 400054,China)
〔Abstract〕The paper presented a detail solution of library reader information service by the name of multi-agent expert system oriented reader information service.Virtual private network technology was adopted into the system to provide a remoting connect method of library internal expert system and data warehouse through common network so that the communication cost has been reduced.Internal expert system was shown by the form of B/S website in order that library officers real-time understand reader conditions through the website conveniently.Consequently,the potential loss readers were retained by the books recommendation of the system so as to enhance the information service quality of library.
〔Keywords〕virtual private network;expert system;multi-agent;information service of library
對于圖書館來說,無論圖書館規模多大,或者館藏多少,讀者才是圖書館生存和發展的根基,而保持讀者、吸引讀者和充分發掘讀者的借閱潛力是圖書館提高核心競爭力的關鍵。如何通過提高讀者的滿意度及忠誠度,已成為各類圖書館關注的焦點課題[1]。圖書宣傳是圖書館常用的方式。圖書館紛紛推出各類暢銷圖書的介紹。圖書宣傳激勵了讀者的閱讀興趣,但很難滿足不同層次的讀者需求,由于背景、收入、年齡、教育程度、行為特征等的不同,對圖書館服務的需求也呈現多層次、個性化、差異化的趨勢。單一的圖書宣傳無法滿足眾多讀者的獨特需求,個性化服務和實時推薦將是未來圖書館競爭的主要內容。
如今的數字圖書館幾乎都利用高端服務器、多類網絡通信技術和智能存儲系統,將面向對象的軟件技術、人工智能技術與先進的知識組織和調度系統相結合,建立具有很好的可擴展性、易用性、可管理性和高可用性以及較強的可持續發展能力的數字圖書館系統和群體。其代表項目的主要功能概述如下:
哥倫比亞大學開發了一項“新書通知服務”,每周向用戶提供E-mail通知,通知的內容既包括新編目的圖書,又包括電子資源以及和用戶的研究學習興趣相匹配的其他媒體。美國RICE大學的Information Session,也可以按照教師和學生的個人需求定做不同的信息服務。UKE大學的End Note Bolographic Software,則可以幫助用戶建立一個個人化圖書館[2-3]。
北京大學開發了一個用戶信息模塊,為用于提供個人查詢信息的窗口,用戶可以向圖書館提出服務請求和建議。清華大學圖書館也研制了“快捷圖書館——讀者的個性化圖書館”,提供了個人信息查詢、書目追蹤、定制服務等功能,但是仍有待繼續開發。浙江大學圖書館研制了“我的圖書館”,采用了B/S訪問模式,讀者通過瀏覽器進入系統,根據自己的知識結構和信息需求對圖書館數字資源進行利用。中國人民大學圖書館和信息學院共同推出了“Digital Personal Service System”,包括了數字圖書資源檢索、個性化推薦、在線咨詢3個子系統,該系統根據讀者的專業特點和興趣愛好,向讀者提供和推薦教學科研所需的資料和信息,還能實現在線咨詢服務,實現了圖書館異構數字資源的共享[4-5]。
由此可見,數字圖書館的建設是以不斷改善讀者服務為最終目標。為讀者在知識發現與利用上提供高效方便的工具,并且使得讀者可方便地透過數字圖書館的多個資源庫無縫獲取所需的知識。以人為中心的數字圖書館研究試圖進一步了解數字圖書館在增強人類在創造、探索、使用信息方面的活動中的影響和潛力,并促進為這些活動設計的技術的研究。
隨著各國圖書館數字化程度與數字圖書館的建設不斷發展,圖書館要處理和提供的信息更多、更新、更廣泛和更復雜。在圖書館現有的數字化系統中每年、每月、每天產生著大量的統計數據和表單,它們對圖書館館藏建設等業務有著很強的指導作用[6]。因此,如何獲取知識便成為廣大研究者和工程人員關注和研究的重點。利用數據挖掘為基礎的專家系統可以從大量的數據中所取隱含在其中的、人們事先不知道的、潛在的、有用的知識,必將為圖書館事業的發展提供有力的支持[7-8]。
總之,圖書館服務多代理專家系統可實現信息服務質量的提升和業務的拓展。這樣構成的數字圖書館借助現代信息技術,其意義不僅在于服務媒體和時空的轉變,更重要的是能夠借助專家系統技術,完善其服務結構和提升服務水平。
在這種背景下,本文提出了一種基于全新的基于信息技術的管理理念——面向讀者的信息服務多代理專家系統(Orientation Reader Multi-Agent Expert System)。其最終目標在于圖書館與讀者建立一種長期的借閱關系,能使圖書館贏得競爭優勢。下面我們來解釋一下系統的定義。
系統的設計思路
眾所周知,專家系統體現了人的思維能力。將這種思維能力和系統的物理規律、數學模型有機地結合,更靈活地表征系統各個狀態,而多代理專家系統軟件正是力圖在得到足夠好的專家知識的基礎上,依靠優化和學習,調整專家知識、調整推理結構并對圖書館系統運行狀態給出相關的判斷。
所謂多代理,是指實現手段有很多,包括讀者細分、讀者忠誠度分析、讀者流失分析、讀者圖書推薦這四大推理引擎。多代理既是專家系統的重要理論組成部分,又是其重要管理工具,是分門別類研究讀者、進行有效讀者評估、合理分配服務資源、成功實施讀者策略的技術保障,為圖書館充分獲取讀者特征、制定圖書推薦策略提供理論和方法指導。
多代理專家系統包括了4種推理引擎:(1)讀者細分引擎;(2)讀者忠誠度分析引擎;(3)讀者流失分析引擎;(4)讀者圖書推薦引擎。
這4種推理引擎同時存在、各盡其責(如圖1所示)。這些引擎是通過圖書館歷史數據和在線強化學習達到。
圖1 系統組成結構
在對4種引擎結論的優化決策中,采用如下方法:
在引擎推理融合中,將各推理引擎的決策uj綜合,產生最后決策u,最后決策取決于概率比值:
其中U=(u1,u2,…,un)是輸入矢量。
在多代理專家系統中,讀者細分推理機、讀者忠誠度分析推理機、讀者流失分析推理機和讀者圖書推薦推理機均靠圖書館實時流通業務數據庫的觸發器啟動,它們的計算工作流程圖如圖2所示。
不同的決策概率可能會造成不同的結論,這往往需要實踐加經驗來決定,能否有一種自適應的方法或者模糊的方法來解決該問題也是系統的難點之一。
2 系統實施方案
對于圖書館信息系統提供基于Web的讀者基本數據、讀者借閱記錄等信息,進行讀者細分,分析讀者忠誠度,研究已經流失的讀者,從中尋找出先前未知的、對圖書館決策有潛在價值的知識和規則,發掘潛在流失的讀者,讓圖2 推理引擎工作流程圖
圖書館實時把握讀者動向,掌握讀者流失的規律,及時對潛在流失的讀者提供感興趣的圖書推薦,從而達到提高圖書館服務質量的目的。
針對上述目標,本文著手從以下幾個方面開展實施:
2.1 數據倉庫的設計與實施
這方面的內容包括建立實時數據庫,設計多維立方體,建立OLAP分析模型等內容。
2.2 建立四大推理引擎
(1)讀者細分引擎:根據讀者的基本信息,如年齡、性別、專業、年級、學歷等,利用系統聚類算法,把讀者分割成不同的群體。
(2)讀者忠誠度分析引擎:根據讀者的借閱習慣,利用決策樹算法將讀者分為偶然讀者、一般讀者和忠實讀者三類。
(3)讀者流失引擎:根據讀者資料和借閱行為及其相關數據等歷史信息,將神經網絡應用于讀者流失分析中,針對目前圖書借閱中存在的問題,給出了讀者流失預測模型,利用訓練后的模型對讀者的流失率進行預測并生成讀者列表。
(4)讀者圖書推薦引擎:利用關聯規則挖掘算法分析讀者和圖書之間的關聯,進而向讀者推薦其它可能感興趣的圖書。
對于不同的引擎,可能需要采用不同的人工智能算法加以分析,而這些算法用于分析圖書館信息服務數據的準確性和實時性恰恰是本文的難點。四大推理引擎是形成知識的必要條件,我們初步考慮如下算法這些推理引擎:
讀者細分引擎:采用層次聚類算法實現。
讀者忠誠度分析引擎:采用決策樹分類算法實現。
讀者流失引擎:采用神經網絡預測算法實現。
讀者圖書推薦引擎:采用關聯規則和序列分析算法實現。這里需要解釋一下為什么要用兩種方法實現圖書推薦,關聯規則模型分析的是讀者的個人信息,并由此預測該讀者最有可能借閱其它圖書,這種模型適合于經常借書或正在借書的讀者,當他們借閱書籍時可以及時向他們推薦其它圖書,序列分析模型分析的是圖書借閱信息,并由此預測借閱了某圖書的讀者還可能借閱其它哪些圖書,這種模型適合于不經常借書或沒借書的讀者,當他們借了某圖書后,可以通過電子郵件或者其它方式告知他們圖書館有他們感興趣的圖書,激發他們的借書讀書的熱情。
2.3 將推理引擎集成到專家系統中
專家系統由四大主要部件:知識庫、推理機、用戶接口、動態庫。將四大推理引擎的知識集成,基于一種特有的圖形化專家知識組建方式,可以很方便地任意增加、修改、存儲專家知識,使專家知識能不斷地積累、豐富和完善。其推理過程如圖3所示:
圖3 模糊推理過程框圖
采用這樣的方式進行知識融合,形成關于讀者的完整認識,應用心理學有關方法,對讀者實施必要的針對性圖書信息推薦。
在進行模糊診斷之前首先要設法建立讀者狀態與引擎結論之間的模糊關系矩陣R,也叫隸屬度矩陣。首先測取讀者的待檢狀態的征兆參數向量矩陣X;然后求解關系矩陣方程Y=XR,得到待檢狀態的向量Y,據此即可得出合理的結論。
2.4 專家系統的評估與動態優化
由于圖書館的書籍不斷增加,書籍對于讀者的吸引了會發生變化,而讀者由于自身的發展需要,對于圖書的渴求程度也會發生變化。因此上述形成的對讀者的全面認識可能會變成一種歷史經驗,而缺乏現實的指導意義。
專家系統的動態優化和推理引擎的實時自修正問題關系到系統的準確性和有效性。這就需要決定何時進行系統更新或者引擎自修正,如何時機不對,既有可能造成誤報也有可能造成漏報,反而造成圖書館管理的混亂。根據不同情況而定做的界面,可使圖書館管理人員能很便捷地觀察讀者變化趨勢和推理過程。當知識和現實發生矛盾時,需要定期地啟動推理引擎進行新的推理,重新融合成新的專家知識,對專家系統的動態優化才能讓其具有生命力,持續地為圖書館信息服務提供作用。
2.5 虛擬專用網VPN的建立和安全性設置
虛擬專用網VPN的建立原本是成熟技術,但是由于涉及圖書館內部信息,于是VPN的安全性配置成為了需要關注的內容。
在以上理論研究的基礎上,實現專家系統Expert System,結合數據倉庫Data Warehouse和虛擬專用網Virtual Private Network技術構建系統的實施圖,如圖4所示。其中虛線框中的內容是本文需要完成的內容。圖4 系統實施圖
3 結 論
本文利用智能技術中的專家系統實現智能信息推送。既有圖書館服務信息管理功能,也有用于推理引擎的數據挖掘算法理論研究,還有信息集成和知識融合功能,可以說是比較全面的圖書館信息服務智能分析系統,該系統最終以知識的方式展示出來,從而構建了圖書館智能信息共享平臺。
參考文獻
[1]於堅秋.公共圖書館讀者信息需求與服務對策淺析[J].國家圖書館學刊,2007,(1):85-88.
[2]馬建玲,史風.國外圖書館MyLibrary個性化服務系統比較研究[J].現代圖書情報技術,2004,(10):70-73.
[3]季曉林.MyLibrary用戶模型功能設計——泰達數字化圖書館個性化服務的實踐[J].現代情報,2005,(10):85-87.
[4]何平,陳有志,廖紅四.數字圖書館信息門戶的個性化服務模式[J].中國信息導報,2006,(8):27-29.
[5]曹作華.論圖書館信息資源建設的綜合評價[J].圖書情報工作,2002,(5):45-49.
[6]王居平.圖書館學和情報學中的量化分析和預測方法初探[J].情報雜志,2007,(1):105-106.
[7]趙嘉凌,蔡文偉.基于數據倉庫和OLAP的圖書借閱分析系統的設計[J].圖書館學研究,2008,(3):36-39.
[8]李璐璐.基于數據挖掘技術的信息服務研究及系統模型設計[J].大學圖書情報學刊,2008,26(4):46-48.