摘要:介紹了用戶Agent、個性化信息Agent這兩種模型的構建方法以及需要注意的問題。
關鍵詞:智能Agent;個性化信息服務模型;用戶Agent;個性化信息Agent
引言
數字圖書館的資源是海量的。根據不同用戶的信息需求,為用戶提供個性化服務是數字圖書館所追求的重要目標。目前的數字圖書館服務離此目標還有一定距離,原因之一就是缺少一種更為智能化的信息服務技術。智能Agent因其具有自主性、代理性、適應性和協作性等特征已得到廣泛的應用。將智能Agent引入信息服務之中,為用戶提供個性化服務是信息服務的發展趨勢。
1 智能Agent的特征及其在個性化信息服務中的功能
智能Agent能根據用戶需要,代理用戶自動地完成各項工作,并能推測用戶的意圖,自主制定、調整和執行工作計劃。一般認為,智能Agent應具有如下特征:①智能性。能感知環境,具有推理或智能計算功能,能分析用戶的需求,在運行過程中動態地收集信息,不斷調整和修改自身功能。②代理性。能代表用戶完成某些工作或代理用戶軟件與其他軟件進行通信和聯系。③自主性。能在沒有外界因素干預的情況下持續運行,并能控制自身的行為和狀態。④協作性。Agent自主但不孤立,它能同其它Agent主體進行信息交換,也能借助于通訊機制與其他Agent進行協作來達到預期的目標。⑤適應性。Agent具有學習能力,不僅能對外界環境的變化作出反應,而且能夠采取一種面向目標的行為。⑥可信賴性。智能Agent能準確地、可信地代表用戶,這是Agent能否被用戶接受的關鍵。
Agent作為一種全新的信息服務技術,具有不斷學習、適應用戶需求變化的能力,能為用戶提供個性化信息服務。具體來說,應用于個性化信息服務的智能Agent主要完成以下功能:①智能搜索。分析和預測用戶需求,自動查找相關信息。②導航與解惑。告知用戶所需資源的位置,并借助豐富的信息資源體系回答用戶提出的特定問題。③信息過濾。按照用戶的條件,對重復或無用的信息進行過濾和篩選。④知識挖掘。對相關信息進行分門別類的整理,并從大量的數據中提取出有價值的信息和知識。⑤信息推送。及時把用戶定制或感興趣的信息發送給用戶。
2 利用智能Agent構建個性化信息服務模型
基于Agent的個性化信息服務能夠為每個或每類用戶“量體裁衣”,為不同用戶提供具有針對性的信息服務。一個完整的個性化信息服務模型主要由用戶Agent、個性化信息Agent等多個模型組成。
個性化信息服務模型中,用戶Agent主要對用戶的特征、興趣、偏好、需求等信息進行描述,以確立用戶所需信息服務的類型。個性化信息Agent主要將個性化信息從全局信息空間中分離出來。而功能強大的信息搜索和友好的用戶界面是實現個性化信息服務的重要保障。
2.1 用戶Agent模型的構建
構建用戶Agent模型是實現個性化服務的前提和基礎。用戶Agent模型主要實現用戶信息獲取、用戶信息分析和用戶信息更新等功能。
(1)用戶信息獲取。主要是獲取用戶活動信息,建立用戶信息庫,為模型提供必要的數據源。用戶信息庫應盡可能完整地記錄用戶的基本情況,不僅包括用戶姓名、專業、身份、單位等信息,而且還包括用戶的興趣、愛好、研究領域等情況。目前,獲取用戶信息的方法有:一是人機交互法。在圖書館主頁上提供個性化服務的注冊入口,讓用戶自己登記感興趣的專業、方向,想獲得的信息以及獲取方式、時間等。二是監視跟蹤法。主要通過帶有Agent的瀏覽器來監視、跟蹤用戶的行為,并把用戶輸入的主題詞、關鍵詞、瀏覽頁面及操作等信息記錄下來,經過分類與整理,充實到用戶信息庫中。通常,用戶瀏覽的頁面和瀏覽行為最能全面反映用戶的興趣;用戶的Bookmark和保存整理的文檔雖不能全面地反映用戶的興趣,但能很好地反映用戶關注的信息;用戶的借閱信息、咨詢記錄和下載記錄也能較好反映用戶的興趣愛好。三是系統導入法。通過合作與交流,將其它數字圖書館、信息服務機構、文獻資源共享聯合體等有關用戶數據導入個性化服務系統。
(2)用戶信息分析。為了開展個性化服務,必須了解用戶,加強對用戶信息的分析,確定用戶興趣模型。為此,可通過對用戶分類、聚類、時間序列模式分析,抽象出每類用戶的普遍性需求和個性化需求,并建立一系列關聯規則。還可以通過曲線圖解法,確定網站中頻繁訪問的路徑和發現用戶引用頁面的頻率,從中找出用戶的興趣愛好,不斷調整、修改網站的結構和內容,以更好地開展個性化服務。
(3)用戶信息更新。在大多數情況下,用戶的興趣并不是專一的,而是不斷變化的。因此,基于Agent的信息服務系統必須有較強的適應能力和學習能力,能不斷跟蹤和分析用戶變化,動態地調整用戶興趣的權重或修改用戶興趣模型的結構,使其逐漸貼近用戶個性需求。為了提高服務質量,系統應要求用戶對所提供的信息做出反饋,并對反饋的信息進行分析和處理,不斷補充和完善用戶信息庫。
2.2 個性化信息Agent模型的構建
目前,構建個性化信息Agent模型的方法主要有以下幾種:
(1)信息抽取法。信息抽取就是自動從文本信息中抽取所需要的內容。與信息檢索不同,它突破了信息檢索中必須由人來閱讀、理解、抽取信息的局限,實現了信息的自動查找、理解和抽取。信息抽取的處理過程是:首先進行詞法分析,然后進行名稱識別,對各種名稱進行匹配,標識特殊詞組;接著進行句法分析,得到句子的名詞詞組、動詞詞組等成分;隨后進行模式匹配,得到實體內容,進行一致性分析,對指代、省略等不確定信息進行相關性分析;最后填充模板,得到信息抽取結果。
(2)信息過濾法。信息過濾是根據用戶需求過濾掉那些不感興趣或無用的信息。常用的信息過濾方法有兩種:一是基于內容的過濾方法。主要利用關鍵詞將信息與用戶描述文件進行匹配計算,具有簡單、有效等優點。其缺點是難以區分信息的特征與形式,只能發現那些與用戶曾經感興趣的信息相近的信息,而不能為用戶發現新的感興趣的信息。二是基于協作的過濾方法。主要跟據用戶的相似性來推薦信息。其優點是能夠發現新的、用戶可能感興趣的信息。缺點是在系統使用之初,由于系統信息還未獲得足夠多的評價,因而很難利用這些評價來發現相似的用戶,隨著用戶和信息的逐漸增長,這種方法的性能將會降低。上述兩種過濾方法各有利弊,應綜合利用這兩種方法的優點,構建混合型的信息過濾模式,以提高信息過濾的性能。
(3)信息共享法。個性化服務系統中每個用戶的信息Agent并不是孤立的,它們可以通過相互合作構成一個MAS(Multi-Agent System)。MAS的合作求解能力遠遠超過單個Agent,這是MAS產生的最直接原因。MAS通過Agent的合作,使每個用戶擁有一個或多個Agent,這些Agent推薦的信息在內容上都有相關性,克服了單個信息Agent功能不強的缺陷。多Agent之間的合作是通過多Agent協商協議來完成的。協商協議是MAS實現協同、協作、沖突消解和矛盾處理的關鍵。信息Agent之間一旦達成合作協議,多個信息Agent的個性化信息模型就構成一個邏輯體,每個信息Agent就將自己和伙伴Agent的信息文檔推薦給相關用戶,用戶能享用整個Agent系統所提供的信息。
3 需要注意的問題
3.1 用戶信息需求的準確性
對用戶的需求掌握得是否準確直接關系到個性化服務的質量和效果。通常,用戶行為和信息需求是持續變化的,對如何利用Agent實時準確地監視跟蹤用戶活動、及時獲取用戶信息、實時更新用戶信息等問題需要進行深入的研究。
3.2 網絡安全和個人隱私的保護
網絡的開放性、匿名性等特點,使服務系統和網站極易受到黑客攻擊、病毒感染或其它惡意行為的破壞。利用Agent監視跟蹤用戶行為、捕捉用戶信息必然涉及用戶隱私問題。對這些問題應高度重視,要不斷增強主動防范意識,建立融技術、管理、人才、制度等為一體的多層次網絡安全體系,有效地保障網絡安全和用戶隱私性。
3.3 信息資源的整合與集成
個性化服務不但要有強大的技術支持,而且還要依賴資源的合理配置。目前,數字圖書館資源類型多樣,已不再局限于本地數字館藏,而且還包括通過自建、購買、租賃、共享、交換、即付即用等途徑建立起來的信息資源。圖書館應加強這些資源的整合和集成,逐步建成一站式檢索平臺。
3.4 用戶的溝通與指導
要重視個性化服務的宣傳與推廣,通過座談會、調查表、BBS和E-mail等途徑加強與用戶的溝通,不斷了解用戶需求以及對圖書館的意見和建議,及時調整服務策略。在服務過程中要不斷指導用戶,提高其使用技能,提高其信息素質。