
[摘 要]生成式人工智能迅速發展背景下,讀者行為出現了新的變化,要求圖書館及時捕捉讀者行為特征,進行讀者畫像,以精準提供個性化服務。針對讀者畫像構建提出包含數據接入層、數據收集層、數據處理層、讀者畫像服務層和反饋優化層的五層基礎畫像架構模型。數據接入層主要負責通過Web終端等多元化渠道接入用戶數據;數據收集層是在數據接入基礎上深化分析并提煉關鍵行為特征的過程;數據處理層通過清洗、整合和特征提取,為構建穩固的分析平臺奠定基礎;讀者畫像服務層是利用處理后的數據提供對應的服務;反饋優化層則依賴用戶反饋,不斷優化和迭代畫像模型。同時,圖書館必須保護讀者的數據隱私,提升系統的迭代能力和彈性,以確保生成式人工智能支持下的服務能夠持續適應讀者需求的演變,為圖書館的精準服務和戰略規劃提供學術建議。
[關鍵詞]讀者畫像 生成式人工智能 圖書館
[分類號]G252
ChatGPT等生成式人工智能技術的迅速普及,使知識獲取方式發生深刻變革,讀者的需求亦隨之改變,要求圖書館對讀者群體的偏好、閱讀行為以及信息搜索模式進行深入剖析。圖書館須采用更為精細化的數據分析工具,以便捕捉讀者個性化軌跡,形成讀者畫像。通過構建動態更新的讀者模型,圖書館能夠洞察其服務群體的細微變化,從而提供定制化的閱讀推薦、知識服務和學術資源配置。
既往學界對圖書館讀者畫像開展了大量的研究,如毛晨晰[1]認為,通過用戶畫像和知識圖譜的融合可以構建更為高效和精準的智慧圖書館信息推薦體系。李燕波[2]通過社會感知技術和時空數據分析的結合,來構建更加細致和深入的用戶畫像,以提升圖書館服務的個性化程度和用戶滿意度。趙鳳云[3]關注基于機構畫像的數字學術空間構建,通過理解機構需求來優化圖書館的資源配置和服務模式,以強化其學術支持功能。鄭繼來和曹意[4]的合作研究致力于通過用戶畫像分析,精確推廣公共圖書館中的少兒閱讀。高紅蓮[5]提出利用多源數據融合技術構建機構畫像,可以增強圖書館服務的個性化和智能響應能力。姚淑青[6]強調將情景感知集成到用戶畫像構建中,有助于創建動態的服務系統。馬小培[7]研究了智慧校園環境下的圖書館用戶畫像及其應用,以提高用戶的整體體驗。這些研究共同指向了一個趨勢,即隨著技術的進步和用戶需求的變化,圖書館必須對讀者行為進行精準畫像。
遺憾的是,當前學界對生成式人工智能下讀者的畫像還缺乏專門研究。有鑒于此,筆者基于生成式人工智能下讀者行為的變化,構建了包含數據接入層、數據收集層、數據處理層、讀者畫像服務層和反饋優化層的五層基礎畫像架構模型,以期為生成式人工智能時代圖書館讀者畫像發展提供學術參考。
1 生成式人工智能下讀者需求的變化
生成式人工智能在圖書館服務中的應用,體現了其在信息組織、檢索及用戶交互方面的革新潛力[8]。例如,斯坦福大學圖書館、美國國會圖書館等國外公共文化服務組織采用了基于深度學習的算法,自動為大量數字化文獻生成元數據,這不僅提高了元數據的生成效率,還通過機器學習模型的持續訓練,不斷優化元數據的準確性和相關性。一些國內圖書館的問答系統,例如清華大學的“清小圖”智能問答系統、江西省圖書館的“圖圖”機器人等,通過自然語言處理技術理解用戶查詢的語義意圖,并提供精準的信息檢索服務。隨著ChatGPT等新技術的深入發展,生成式人工智能在圖書館的閱讀體驗、個性化服務等領域將會具有更大的應用空間。生成式人工智能對海量文本數據的分析和學習能力,使其可通過模式識別和生成算法,不斷從用戶互動中學習,以提供更加個性化的服務,不僅提升了圖書館的工作效率,也極大地豐富了用戶的體驗。
傳統圖書館服務環境下,讀者的行為主要是通過傳統的查詢和檢索方式進行信息獲取,這些過程往往是線性的、基于關鍵詞的搜索,以及依賴于目錄和索引的手動瀏覽。讀者的需求和偏好通常通過直接交流或問卷調查等方式被動地收集,而圖書館的資源推薦和服務更新依賴于圖書館員的專業知識和經驗,這限制了服務的個性化和效率。隨著生成式人工智能的引入,圖書館的服務模式發生了變化,圖書館的讀者畫像變得尤為重要,因為生成式人工智能下讀者的行為模式出現了顯著變化。生成式人工智能技術通過模擬人類的認知過程,可以自動生成信息內容,提供個性化的讀者服務[9]。這種技術的應用在提高信息檢索效率的同時,也使得讀者體驗更加個性化,需要對讀者進行更為精準的畫像。具體表現在以下方面。
首先,個性化閱讀需求的增強。生成式人工智能技術的發展,特別是自編碼器、生成對抗網絡等深度學習技術的應用,極大地增強了對讀者閱讀偏好的理解和預測能力。這些技術使AI不僅能理解復雜的數據結構,還能學習讀者的閱讀偏好和歷史行為模式,從而生成高度個性化的書籍和文章推薦。這種能力的提升導致讀者期望更加個性化和定制化的閱讀體驗,因此,精準的讀者畫像成為滿足這些增強的個性化需求的關鍵。
其次,自由式的信息獲取。讀者不再僅僅滿足于傳統的信息獲取方式,而是轉向更自由、靈活的交互式信息探索。生成式人工智能支持與讀者的實時互動,能夠即時響應查詢和反饋,提供更加定制化的內容。為了滿足這種自由式信息獲取的需求,圖書館需要更精準地了解每位讀者的獨特需求和偏好,這進一步強調了讀者畫像的重要性。
最后,信息粒度的適應性變化。“信息粒度的適應性”這一概念是指信息內容根據讀者需求在細節程度上的可調節性。讀者對信息內容的深度和廣度有不同的期望,這反映了對信息粒度的不同需求。生成式人工智能技術能夠調節信息的粒度,滿足從宏觀概覽到領域內細節的不同需求。為了實現這種信息粒度的適應性調節,圖書館需要對讀者進行更細致的畫像,以確保能夠根據每位讀者的獨特需求提供恰當的信息。
生成式人工智能在圖書館環境中的應用,不僅提升了對讀者閱讀偏好的理解和預測能力,而且通過個性化內容推薦和信息粒度的適應性調節,響應了讀者對個性化閱讀和自由式信息獲取的增強需求。因此,為了滿足這些變化的需求,圖書館必須對讀者進行更為精準的畫像,以便更好地利用生成式人工智能技術提供高度定制化的服務。
2 生成式人工智能環境下讀者畫像的架構
2.1 分層架構
在生成式人工智能應用的背景下,圖書館讀者畫像的構建涉及多個層面的綜合工作,應包含數據接入、搜集、處理、運用與反饋等模塊。
數據收集層是構建讀者畫像的基礎,通過精確記錄交互數據和行為數據,捕捉社會屬性和心理特征數據,為后續的數據處理和分析提供原始輸入。這一層確保了數據的多維度和多角度收集,為構建全面的讀者畫像奠定了基礎。數據處理層的關鍵在于確保數據的質量和可用性。數據清洗子模塊的目的是去除數據集中的冗余和錯誤,而數據轉換子模塊則負責將來自不同渠道的數據統一成可分析的格式。特征提取子模塊通過算法從大量數據中識別出對構建畫像有決定性影響的特征,這些特征將直接影響分析的準確性和服務的個性化程度。數據處理層中的分析與模型構建層通過用戶分類、興趣模型和需求預測3個子模塊,將處理后的數據轉化為有意義的信息。用戶分類子模塊依據社會屬性和行為數據將讀者劃分為不同群體,興趣模型子模塊應用機器學習技術深入分析讀者偏好,需求預測子模塊則基于歷史數據預測未來的行為趨勢。讀者畫像服務層是讀者畫像應用的直接體現,個性化內容推薦、定制化查詢服務、互動式內容教育等子模塊共同作用,提供精準的資源推薦和個性化服務。這一層的設計直接關系到用戶體驗的提升和圖書館服務的創新。反饋優化層通過用戶反饋收集、數據分析與報告、服務質量監控等子模塊,形成一個閉環的改進機制。服務反饋子模塊收集用戶對服務的評價,畫像更新子模塊根據最新數據調整畫像,持續學習子模塊則利用最新的深度學習技術不斷完善推薦算法和服務模式。具體如圖1所示。
2.2 畫像分析
2.2.1 數據接入層
數據接入層是生成式人工智能系統中負責收集輸入數據的基礎架構,確保了從多個渠道和接口獲取數據的能力。在傳統圖書館服務中,讀者畫像主要依賴于借閱記錄、圖書館訪問歷史等相對有限的數據來源。這些數據雖然能夠提供基礎的用戶偏好信息,但在深度和廣度上受限,難以全面捕捉用戶的復雜需求和行為模式。相比之下,生成式人工智能環境下的數據接入層具有更廣泛的數據來源和更高的技術集成度,如Web終端、圖書館機器人、移動應用、API接口等。
生成式人工智能的數據接入層首先應包括Web終端用戶交互的主界面,通過在線目錄和服務捕獲用戶行為和偏好。其次,圖書館機器人通過交互式操作收集用戶的查詢習慣和借閱偏好,為服務優化提供數據支持。移動應用接入,尤其是Android和iOS平臺的應用,可通過圖書檢索和借閱服務功能,反映用戶的移動使用習慣。再次,API接口則為數據交換提供了與外部資源如學術數據庫和電子書平臺的連接,豐富數據收集渠道。此外,物聯網設備如智能貨架和環境監測傳感器,在內部收集關于圖書流通和環境數據,提高運營效率。最后,社交媒體和其他數字平臺的用戶互動分析,為圖書館揭示用戶興趣和社交行為模式。
2.2.2 數據收集層
生成式人工智能環境下,讀者數據收集是構建精準和動態讀者畫像的基礎。這種數據收集的必要性源于信息技術環境的變化和讀者行為特征的演進。隨著生成式人工智能的發展,圖書館服務不再僅限于傳統的查詢和借閱,而是向著更加個性化和互動化的方向發展。讀者的行為數據從簡單的借閱記錄轉變為包括在線互動、信息檢索習慣、閱讀偏好在內等的多維度信息,這些變化要求圖書館能夠捕捉更加豐富和深入的數據來響應服務需求[10]。傳統圖書館在收集讀者數據時多依賴于簡單的統計,而生成式人工智能技術則能通過深度學習算法處理大量數據,模擬人類認知過程,以生成新內容或決策。
數據收集包括:(1)生成式人工智能工作原理的核心在于通過數據學習和模式識別,模擬人類的認知過程來生成新的內容或決策。因此,收集讀者的交互數據和行為數據,不僅可以幫助圖書館更好地理解讀者的即時需求,還可以通過生成式人工智能的深度學習算法,預測和推薦符合其興趣和需求的信息資源。例如通過分析搜索、查詢和點擊歷史,生成式人工智能可以生成個性化的搜索結果和閱讀建議;通過評估下載和借閱記錄,可以優化藏書結構和資源配置。(2)行為數據的收集,如瀏覽路徑和停留時間,為圖書館提供了評估用戶界面設計和內容布局的依據,有助于優化用戶體驗。用戶的反饋和評價則直接反映服務的效果,為服務改進提供了直接的指導。這些數據的分析和應用,都基于生成式人工智能處理識別大規模的數據集,并進行自我學習和優化。(3)社會屬性數據的收集,如年齡、性別、教育背景和職業信息,為圖書館提供了市場精細化細分的可能。這些數據有助于圖書館在提供服務時考慮到不同群體的特定需求和偏好,從而設計出更為精確的服務策略和資源推薦。
2.2.3 數據處理層
傳統圖書館對于讀者數據的處理主要依賴于借閱記錄、目錄查詢和用戶登記數據等靜態和結構化數據,數據處理系統通常采用簡單的數據庫,主要用于存儲借閱記錄和用戶信息等基本數據,更側重于處理基本的數據管理和維護,如記錄更新、數據整理、借閱管理等,缺乏復雜的數據清洗、轉換和特征提取過程。生成式人工智能采用分布式數據庫、云存儲、數據清洗和轉換,并利用先進的數據挖掘技術,使圖書館可以對用戶構建動態的興趣模型,拓展了用戶個性化服務的邊界。
在數據儲存上,圖書館信息系統可提升安全存儲和高效檢索大量多樣化數據的能力,采用分布式數據庫和云存儲解決方案以應對數據量的劇增。數據清洗可通過自動化程序保證數據集的準確性和可靠性,關鍵是去除錯誤、重復或不完整的記錄。數據轉換將原始數據格式化以便于分析和模型構建,利用自然語言處理技術和特征提取識別出有助于構建讀者畫像的關鍵信息,通過深度學習模型分析多元化的讀者行為,如在線閱讀模式和社交媒體互動。數據輸出則將處理后的數據轉化為支持實時推薦系統和個性化內容生成的信息,要求與服務提供層緊密集成[11]。此外,圖書館需從大量用戶數據中提取價值,以做出智能化服務決策。用戶分類組件通過分析社會屬性和行為特征,將讀者劃分為不同群體以設計精準服務策略。興趣模型組件使用機器學習算法分析讀者歷史行為,構建動態興趣模型,預測讀者可能感興趣的新書或主題。需求預測組件則利用趨勢分析和模式識別技術,預測未來需求和行為趨勢,保持服務的前瞻性和創新性。
2.2.4 讀者畫像服務層
傳統圖書館服務環境下的讀者畫像常依賴于較為簡單的數據記錄,如借閱歷史和基本用戶信息。個性化服務較為有限,主要基于圖書館員的經驗和直接的用戶反饋,缺乏深入的數據分析能力,很難實時響應用戶的變化需求。生成式人工智能環境下,引入個性化內容推薦組件,利用深度學習和用戶行為分析技術智能篩選與讀者興趣相符的內容。定制化查詢服務和智能問答服務通過自然語言處理和語義理解技術提高檢索效率和精準度,使讀者畫像更為精準。
在生成式人工智能環境下,圖書館的讀者畫像服務層需要包含多個組件,以適應讀者行為的變化并提升服務質量。數據處理層通過高效的數據存儲、自動化的數據清洗、精準的數據轉換、深入的特征提取,以及實時的數據輸出,保障了個性化和智能化服務的實施基礎。這一層面的工作優化了資源配置,提高了服務效率,增強了用戶體驗,同時為圖書館的戰略規劃和知識管理提供支持。而在分析與模型構建層,通過用戶分類、興趣模型構建、需求預測等組件,圖書館能夠精準地捕捉和理解讀者的需求和偏好,實現服務的個性化和前瞻性。這包括利用先進的數據挖掘技術進行用戶分類,構建動態的興趣模型以預測讀者的新興趣點,以及通過趨勢分析和模式識別預測未來需求。生成式人工智能技術的應用,如深度學習、自然語言處理等,使得從大數據中提取有價值信息、做出智能化服務決策成為可能,極大地提升了圖書館服務的效率和質量。
2.2.5 反饋優化層
傳統圖書館服務環境下的讀者反饋和服務優化通常基于直接的用戶反饋,如填寫滿意度調查表或口頭反饋。反饋處理多依賴于人工分析,缺乏深度的文本挖掘與分析。生成式人工智能環境下,用戶反饋收集模塊通過自然語言處理技術自動化分析開放式反饋,提供更深層次的情感和服務評價分析。數據分析與報告模塊運用數據挖掘和預測分析技術,對用戶互動數據進行深入分析,為策略制定提供數據支持。
在生成式人工智能環境下,圖書館反饋優化層的設計是為了實現服務的自我完善和適應性發展。第一,用戶反饋收集模塊通過自然語言處理技術解析用戶的直接反饋,利用機器學習進行情感傾向和服務評價的提取,為服務改進提供數據支持。第二,數據分析與報告模塊應用數據挖掘和預測分析技術深入分析用戶互動數據,生成使用統計和趨勢預測報告,支持圖書館策略制定。第三,服務質量監控模塊通過實時數據監控和性能分析確保服務的連續性和用戶界面的響應速度,應用異常檢測算法預防潛在服務故障。第四,內容和服務更新模塊利用AI模型自動化生成更新通知,并根據用戶反饋優化服務內容,保證用戶及時獲取資源和服務信息。第五,用戶體驗改進模塊專注于界面和交互設計的優化,通過用戶研究和行為分析創建直觀的用戶界面,增強人性化設計。第六,策略和流程優化模塊結合策略調整和流程再設計,通過分析用戶行為數據指導采購策略和內部管理流程的優化,提高服務效率和用戶滿意度。
3 生成式人工智能環境下讀者畫像的保障措施
3.1 數據隱私與倫理保護
在傳統環境下,讀者畫像通常基于有限的數據,如借閱記錄和基本用戶信息。數據隱私和倫理問題相對較少,因為所涉及的數據量和類型較為有限。生成式人工智能環境下,讀者畫像的構建需要大量的個人數據,涉及嚴重的隱私問題。首先,數據隱私保護是構建讀者畫像時的核心倫理原則。在信息科學領域,隱私權被視為個體自主權的延伸,是個人信息自由不受侵犯的權利。在實踐中要求圖書館在收集、存儲和處理個人數據時,必須確保數據的保密性、完整性和可用性。這不僅是遵循《通用數據保護條例》(GDPR)等法律法規的要求,也是對用戶信任的基本回應。其次,數據的收集和使用應遵循最小化原則,即僅收集實現特定服務所必需的最少數據。這一原則減少了數據泄露的風險,同時也符合節制原則,即在滿足服務需求的同時,最大程度地減少對個人隱私的侵犯。例如,圖書館在構建讀者畫像時,可以通過模糊化處理技術來實現對讀者個人身份的保護,如使用數據脫敏和匿名化技術。最后,數據的處理和分析應保證透明度和可解釋性。透明度要求圖書館明確告知用戶其數據如何被收集、存儲和使用,以及用戶如何能夠訪問和控制自己的數據。可解釋性則要求算法的決策過程能夠被理解和審查,以避免算法偏見和不公正的結果,確保算法的公正性和非歧視性。
3.2 畫像的迭代與更新
在傳統環境下,讀者畫像的更新通常不夠頻繁,其畫像更新主要依賴于對讀者的滿意度調查,且依賴于手動或半自動的過程。在生成式人工智能環境下,讀者海量的數據反映了讀者個性化的動態變化,圖書館一方面可以集成動態數據,進行數據同步和融合,確保讀者畫像反映最新的用戶行為和偏好模式;另一方面,可以進行模型自適應調整。圖書館采用自適應濾波器和在線學習算法,對現有的用戶分類和興趣模型進行實時更新。這些算法能夠處理流數據,及時調整模型參數,以適應用戶行為的新趨勢和變化。另外,圖書館還可以采取增量學習與遷移學習進行畫像迭代。為了提高迭代效率,圖書館應用增量學習策略,僅對模型中受新數據影響的部分進行更新,而不是重新訓練整個模型。同時,遷移學習技術被用于將已有模型的知識應用到新的數據集上,減少計算資源的消耗并加速迭代過程。在更新迭代過程中,圖書館通過多維度特征分析來提煉和優化讀者的行為特征,包括但不限于交互行為、借閱歷史和社會屬性。這種分析有助于捕捉到更加細致和深層的用戶需求,從而提供更加準確的個性化服務。
3.3 提升系統彈性
在傳統環境下,系統彈性的需求相對較低,因為傳統的物理空間服務依然是服務的重要內容,對技術的依賴程度并不是太高。隨著對生成式人工智能的采用,圖書館對技術的依賴與日俱增,系統的彈性和故障恢復能力顯得格外關鍵。這不僅是為了保障服務的不間斷性和穩定性,而且是為了維護圖書館作為知識管理和信息服務中心的核心地位。一旦發生技術故障或外部攻擊,未經充分彈性設計的系統可能會導致服務中斷,影響用戶體驗和圖書館的運營效率。因此,構建具有高度彈性的系統不僅是對潛在風險的預防,也是對圖書館服務質量承諾的體現[12]。此外,災難恢復計劃是確保服務可靠性的關鍵組成部分。這要求圖書館制定詳盡的應急預案,包括數據備份、緊急恢復程序和用戶通知機制。數據備份計劃應定期更新,以反映最新的服務和用戶數據。緊急恢復程序則需要明確故障發生后的具體操作步驟,確保在最短時間內恢復服務。用戶通知機制則保證在服務中斷時,用戶能夠獲得及時的信息和必要的支持。
4 結語
在生成式人工智能的背景下,圖書館構建的讀者畫像體系成為適應和捕捉讀者需求變化的關鍵工具。通過對大數據的深入分析與學習,在此基礎上構建的讀者畫像系統,使圖書館能夠洞察讀者的行為模式、偏好變遷以及信息需求的新動向。這種動態的、數據驅動的畫像不僅為圖書館提供了精準服務的依據,而且也促進了圖書館服務的個性化和智能化發展。隨著讀者畫像的不斷迭代和優化,圖書館能夠更加有效地管理資源,提高服務質量,同時也為讀者帶來更加豐富和便捷的閱讀體驗。這一進程不僅展現了圖書館服務創新的活力,也體現了圖書館在知識社會中不斷進步和適應的能力。
參考文獻:
[1] 毛晨晰.融合用戶畫像和知識圖譜的智慧圖書館信息推薦體系研究[J].河南圖書館學刊,2023(8):115-119.
[2] 李燕波.社會感知驅動下圖書館融合時空數據的用戶畫像構建與應用研究[J].圖書館界,2023(4):86-89,94.
[3] 趙鳳云.基于機構畫像的智慧圖書館數字學術空間構建研究[J].大學圖書情報學刊,2023(3):39-43.
[4] 鄭繼來,曹意.基于畫像分析的公共圖書館少兒精準閱讀推廣研究[J].情報探索,2023(4):109-114.
[5] 高紅蓮.多源數據融合驅動的機構畫像構建與應用研究[J].河北科技圖苑,2023(1):42-46.
[6] 姚淑青.融合情景感知的智慧圖書館用戶畫像構建研究[J].圖書館界,2022(5):1-5.
[7] 馬小培.智慧校園環境下圖書館用戶畫像及其應用研究[J].晉圖學刊,2019(5):19-23.
[8] 嚴雪雁.ChatGPT技術融入圖書館服務:應用價值、內在挑戰與應對策略[J].圖書館,2023(9):1-9.
[9] 張強,等.Chat GPT在智慧圖書館建設中的機遇與挑戰[J].圖書館理論與實踐,2023(6):116-122.
[10] 郭亞軍,等.ChatGPT賦能圖書館知識服務:原理、場景與進路[J].圖書館建設,2024(3):60-68.
[11] 周旭.機遇與挑戰:Chat GPT普及背景下圖書館的應對分析[J].圖書館,2023(6):34-41,48.
[12] 江麗.通用人工智能(AGI)類ChatGPT出現,圖書館會消失嗎?[J].圖書館界,2023(3):6-10.
陳振杰 男,1981年生。本科學歷,館員。研究方向:公共圖書館服務與管理。
(收稿日期:2023-08-22;責編: 徐向東。)