

[摘 要]用戶畫像作為實現精準化服務的重要手段,逐步成為圖書館研究的熱點,但其帶來的問題也不容小覷。結合公共圖書館用戶服務的實際情況,闡述用戶畫像在公共圖書館應用中存在的問題并分析其原因,提出風險應對策略,以期為用戶畫像技術在公共圖書館的良性應用提供思路。
[關鍵詞]用戶畫像 精準化服務 問題分析 風險應對
[分類號]G258
1 引言
2021年文化和旅游部在印發的《“十四五”公共文化服務體系建設規劃》中提到,要構建公共文化服務用戶畫像和知識圖譜,提供差異化服務[1]。隨著公共圖書館事業的發展以及讀者需求的變化,公共圖書館的創新能力成為制約其發展的重要因素之一,為此,滿足讀者的個性化、精準化、多樣化閱讀需求,不斷提升圖書館智慧服務水平,成為當下公共圖書館不斷追求的重要目標。而用戶畫像作為實現精準化、智慧化、個性化服務的重要手段,也逐步成為圖書館研究的熱點。
2 用戶畫像概念及研究現狀
2.1 用戶畫像的概念
用戶畫像最早由美國交互設計之父艾倫·庫珀(Alan Cooper)提出,它通過虛擬化的標簽來表示現實存在的用戶,是對一系列真實數據進行加工處理而建立的用戶模型,構建多采用聚類分析、神經網絡、數據統計等方法[2]。用戶畫像最初應用于電商領域,如精準營銷、個性化推送服務和用戶拓展等方向,隨著大數據技術的發展,用戶信息充斥網絡,用戶畫像也不斷向管理學、社會學、經濟學等多領域拓展[3]。目前,基于用戶畫像的精準化信息推送服務已廣泛應用于抖音、京東、淘寶等電商平臺和其他信息服務企業[4]。
公共圖書館作為公共文化服務的重要機構,需要分析用戶的閱讀習慣、行為偏好、知識水平等內容,從而發現用戶文獻資源需求,細化資源服務,設計個性化、專業化、精準化的閱讀推廣方案等。鑒于用戶畫像技術在電商等領域的成功經驗,許多圖書館也在積極尋求基于該技術的圖書館精準化閱讀推廣服務路徑。表1所示的是公共圖書館用戶畫像的數據依據。
2.2 研究現狀
依托CNKI數據庫對用戶畫像的發文量進行統計,檢索方式采用高級檢索,以“用戶畫像”為主題,共篩選得到與圖書館相關的結果863條,對檢索結果進行可視化處理得到圖1。從圖1中可以看出,圖書館于2014年開始對用戶畫像技術進行研究,2018年起發文量出現明顯增長,近幾年圖書館對用戶畫像技術的研究仍然保持著較高的熱度。
從發文內容進行分析,當前圖書館界對用戶畫像的研究絕大多數都集中在應用層面,如潘家芳[5]、劉一鳴等[6]對如何基于用戶畫像技術開展精準服務展開研究;王英等[7]對圖書館用戶畫像的構建進行探索;劉海鷗等[8]從用戶畫像與資源融合角度進行研究;張鈞[9]對基于用戶畫像的知識發現服務進行研究。另外,用戶畫像技術還被廣泛應用于個性化空間再造、資源優化、館藏空間創新研究、移動圖書館建設等多種場景。
雖然圖書館對用戶畫像技術的應用已進行了較為深入的研究,但對于其所帶來的風險及問題卻鮮有涉及,基于以上分析,筆者從公共圖書館用戶畫像構建的潛在問題、原因分析及應對策略進行研究說明。
3 用戶畫像應用的潛在問題及原因分析
3.1 潛在問題
圖書館應用用戶畫像的主要目標是為用戶提供精準化、智慧化服務,提升用戶體驗感和滿意度,進而促進公共圖書館可持續發展。但在現實應用過程中,不可避免地會出現一些問題或風險,主要包括兩類:一是無法滿足既定目標,如無法實現精準化服務,與圖書館“平等”、智識自由[10]的服務理念相背離;二是無法保障信息安全,如存在數據泄露、用戶信息安全風險等。
3.1.1 無法實現精準化服務
在現階段的研究中,用戶畫像是實現公共圖書館精準化服務的重要手段,用戶畫像中為讀者“貼”的標簽是否符合其實際情況,直接影響到圖書館是否能提供精準化服務。在現實生活中,用戶畫像無法精準描述用戶的現象已經出現,如2021年《中國青年報》社會調查中心公布的一項數據顯示,體驗過互聯網用戶畫像的受訪者中超過半數認為用戶畫像不符合自己的實際感受[11]。
3.1.2 與圖書館服務原則相背離
隨著人工智能的飛速發展,用戶畫像成為一把“雙刃劍”,為圖書館帶來高效率、智能化、個性化服務的同時,正“侵蝕”著圖書館平等服務與智識自由的服務理念。
2018年頒布的《中華人民共和國公共圖書館法》第三十三條規定,公共圖書館應當按照平等、開放、共享的要求向社會公眾提供服務[12]。“平等”即所有人都具有平等享受公共圖書館服務的權利,圖書館應為所有用戶提供無差別服務[13],而構建用戶畫像,根據用戶標簽推送服務這一行為極易導致服務失衡。一方面,由于用戶畫像很大程度上依賴讀者的線上行為數據,因此對較少訪問線上資源的群體以及特殊群體顯得不那么“友好”,從而使服務效果存在群體差異。另一方面,用戶畫像中的標簽還可能導致用戶歧視,如根據用戶的學歷水平、專業、工作性質等帶有認定性質的標簽信息,將用戶區分為不同的知識層級,帶來用戶身份歧視[14]。同時,用戶畫像所標識的用戶特征有時過于理想化而缺少人情味,這也與圖書館“以人為中心”的服務理念相背離。
從智識自由角度來說,圖書館開展精準化、個性化資源推送,雖然可以提升用戶體驗感,增強用戶依賴性,但也使得用戶固化了現有的行為偏好,限制了用戶智識自由和未來發展的可能性[15]。另外,在用戶畫像的構建過程中,數據處理算法或多或少會帶有研發人員的主觀性,從而進一步限制了用戶的知識拓展水平,使其陷入“繭房效應”。
3.1.3 用戶信息安全
大數據技術的發展為行業創新和快速決策提供了重要支撐,使每個人都成為大數據時代的參與者、受益者,但同時也給用戶信息安全帶來了不容小覷的風險與挑戰,用戶的“隱私空間”正不斷受到擠壓。圖書館用戶畫像使用戶的閱讀行為缺乏私密性,任何行為數據都有可能被保存下來,大量的數據信息為圖書館信息安全防護帶來了極大的風險,如遭受網絡攻擊、第三方數據泄露、內部人員泄露等[16]。
3.2 原因分析
3.2.1 用戶畫像失效
用戶畫像失效是指圖書館構建的用戶標簽與用戶當前需求不匹配。這是因為用戶信息數據是用戶畫像構建的原始依據,用戶畫像是一種根據用戶以往行為來預測用戶未來行為的過程。用戶信息分為用戶靜態信息和用戶動態信息,用戶靜態信息包括性別、學歷、專業、工作類型等,而用戶動態信息包括用戶在圖書館管理系統、移動圖書館、圖書館門戶網站的借閱數據、檢索、瀏覽、點贊、轉發等交互信息。用戶畫像的構建流程首先是根據各個系統收集的用戶基本信息進行初步“勾勒”,然后根據用戶的實時動態信息進行進一步完善,并通過建立用戶反饋機制進行修正,如圖2所示。
一方面,由于用戶畫像的構建依據是用戶的基本信息和行為信息,因此用戶畫像有效的前提是用戶需求、用戶基本信息、用戶行為信息之間存在強關聯性和延展性,即用戶過去的需求信息和行為在未來依然有效,否則便會導致用戶畫像失效[10]。用戶需求按持續時間可分為長期需求、短期需求和臨時性需求,長期需求和短期需求的數據在一段時間內相對穩定,數據量較大且具備一定的規律性,可預測性較強;而臨時性需求往往表現出隨機性、無規律性,數據波動較大,因此預測難度較大。
另一方面,用戶畫像本身是大數據環境下抽象出來的虛擬角色,即使其本身源于用戶的真實信息,但始終無法取代真實用戶,用戶畫像中標簽與用戶真實需求不可避免地存在差異,因此標簽數量越多,可供匹配的資源就越少,準確性便越低。
3.2.2 無法準確匹配資源
能否實現用戶精準化服務與用戶畫像和館藏資源是否匹配息息相關,因此構建用戶畫像的同時,對館藏資源的屬性和內容進行多維度、深層次的揭示至關重要,只有將用戶畫像與資源畫像建立起符合邏輯的映射關系,才能更精確地為用戶推送資源,但在實際工作中,往往過于注重對用戶畫像的構建而忽視了資源畫像。
3.2.3 用戶知識水平存在較大差異
在傳統媒體時代,人們獲取信息的方式主要是收音機、電視、報紙、書籍等,如果想要獲取更多的信息是比較困難的。而在科學技術迅猛發展的信息時代,人們獲取知識的途徑更加多種多樣,正因為如此,用戶群體也產生了較為嚴重的兩極分化。高知人群由于熟練掌握各種知識獲取渠道,在大數據系統中留下的信息數據相對較多,而低知人群則因年齡、觀念、知識水平等因素的影響,其信息獲取方式主要通過傳統媒介,因而大數據系統采集的數據相對較少,如此數據不對等的現象導致了用戶服務的不對等,違背了公共圖書館“平等”的服務理念,這也是當下智慧圖書館建設的突出問題之一。
3.2.4 算法有待完善
用戶畫像的構建離不開人工智能算法的支持,而算法上存在的不足主要體現在兩個方面:一是算法的理論研究和真實環境存在差異。算法是對規律的擬合,一方面在對算法進行理論研究時通常會對環境條件進行簡化和假設,另一方面人類對社會和自然規律的認識還不夠完善,從而導致算法偏離規律甚至錯誤識別規律。二是算法歧視。通常我們認為算法是依據海量數據做出決策,其精確度和公平性遠高于人的決策,然而事實上算法的運算法則絕非完全客觀中立和公平,算法設計或多或少會帶有研發人員的主觀因素。在數據處理過程中,算法的不透明便會導致特定服務群體的不公平對待,從而影響用戶的體驗感,算法歧視所帶來的負面效應不容忽視。
3.2.5 缺少完備的用戶信息保護機制
在當前信息化時代,公共圖書館的用戶信息包括讀者個人信息、借閱信息、檢索信息等,呈現出多樣化、復雜化的特點,然而在讀者信息保護方面,圖書館還存在用戶信息保護機制不健全的情況。一方面,圖書館自身在讀者個人信息的收集、存儲、使用等方面缺少嚴格的監督機制和操作規范,使得用戶信息保護存在安全漏洞;另一方面,復雜的網絡環境和第三方的引入,也增加了用戶信息泄露的風險。
4 應對策略
4.1 讀者賦能,開放權限
用戶是精準化服務的受益者,更應該是參與者甚至創造者,最了解用戶的就是其自身,因此用戶畫像的構建應體現用戶的主體作用,向用戶開放權限,讓用戶參與畫像決策。一是賦予用戶知情權。通過向用戶展示算法處理流程及其“畫像”,使用戶了解其在圖書館的標簽定位。二是賦予用戶管理權。對于自身“畫像”,用戶可自由進行標簽的“增加”“刪除”和“修改”;對于用戶行為數據,用戶也可以自行設置“遺忘”“加強”“減弱”,通過這樣人工干預的方式,可以有效剔除用戶臨時行為的干擾,并準確識別有效行為,提高預測的準確性。三是賦予用戶反饋權。用戶在獲得信息推送服務后,通過用戶反饋渠道,對推送信息的準確性、匹配度、適用性等進行評價,并根據用戶反饋結果優化用戶畫像和資源畫像的構建算法,以提升用戶的體驗感。
4.2 建立資源畫像
資源畫像主要用來揭示館藏資源特征,是實現知識發現的重要手段[17]。資源畫像與用戶畫像構建類似,即對館藏資源的各種信息數據進行挖掘和提取,生成館藏資源畫像模型。如濰坊市圖書館“細顆粒度建設和標簽標引”項目,通過將數據標引最小化,從而實現檢索結果精準化。
資源畫像的數據類型主要分為基本數據和行為數據(見表2),其中基本數據包括資源的研究領域、載體形式、知識類型、內容概況、出版時間等,而行為數據包括資源熱度、資源評價、讀者反饋、使用情況等信息。通過對資源進行有效的描述和標引,多維度構建資源畫像,建立用戶畫像與資源畫像(需求端與供給端)的映射關系,實現由“人找資源”到“資源找人”的雙向奔赴,為用戶提供高質量精準服務。
4.3 線上線下聯動,擴大用戶覆蓋面
由于移動圖書館、數字圖書館等線上平臺在用戶行為信息采集上具有實時性、完整性、便捷性等優勢,因此線上用戶的數據完整性明顯高于線下用戶,容易導致線上線下用戶數據采集失衡。為了讓特殊群體享受普遍均等服務,公共圖書館應多渠道采集用戶行為信息,提升用戶素養,盡可能消除信息差距。
一是開展用戶培訓,完善服務設備。公共圖書館應當根據特殊群體的特點,積極創造條件,為特殊群體提供數字素養和信息技術培訓,如湖北省圖書館開展的“銀齡E時代 網羅智生活”老年人智慧觸網系列講座活動,幫助老年群體解決在智能技術方面遇到的問題和困難。同時,加強特殊群體閱讀資源和服務產品開發,方便其充分利用線上資源,獲得行為數據,共享精準化服務。
二是強化線下服務,多渠道數據獲取。為平衡線上線下數據采集,公共圖書館應不斷強化線下服務,開展形式多樣、內容多元、主題鮮明、受眾廣泛的閱讀推廣活動,使更多讀者參與其中;多渠道開展用戶需求調研,建立便捷高效的線下需求反饋通道,逐步豐富特殊群體行為數據,實現用戶畫像普遍均等服務,如河北省圖書館定期開展“館長接待日”,面對面充分了解讀者閱讀需求,提升服務水平。
4.4 優化算法
大數據時代,算法已應用到各行各業,面對算法表現出的負面影響,公共圖書館應該積極轉變態度,從被動應對變為主動治理,既要從技術手段不斷優化,也要通過法律手段進行規制,從根本上消除算法帶來的負面影響。
(1)技術優化,破除繭房效應。擴大用戶數據的采集維度,開展多元化信息推送。既要關注用戶顯性需求,又要充分挖掘用戶可能不感興趣但需要的隱性需求,幫助用戶進行知識拓展,改善精準化信息推送帶來的“繭房效應”。
(2)開放互通,算法公開透明。算法應用的全部過程應公開透明,實現算法與用戶之間的開放互通,減少數據誤差所帶來的服務不匹配。同時,算法向用戶公開,可以使用戶對算法的處理流程進行監督,避免算法對不同群體的區別對待,改善“算法歧視”。
(3)法律規制,推動平臺自律。隨著算法技術的不斷升級,與之相關的法律法規還有待完善,需將數字平臺納入法律規制范疇,對算法采取場景化規制,不同場景采用不同算法規制方式,以此實現負責任的算法[18]。另外,算法研發人員也應加強自我約束和自我管理,規范行業準則,用理性的態度設計算法邏輯。
4.5 建立完備的讀者信息保護機制
數字時代,用戶個人信息的保護無法通過避免數字化來實現,只能依賴立法與制度[15]。公共圖書館作為用戶信息的采集和使用者,應承擔起用戶信息的安全保障責任,建立合規的用戶信息收集制度和安全管理制度,以實現用戶信息的有效收集和合理應用。
圖書館收集用戶信息應建立具體的管理制度。首先,應在“告知—知情—同意”的條件下采集用戶信息,在進行信息采集和處理前,應告知用戶并取得授權,同時,應賦予用戶信息查閱、信息變更、信息刪除等權利,保證用戶對自身信息的控制權。其次,在用戶信息采集過程中,應避免信息的過度采集,按照“最小必要原則”[19],以最小用戶個人權益影響,最大限度地滿足功能需求。再次,圖書館應安排專人對用戶數據進行維護和管理,圖書館內部工作人員或委托第三方進行數據管理時,應簽署保密條例,嚴格控制用戶數據的使用。最后,圖書館對用戶數據進行分析處理時,可針對用戶敏感信息進行數據脫敏處理,實現用戶敏感數據的可保護性。在不違反系統規則的前提下,對用戶敏感信息進行脫敏處理后,再進行分析和應用[20]。
5 結語
精準化服務是當下公共圖書館研究的重要方向,用戶畫像作為實現精準化服務的重要手段,未來將成為公共圖書館面向用戶服務的重要工具。在用戶畫像大規模應用于圖書館之前,應充分認識其“雙刃劍”的特性,既要理性對待其優勢,又要對其隱患保持警醒,積極探尋用戶畫像技術在圖書館的應用路徑,以期為社會公眾提供高品質閱讀服務。
參考文獻:
[1] 中華人民共和國文化和旅游部.“十四五”公共文化服務體系建設規劃[EB/OL].[2021-06-10].https://zwgk.mct.gov.cn/zfxxgkml/zcfg/zcjd/202106/t20210623_925880.html.
[2] 王慶,趙發珍.基于“用戶畫像”的圖書館資源推薦模式設計與分析[J].現代情報,2018(3):105-109,137.
[3] 李寶.基于用戶畫像的高校圖書館個性化資源推薦服務設計[J].新世紀圖書館,2021(4):68-75.
[4] 湯麗媛,王俏.數據驅動下的圖書館用戶畫像構建與信息資源精準服務研究[J].晉圖學刊,2021(6):39-44.
[5] 潘家芳.人機智能協同的圖書館精準服務研究[J].圖書館工作與研究,2023(3):38-45.
[6] 劉一鳴,何國玉.基于老年人健康信息需求的公共圖書館精準服務路徑研究[J].圖書館理論與實踐,2023(3):54-65.
[7] 王英,等.面向紙本圖書的圖書館用戶畫像構建探索[J].圖書館雜志,2023(2):128-137.
[8] 劉海鷗,李凱,姜波.移動圖書館推薦系統中的用戶畫像與資源畫像情境化融合研究[J].圖書館,2021(6):66-71,93.
[9] 張鈞.基于用戶畫像的圖書館知識發現服務研究[J].圖書與情報,2017(6):60-63.
[10] 于風程.圖書館用戶畫像服務失靈風險及其規避[J].圖書館建設,2024(2):110-118,126
[11] 中國青年網.70.5%受訪者體驗過互聯網用戶畫像感覺符合實際的不足一半[EB/OL].[2021-01-13].https://baijiahao.baidu.com/s?id=1688736654608252761amp;wfr=spideramp;for=pc.
[12] 中國人大網.中華人民共和國公共圖書館法[EB/OL].[2018-11-05].http://www.npc.gov.cn/npc/c2/c12435/20
1905/t20190521_276640.shtml.
[13] 李龍淵.公共圖書館服務平等、開放、共享理念解析[J].圖書館建設,2021(1):39-47.
[14] 周莉.學術期刊用戶畫像個人信息保護:風險與規制——以《個人信息保護法》為視角[J].武漢科技大學學報:社會科學版,2023(1):95-99.
[15] 徐娟.用戶畫像中的人權保護[J].河北法學,2023(2):102-117.
[16] 陸夢成,王海亮.用戶畫像在公共圖書館應用的數據風險與法律規制[J].圖書館研究,2022(1):9-18.
[17] 盧思佳,王鳳姣.基于畫像分析的高校圖書館精準知識服務研究[J].大學圖書館學報,2021(5):55-62,86.
[18] 人民資訊.論算法的法律規制[EB/OL].[2021-01-17].https://baijiahao.baidu.com/s?id=168912721832232183
2amp;wfr=spideramp;for=pc.
[19] 韓旭至.敏感個人信息的界定及其處理前提——以《個人信息保護法》第28條為中心[J].求是學刊,2022(5):132-145.
[20] 盧岑.面向物聯網的數據脫敏技術研究[D].南京:南京郵電大學,2021.
劉 瑩 女,1991年生。碩士,館員。研究方向:數字圖書館。
(收稿日期:2023-06-27;責編:劉清揚。)