龍春芳

關鍵詞: 小數據;圖書館;用戶畫像;融合
摘 要: 文章分析了小數據的內涵與特征,介紹了圖書館對用戶小數據的融合處理流程,指出了基于小數據融合的圖書館用戶精準畫像構建方式,以期為相關研究提供參考。
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2020)10-0090-03
大數據、云計算等技術在圖書館的應用為信息資源獲取提供了便利,保障了個性化定制、智能推送等服務的實施,推動了圖書館服務環境、模式與內容的變革。然而,大數據的總量和復雜程度日益增長,對其研究和利用要耗費大量的人力、財力,這個過程不僅容易導致隱私泄露,而且無差別的服務方式也影響了服務效果。為解決這些問題,圖書館界開始關注小數據。小數據是指具有顯著個體特性的信息證據,是從個體角度采集的全部數據,包括行為、喜好、社會關系等。對小數據進行統一融合和客觀分析,發現其中隱含的價值,可以預測個體的行為、特征和社會聯系,彌補大數據的不足[1]。通過數據融合建立精準的用戶畫像,對用戶閱讀場景、閱讀需求、身份特點等進行分析,有利于準確制訂服務方案,提升用戶的服務體驗。
1 小數據的內涵、特征與作用分析
1.1 小數據的內涵
小數據又被稱作個體資料,是指包含個體所有特征信息的數據集合。關于小數據的研究始于2011年,最初研究人員僅將其看作與大數據相對的概念,即規模小、變化慢、維度低的數據。舍恩伯格教授在《大數據時代》一書中指出,大數據是側重決策的全數據,是通過全方位的數據采集、整理、分析探索事物發展的結果,小數據是以用戶為中心,側重對個體特征的深入挖掘,旨在探索個體與相關事物之間的聯系。
1.2 小數據的特點
隨著大數據的興起,人們日益認識到數據的價值,借助大數據分析預測用戶需求成為各行各業的趨勢。與大數據相比,小數據具有成本低、風險低、個性化、動態化的特點,各種移動終端、可穿戴設備的應用也為小數據采集提供了便利[2]。小數據是圍繞個體產生的,因此不同個體之間的差異以及對同一事物的不同見解決定了數據的個性化特點。小數據的形式多樣,包括圖像、視頻、聲音等。由于小數據規模較小、結構簡單,并不需要復雜的技術和系統配置,所以可以在一定程度上避免信息利用過程中存在的風險。小數據的數據體量小,分析整理更加方便,對于系統的配置要求不高,能夠減少系統損耗,降低數據處理成本[3]。
1.3 小數據的作用
小數據包括用戶的情境狀態數據、身體數據、行為數據等,對這些數據進行采集和分析,建立與用戶相關的數據模型,可以更好地預測用戶需求。小數據從微觀層面反映了用戶的閱讀需求、個性特征、喜好等,揭示了用戶活動與圖書館服務之間的因果關系。對個體數據進行追蹤、采集和分析,可以精準預測個體需求和事態發展方向,為圖書館制訂服務方案提供依據。
2 圖書館對用戶小數據的融合處理流程
數據融合是指將異構數據轉換為統一的形式以便為決策提供依據。圖書館用戶在獲取服務過程中會產生形式多樣的小數據,圖書館應對這些小數據進行融合分析,挖掘其中隱含的價值。
2.1 分析數據源
圖書館通過多種途徑采集與用戶相關的小數據后,首先要對數據進行綜合分析,經過數據映射、去重、更新等操作后將其納入小數據融合庫中。對于來源多樣的異構小數據,圖書館需要建立統一的數據模型,在確定不同數據映射關系的基礎上賦予不同數據相應的權重,再將這些數據納入相同的模型中。對于相同模型下的映射數據,圖書館還需要做好去重工作以減少數據存儲占用的空間,提高數據存儲效率[4]。
2.2 深入挖掘小數據的基本屬性
深入挖掘小數據的基本屬性有利于掌握讀者的個性化特征。圖書館應從數據中提取與用戶屬性相關的內容,如檢索次數、 訪問時長、閱讀類型等,用于更準確地分析用戶行為。在這個過程中,圖書館既要對有價值的數據進行挖掘利用,也要重視去重處理,只有這樣才能準確描述用戶偏好并劃分用戶群體。
2.3 構建用戶畫像
用戶小數據收集與整理完成后,圖書館就要對這些數據進行關聯、挖掘和態勢分析,從中獲取可用的信息并納入用戶數據庫,從而全面掌握用戶的興趣愛好、行為特征和個性化需求。圖書館只有結合用戶所處的情境建立符合用戶特征的知識空間,探究不同數據之間的關聯,才能獲得更有價值的數據,為構建用戶畫像奠定基礎。
3 基于小數據融合的圖書館用戶精準畫像構建
3.1 小數據融合分析
圖書館建立用戶精準畫像的目的就是結合用戶小數據還原用戶信息,從而全方位把握用戶需求,為開展個性化服務提供支持[5]。圖書館不僅可以從各類服務系統中獲取小數據,也可以借助智能終端、可穿戴設備等采集用戶數據。由于采集的初始數據是分散異構的,彼此之間關聯度不高,所以需要對這些數據進行融合。在這個過程中,圖書館可以提取用戶基本信息,初步描繪出用戶畫像,然后對用戶靜態、動態數據進行分類處理并對源數據庫進行完善,進而得到更加清晰的畫像。
3.2 用戶畫像構建
圖書館對用戶精準畫像的描摹是長期動態的過程,需要分階段、分步驟進行。首先,圖書館要根據源數據分析結果為不同用戶設置對應的標簽,然后對用戶標簽進行分類,建立個體用戶和群體用戶標簽體系;其次,圖書館從多個渠道獲取用戶小數據后,需要借助數據集成、清洗、轉換等技術對其進行預處理,再利用語義分析、聚類分析、有序化分析等算法得出符合用戶特點的標簽;再次,圖書館應根據不同用戶之間、不同數據之間的關聯勾勒出個體和群體用戶畫像,為個性化服務提供依據,詳見圖1。
3.3 用戶隱私保護
圖書館在處理用戶數據過程中不可避免地會涉及一些隱私內容,尤其是個性化服務策略的制訂是以小數據為依據的,這些與用戶切身相關的數據若利用不當,很容易引發各種糾紛。圖書館要想規避用戶小數據利用風險,保障用戶的信息安全,不僅需要引進先進的信息處理技術,還需要完善相應的規章制度[6]。一方面,圖書館要借助信息加密、身份識別等技術對用戶隱私信息進行安全認證,根據用戶等級設置系統訪問權限,對重要信息進行加密傳輸,避免被竊取或惡意傳播;另一方面,圖書館要規范用戶數據使用流程,確保管理人員規范操作,對于部分重要數據的處理必須征得原持有者的同意。
4 基于小數據融合的圖書館用戶需求分析與服務策略
4.1 了解用戶需求
結合用戶精準畫像模型挖掘有價值的內容是掌握用戶需求的必要步驟。圖書館要做好小數據的價值挖掘工作,促進數據庫的不斷完善和更新,確保用戶需求與個性化推送內容的精準匹配[7]。由于用戶需求是動態變化的,所以數據庫中的內容需要實時更新。圖書館也要利用相關評估模塊對與用戶興趣相關的內容進行測評,從而及時發現用戶需求,提高信息服務的針對性。
4.2 調整服務方案
圖書館用戶的需求是隨著服務方式、服務階段、閱讀情境等而變化的,存在隱性需求和顯性需求之分,也存在長期需求和短期需求之分[8]。鑒于用戶需求的復雜、動態性,圖書館應做好用戶數據庫管理工作并及時對用戶小數據進行補充、刪改和更新,保障用戶畫像構建的科學、合理。一方面,圖書館要根據小數據了解用戶心理、行為、社會關系的特點,發現用戶感興趣的內容,明確不同數據之間的因果關系;另一方面,圖書館應重點采集與用戶興趣相關的資源,為個性化服務提供支持。圖書館只有根據用戶需求變化動態調整服務方案,才能為其提供更精準和有效的服務。
4.3 推送個性化資源
圖書館建立精準用戶畫像的最終目的就是為個性化服務提供有效指導。互聯網環境下,越來越多的用戶習慣于通過網絡檢索館藏資源,因此,圖書館可以對用戶的在線瀏覽數據進行綜合分析,借助“數字足跡”跟蹤的方式獲取用戶小數據,全面掌握用戶的行為偏好并制訂信息資源采集、處理、推送的具體方案,提高資源推送的針對性和精準性。
5 結語
滿足用戶的個性化資源獲取需求是圖書館讀者服務的目標。大數據環境下,圖書館可以借助數據分析技術、數據挖掘技術等構建基于用戶個性化特 征的數據庫,建立精準、動態、真實的用戶畫像,在保護用戶隱私的基礎上全面掌握用戶需求,制訂科學合理的個性化服務方案,切實提高圖書館的服務效能。
參考文獻:
[1]? 陳臣.圖書館小數據讀者個性化興趣預測與發現模型的構建[J].圖書館論壇,2017(5):98-105.
[2] 陳添源.高校移動圖書館用戶畫像構建實證[J].圖書情報工作,2018(7):38-46.
[3]? 胡媛,毛寧.基于用戶畫像的數字圖書館知識社區用戶模型構建[J].圖書館理論與實踐,2017(4):82-85,97.
[4] 范曉玉,竇永香,趙捧未,等.融合多源數據的科研人員畫像構建方法研究[J].圖書情報工作,2018(15):31-40.
[5] 汪強兵,章成志.融合內容與用戶手勢行為的用戶畫像構建系統設計與實現[J].數據分析與知識發現,2017(2):80-86.
[6] 劉艷.基于數字足跡的公共圖書館社會化閱讀服務研究[J].數字圖書館論壇,2018(11):52-57.
[7] 丁雷.大數據環境下高校圖書館用戶畫像與特征研究[J].中國科技信息,2018(24):59-62,64.
[8] 陳廉芳.大數據環境下圖書館用戶小數據的采集、分析與應用[J].國家圖書館學刊,2016(3):69-74.
(編校:周雪芹)