董 寧
隨著科技發展,針對用戶數據的挖掘分析和精準化服務在各行業發揮著重要作用,其中基于用戶偏好特征數據關聯的用戶畫像技術已被廣泛應用于精準營銷[1]、智能推薦[2]、產品研發[3]等領域。作為信息服務的主體,圖書館引入用戶畫像概念,通過分析用戶偏好特征數據,構建用戶數據與自身資源、服務數據間的關聯性,創建用戶畫像檔案,進而預測用戶需求,提供精準化服務。“用戶畫像”(User Profile)的廣義概念之一是通過引入數據挖掘、統計分析,描述用戶行為與需求偏好特征,為用戶建立獨特的畫像檔案。學者從不同視角展開利用User Profile方法構建用戶畫像的理論研究[4-9]。與此同時,學者們開展精確描述多元化用戶需求和提升精準服務研究[10-14]。縱觀學界對用戶畫像和精準服務的研究成果,主要側重于運用大數據分析、計算方法構建用戶畫像模型的理論研究,罕見針對圖書館小型數據和群組用戶偏好特征的實證分析成果;中小型圖書館的精準服務探討較少。本研究立足實踐,在缺乏大數據分析體系的情況下,提出運用User Profile的研究方法分析目標用戶多維數據,通過關聯用戶偏好特征標簽,構建適用于地方高校圖書館的群組用戶畫像模型和圖書館精準服務體系。
圖書館挖掘用戶數據、構建群組用戶畫像、實施精準服務,是轉變服務模式的戰略重構。鑒于本研究所在圖書館技術及人員條件有限,對用戶數據的挖掘分析、畫像繪制、精準服務探索采取分步驟、分層次的方法。作為初期研究,以圖書館年接待量最高、資源利用效能最好的主要用戶:本科生、研究生、教學科研人員(含專業技術類人員)為研究對象。通過挖掘多維用戶數據,關聯數據中隱含的用戶行為偏好特征,繪制群組用戶畫像,并基于此構建圖書館精準服務體系框架。在后續研究中,通過調研精準服務效能數據及用戶反饋,驗證畫像及服務體系的有效性;并逐漸擴展用戶畫像研究范圍(如引入行政管理人員、后勤職工、離退休人員、校外讀者等用戶類型)和豐富精準服務內涵。

圖1 群組用戶畫像建模流程
完整的群組用戶畫像建模(數據重構)過程,包括如圖1所示的用戶數據挖掘、數據分析、建立用戶標簽化體系、繪制群組用戶畫像等步驟。
用戶數據的多元挖掘是構建畫像的基礎。數據挖掘包含挖掘用戶的靜態數據、動態數據、社交網絡數據、心理特征數據等。多維度數據交叉形成立體動態畫像,對于每一個維度數據挖掘越多,構建的畫像像素越高,圖書館越能提供精準服務。鑒于此,本研究用戶數據從以下數據源獲取。
(1)圖書館后臺數據。圖書館后臺數據包括圖書館門戶網站數據、書目檢索平臺(OPAC)統計數據、圖書館數據庫網絡日志數據、移動閱讀終端統計數據、門禁系統數據、預約選座后臺數據、互動社交平臺和APP日志數據。
圖書館門戶網站數據中儲存了用戶靜態數據(如姓名、性別、年齡、學科專業、班級、教育層次、注冊信息等);書目檢索平臺(OPAC)記錄了用戶的動態行為與心理偏好數據(如借閱信息、閱讀偏好、訂閱與收藏、檢索偏好與途徑、圖書薦購、活躍程度、評論等);圖書館數據庫網絡日志數據(如各類數據庫登錄次數、檢索途徑與頻次、使用偏好、下載頻次、主題類型等)客觀體現不同用戶的學習途徑、學科需求和興趣偏好;移動閱讀終端則統計用戶的閱讀需求和心理特征(如登錄次數、主題類型、下載次數、訂閱類型、評分、分享等);門禁系統數據(如到館頻次、時間、地點)記錄用戶到館頻次信息;預約選座后臺數據(如選座頻次、時間、地點、位置、個人偏好)提供用戶利用圖書館空間和個人學習習慣特征;互動社交平臺、APP日志數據則動態體現讀者的資源信息、服務獲取需求、主題偏好等。
(2)主題調查問卷數據和訪談數據。主題調查問卷和訪談是圖書館有針對性地獲取目標用戶資源利用和需求信息的途徑。通過設計問卷、開展訪談所獲取的數據可以直觀洞悉用戶的學習層次、學科需求、動態行為特征和心理偏好,有助于刻畫精準的用戶畫像。此類數據具有多維度、主題相關性強的特點,規避了繁雜無用信息的干擾。
首先,對各類數據進行清洗、去重合等預處理操作。這一過程通過語義分析,包括網站、數據庫后臺的機器識別(自然語言處理技術)和人工識別,即人工提取數據中隱含信息、去重合、分類篩選。其次,對篩選信息進行關聯性統計分析。利用統計分析工具繪制易識別圖譜用于揭示數據中隱含的信息關聯,建立不同類型用戶的特征標簽映射。
梳理關聯分析數據信息,按特征形成用戶標簽體系。該步驟是繪制用戶畫像的核心工作,即為各群組用戶建立匹配其特征(如學習特征、學科需求、行為特征、心理及興趣偏好等)的用戶標簽映射關系。通過區分群組的相似背景、行為特征、心理需求和行為模式等,繪制不同類型的群組用戶畫像,根據每組用戶共性需求提供精準服務。
根據群組用戶畫像模型,圖書館預測不同類別用戶的知識(包括資源、服務)需求,精準推送滿足用戶興趣的資源與個性化服務。本研究設計的精準服務體系架構包括二要素、三步驟。
1.5.1 精準服務體系的二要素
(1)核心要素:用戶。用戶是圖書館重構精準服務的中心元素。圖書館以用戶為中心,預測用戶潛在需求,為圖書館服務設計提供決策依據。同時,讓用戶參與圖書館服務的設計與優化過程,使之與用戶訴求精確匹配,這是實現精準服務的基礎。
(2)主導要素:圖書館。作為構建用戶畫像和提供精準服務的主體,圖書館在決策管理、體系構架、用戶數據挖掘與分析、需求匹配、服務執行、信息反饋各環節承擔主導作用。
1.5.2 精準服務體系的三步驟
(1)群組用戶需求提取。構建群組用戶畫像模型后,圖書館要深入分析目標用戶的現實需求、潛在需求,引入時間序列預測未來需求的走向;掌握不同類型群組用戶和同一組群內用戶的共有化和差異化需求;將需求內容關鍵詞按出現頻次序列化提取,形成不同群組用戶的需求清單。
(2)匹配形成精準服務。圖書館依據需求清單,定量測算不同類型用戶的需求偏好權重,結合時間闕值,確定需求特征元數據。需求特征元數據包含資源需求元數據、服務需求元數據。針對資源需求元數據,首先匹配館藏資源庫內部數據,如匹配成功,將館藏資源數據信息及時推送至需求用戶;如需求元數據與館藏內容數據不匹配,直接通過薦購平臺訂購需求資源并反饋用戶。針對服務需求元數據,匹配圖書館各類服務,精準推薦需求用戶。圖書館應厘清用戶的短期需求、長期需求、規律性需求、共性需求等,依據現有服務區塊中服務的時間序列特性,預測用戶的周期性服務需求,制定服務項目時序計劃,主動提供滿足不同時間序列特征的主題定制服務。同時,圖書館還需為活躍用戶、代表性用戶提供訂制化的服務和定期推送專題信息服務等。
(3)體系維護與更新。用戶需求、圖書館資源層、服務區塊都是動態變化的。用戶的需求與行為模式隨時間、心理情緒、外部環境、資源服務的變動相應變化。圖書館應定期監測,更新群組用戶畫像模型,進而優化整個精準服務體系。通過與用戶建立雙向溝通機制,圖書館了解新的用戶需求反饋,定期采集、過濾、分析新的用戶數據,更新群組用戶畫像,循環維護整個精準服務體系的良性運轉。
本研究以山東工商學院圖書館的三類主要用戶為分析目標,結合前文所構建的“群組用戶畫像模型”和“基于群組用戶畫像的圖書館精準服務體系”進行實證分析。
2.1.1 圖書館后臺數據
圖書館后臺數據包含2019年度圖書館用戶各類統計日志數據。數據采集利用“校園一卡通”賬號作為數據來源的登錄端口。表1為本研究各類型的后臺統計數據。

表1 各類型后臺統計數據
2.1.2 主題調查問卷數據
本研究使用“問卷星”為調查問卷設計平臺,設計《基于用戶畫像的圖書館精準服務需求調查問卷》。問卷設計大綱如表2所示。問卷綜合采用結構型(提前設定選擇項)、非結構型(開放式問卷)問題設計,部分內容采用李克特五級量表方法設計。主題因素涉及用戶的“基本信息”“到館目的”“圖書借閱情況”“數字資源利用及需求”“圖書館微信公眾號利用及需求”“學科服務用戶需求因素”“圖書館空間利用服務”共7部分37項問題,旨在全面了解用戶需求。

表2 《基于用戶畫像的圖書館精準服務需求調查問卷》設計大綱
調查問卷設計后,采用SPSS25.0對問卷的信度和效度進行檢測。將VOL量表納入SPSS25.0信度分析,得到Cronbach’s Alpha值為0.917,說明本問卷設置各變量信度較高。效度分析包括內容效度分析、建構效度分析。其中,本問卷的主題因素、變量問題設計均覆蓋到調研目標領域(圖書館資源、服務利用與需求、用戶畫像),認為本次調查具備良好的內容效度。建構效度指能測量出理論的特質或概念的程度[15]。本問卷量表經SPSS處理后得到的分析結果為:KMO值為0.702,題項變量間關系適中;Bartlett球形檢驗的近似卡方分布為1323.637,自由度為513,顯著性概率值p=0.000<0.05,達到顯著水平,因此認定該問卷變量效度合適。
調查問卷以微信、網頁鏈接形式同時發布。發放對象為本校本科生、研究生、教師(包括教學科研人員、部分專業技術人員)。發放時間共30天,共發放問卷1,000份,回收問卷986份。回收樣本經問卷星后臺統計與人工篩選,得到有效問卷923份,回收有效率達92.3%。樣本數符合麥克萊夫[16]樣本數量與指標變量比例建議。其中本科生填寫532份,研究生填寫186份,教師用戶填寫205份。
2.1.3 訪談數據
本研究對山東工商學院6個學院(經濟學院、管理科學與工程學院、工商管理學院、會計學院、計算機科學學院、人文與傳播學院)的98名教師(年齡28~56歲、均為碩士以上學歷)進行面對面訪談,內容涉及學科專業資源需求、圖書館資源建設滿意度與需求意見、圖書館學科服務滿意度與需求意見、學科信息推送滿意度、個性化需求等。圖書館調研團隊整理上述訪問內容文本,依需求排序形成用戶需求標簽信息。
2.2.1 數據預處理
后臺統計數據經機器語言識別、清洗、去重合處理,再由人工整合形成有價值信息文本條目。在線問卷調查數據,經平臺自動統計排序、人工去重、篩選形成分類信息。訪談內容文本信息則經人工匯總、提煉相關主題和影響因素關聯信息。綜合提取上述三類數據中隱含的用戶行為與需求信息高頻詞,經去重合篩選形成用戶的“資源利用行為”“服務利用行為”變量集群;并將通過變量標簽與用戶類型關聯性分析,揭示各群組用戶的顯著行為數據與組群用戶需求的對應特征關系。
2.2.2 群組用戶行為特征關聯分析
為分析不同群組用戶的需求與行為特征是否存在關聯性,本研究提出以下假設:
H1:群組用戶類型與資源利用行為數據特征相關。
H2:群組用戶類型與服務利用行為數據特征相關。
為驗證上述假設,本研究將預處理后的后臺與問卷行為排序數據導入SPSS25.0分析不同群組用戶需求(主題)與行為特征(變量數據)間的關聯性。假設內容及對應分析運算結果如表3所示。

表3 群組用戶需求行為特征關聯假設與對應分析結果
經卡方檢驗,上述假設的伴隨概率P值均小于0.05,假設均通過驗證,主題與相關變量之間具有較高相關度。同時,對應分析經因子降維處理,繪制二維散點圖揭示各群組用戶需求與行為特征之間的親疏關系。

圖2 群組用戶與資源利用行為對應分析結果
圖2是描述群組用戶類型與行為特征的對應分析結果。由圖2可見,從右上區域經順時針依次分為1-4象限,位于不同象限的變量距離主題(用戶)的距離越近,說明關聯性越強,反之則關聯性越弱。不同群組用戶利用圖書館資源行為特型有顯著差異。其中處于第1象限的“教學科研人員”與“中外文期刊數據庫、教學案例資源、學科評價數據庫、學術核心期刊、專業圖書、事實數值數據庫、教參類圖書、統計年鑒”等資源關系最密切,說明該類型用戶利用圖書館資源主要為滿足教學、科研需求。位于第1象限的研究生群組用戶對中外文數字期刊資源、學科專業圖書、核心期刊的利用較好,說明他們的專業學習、學術科研需求較高。與前兩組用戶存在較大差異的是本科生群組用戶,此類型用戶的主要行為變量位于第2象限,主要以閱讀文學圖書、各類考試、職業規劃與社科休閑類圖書為主;對圖書館數字資源的利用傾向于語言學習、考試資源、公開課視頻、藝術鑒賞類資源。
各群組用戶利用圖書館提供的服務行為同樣存在差異。
如圖3中第1象限的教學科研人員經常參與圖書館服務包括利用圖書館數字資源庫、學科圖書借閱、代查代檢、原文傳遞、學術不端檢測服務,參與專業數字資源與學科評價資源講座等,對于學科定題信息推送、課題申報講座等定制化服務有較強需求。同象限的研究生用戶則在利用數字資源、學科專業圖書的同時,注重學術論文寫作、課題申報等知識的獲取。位于第2象限的本科生用戶對于圖書館服務利用則主要體現在預約選座、利用空間自習、文學圖書借閱、參與圖書館資源講座、新書推薦服務等;其中,高年級本科生關注畢業論文寫作、考研及公務員考試、職業規劃類講座,而新生則多參與新生入館培訓、讀書沙龍活動等。

圖3 群組用戶與服務利用行為對應分析結果

圖4 本科生群組用戶畫像

圖5 研究生群組用戶畫像

圖6 教學科研人員群組用戶畫像
依據上述群組用戶的行為與需求關聯特征,歸類標簽,形成各類型群組用戶的學習特征、行為特征、心理及興趣偏好等標簽映射關系。根據用戶標簽映射,繪制圖4~6所示的本科生群組用戶畫像、研究生群組用戶畫像,以及教學科研人員用戶畫像。可視化標簽直觀體現三類群組用戶行為模式和需求偏好的差別。其中,本校本科生用戶對文學、社科類、技能考試類紙質圖書最為關注,他們到圖書館主要目的是自習、閱覽期刊和圖書借閱;對于數字資源,特別是學術論文撰寫的需求還未形成;只有高年級本科生有獲取畢業論文學術規范的需求。研究生群組關注圖書館數字資源對其提供的課程資源、學科專業、研究工具等的掌握,圖書借閱以學科專業類為主,開始嘗試研究生創新創業項目申報,有學術論文寫作和投稿技巧的需求。教學和科研人員主要關注自身授課的教學方法,科研項目、成果受獎、職稱晉升、學科相關信息、資源和研究方法。行政管理人員關注其工作領域相關的政策、法規、新聞動態、會議資源等。
2.4.1 精準服務體系實施內涵
在繪制群組用戶畫像的基礎上,本研究依據前文“基于群組用戶畫像的圖書館精準服務體系”理論架構,構建如圖7所示的精準服務體系實施流程圖。精準服務體系的核心為不同類型群組用戶。圖書館通過分析各群組用戶的動態行為特征、學習階段特性、興趣偏好等因素,為目標用戶精準推送資源與服務。本科生群體是紙質圖書借閱的主力軍,圖書館可以向此類用戶推薦符合其閱讀偏好和學科領域的優秀圖書;定期通過微信推送新書信息,開展主題讀書沙龍等活動;有針對性開展適合本科生的圖書館基礎服務知識、信息獲取與評價、優秀公開課、綜合素質提升類講座、畢業論文撰寫系列講座。針對研究生用戶的學術資源和寫作需求,圖書館為不同專業研究生推薦學科領域經典資源、最新資源,開設嵌入式研究方法和學術論文寫作、課題申報基礎培訓。教學科研用戶的需求具有較強學科性,圖書館應根據用戶需求與建議,完善資源庫;發揮圖書館情報信息領域優勢,為目標用戶,特別是活躍核心用戶定制學科個性化服務,如定題信息推送、專利檢索服務、投稿指南等;努力參與科研人員的科研信息采集、評價、管理等學科服務;針對教師的科研、立項需求,圖書館可以邀請學科專家為用戶開展科學評價、課題申報主題講座。

圖7 基于群組用戶畫像的高校圖書館精準服務體系
2.4.2 精準服務體系更新運轉
本研究架構的精準服務體系強調用戶與圖書館二要素間的雙向互動,圖書館通過與用戶建立雙向溝通機制促進精準服務體系的更新運轉。一方面圖書館采取靈活的實時服務評價方法,如借鑒餐飲業、電商平臺的實時服務評分問卷,獲取群組用戶的滿意度。同時定期與用戶互動,如學科館員走訪二級學院,發放主題問卷,組織“我為圖書館諫言”師生互動沙龍,微信留言板等方法,了解用戶需求與建議,補短板、促使圖書館自身升級資源儲備、優化服務內涵。另一方面,圖書館分析用戶動態數據,如動態評估用戶需求,更新用戶畫像模型,進而調整精準服務策略,促使整個生態系統在供需平衡中保持活力。
本研究引入用戶畫像(User Profile)的研究方法,通過對目標用戶多維數據與需求的挖掘、關聯性分析,建立群組用戶標簽映射,繪制群組用戶畫像模型,并以此為基礎架構基于群組用戶畫像的圖書館精準服務體系。經實證分析,檢驗了圖書館通過繪制群組用戶畫像實施精準服務的可操作性。為維持服務體系的有效運轉,圖書館應建立圖書館與用戶間的互動機制,通過實時反饋溝通,保障用戶畫像模型和精準服務體系的有效性和生命力。研究基于山東工商學院圖書館目標用戶構建的初期實證設計,其群組用戶畫像的范圍、畫像構建的準確性、科學性及精準服務效能將通過后續研究和用戶調研反饋來驗證、改進。本研究的不足有:目標群組用戶的區分粒度過粗,僅從本科生、研究生、教學科研人員三方面論證,難以全面定義群組用戶和精準服務,后續將擴展補充行政人員、離退休人員、后勤職工、校外讀者等用戶;實證分析中的問卷調查、訪談數據難以避免設計者的主觀性和表述偏差,后續研究將盡量減少人為因素;基于用戶畫像的技術算法運用有待豐富,后續將引入k-means等聚類算法處理用戶數據。