徐維晨
一、文獻回顧
1.檔案潛在用戶研究進展
國內對檔案潛在用戶的研究可分為以下兩個方面,一是在概念界定方面。1994年,浙江省檔案館的李軍將用戶分為“現實用戶”和“潛在用戶”,他在文中提到“檔案潛在用戶是指只具有使用檔案的需求,而沒有到檔案部門查找檔案的用戶”[1]。2011年李財富、楊靜在《檔案“潛在用戶”轉化》一文中指出“潛在用戶的概念是相對于現實用戶提出來的,是指在社會上的組織或者個人具有檔案利用的需求,但是不知道如何利用檔案,同時在事實上也沒有與檔案館建立聯系的一類群體”[2]。二是檔案潛在用戶轉化方面。秦慧和陳妍希提出要注意挖掘檔案用戶的潛在需求,刺激其潛在需求,從而促使檔案潛在用戶轉變為現實用戶[3];王向女、袁倩探討了在社交媒體平臺上檔案潛在用戶挖掘的必要性[4]。在轉化對策方面,鄭典宜[5]、馬英杰[6]、鄭伽[7]、楊靜[8]、邢變變[9]、馮妍[10]等都提到要借助網絡技術將潛在用戶轉變為現實用戶。
國外并沒有具體的針對檔案潛在用戶的研究。“在西方發達國家,80%以上的檔案用戶是普通公眾”[11]。在第十四屆國際檔案大會上,西方檔案學者提出了“檔案休閑利用服務”的觀點,主張檔案社會化服務,拓展了檔案潛在用戶的范圍[12]。國外的檔案服務研究,應用性、技術性很強,非常關注用戶的體驗,主張個性化服務。Kim hn關注檔案服務中個性化用戶的建模,根據用戶興趣提供相應的服務[13];Fernando ZT等人提出關注用戶個性化數據,打造注重與用戶交互和協作的存檔網絡平臺[14]。
2.小數據研究進展
2014年美國康奈爾大學的德伯哈爾·艾斯汀教授是第一位提出“小數據”的研究者,她從年邁父親的數字社會脈動的異常信號受到啟發,認為個體行為的個體數據為總結個人行為模式規律提供可能[15]。目前,小數據應用范圍十分廣泛,如科研用戶小數據融合研究[16]、借助小數據分析提升散客旅游者體驗質量的研究[17]、通過小數據提供嵌入式的學科服務[18]等。
在圖情檔領域,小數據應用于用戶服務的研究主要集中于圖書館領域。刁羽在分析小數據與圖書館智庫型信息咨詢服務契合性的基礎上,構建基于小數據的高校圖書館智庫型信息咨詢服務模式體系結構[19];陳臣、馬曉亭對小數據在讀者畫像價值進行了定量分析,建立了讀者畫像的個體化標簽,構建了基于小數據的讀者畫像系統[20]。在檔案領域,將小數據應用于用戶服務的研究很少,知網檢索有效文獻只有五篇。呂元智在2016年時從小數據的概念入手,設計了基于小數據的數字檔案資源知識集成服務系統框架[21];2018年李財富和余林夕提出將用戶小數據用于精準化檔案信息服務[22];2019上海大學圖書情報檔案系的古同日同學從技術條件和成本上質疑了小數據應用于檔案信息資源開發利用服務[23]。
綜上,檔案領域針對潛在用戶的研究大多數停留在理論層面,提出的相應對策太過寬泛,應用性較弱,實證色彩不足。在小數據領域的研究則更是少之又少,檔案領域應該借鑒其相關領域的經驗,加快推進小數據應用于檔案服務。基于此,本文基于用戶的小數據,探討將其應用于檔案館潛在用戶的信息推薦服務中,以期促進更多檔案館潛在用戶轉化為現實用戶,擴大檔案館用戶范圍,提高檔案利用效率。
二、檔案館潛在用戶信息推薦服務現狀分析
1.信息推薦內容無法吸引潛在用戶
檔案館通常通過門戶網站、微信、微博、短信等方式來進行檔案信息推薦服務。在推薦的信息內容方面,檔案館所傳播的信息內容多數是會議通知、政務信息、檔案文化、檔案技術、檔案宣傳活動等,形式多以文本和圖片為主。以浦東檔案館的微信公眾號“浦東檔案為例”,在其平臺上推送的文章分為“蘭臺動態”、“浦東家族”、“崢嶸70年”、“檔案法規”、“閑話浦東”六個主題,在宣傳檔案工作、普及檔案知識、傳播檔案文化等方面起到了很大作用,但是其閱讀量較少。微博上的內容則是轉發他人信息、工作動態居多,很難吸引潛在用戶的關注。而國內的大部分檔案館網站設計比較粗糙,很少有精準的推送和定制服務,更為完善的個性化服務還在探索當中,有些檔案館網站雖然開通了更為貼近民生、吸引用戶的民生檔案信息服務板塊,但也只是依據用戶大數據,豐富民生檔案信息種類和服務內容。國外的檔案館網站,如美國國家檔案館為了進一步刺激潛在用戶的需求,開辟了更進一步的個性化服務板塊,有針對教育的數字教室板塊、針對退伍軍人的退伍軍人服役檔案獲取板塊[24],雖然可以相對來說刺激檔案館潛在用戶的需求,但也只是針對用戶群進行細分,提供相對具有個性化的服務,還沒有達到針對個人的多樣化、精準化服務。
檔案館信息推薦的內容無法滿足用戶的多樣化需求,無法更進一步的“喚醒”檔案館潛在用戶,使其轉變為現實用戶是檔案館服務的一大短板。檔案館潛在用戶小數據是用戶的個體數據,是“能展現用戶行為需求特征的各種數據的結合”[25],對這些數據進行采集分析,能夠準確掌握用戶需求,及時關注用戶真正感興趣的信息內容,及時推送給用戶,有效吸引潛在用戶轉變為現實用戶。
2.“等客來”被動服務理念亟須轉變
目前,我國大多數檔案館還是處于一種“等客來”的狀態,從整體上缺乏有深度、有內涵的開發及主動服務的姿態。雖然檔案館在信息推薦方面提供了多種渠道,但還需要用戶主動去其服務平臺上進行瀏覽點擊,而不是主動的推送信息。在美國國家檔案館網站上提供了彈窗式服務,但其所推送的內容是訂閱服務[26],也不是大部分用戶所真正感興趣的信息。“我國國家檔案館在公共文化服務方面依然實行的是被動式服務,在檔案文化意識、服務理念方面都較保守。這種服務方式可以滿足國家黨政機關政治文化需求,但是忽視了對公眾文化需求的調查和了解,無法建立起服務公眾的有效反應機制。”[27]檔案館潛在用戶群體數量龐大,“等客來”的被動式服務阻礙了檔案館潛在用戶的轉化,使得檔案館用戶群體無法大規模形成,檔案資源得不到有效利用。
2018年的“局館分離”檔案機構改革,理順了檔案局和檔案館的關系,檔案館的服務職能更加凸顯。檔案館應該以此為契機提供更加主動的服務方式,利用用戶小數據,分析用戶需求,為用戶量身打造屬于個體的信息推送,以更為主動的服務方式喚醒檔案館潛在用戶需求。
三、基于小數據的檔案館潛在用戶信息推薦服務流程
小數據在圖書館領域應用較為成熟,針對潛在用戶喚醒方面,圖書館也有更為具體的信息推薦服務方式,如由其打造的“國圖公開課”平臺,該平臺面向公眾提供國家圖書館的精品視頻課程,為了優化該平臺的使用效果,國圖引入了個性化信息推薦服務,在其網站上專門打造了一個“推薦課程”板塊[28],類似于淘寶的“猜你喜歡”。通過有效解析用戶個性化信息行為,在用戶沒有明確意圖的情況下根據用戶偏好主動推送精準、高效的館藏資源信息服務,使用戶活躍量明顯增加,讓更多的潛在用戶轉化為現實用戶。借鑒該領域的成功經驗,檔案館主動為潛在用戶推薦信息服務的流程可以分為小數據采集、小數據存儲、小數據分析、信息推薦四個步驟。
1.小數據采集
“小數據”是指以個人為中心的全方位數據,包括數據被采集時對象實時的生活習慣、身體狀況、社交、財務、喜好、情緒、行為等數據,通過分析個體的全部小數據資源可對外形成一個富有個人色彩的數據系統,來達到對個人特征、社會關系、需求和行為的精確分析與預測[29]。“國圖公開課”平臺采集了用戶的三大數據,其一是基礎數據,包括用戶的性別、年齡、職業等;其二是讀者用戶行為數據,包括用戶在其使用平臺過程中的觀看、分享、筆記等數據;最后是用戶的場景數據,登陸的時間、地點、環境等數據[30]。鑒于此,檔案館在采集用戶的數據時可分為潛在用戶的身份特征數據、行為數據和社會化共享數據。
檔案館潛在用戶是與現實用戶相對而存在的,“某檔案用戶本來是檔案館標準的現實用戶,后因為自身的檔案信息需求總得不到滿足,超過了自身的忍耐限度,慢慢喪失對檔案機構的信心,逐漸轉化為潛在用戶。”[31]因此這部分人肯定會在檔案館留下身份特征數據和行為數據,身份特征數據包括用戶的姓名、性別、職業、年齡等,這部分數據是相對靜態的;用戶的行為數據主要來源于服務監控設備、傳感器網站等,包括用戶登陸系統、選擇檢索路徑、查詢關鍵詞、調卷、復制摘錄等信息[32],還有用戶在實體檔案館的查閱信息以及用戶的反饋信息。還有一些行為數據來自利用需求處于待被喚醒狀態時的檔案館潛在用戶,他們雖然不太會有明確的意圖去檔案館留下身份特征信息,但是會不自覺的瀏覽檔案館所發布的一些信息,產生一些行為數據。檔案館潛在用戶的社會化共享數據來源于虛擬的網絡平臺,隨著社交媒體的發展,大部分檔案館潛在用戶都會選擇社交媒體平臺來了解檔案信息,因此平臺上會遺留下來用戶登陸、社會化賬號、歷史檢索痕跡、人機交互等數據[33]。從這些數據中都可以采集到反應用戶需求的檔案館潛在用戶的小數據。
2.小數據存儲
“國圖公開課”平臺為了存儲用戶小數據打造了用戶數據資源池。檔案館也應為采集到的用戶小數據打造一個專門的數據庫,潛在用戶小數據的存儲工作要包括以下幾個方面:首先,要統一所存儲的數據保存標準,對于不符合標準的小數據要及時完成轉化工作,以便之后的分析利用工作的開展;其二,對于被采取的小數據,要注意保障其數據安全。因為小數據是用戶的個人數據,其中還包括用戶的身份特征數據,涉及用戶的隱私問題,在存儲過程中數據的安全問題尤為重要。為了避免個人信息泄露,數據庫的進入要設置相關權限,對數據庫進行加密保護;其三,為了保證所存儲小數據的質量,方便日后分析使用,要對小數據進行初步的整理,去除用戶小數據的噪音,保存真正有價值的潛在用戶數據,使用技術手段對潛在用戶小數據進行鑒定,剔除不必要的數據。在存儲過程中,對用戶小數據進行初步整理,存儲真正有價值的小數據,同時對所存儲的數據進行安全保護,增強潛在用戶小數據的可利用性和安全性。
3.小數據分析
對潛在用戶小數據進行分析是核心步驟,從小數據分析中提取用戶真正的需求,關注用戶的興趣點,才能有針對性的提供信息推薦服務。小數據分析過程包括數據的挖掘、整合和優化[34]。可以利用數據挖掘技術、數據倉庫技術等數據處理技術對小數據進行分析,如因為手機、電腦等移動終端的便利,大部分潛在用戶主要通過檔案館的社交媒體平臺來了解檔案信息,表達其潛在需求,由此對數據的挖掘可以重點挖掘兩個方面:一是用戶所瀏覽過的頁面內容信息,采用web文本挖掘技術,提取文本中潛在的、有價值的內容;二是挖掘用戶的瀏覽行為,比如點擊鼠標的次數等。通過數據挖掘,利用適配的算法發現用戶小數據的規律,將提煉出來的有價值的小數據,按照所屬的用戶逐一整合,利用數據倉庫技術,將統一用戶的小數據集成于相關的數據結構中,從而了解用戶的行為趨向。然后,對所整合的用戶小數據進行優化,提升小數據的質量,確保最終小數據的準確性。還可以采用用戶畫像技術,通過標簽映射法,從小數據中提取出用戶的興趣屬性,形成標簽,賦予到用戶身上,以將用戶興趣特征化[35],最后建立屬于用戶個體的單用戶畫像庫。
4.信息推薦方式
潛在用戶小數據的采集、存儲、分析都是為了最后的信息推薦服務工作的。首先,要將最后形成的用戶數據庫與信息資源相匹配,根據用戶數據庫所反映的用戶興趣點,提供一對一精準的檔案信息服務。根據小數據分析結果,把握用戶的興趣點,豐富信息推薦內容,使其更能吸引潛在用戶的關注,喚醒潛在用戶的需求。其次,在信息推薦方式上應采取主動推送的方式,打破檔案館長期處于被動服務的局面。“國圖公開課”平臺上主動為用戶打造了“推薦課程”板塊,推送其可能感興趣的課程。檔案館理應借鑒學習這種方式,比如在其檔案網站上專門開辟一個用戶可能利用的信息板塊,主動為潛在用戶推薦一些感興趣的信息,還可以通過網頁彈窗這種醒目的形式,主動推送信息,吸引潛在用戶。
參考文獻:
[1]李軍.談檔案潛在用戶的轉化[J].浙江檔案,1994(04):18-19.
[2]李財富,楊靜.檔案“潛在用戶”轉化[J].浙江檔案,2011(09):32-34.
[3]秦慧,陳妍希.注意挖掘檔案用戶的潛在需求[J].蘭臺世界,2009(05):20-21.
[4]王向女,袁倩.社交媒體平臺檔案潛在用戶挖掘的必要性探析[J].山西檔案,2019(04):35-39.
[5][6]鄭典宜,馬英杰.高校檔案潛在用戶的利用需求解析[J].山西檔案,2015(06):38-41.
[7]鄭伽.長尾理論與檔案潛在用戶群體需求的對接[J].檔案管理,2017(05):32-33.
[8]楊靜.“互聯網+”時代檔案潛在用戶轉化的思考[J].檔案學研究,2018(01):75-81.
[9][10]邢變變,馮妍.“互聯網+”環境下檔案用戶轉化策略研究[J].檔案,2018(10):10-16.
[11][31]楊靜. 檔案潛在用戶研究[D].安徽大學,2013.
[12]馮惠玲,安小米.第十四屆國際檔案大會的學術特點及主要議題[J].檔案學通訊,2000(06):4-6.
[13]Kim, HN.User preference moeling from positive contents for personalized recommendation [J].Discovery Science, Proceedings, 2007(7):116.
[14]Fernando ZT, Marenzi I, Nejdl W. ArchiveWeb: collaboratively extending and exploring web archive collections—How would you like to work with your collections?[J]. International Journal on Digital Libraries, 2018,19(1):39-55.
[15]Estrin F D.Small Data, Where N=me [J].Communications of the ACM,2014,57(4):32-34
[16]李立睿,鄧仲華.“互聯網+”背景下科研用戶的小數據融合研究[J].圖書情報工作,2016,60(06):58-63.
[17]張麗萍.基于小數據背景的提升散客旅游者體驗質量的研究[J].中外企業家,2015(31):95-96.
[18]孫丹霞,王偉軍,姜毅.基于用戶小數據的嵌入式學科服務研究[J].圖書館工作與研究,2019(04):84-90.
[19]刁羽.基于小數據的高校圖書館智庫型信息咨詢服務模式研究[J].圖書館工作與研究,2019(08):82-86.
[20]陳臣,馬曉亭.基于小數據的圖書館用戶精準畫像研究[J].情報資料工作,2018(05):57-61.
[21]呂元智.基于小數據的數字檔案資源知識集成服務研究[J].檔案學通訊,2016(06):47-51.
[22][25]李財富,余林夕.基于檔案用戶小數據的精準化檔案信息服務探析[J].檔案與建設,2018(08):4-7.
[23]古同日.對小數據應用于檔案信息資源開發利用中的思考[J].山東檔案,2019(02):17-19+16.
[24]National Archives[EB/OL].[2021-02-02].https://www.archives.gov/.citizen—Archivist
[26]Citizen Archivist Dashboard [EB/OL].[2021-02-02].http://www.archives.gov/citizen-Archivist.
[27]黃雪志. “局館合一”到“局館分離”對國家檔案館公共文化服務的影響[C]. 中國檔案學會.2019年全國青年檔案學術論壇論文集.中國檔案學會:中國檔案學會,2019:195-199.
[28]國圖公開課[EB/OL].[2021-02-02].http://open.nlc.cn/onlineedu/course/
explore/search.htm?filter=category&subjectId=0&categoryId=0&orderBy=recommend
[29]陳臣.基于小數據決策支持的圖書館個性化服務[J].圖書與情報,2015(01):82-86.
[30]張華,魏大威.面向“國圖公開課”的數字圖書館個性化信息推薦服務研究[J].圖書館學研究,2019(17):54-61.
[32][33][34]馬雙雙.基于小數據的我國檔案信息資源個性化服務研究[J].圖書館學研究,2018(04):86-91.
[35]許鵬程,畢強,張晗,牟冬梅.數據驅動下數字圖書館用戶畫像模型構建[J].圖書情報工作,2019,63(03):30-37.
作者單位:上海大學圖書情報檔案系