丁洋 白晶

摘 要:大數據時代的到來,為高校圖書館創新和拓展資源建設模式帶來了前所未有的機遇和挑戰。以讀者需求為中心的讀者需求驅動采購,是高校圖書館館藏建設的發展方向,體現出以人為本的服務理念。大數據環境下,針對高校圖書館文獻資源建設面臨的問題和困難,探討大數據技術應用于讀者需求驅動采購中的方法和意義。
關鍵詞:大數據;讀者需求;高校圖書館;文獻資源建設
維克托·邁爾·舍恩伯格在《大數據時代》中指出大數據的核心是預測,人們對于數據的認識發生了轉變,數據的獲取不再是隨機樣本,而是所有數據;在龐大的研究數據面前,放棄對精確度的追求,不再熱衷于尋找因果關系,而是更加關注相關關系。并展示亞馬遜如何利用用戶的購買和瀏覽歷史數據進行有針對性的書籍購買推薦。
大數據思維和技術在高校圖書館文獻資源建設中的應用,是時代發展的必然要求,將創新和拓展高校圖書館信息服務的方式和內容。大數據環境下的讀者需求驅動采購是圖書館采訪人員在信息技術的支撐下,把原本較難收集和使用的各類與采購有關的數據,如讀者行為數據集合起來,以讀者需求為中心,再依據館藏數據和學科專業數據,通過大數據技術處理,對各類結構化數據和非結構化數據進行智能化的挖掘,發現數據之間的關聯,從而指導文獻采購工作。
一、高校圖書館文獻資源采購現狀
1.傳統采購方式仍占據主導地位
以哈爾濱師范大學圖書館為例,文獻資源采購為政府采購,采購方式以訂單采購和現場采購為主,讀者薦購為輔。從文獻傳遞、館際互借,到讀者薦購,再到目前研究較多的讀者決策采購,高校圖書館一直在探索能夠不斷滿足讀者愈加多元化的文獻信息需求的采購方式,但依然存在較多問題,以哈爾濱師范大學圖書館讀者薦購為例,見表1。
表1? 哈爾濱師范大學圖書館2013年至2020年讀者薦購圖書統計表
哈爾濱師范大學圖書館從2013年開始讀者薦購工作,通過填寫“讀者薦購表單”、網上訂單采選、電話和郵件等方式接收讀者薦購書目,對符合館藏要求的圖書開辟“讀者薦購綠色通道”,由工作人員采取線上電商和線下書店兩個渠道直接采購。到書時間基本保證在一個星期左右,能夠及時滿足讀者的閱讀需求。2015年起實行政府采購,圖書館所有圖書采購必經館配商來做,因經費使用權受限,2016年、2017年讀者薦購工作暫停。2018年開始,讀者薦購工作重新啟動。2020年因疫情原因學校推遲開學,也影響了讀者薦購工作的開展,所以數量較少。從表1可以看出,除了特殊年份外,讀者薦購數據呈增長趨勢,但在整個館藏建設中所占份額較少,采購量最多的2019年僅占到當年總購書冊數的3.4%。不能充分發揮讀者的決策作用,以讀者為中心的采購模式尚處于起步階段。
2.傳統圖書采購方式的弊端
訂單采購是由工作人員根據本館的館藏方針有計劃、有選擇地選劃圖書,再將訂單發送給館配商。其弊端在于書目信息匯集的不完整,圖書采購范圍完全受館配商限制;現場采購時間受限,采購人員工作量增大。另外,以上兩種方式都是基于采訪人員的個人經驗,因此很多圖書在專業性和需求程度上很難滿足讀者的要求。讀者薦購在目前還是一種輔助采購行為,由于讀者推薦的圖書必須通過館配商購買,圖書訂到率和到館時間得不到保證,往往等讀者看到其所薦購的圖書時已經過了需求的最佳時機,更無法對讀者的閱讀起到推薦和引導的深層作用。而針對電子圖書部分,則完全是由電子圖書書商提供內容,圖書館根據經費情況進行訂購,讀者很難參與其中,嚴重影響讀者積極性。另外,傳統的讀者薦購方式,薦購書目要經采購人員收集、審核、下單,到館后還要單獨驗收、加工、聯系讀者借閱,工作量明顯增加。
二、大數據環境為優化讀者需求驅動采購提供了可能
1.國內外的理論和實踐
國外,讀者決策采購模式最早興起于美國,1999年美國科羅拉多研究圖書館聯盟與電子書整合平臺NetLibrary協商,并進行了基于讀者驅動的電子書采購實驗,這被認為是讀者決策采購的開端,之后讀者決策采購風靡全美高校圖書館,成為館藏建設的主導模式,無論是紙質文獻采購還是數字文獻采購,其應用環境和運行模式都相對比較成熟。國內,2011年張甲、胡小菁把讀者決策采購模式推送給圖書館界,內蒙古圖書館和南京圖書館先后給予了很好實踐,內蒙古圖書館自主研發的“彩云服務平臺”,“借、采、藏”一體化,即讀者可以在內蒙古圖書館合作的實體書店挑選圖書,持圖書館讀者證即可在書店前臺辦理借閱手續,無需任何費用即可當場帶走;南京圖書館“陶風采”活動,吸引了5萬多名讀者參與推薦圖書,“推薦圖書總碼洋45萬余元,占當年中文購書總經費的21%。”
2.網絡采選系統的出現
2004年中國圖書進出口(集團)總公司推出了“海外圖書采選系統”(簡稱PSOP),外文圖書的采購首先邁入了網絡采選時代。教師可通過賬號進入該系統,在系統提供的書目信息中選劃自己需要的圖書,然后由圖書館采購人員審核決定是否購買。2020年在疫情常態化的情況下,北京人天書店搭建線上采書平臺,在2020年10月和2021年3月,舉辦全國館配商聯盟線上圖采會,數百家出版社參加,20余萬種新書躍然網上,讀者選擇圖書館登錄,輸入用戶名、圖形碼即可登錄。薦購方式簡單明了,包括檢索圖書、高級檢索、紙電檢索和我的薦購四種形式。平臺展示分主會場、分會場、論壇、新聞區、銷量排行榜和留言板,交易會設計科學、合理、方便宜檢,為線上采購提供了模板,為讀者決策采購提供了可能。
三、大數據環境下讀者需求驅動采購的實現
1.樹立大數據意識
盡管目前高校圖書館實行讀者需求驅動采購面臨較大的挑戰,但大數據時代的到來,現有圖書館采購方式的變革是一種必然,業內人士在這種大趨勢下所能做的是抓住機遇、迎接挑戰。意識是賦予現實心理現象的總體,是個人直接經驗的主觀現象。大數據時代,圖書采購作為圖書館文獻資源建設的主陣地,必須樹立大數據意識,重視大數據意識的培養,學會理解數據類型的多維性、數據采集的多途徑、數據統計的規律性及數據處理的科學性等問題,以大數據為依據,構建圖書館讀者需求大數據研究中心。收集、整合、分析、統計校內外讀者的閱讀行為和購買行為,進而制定出科學、合理的圖書館采購方案,提高圖書采購質量,使圖書館的文獻資源更好地服務于師生,服務于社會。
2.培養大數據使用能力
大數據技術含量很高,又是新事物,不被大多數工作人員所熟悉和掌握,所以要注重工作人員大數據使用能力的培養,圖書館應組織工作人員開展深入、系統地學習,掌握如數據采集、存儲、分析、挖掘等方面的技術和工具,工作人員要多學習、多關注大數據的發展狀況,確保有足夠的能力適應相關工作。要建立完善的數據管理系統,高校圖書館應設立數據館員崗位,專門負責數據的管理和服務工作。
3.養成大數據思維習慣
大數據思維就是需要全部數據樣本而不是抽樣,關注效率而不是精確度,關注相關性而不是因果關系。高校圖書館圖書采購是政府采購,采購數量由學校投入經費的多少來決定,采購種類由采購人員制定的采購方案確定,采購方案的依據是采購原則、館藏結構、讀者需求,其中館藏結構和讀者需求的來源主要是數據分析,利用數據之間的關聯性,通過收集讀者在圖書館的自動化管理系統上的查詢、借閱等行為數據和監測讀者在移動圖書館、微信公眾號等平臺上的交互數據,預測讀者需求,制定科學合理的采購計劃,確定采購數量和資金分配,并為讀者提供個性化的藏書推薦,挖掘讀者潛在的隱性需求。所做這些,均要求工作人員具有大數據思維,把大數據的潛在價值轉化為最大利益,大數據思維為讀者決策采購提供了理論指導。
4.利用大數據技術
(1)大數據采集功能
大數據采集是指對各種來源的結構化和非結構化海量數據進行的采集,包括館藏資源數據、學科建設數據、讀者身份數據和讀者行為數據。館藏資源數據包括館藏書目數據、館藏數字化資源數據;學科建設數據主要涉及本校學科專業設置、重點學科專業、專業師生人數,以及與之匹配的館藏種類與數量;讀者身份數據包括姓名、年齡、職業、學歷及專業、研究方向、興趣愛好、讀者級別等;讀者行為數據指讀者在使用館藏資源和各種網絡平臺的過程中所產生的時間、位置、檢索、下載、借閱、薦購、關注、評論等行為特征,以及對讀書環境的滿意度、對工作人員的滿意度、對薦購圖書處理的滿意度、對圖書館整體的感覺和認可度等心理活動。
(2)大數據預處理功能
大數據的預處理是指在數據分析之前,先對采集到的原始數據進行“清洗、填補、平滑、合并、規格化、一致性檢驗”等操作,以此提高數據的質量。圖書館讀者需求的數據來源,主要來自移動互聯網、圖書館網站、圖書館自動化管理系統、實地調研等,這些結構化和非結構化的數據是零散的、孤立的、異構的,利用這一功能對事先采集到的數據進行科學、合理的梳理,將不同來源、不同格式的數據進行有機集中,以支持多樣數據源與其他組件間的輸入和輸出,平滑運行。
(3)分析挖掘功能
是指從可視化分析、數據挖掘算法、預測性分析、語義引擎、數據質量管理等方面,對雜亂無章的數據,進行萃取、提煉和分析的過程。圖書館從讀者需求的角度,對數據進行分析挖掘主要表現在:依據讀者在利用圖書館資源的過程中所產生的各種行為數據,綜合考慮來自圖書內容和讀者需求的影響,找出讀者對圖書館數據平臺中各種內容的偏好規律,基于對讀者檢索、閱讀電子書、所訪問網頁等數據所顯示的讀者偏好分析,從而判斷是否滿足采購條件,以保障實現圖書的讀者驅動采購。
四、大數據技術對高校圖書館文獻資源采購的意義
1.實現了圖書采購的時效性
大數據環境下,數據價值的時效性特征愈加凸顯,利用大數據技術對圖書館數據庫中存儲的海量數據信息進行實時的收集和分析,從而快速及時地獲得讀者在最近時間段內對圖書館資源的利用情況,指導文獻資源采購工作,提高圖書采購質量的時效性。
2.實現了圖書采購的主動性
在傳統的文獻資源采購模式中,圖書館工作處于比較被動的位置,其原因之一是工作中缺乏科學數據的支撐。影響文獻資源建設的因素紛繁復雜,將大數據技術與高校圖書館藏書采購有機結合,以數據為支撐,深入挖掘與采購相關各因素之間的關聯,可以使采訪人員在工作中做到有的放矢,科學決策。在藏書采購過程中及時了解資源內容與讀者需求之間的關系,實現個性化的采書推薦和有針對性的采購,避免因被動盲目造成資源的浪費。
3.實現了圖書采購的預測性
大數據的核心價值是預測,通過對相關數據的深入挖掘,發現讀者的興趣偏好,預測讀者的需求,從而做出準確的采購決策和信息推送。讀者需求驅動采購是以讀者為中心的采購方式,一方面讀者可以直接代替圖書館采訪人員做出訂購決策,讀者選擇了該書,只要符合圖書館預設的訂購條件,即可自動進入訂購環節,因此需要工作人員根據數據分析結果做好前期的預測工作,設定科學的訂購條件參數,并為讀者提供精準的信息推送服務;另一方面采訪人員可以根據數據分析結果,從數據的角度量化讀者需求與文獻資源之間的關系,預測讀者需求,制定采購決策,增強館藏建設的針對性。
4.實現了傳統采購模式的新突破
大數據環境下的讀者需求驅動采購的工作要點是以用戶需求為中心,以大數據技術為手段,搭建起以各類數據為支撐的智能化的文獻采購數據管理平臺,讓讀者積極參與到圖書館資源建設中來,改變傳統圖書館館藏建設中存在的主觀、被動、盲目的弊端。大數據技術與高校圖書館館藏采購工作的結合,突破了傳統圖書館資源建設的藩籬。
五、結語
高校圖書館是構建學習型社會的主力,大數據環境下的讀者需求驅動采購,是根據學校學科設置、館藏結構優化和讀者需求導向等各項數據,深入挖掘其相關性,從而指導文獻資源的采購。圖書館需要從人才、技術、管理等方面綜合建設,建立健全相關制度,引進數據專業人才,運用大數據技術,根據館藏特點和采購原則,整合、分析各類讀者的需求數據,制定科學、合理的采購方案,優化采購流程和資源配置,建立以讀者需求為導向的資源建設模式。
參考文獻:
[1](美)維克托·邁爾·舍恩伯格.大數據時代[M].杭州:浙江人民出版社,2013
[2]孫冬雪.大數據環境下省級公共圖書館圖書采購模式研究[J].圖書館學刊,2016
[3]徐春艷,許麗麗,洪艷霞.大數據在高校圖書館信息資源建設中的應用探析[J].農業圖書情報學刊,2017
[4]王芙蓉.大數據環境下基于讀者決策的圖書館文獻資源采購模型研究[J].圖書館學研究,2017
[5]劉海英.大數據時代高校藏書采購模式發展探索[J].大學圖書情報學刊,2017
[6]曹樹金,劉慧云,王連喜.大數據驅動的圖書館精準服務研究[J].大學圖書館學報,2019
(作者單位:哈爾濱師范大學圖書館)