吳澹寧 陳 敏
(1.浙江音樂學院圖書館 浙江杭州 310024)
(2.浙江省教育技術中心 浙江杭州 310012)
在高校圖書館日益重視數據統計的今天,越來越多的高校圖書館每年通過微信公眾號、圖書館網站等開放性平臺發布年度閱讀報告。圖書館年度閱讀報告,指圖書館收集、整理過去一年①中積累的各種數據,如借閱情況、入館情況、館藏資源使用、電子資源使用、各種服務與活動記錄等,經過采集、匯總、篩選、分析等步驟后形成的專項閱讀報告[1],是圖書館閱讀大數據統計工作的重要成果。按調研中各高校圖書館發布的年度閱讀報告詳盡程度,可分為普通微信版和完整數據版。前者以展示數據為主,創新表現手法讓讀者了解圖書館資源與服務情況;后者側重以專業統計方法,將圖書館全年的大數據在不同統計維度做詳細展示和分析。專業的閱讀報告,有助于找出數據間的關聯和特征信息,發掘出關鍵信息反映的客觀規律,推動圖書館資源建設,提升閱讀推廣的寬度和深度,完善和優化讀者服務,從而推進高校圖書館智慧化建設,支撐高校教學和科研規劃的科學決策,為建設世界一流大學和一流學科奠定堅實基礎。
重慶大學圖書館谷詩卉等人[2]、暨南大學圖書館都藍等人[3]和沈陽師范大學圖書館孫鵬[1]先后發表過高校圖書館年度閱讀報告的研究成果,主要分析了我國高校圖書館微信發布的年度閱讀報告,闡述了當前高校圖書館年度閱讀報告的主要特點和不足,提出了相應的完善策略。筆者旨在上述研究的基礎上,更全面深入地研究完整版年度閱讀報告的結構與內容,從專業性和可讀性兩個角度解讀圖書館閱讀數據的關聯分析、數據標準化及可視化展示等內容,探討年度閱讀報告編制工作的發展方向和專職“統計館員”的設立,以期在高校圖書館年度閱讀報告的編制工作和圖書館讀者行為綜合評估上提供一些意見和建議。
本次調研選取42所“一流大學”和10余所“一流學科”建設的高校圖書館,主要以各高校圖書館完整版年度閱讀報告為分析對象,通過微信公眾號、圖書館網站和微博官方號等泛化調研的途徑獲取各高校圖書館公開發布的年度閱讀報告、畢業生閱讀賬單和其他各類個人閱讀報告,經過電話、郵件、微信和QQ等細化溝通的方式同各高校圖書館辦公室、技術部門負責人或年度閱讀報告編制負責人,就完整版年度閱讀報告的詳細情況開展了關聯分析、可視化展示和報告編制等具體問題的討論和交流。
2017年,谷詩卉等人的研究顯示,大部分高校圖書館尚未開展年度閱讀報告的編制工作,僅收集到16個“985工程”高校圖書館的年度閱讀報告[2]。2018年,都藍等人的研究顯示,共計29所高校圖書館發布了微信版年度閱讀報告[3]。本次調研發現,2019年共有35所“一流大學”圖書館通過微信公眾號發布2018年度閱讀報告,占總數的83%,其中16所高校圖書館編制了完整版年度閱讀報告、8所高校圖書館編制了圖書館年度報告(年鑒形式,含數據統計版塊)。華東師范大學圖書館等高校圖書館同時發布了年度閱讀報告和圖書館年度報告,說明在“雙一流”高校圖書館這支隊伍中,絕大多數圖書館每年都會公開發布年度閱讀報告,十分重視閱讀報告的編制和相關統計工作。
3.1.1 注重結構與內在聯系
2019年2月4日,北京大學圖書館在其微信公眾號發布微信互動H5形式的年度閱讀報告及PDF格式的完整報告[4]。報告整體結構以本館概況、到館與主頁訪問、資源檢索與利用、讀者借書及其特征和新媒體與閱讀推廣為主線,以具體項目類別作劃分,各統計項目間具有良好的內在聯系與分類定義。報告首先歸納過去一年的總體概況,其次統計了讀者到館數、在線訪問量和資源利用率等,隨后分析了被利用資源及其讀者具備的特征規律,最后總結了圖書館運用新技術新設備在閱讀推廣上所做的努力和取得的成效。
3.1.2 重視數據可視化展示
相比傳統圖表,數據可視化是更生動、友好的表現形式,呈現隱藏在龐雜數據背后的事實數據。通過交互式實時數據可視化大屏來發現并診斷業務問題已成為越來越多大數據解決方案中的重要一環[5]。2019年1月14日,中國美術學院圖書館微信公眾號發布了在阿里云DataV平臺制作的可視化數據報告[6]。從其數據大屏中不難發現數據可視化的主要特點,即多樣性和可視性。多樣性即通過鉆取、聯動、維度切換等分析操作,使讀者從多個角度、多個側面觀察了解數據,使得數據更為立體且富有生命力;可視性則讓數據以圖像、動畫、三維圖形等多種形式呈現,數據更為直觀、更具可讀性[7]。
3.1.3 強調數據挖掘,提高分析質量
2019年5月7日,上海交通大學圖書館在其官網發布2018年讀者閱讀狀況分析報告[8]。上海交通大學圖書館的年度閱讀報告以數據分析為主體,輔以少量圖表,體現了閱讀數據深入分析的專業性。針對借閱榜、預約榜、續借榜的統計,不再展示詳盡的熱門榜單,使用小標題“史海鉤沉,鑒古知今”“鯤鵬展翅,智能延伸”“舟舶繼路,物聯引領”,結合時事熱點總結讀者對人工智能和現代物流等領域的關注和學習興趣。報告簡明精煉,視角獨特,深刻地剖析了數據背后蘊藏的信息與規律,與單純依靠數據堆砌的閱讀報告形成鮮明對比。
3.1.4 樹立品牌意識,強化讀者互動
2018年初,廈門大學圖書館對其年度閱讀報告項目“圕·我和你”進行了全面的品牌升級,推出以“Library Go”為主題的年度閱讀報告。報告分為“Library Go UP”(向上的圖書館)、“Go to Library”(一起去圖書館)、“LibraryGo”(智慧圖書館)、“Library Go”(圖書館走出去)和“Go with Library”(和圖書館一起成長)五部分[9],將數據展示轉化為圖書館資源服務與發展歷程的講述,體現數據展示與讀者體驗的深度融合,反響極佳。
2019年1月6日,武漢大學圖書館微信公眾號通過“大魔王毀滅圖書館的清單”,讓讀者了解武漢大學圖書館過去一年中的點點滴滴[10]。在文末設置了三個開放性問題,例如“同學們,在你們想象中的未來,還有圖書館的存在嗎?未來的圖書館應該是什么模樣呢?”等,吸引讀者參與和分享閱讀報告,為圖書館建設和發展建言獻策。
天津大學圖書館制作的2018年度閱讀報告中統計了預約圖書到館時間在60天以內的取書情況,得出取書量隨到館時間的變化趨勢為:預約圖書的到館時間在3周內,成功取書量明顯高于超期未取;若到館時間超過4周,取書率則會明顯下降。建議適當考慮恢復超期管理制度或優化預約圖書借閱權限的設置,加快圖書流通,縮短預約圖書的到館時間。
可見,圖書館科學管理和服務提升可以依靠閱讀數據的專業分析和深度挖掘。總結調研中各高校圖書館該方面的優秀做法,發現一是統計項目的設置應當盡可能覆蓋圖書館所有資源、服務和活動,確保數據的真實性、完整性和多樣性;二是數據分析的切入點應立足每個學校的實際情況和需求,堅持以問題為導向、按需謀劃,滿足協助教育教學和管理等多元化科學決策的需要。
4.1.1 加強數據關聯分析,助推高校科學決策
圖書館閱讀大數據的統計分析應當加強閱讀數據與教育教學數據的聯動性。例如,通過學生學段和選課數據聯動借閱書籍分類統計發現:大一新生較為關注基礎課程的學習,教學參考書的借閱占很大比重;大二大三學生隨著學業的深入對人文社會科學類等拓展知識面書籍的需求會逐漸增加;大四學生面臨畢業就業壓力,更傾向于專業知識和技能的書籍。類似這樣的關聯分析,不僅有利于圖書館館藏建設和資源布局的決策,同時對學校課程設置和教學規劃、學生知識體系構建、教師素養提升方面等都有積極的指導意義。
4.1.2 用好閱讀大數據,辦好智慧化高校
智慧校園的建設旨在校園內部存在信息孤島的情況下,整合學校相關資源與數據,創建“校園大數據池”,對師生的實際需求開展動態分析和精準評價,對相關反饋能及時響應和主動調整,本著“辦人民滿意教育”的宗旨,使校園建設更符合師生身心發展和內心期盼[11]。西安交通大學等國內知名高校現已建立校內大數據平臺,包括學生大數據分析與服務平臺、教育教學質量實時監測大數據平臺等,實現對學生的全息個性畫像算法,全面了解學生的生活、學習、身心等行為特征和發展規律,發現問題及早介入。高校圖書館作為校內重要的資源承載者和信息傳播者,閱讀大數據的精準分析和深入挖掘能夠生動地描繪師生學習、教學和科研等多方面的行為細節,將其納入智慧校園大數據平臺,對全面解讀和評估師生在校行為將起到重要作用。
圖書館經歷了從傳統紙本到數字圖書館、移動圖書館的轉變,現正逐步向智慧圖書館發展[12]。圖書館不再只是狹義的作為一個為讀者提供紙質文獻、電子資源和信息咨詢服務的場所,而將成為一座讀者獲取知識、分享知識和創造知識的殿堂,隨之產生的行為數據是海量的、非結構化和多元復雜的。僅本次調研收集到的18份完整版年度閱讀報告中的統計數據,就包含了借閱、入館、資源檢索與訪問、微信訪問與點贊、薦購、自助打印復印服務、研修空間使用、超期罰款、各種講座或信息服務的參與、學科情報分析、新媒體服務等十幾種行為和幾十種維度。因此,將不同類型的數據進行整合和標準化處理形成對師生在校行為分析與評價的有效數據集合就顯得勢在必行。
數據標準化就是將數據按比例縮放,使之落在一個特定的區間(一般是[0, 1]),主要包括數據同趨化和無量綱化兩方面。同趨化處理是解決數據不同性質的問題,先改變逆指標數據的性質,使所有指標對評測的作用力同趨化[13]。無量綱化處理是解決數據的可比性,主要方法有Min-Max標準化和Z-Score標準化,計算方法見公式①和公式②[13]。經過標準化處理,原始數據轉換為無量綱的純數值,可用于多指標的評價體系。例如,四川大學圖書館2018年度閱讀報告中設計的“圖書館資源綜合利用指數”,充分借鑒了數據標準化的理念,按部門、專業、班級和個人,分別計算了圖書外借量、預約量、入館量和數字資源訪問量等占各自總量的比例,求和得到資源的綜合利用值,為揭示不同讀者人群對圖書館四項服務的綜合利用情況提供了數據保障。

數據可視化有助于增強數據的處理和組織效率,幫助人們處理復雜信息并增強記憶。實現數據可視化,可從以下三個方面著手:①以豐富的圖形呈現,替化數據羅列。每項數據都有特定的屬性和對應的數值,在理解數據屬性的基礎上,選擇合適的圖表應從所需傳達的信息和數據分析的目的出發。②以優化設計的圖表,展現數據內涵。數據可視化的設計和制作宜把握信、達、雅原則,既要精準展現數據的差異、趨勢和規律,又要以精致的表現手法準確傳遞核心思想,如補充必要的統計方法說明、用醒目的顏色突出重點數據、避免不必要的設計缺陷等。③以數據故事的形式,揭示本質規律。數據可視化的本質是數據和讀者之間的對話,是通過數據傳遞給讀者具體信息。數據報告中聯結各統計模塊和圖表的線索就是一種“表述結構”,常見的有作者驅動型、讀者驅動型和馬提尼酒杯型。作者驅動型就是故事有明確的開頭和結尾,讀者必須按照預先的設定來聽故事,如北京大學圖書館年度閱讀報告;讀者驅動型與之相反,沒有明確的開頭,給讀者足夠的空間去提出問題和探索數據;馬提尼酒杯型是將作者驅動型和讀者驅動型結合,讀者要沿著作者預設的單一路徑開始閱讀,當這一過程結束,讀者便可以自由探索[14]。
2017年讀書節,廈門大學圖書館設計發布了體系化的讀者積分規則[15]。讀者在圖書館主動參與的任何事情都可以獲得積分,包括OPAC、微信和APP客戶端等,所獲得的積分可用于兌換圖書館文創產品、增加借閱權限和抵扣罰款,通過讀者積分制度的推行大大提高了讀者對圖書館資源和服務的利用率,增加了讀者積極參與圖書館建設的能動性。
廈門大學圖書館等高校圖書館推行的讀者積分制度是對圖書館讀者行為評價體系建設的積極探索。筆者認為圖書館可以設立自身獨立的讀者行為評價指數(簡稱“圖書館指數”),用于各類型各維度的閱讀數據綜合評估。根據本校學生的閱讀習慣和實際情況,綜合考慮各種圖書館行為(包括借閱、入館、薦購、閱讀推廣活動、新生入館培訓、志愿者活動等)的評估后,設定各項指標在圖書館指數中的權重系數,定期分析讀者個人的圖書館參與度,實現全方位、立體式的科學發展性評價,并能真正通過評價促進學生閱讀習慣的養成和閱讀能力的提升,計算公式見③~⑧:

基于本次“雙一流”高校圖書館年度閱讀報告的調查研究,閱讀報告編制工作的發展大體可總結為四個階段:①數據的采集、統計和展示階段,即普通微信版報告的發布,目前多數高校圖書館閱讀報告的編制還停留在這個階段;②統計項目的豐富和簡單分析階段,即完整數據版報告的編制。北京大學圖書館、天津大學圖書館、上海交通大學圖書館等高校圖書館的年度閱讀報告就符合專業性、精準化等諸多要求;③數據的關聯性分析和可視化展示,即一份精致報告的形成,圖書館閱讀數據只有與教學數據(選課、成績等在校行為)、學科數據(師生科研)和管理數據(圖書館管理、校園管理等)產生聯動,充分運用數據可視化技術,以精煉的語言精準地剖析問題的實質,才能兼顧閱讀報告的專業性和可讀性,展現數據之美;④閱讀報告影響力及價值的升華。閱讀報告的真正價值不應局限于總結過去的情況,更重要的在于預測未來發展趨勢,提出建設性意見并指導實際工作。
注釋:
① 年度閱讀報告的統計時間為自然年。