王 雪,金 玲,蘇曉宏
(1.大連民族大學 圖書館,遼寧 大連 116605; 2.大連海事大學 圖書館,遼寧 大連 116026)
?
基于數據挖掘感知讀者借閱規律的智慧型圖書館建設
王雪1,金玲1,蘇曉宏2
(1.大連民族大學 圖書館,遼寧 大連 116605; 2.大連海事大學 圖書館,遼寧 大連 116026)
摘要:以大連民族大學所有本科生讀者兩年借閱流通數據為研究對象,利用數據挖掘與統計分析的方法,通過天、周、年三個時間尺度深入分析了讀者借閱行為的時間特性與周期特性,進而感知讀者需求與目前服務的不匹配之處,最后對應優化各種業務流程使圖書館更加智慧地為讀者提供服務。研究表明,通過大數據分析方式來感知讀者借閱行為規律,對于提高圖書館服務水平、建設智慧型圖書館具有非常重要的意義。
關鍵詞:借閱行為;數據挖掘;智慧型圖書館
隨著科技的迅猛發展和社會環境的變遷,越來越多的圖書館開始從傳統型和數字型向智慧型邁進。智慧圖書館建設已成為圖書館界既定的發展戰略,國內外也掀起智慧圖書館建設和研究的熱潮[1]。智慧圖書館主要利用新一代信息技術來改變用戶和圖書館系統信息資源相互交互的方式,以便提高用戶獲取信息的明確性、靈活性和響應速度,從而實現智慧化服務[2]。智慧圖書館的核心理念是以人為本,以用戶需求為主導[3-4],最終實現圖書館各項服務的智能化、全面化、人性化[5]。如何達到深度感知讀者需求,以期給讀者提供個性化、人性化的服務日益成為智慧型圖書館建設的靈魂。
圖書借閱是圖書館為讀者提供服務的傳統方式和主要途徑,甚至可以認為借閱行為是讀者與圖書館產生關系的最重要的表現形式。考慮到圖書借閱服務的重要性,對用戶借閱流通數據的分析和挖掘是提高圖書館讀者服務、優化工作流程的核心內容,也是進一步深入開展文獻信息服務的重要基礎[6]。本文以大連民族大學所有本科生讀者2012年1月至2013年12月兩年借閱流通數據為研究對象,分別通過天、周、年三個時間尺度對讀者借還書情況加以分析,進而深入挖掘讀者借閱行為的時間特性與周期特性。通過實證數據的分析與挖掘,針對智慧圖書館的建設提出了優化策略,取得了良好的服務效果。
一、以天為單位讀者借閱行為的分析及優化對策
圖書館開館時間為上午8:00至下午4:30,午間不閉館。以天為單位,讀者借還書時間規律如圖1。

(a)每天借書行為時間分布圖

(b)每天還書行為時間分布圖
橫軸代表時間,縱軸代表在此時間段內圖書被借閱和歸還的數量。根據圖1可以挖掘出圖書館接待讀者的高峰時間有兩個,分別為上午10點和下午3:30分左右,借書的數量在這兩個高峰點分別達到了4 754冊和3 600冊,而還書的數量也分別達到了4 705冊和3 020冊。針對該結果進行分析后發現,學生借還書行為和他們的上課時間安排息息相關。學生每天的上課時間安排為8:00-9:40,10:00-11:40,13:30-15:10以及15:20-17:00。學生一般在上午第一節課下課(9:40)以及下午第一節課下課時間(15:10)來借還書。此外,借還書行為時間規律圖如圖1(a)和(b),可以發現開館有還書小高峰現象,閉館有借書小高峰的現象。剛開館的8:00-9:00這個時間段里,學生的還書行為很多,而借書行為很少,根據統計借書行為是還書行為的2.12倍。產生這一結果的主要原因是如果學生需要借閱書籍的話,需要進入館內進行圖書查找、瀏覽和比較,經過一段時間才能產生借書行為,而還書在入館時就可以進行。在下午4:00-4:30這個時段會出現借書的小高峰,借書行為是還書行為的4.35倍,這主要是由于下午4:30借閱部門停止借書。 由圖1可以看出,學生借還書行為的高峰時段雖然非常接近,但是還書高峰時間總是領先于借書高峰時間。出現這種情況有兩個原因:一是大連民族大學本科生可借閱書籍的數量是有限的(普通學生借書量為5本,優秀學生借書量為8本),一般需要先歸還完書籍,才有資格借閱其他書籍;另一個原因是圖書館門禁的限制致使學生會先歸還圖書,再進入館內花費時間去檢索和查找自己所需要的書籍,這就導致還書高峰出現在借書高峰之前。基于以天為單位對讀者借閱行為的分析,本校圖書館的流通部門以人為本,以用戶需求為主導,在讀者出現借還書高峰的時間段適當增加了流通窗口。尤其在每天剛開館時,一般還書會出現一個小高峰,因此流通部門靈活調配工作人員,為讀者提供更加便捷更加智慧的借閱服務。
二、以周為單位讀者借閱行為的分析及優化對策
圖書館每周的開館時間為周一至周六8:00-16:30,其中周四、周六開館時間為8:00-11:30。讀者以周為單位借還書行為規律見表1。

表1 以周為單位讀者借書與還書統計表
每周有兩個借還書高峰期:周一和周五。其中,周一是借還書的最高峰,數量分別達到了43 948冊和46 667冊,分別占每周總借書量的25.3 %和總還書量的27.6 %,這主要是由于周六開館半天和周日全天閉館導致的。此外,周四下午閉館導致周五出現另一個小高峰,借書和還書數量分別為36 386冊和34 844冊,分別占每周總借書量的21.0 %和總還書量的20.5 %。基于此分析結果,一方面,流通部門在借還書的高峰時間周一和周五適當增加流通窗口,合理安排工作人員。另一方面圖書館也逐步意識到:正是由于圖書館的工作安排(周四、周六半天閉館,周日全天閉館)而導致讀者每周借還書比例出現了兩個高峰。如果沒有這三次閉館安排,讀者的借閱情況從總體看來每周應該呈現出平穩的發展態勢。因此可以考慮在三次閉館時間內,適當開放部分流通窗口,這樣既滿足了學生隨時的借閱行為,也緩解了工作人員在某個時間段內的壓力,使流通部門更好的安排和調配工作人員,同時為讀者提供更加人性化的服務。
三、以年為單位讀者借閱行為的分析及優化對策
本研究所使用的數據是大連民族大學本科生讀者2012年1月至2013年12月兩年借閱流通數據。由于這兩學年寒暑假時間只差一天,時間上幾乎是重合的,因此直接將兩年的數據疊加到一起進行分析。此外為了平滑數據,以周為時間段統計借還書情況。以年為單位讀者借閱行為的時間規律如圖2,橫軸代表一年中的第幾周,縱軸代表在該周圖書被借閱和歸還的數量。

(a)每年借書行為時間分布圖

(b)每年還書行為時間分布圖
由于寒暑假的原因導致出現了兩個學生借還書比例特別少的時間段如圖2。第4-9周和30-34周。寒暑假每個周三上午的9:00-11:30流通部會開館接待讀者,所以在寒暑假會有少量的學生借閱記錄。通過比較可知,暑假借還書數量明顯多于寒假,原因在于暑假有很多學生會選擇留在學校繼續學習或者找些兼職來做繼續呆在校園。而寒假由于春節的存在,絕大多數學生都會離開學校,導致讀者的借閱行為很少。因此為了更好的滿足留校學生的閱讀需求,流通部門應適當地增加暑期的開館次數以及開館時間,從而更加有效的為讀者服務。
學生寒暑假開始的前2周所借閱的書籍可以順延到開學之后的一周內歸還,否則將產生超期罰款,這就導致在寒暑假開始的前2周之內以及寒暑假結束之后的1周(第10周和第35周)出現了一個借還書的小高峰。但也應注意到寒暑假的影響不是完全相同的,暑假結束后由于大四學生離校而新入校的大一新生還沒有開始借閱書籍,暑假結束以后1周(第35周)的小高峰明顯低于寒假后的1周(第10周)。也正由于大四學生的離校(大約在第25周),導致還書的數量在暑假前出現了一個小高峰,達到了7 100冊。而在新生結束為期兩周的軍訓(大約在第37周)開始大量涌入圖書館時,此時借還書的數量出現了一個高峰,分別達到了5 900冊和4 050冊,已經達到甚至超過了大四學生離校前借書的平均數量。從新生開始出現借閱行為的37至52周,借還書的數量保持了比較平穩的整體態勢。在此時間段內,我們應注意到借還書的數量都有個明顯的低谷和高峰。產生低谷的時間是第40周左右,這個時間正好是國慶小長假,而產生高峰的時間是12月末,原因和學生的考試需求有關,另外這段時間也是寒假假期借書時間的開始。
通過以上對讀者全年借還書情況每個時間段的詳細分析,流通部門可以根據學校校歷以及學校工作的安排比較準確的預測出學生借還書出現的高峰和低谷,以此為依據合理安排流通窗口以及工作人員數量,保證在任何時間都能根據讀者需求給讀者提供方便快捷的服務。
四、單本圖書借閱時間分布的數據挖掘及優化對策
單本圖書借閱時間的分布,即每本書籍在讀者手中滯留的時間如圖3,橫軸代表讀者持有某書籍的天數,縱軸代表在此天數有多少本書籍被讀者持有。由于本科生單本圖書的可借閱時間是一個月,否則將產生超期罰款,這就導致讀者對書籍的持有時間集中在1至30天,同時在這個時間段內出現周期性的高峰(均為7的倍數天),這與之前章節中所分析出周一是每周借還書的最高峰一致。學生對書籍持有天數在31至36天之間的數量是非常大的如圖3。這部分有可能是用戶超期未還書造成的,也可能是用戶續借造成的。但不論哪種原因,都說明目前給本科生設定的一個月的借閱時間偏短,造成一些讀者要繳納超期罰款的現象。因此流通部門適當增加單本圖書的可借閱時間,使流通制度的設置更加符合讀者實際的閱讀需要。

圖3 讀者持有書籍時間分布圖
在圖書被借閱36天之后的整體態勢是趨于下降,但在50-70天又出現了一個小高峰。產生這種情況的原因一是讀者對所續借書籍會在這個時間段歸還,因為第一次借書外加續借時間的最大期限是60天。二是讀者對所借書籍的持有時間也可能會跨越寒暑假,經過實證數據驗證發現主要是后者這種情況,因此目前圖書館針對跨越寒暑假借閱行為的處理是合理的,順延還書的措施滿足了讀者需要長時間借書的需求。
五、結語
通過對讀者借閱數據的分析與挖掘來感知讀者借閱行為的時間特性與周期特性,根據讀者需求和圖書館目前服務之間的矛盾進行有針對性的改進,從而更加智慧地為讀者提供借閱服務。通過本文研究可以發現:智慧型圖書館建設不但要基于物聯網、云計算、移動網絡等高新技術,基于數據挖掘的用戶信息感知技術也是其中的一個重要環節[7]。因此今后在智慧型圖書館建設過程中,既要能在分析用戶需求的基礎上保證其服務的先進性與全面性,也要能全面把握現有用戶資源,對用戶各種行為數據進行智能感知。只有將基于大數據分析的用戶行為感知和以人為本的業務流程再造有機融合起來,才能使圖書館更加智慧地為讀者提供服務。
參考文獻:
[1] 李顯志,邵波. 國內智慧圖書館理論研究現狀分析與對策[J]. 圖書館雜志,2013(8):12-17.
[2] 嚴棟. 基于物聯網的智慧圖書館[J]. 圖書館學刊,2010(7):8-10.
[3] 劉麗斌. 智慧圖書館探析[J]. 圖書館建設,2013(3):87-89.
[4] 烏恩. 智慧圖書館及其服務模式的構建[J]. 情報資料工作,2012(5):102-104.
[5] 梁轉琴. 智慧圖書館實現的條件探析[J]. 圖書館學研究,2013,14:6-9.
[6] 樊超,郭進利,紀雅莉,等.基于圖書借閱的人類行為標度律分析[J].圖書情報工作,2010,15:35-39.
[7] 劉宇初.基于定量判別方法在高校圖書借閱信息群中行為數據挖掘的應用[J].科技傳播,2012,14:181-182.
(責任編輯王楠楠)
SmartLibraryConstructionbyPerceivingReaders’BorrowingRegularityBasedonDataMining
WANGXue1,JINLing1,SUXiao-hong2
(1.LibraryofDalianMinzuUniversity,DalianLiaoning116605,China; 2.LibraryofDalianMaritimeUniversity,DalianLiaoning116026,China)
Abstract:Inthisstudy,wefocusonalltheundergraduatereaders’circulationdatawithintwoyearsinDalianMinzuUniversity,andthoroughlyanalyzethetimeregularityandperiodicityofreaders’borrowingbehavioratday,weekandyeartimescalesbyutilizingthemethodsofdataminingandstatisticanalysis.Andwecanperceivethatourcurrentservicedoesnotmatchreaders′demand.Finallybycorrespondinglyoptimizingvariousworkflow,thelibrarycanprovidesmarterserviceforreaders.Thisstudyillustratesthatperceivingthetimeregularityofreaders’borrowingbehaviorbybigdataanalysisissignificantforimprovingtheserviceandconstructionofsmartlibraries.
Keywords:borrowingbehavior;datamining;smartlibrary
收稿日期:2015-07-24;最后修回日期:2015-10-20
基金項目:國家自然科學基金項目(61374170);遼寧省高等學校杰出青年學者成長計劃(LJQ2013125)。
作者簡介:王雪(1979-),女,遼寧鐵嶺人,館員,主要從事數據挖掘及智慧型圖書館建設研究。
文章編號:2096-1383(2016)04-0433-04
中圖分類號:G250
文獻標志碼:A