余夢媛



摘 要:?當前圖書館借閱量預測方法無法描述混沌性等非平穩變化特征,導致圖書館借閱量預測錯誤差大,為了改善圖書館借閱量的預測效果,設計了基于小波支持向量機的圖書館借閱量預測方法。首先對當前國內外圖書館借閱量的預測研究現狀進行分析,找到引起圖書館借閱預測誤差大的原因,然后收集圖書館借閱量預測的歷史數據,并通過混沌分析算法對歷史數據進行重新構造,并引入小波支持向量機實現圖書館借閱量預測模型的建立,最后與其它圖書館借閱量的預測方法在相同環境進行對比測試。提出的方法可以對圖書館借閱量的變化特征進行深度挖掘,圖書館借閱量預測精度超過95%,高于對比方法圖書館借閱量預測精度,獲得更加可靠的圖書館借閱量的建模和預測結果。
關鍵詞:?圖書借閱量; 混沌性特征; 數據挖掘; 混沌分析算法
中圖分類號: TP 393? ? ? 文獻標志碼: A
Prediction of Library Loan Volume Based on Wavelet Support Vector Machine
YU Mengyuan
(Department of Library, Henan Polytechnic Institute, Nanyang, Henan 473000, China)
Abstract:
Current library borrowing forecasting methods cannot describe the non-stationary change characteristics such as chaos, which leads to great error in library borrowing forecasting. In order to improve the forecasting effect of library borrowing, a library borrowing forecasting method based on wavelet support vector machine (WSVM) is designed. Firstly, this paper analyzes the current situation of the prediction of library borrowing volume at home and abroad, finds out the reasons for the large error in the prediction of library borrowing volume, then collects the historical data of library borrowing volume prediction, reconstructs the historical data through chaotic analysis algorithm, and introduces the wavelet support vector machine to establish the prediction model of library borrowing volume. Finally, it establishes the prediction model of library borrowing volume. The forecasting methods of library borrowing volume are tested in the same environment. The presented method can deeply mine the changing characteristics of library borrowing volume. The prediction accuracy of library borrowing volume exceeds 95%, which is higher than that of the comparative methods. It can obtain more reliable model and prediction results of library borrowing volume.
Key words:
book borrowing; chaotic characteristics; data mining; chaotic analysis algorithm
0 引言
隨著高校招生規模的不斷擴大,高校學生人數猛增,高校圖書館使用頻率越來越高,而圖書館借閱量預測結果是衡量一個學校圖書館信息系統一個重要評價指標[1-3]。圖書館借閱量的預測可以幫助圖書館管理人員了解學生喜歡那類圖書,可以對圖書進行有效管理,提高圖書館中圖書的利用率,同時可以幫助學生快速借到自己真正需要的圖書,因此圖書館借閱量的建模和預測結果對圖書館智能化管理具有重要研究意義[4-6]。
針對圖書館借閱量的建模和預測問題,國外的研究起步比較早,而且技術也比較成熟,而國內的研究雖然起步比較晚,但是我國投入了大量的人力、財力對圖書館借閱量的建模和預測問題,發展勢頭十分好[7-8]。圖書館借閱量的建模和預測研究可以劃為兩類2方法,一種是基于線性理論圖書館借閱量的預測方法,主要為回歸分析算法、灰色模型等,它們通過對圖書館借閱量相關數據進行分析,估計圖書館借閱量預測模型的參數,對于小規模圖書館,其它預測效果比較好[9],但是對于大型圖書館,它們借閱量預測精度比較低,這是因為現代圖書館借閱量不只具有線性變化特征,由于受到學生、圖書館環境、圖書種類等影響,具有一定的混沌性,這樣無法建立精確的圖書館借閱量預測模型。另一種是基于非線性理論圖書館借閱量的預測方法,引入了混沌分析算法、神經網絡、對圖書館借閱量的變化特征進行分析和描述,相于線線預測方法,該類方法的圖書館借閱量的建模和預測效果更優[10-12]。但是神經網絡是一種基于經驗風險小化的非線性預測方法,對圖書館借閱量的歷史數據規模有要求,因此圖書館借閱量預測結果不太穩定,而對于復雜多變的圖書館借閱量,混沌分析算法只能從一個方向對其特征進行描述,圖書館借閱量預測效果有待改善,因此圖書館借閱量的預測仍然是當前高校和各種科研院所關注的焦點[12-14]。
針對混沌分析算法、神經網絡等圖書館借閱量的預測方法預測錯誤差大的難題,以高圖書館借閱量預測精度為目標,提出了基于小波支持向量機的圖書館借閱量預測方法,引入數據挖掘技術中的小波支持向量和混沌分析算法聯合對圖書館借閱量進行預測,通過采用具體圖書館借閱量歷史數據對該方法性能進行測試。本文方法能夠有效描述圖書館借閱量的變化特征,圖書館借閱量預測精度超過95%,遠遠高于圖書館管理系統中對借閱量預測精度要求,而且預測效果要明顯優于其它方法,驗證了本文方法的可行性和優越性。
2 基于小波支持向量機的圖書館借閱量預測模方法
2.1 混沌分析算法
現代圖書館借閱量不只具有線性變化特征,由于受到學生、圖書館環境、圖書種類等影響,具有一定的混沌性,如果直接將圖書館借閱量的歷史數據xi,i=1,2,…,N進行建模,那么無法準確找到圖書館借閱量的歷史數據隱藏的變化特征,因此采用混沌分析算法對圖書館借閱量的歷史數據xi,i=1,2,…,N進行分析和處理,實現重新構造,得到一個新的對圖書館借閱量的歷史數據,即建模的學習樣本,具體如式(1)所示。
式中,m表示圖書館借閱量的嵌入維數,τ表示歷史數據的時間延遲數量。
2.2 數據挖掘技術
當前數據挖掘技術的類型很多,狀態回聲網絡、極限學習,支持向量機等,其中支持向量機的建模效果以用通用性更好,因此本文選擇其進行圖書館借閱量的建模和預測。圖書館借閱量歷史數據樣本數量為:n,它們組成一個集合:{(xi,yi),i=1,2,…,n},采用函數φ(x)對圖書館借閱量歷史樣本進行映射,并建立如下形式圖書館借閱量預測的回歸方法如式(2)所示。
式中,ω為權值向量,b為偏置向量。
要得到圖書館借閱量預測結果,首先要對ω和b進行準確估計,通過引入懲罰參數(C)得到如下的最小化形式如式(3)所示。
2.3 小波函數
從式(6)可知,要建立最優的圖書館借閱量預測模型,就需確定最合理核函數k(x,xi),當前核函數很多,但是都有它們各自的局限性,而小波函數具有較好的性能,本文選擇其構建最合理的核函數k(x,xi)。小波函數ψ(x)通過平移因子a和伸縮因子b是到許多小波函數組合,具體如式(8)所示。
2.4 圖書館借閱量預測步驟
(1) 針對一個具體的大學圖書館,與圖書館管理系統的管理員進行聯系,從圖書館管理系統中導出圖書館借閱量的歷史數據。
(2) 采用混沌分析算法對書館借閱量的歷史數據進行分析和處理,確定圖書館借閱量的嵌入維數和歷史數據的時間延遲數量。
(3) 根據圖書館借閱量的嵌入維數和歷史數據的時間延遲數量,建立圖書館借閱量建模學習樣本。
(4) 初始化小波支持向量機的參數,如懲罰參數(C)的值,小波函數的a和b的值。
(5) 采用小波支持向量機對圖書館借閱量建模學習樣本進行訓練,建立圖書館借閱量預測模型。具體如圖1所示
3 圖書館借閱量建模和預測的實例研究
3.1 圖書館借閱量數據來源
為了分析基于小波支持向量機的圖書館借閱量預測方法的性能,采用某大學圖書館的日借閱量歷史數據進行實例分析,具體如圖2所示。實驗平臺為:Intel 酷睿i9 9900K CPU,影馳ONE 240G SDD 硬盤,芝奇Ripjaws4 DDR4 8G RAM, Win10 OS。
3.2 圖書館數據的混沌分析算法處理
采用混沌分析算法分析對圖2中的圖書館借閱量歷史樣本數據進行分析,得到圖書館借閱量的嵌入維數和歷史數據的時間延遲值分別為:10和7,根據它們的值建立圖書館借閱量學習樣本數據,選擇最后100個數據作為驗證樣本,其它為擬合樣本。
3.3 本方法的圖書館借閱量預測性能分析
采用數據挖掘技術對圖書館借閱量的歷史數據進行擬合和預測,結果如圖3所示。
對從圖3可知,本文方法的圖書館借閱量擬合效果要優于驗證效果,但是它們的圖書館借閱量預測精度均相當高,可以滿足圖書館管理的實際應用要求。
3.4 與其它圖書館借閱量預測性能對比
為了體現基于小波支持向量機的圖書館借閱量預測方法的優越性,選擇回歸分析方法、RBF神經網絡的圖書館借閱量預測方法進行對比測試。統計它們的圖書館借閱量預測精度以及建模時間,結果表1所示。
對表圖書館借閱量預測精度和建模時間進行分析可以知道
(1) 本文模型的圖書館借閱量擬合和預測精度要優于回歸分析方法、RBF神經網絡的圖書館借閱量預測精度,降低了圖書館借閱量預測誤差,圖書館借閱量預測結果更加可信。
(2) 本文模型的圖書館借閱量建模時間要小于回歸分析方法、RBF神經網絡的圖書館借閱量建模,提高了圖書館借閱量建模速度,圖書館借閱量建模效率得到明顯改善。
4 總結
為了解決當前圖書館借閱量的預測方法存在的缺陷,設計了小波支持向量機的圖書館借閱量預測方法,在相同環境下,與其它圖書館借閱量的預測方法進行了對比測試,本文方法提高了圖書館借閱量預測精度,而且高于對比方法的圖書館借閱量預測精度,圖書館借閱量的建模速度更快,具有廣泛的應用前景。
參考文獻
[1] 馬蕾. 基于流通數據分析的高校圖書館館藏資源建設研究——以長江大學武漢校區圖書館中文圖書為例[J]. 農業圖書情報學刊, 2016, 28(11): 37-41.
[2] 胡烏仁. 大數據環境下高校圖書館讀者閱讀趨勢及特點分析——以內蒙古師范大學圖書館為例[J].內蒙古財經大學學報, 2016, 14(4): 144-148.
[3] 茹文,忻展紅. 圖書館借閱數據分類信息的關聯性研究[J]. 北京郵電大學學報(社會科學版), 2016,18(1):14-19.
[4] 喬慧君,周筠珺. 高校圖書館借閱率與學生學習狀態關系研究[J].大學圖書館學報, 2015, 33(1): 55-60.
[5] 張麗萍,楊琳,王雨荷.基于用戶借閱行為的館藏資源使用挖掘研究[J].圖書館理論與實踐, 2014,21(9):9-12.
[6] 趙楠. 高校圖書館讀者借閱行為分析及導讀策略研究[J]. 赤峰學院學報(自然科學版), 2014, 30(10): 96-97.
[7] 鄒梅. 圖書借閱量下降原因及對策[J].吉林工程技術師范學院學報,2013,29(7):54-55.
[8] 姬曼姝. 高校圖書館流通借閱現狀的統計分析——以內蒙古師范大學圖書館為例[J].圖書情報工作,2013,57(S1):178-181.
[9] 吳佳慧. 高校圖書館館際借閱服務影響效應的實證測度——基于南京部分高校圖書館的調查數據[J]. 圖書館,2018(11):99-105.
[10] 許志榮,陳倩,過榴曉. 基于時間序列分析的高校圖書館借閱量研究——以江南大學圖書館為例[J].農業圖書情報學刊, 2018, 30(10): 107-110.
[11] 宋妍,肖希明. 基于GM(1,1)模型的大學圖書館文獻借閱量預測與分析[J]. 云南師范大學學報(自然科學版),2018,38(6):35-39.
[12] 王蓉.基于云計算平臺的高校圖書館借閱信息管理系統[J].現代電子技術, 2018, 41(13): 182-186.
[13] 李樹青,莊光光,秦嘉杭,等.借閱場景下圖書專業性質量測度方法和圖書個性化推薦服務方法[J].圖書情報工作,2018,62(11):53-63.
[14] 劉春霞.支持向量機的用戶借閱行為分析——以河南理工大學圖書館為例[J].圖書情報導刊,2017,2(8):1-8.
(收稿日期: 2019.05.10)