999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

讀者借閱行為的時間序列分析及預測

2013-04-25 09:51:28
河北科技圖苑 2013年5期
關鍵詞:分析模型

張 淼

(華南師范大學圖書館 廣東 廣州 510631)

1 研究背景與目的

隨著信息研究范式從“以系統為中心”到“以用戶為中心”的轉變[1],對用戶信息行為的全面分析日益成為圖書館學研究的熱點。讀者的借閱行為是讀者最主要的信息行為之一,對讀者借閱歷史行為的客觀記錄進行分析,可以改變讀者工作主觀經驗積累的現狀,也是圖書館開展深層次服務工作的前提條件。同時,隨著圖書館信息化的發展,館藏信息資源的購買數量、比例分布都發生了明顯的變化,對讀者借閱行為的發展趨勢進行分析和預測,可以了解紙質館藏借閱的發展情況、變化規律,完成預測未來行為等決策性工作。而時間序列分析,作為統計分析預測的方法之一[2],可以對讀者借閱行為進行良好的分析與預測。

2 研究方法及研究對象

所謂時間序列分析(Time Series Analysis),是一種動態數據處理的統計方法,該方法基于隨機過程理論和數理統計學方法,研究隨機數據序列所遵從的統計規律,以用于解決實際問題[3]。時間序列分析方法豐富多樣,有不同的流派和方法,其中簡單回歸分析法、趨勢外推法、指數平滑法等都是產生時間較長且較簡單直觀的分析方法。而B-J算法的ARMA、ARIMA模型等則是較新的、近期才逐漸受到關注的方法。這些方法對時間序列有著不同的考察角度,因而有著自己適合的分析領域和用途。本文根據讀者借閱數據的序列特點,選取其中適合的三種模型分別進行比較分析。

通過華南師范大學圖書館(以下簡稱本館)匯文文獻信息服務系統中的統計模塊,以2000年1月1日到2011年12月31日為限,收集一校三區圖書館(石牌校區、大學城校區、南海校區)11年以來的紙本中文圖書的借閱信息,分別進行統計整理與分析。本研究使用SPSS17.0作為統計分析工具。

3 時間序列分析與預測

3.1 時序特性分析

為了建立適宜的時序模型,首先需要對序列的特性進行分析,即對時間序列的隨機性、平穩性、季節性的判斷分析。圖1是根據正在流通的中文圖書的借閱數據繪制的時序曲線圖,即時序分布圖。

圖1 時序分布圖

從圖1直觀地看,數據從2000年開始慢慢走高,在2008年開始回落,之后漸漸走低。序列是帶有明顯的趨勢性、波動性、伴有周期性的季節變動的非平穩數據,且波動幅度不斷增大。由于序列中數據較多,可以繼續利用自相關函數圖(自相關函數圖是序列平穩性考察中首當其沖的圖形工具,對識別時間序列的各種非平穩性和確定時序模型中的參數有非常重要的作用[2])進行序列判斷。圖2是本序列的自相關函數圖,由圖2可知,25階自相關函數值大部分超出隨機區間,序列為非平穩序列,具有趨勢性、波動性變動,并在k=6、12、18、24處取值較大,再次確認序列具有明顯的季節性。

圖2 自相關函數圖

運用時間序列分析法的關鍵就是模型選擇,根據時間按序列的特性選擇一個與實際過程相吻合的模型結果,即模型選擇[3],不同的時序分析方法采用不同的工具選擇模型。根據本序列的時序特征分析,可以初步選定三類模型:傳統時序分析中的指數平滑模型(假設為A型)、隨機時序分析中的ARIMA模型(B型)、季節分解模型(C型)。接下來分別闡述并比較三種模型。

圖3 預測殘差

3.2 指數平滑模型

指數平滑模型是在B-J方法產生之前最為常見的一種方法,它是在加權移動平均法的基礎上形成,可以對不規則數據加以平滑,從而獲得其變化規律和趨勢,以此對未來的數據進行預測[4]。主要有三種方法:Simple、Holt、Winter。這些模型在其趨勢和季節構成方面是不同的,根據對趨勢和季節的不同假設,可任一選擇相應的模型對不規則構成的時間序列進行平滑處理[5]。本序列采用季節性指數平滑WINTERS。統計結果顯示:平穩的R方值為0.681,R方為0.853,從兩個R方值來看,該指數平滑模型的擬合情況比較良好。殘差的自相關圖(ACF)和偏自相關圖(PACF)如圖3所示,可見兩個圖形都沒有顯著的趨勢特征,故可以初步判斷本序列所用模型比較適當。預測結果和擬合圖形輸出如圖4所示,可以看出觀測值與預測值的擬合情況,最初的幾年擬合良好,之后前期不如后期。這與指數平滑模型的特點一致,指數平滑法的不足是模型有一定的不確定之處,預測只根據部分數據,對全部數據中的信息利用不足,因此如果是對2012年預測,可以選取比較臨近的數據進行預測。下面介紹的ARIMA模型將對序列的整體趨勢利用得更充分。

圖4 指數平滑模型擬合值圖

3.3 ARIMA隨機時序模型

ARIMA是自回歸綜合移動平均模型(Autoregressive Integrated Moving Average Models),是隨機性時間序列分析的代表性方法[2],也是時間序列分析模型中非常通用的方法[6],最常用于含有季節成分時間序列的分析[7],對于同時存在趨勢性和季節性的序列,其模型一般記為 ARIMA(p,d,q)(P,D,Q)s,其中P、Q為季節性的自回歸和移動平均階數,D為季節差分的階數,s為季節周期。ARIMA實際上是建立在平穩序列基礎上的,因此首先要對非平穩數據轉換為平穩序列。

3.3.1 數據平穩化處理

平穩化指根據序列的特點和分析的需要對數據進行必要的變換處理,目的使序列的特征體現得更加明顯,利于模型的選擇,包括階差分、季節差分、對數轉換等。過多平穩化處理的數據不能真實的反應數據的特點,但如果平穩化不足,也會給后面的預測帶來很大的誤差。由以上分析可知本序列具有趨勢性及季節變動,可進行一階逐期差分,發現序列在K=6,12時,自相關系數均較大,具有季節變動,對一階差分序列再進行一階季節差分,再繪制差分后序列的自相關圖和偏自相關圖,如圖5、6所示,序列的趨勢、季節變動消除,序列已基本平穩。

圖5 平穩化后的自相關圖

圖6 平穩化的偏自相關圖

3.3.2 參數確定

接下來,根據前面進行的差分過程,嘗試建立ARIMA模型,并考察模型效果。AMIMA的完整形式是 ARIMA(p,d,q)(P,D,Q)s。平穩化處理中進行一階逐期差分和一階季節差分,得到了一個基本平穩的序列。于是模型中d和D應同時取1;從自相關圖5看,1階以后函數值明顯趨于0,呈拖尾性,可取q為1,而12階的函數值明顯不為0,因此Q可取1;再看偏自相關圖6,前3階函數值均顯著不為0,之后慢慢趨于0,因此P可取3或4,而第12階值在線以內,因此P可取0。于是得到初步的模型形式為:ARIMA(3,1,1)(0,1,1)12或 ARIMA(4,1,1)(0,1,1)12,比較以后可選前者,模型分析結果如圖7所示。

圖7 ARIMA模型擬合圖

3.4 季節分解模型

以上兩種模型都是把季節性周期作為序列利用中的一個成分在預測時加以利用,而季節分解模型目的是將季節因素提取出來,從而更便于對剩余序列做進一步的分析[2]。季節分解法認為,時間序列有4種成分,分別是:趨勢性T(Trend)、季節性S(Seasonal)、周期性P(Periodicity)和不規則波動性I(Irregular Variations)。這些成分通過不同的組合方式影響時間序列的變化,通常分為加法模型和乘法模型。加法模型的一般形式為Y=T+S+P+I,乘法模型的一般形式為Y=T×S×P×I。由于本序列具有趨勢性及明顯的季節性,因此在季節分解中應引入趨勢因素、季節因素,序列上下波動幅度有增大的趨勢,這點提示可以采用乘法模型。基本過程為先通過移動平均消除序列中的季節性和其他波動,再剔除趨勢因素,計算出季節指數(SAF),之后剔除季節成分,得到季節調整的序列(SAS),再進行平滑處理得到循環波動序列(STC),最后根據STC值進行線性回歸,預測2012年的借閱量。由SPSS進行季節分解,可以得到四個新變量:ERR(誤差項)、SAS(季節調整)、SAF(季節指數)、STC_1(周期變化指數)。季節指數如圖8所示,每年的2月是寒假,是借閱量第一個最低點,之后3月份開學是整年中借閱量最大的月份,之后一路走低,到8月份是整年借閱量的最低點,暑假開學后由于各類考試的增多,借閱量不斷走高。對獲得的STC值進行SPSS中的專家模型預測,將預測值與季節指數相乘,最終得到2012年的預測值。

圖8 季節比率圖

圖9 季節分解法擬合圖

4 分析、預測及結論

4.1 各模型比較分析

對歷史數據擬合效果分析,由圖4、7、9可以看出,三種模型的擬合效果都不錯,他們對2012年預測如表1所示,將表格作折線圖如圖10所示。從三種模型對借閱量的擬合與試預測效果看,ARIMA模型的精度高于傳統模型;在傳統模型中,WINTERS指數平滑法效果略好于季節分解法。ARIMA模型適用于短期預測,若預測借閱量下一年各月的變化,在外界環境相對穩定的情況下,從實用的角度可選用 ARIMA(3,1,1)(0,1,1)12預測較好,若預測借閱量一段時期的變化,ARIMA模型可能不如傳統時序模型。

表1 2012年1-11月借閱實際值與各模型預測值

圖10 2012年1-11月借閱實際值與各模型預測值

4.2 各校區館藏、借閱量比較分析

利用時間序列圖的比較分析仍然可以發現一些有趣的結論,例如,對石牌校區、大學城兩校區的館藏及借閱年度增長量進行比較分析,如圖11。可以看出,2006年到2012年兩校區的館藏增加量基本相同,兩條曲線基本重合,都呈現逐漸下降的趨勢,這主要是由于購書經費的減少以及采購策略的變化(逐步減少對紙本資源的購買力度,擴大電子資源的購買)。與之相應的兩校區的借閱增長的幅度也逐漸下滑,下滑速度比館藏的下滑速度更為明顯。到2008年,由于當年政府招標采購出現誤差造成新書到館延遲,上半年基本沒有新書入庫,而上半年正是學生撰寫畢業論文,導致2008年與2007年相比借閱量大幅下滑,增長量開始出現負值。

圖11 兩校區館藏與借閱的增長量

另外,本館近年來在暑假期間堅持開放,逐年延長開放時間,結合石牌校區借閱庫室的劃分,將社科書庫(A-F與 H)、理科書庫(N-Z)、文藝書庫(IJK類)、教育書庫(G類)的各年8月份借閱量及總量繪制在一起,如圖12所示。2008年以前有波動,之后借閱量逐步升高,但2012年突然下滑,其中可能的原因與2012年暑假前夕將本館的自修室取消有關。暑假期間是考研等各類考試的準備期,來館自修也會間接地借閱圖書。當然,讀者借閱量的變化與館藏入庫新書量的變化、入館人數是否有關,相關的程度又如何,還需進一步的驗證。例如,可以對兩校區2006年到2012年館藏的增加量與借閱量進行一個積差相關(皮爾遜相關),可以得到二者在0.01水平(雙側)上顯著相關,相關系數(r)=0.688,二者呈正相關。

圖12 石牌校區歷年8月份借閱量

4.3 圖書館應建立長效而深入的分析機制

從時間序列分析的預測結果看,讀者借閱量的變化容易受到各種環境因素的干擾。例如,本研究中2004年我館本科評估時購買大量的圖書補充進來促使當時的借閱量上升明顯,2008年由于招標采購的政策問題導致年底才有新書入庫從而使當年借閱量大幅下降,2012年暑假石牌校區庫室調整關閉自修室導致8月份借閱量顯著下滑。而外部環境的劇烈變化造成借閱量的波動都會對時間序列預測結果的精度產生影響。可以說,目前讀者工作的開展更多地停留在主觀經驗的積累,這種形式的積累不利于傳承,不利于應用,也使得政策決策缺乏客觀依據。那么如何客觀有效地把握館藏利用的動態規律、讀者閱讀心理與行為的內在機制呢?基于圖書館自動化信息系統,對其積攢的大量館藏及利用數據進行客觀、深入、長效的統計分析就是一種思路,這種分析不是短期的、個體館員的零散行為,而是長期的、深入的圖書館的機構行為。將圖書館的統計分析成為各級館員都能動態掌握的工具,作為工作的常態進行開展,將讀者借閱看成是有生命的有機體,傾聽其中傳遞的聲音,制定相應靈活、適用于本館的規則與決策,使讀者工作變得鮮活。

[1]李桂華.信息服務設計與管理[M].北京:清華大學出版社,2009:1-245.

[2]薛微.SPSS統計分析方法及應用[M].北京:電子工業出版社,2004:402-407.

[3]馮力.統計學實驗[M].大連:東北財經大學出版社,2008:134-142.

[4]劉震,吳廣,丁維岱,等.SPSS統計分析與應用[M].北京:電子工業出版社,2011:339-363.

[5]呂振通,張凌云.SPSS統計分析與應用[M].北京:機械工業出版社,2009:253-257.

[6]胡平,崔文田,徐青川.應用統計分析教學實踐案例集[M].北京:清華大學出版社,2007:30-34.

[7]黃潤龍.數據統計分析——SPSS原理及應用[M].北京:高等教育出版社,2010:310-318.

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 亚洲全网成人资源在线观看| 日本一区二区三区精品AⅤ| 国产成人高清精品免费| 欧美精品v欧洲精品| 欧美视频二区| 亚洲免费黄色网| 国产精品短篇二区| 无码中字出轨中文人妻中文中| 色精品视频| 久久先锋资源| 中文字幕日韩欧美| 99伊人精品| 国产视频一区二区在线观看| 亚洲精品麻豆| 中文字幕在线永久在线视频2020| 免费一级α片在线观看| 亚洲人成网站色7777| 亚洲国产精品日韩欧美一区| 日本五区在线不卡精品| 国产精品欧美在线观看| 人妻丰满熟妇av五码区| 青青操国产| 少妇高潮惨叫久久久久久| 一本大道香蕉中文日本不卡高清二区 | 日本爱爱精品一区二区| 高清无码一本到东京热| 精品视频第一页| 欧美激情网址| 国产久草视频| 色偷偷男人的天堂亚洲av| 日本国产一区在线观看| 一级毛片中文字幕| AV在线天堂进入| 色综合狠狠操| 亚洲日韩国产精品综合在线观看| 日韩精品毛片人妻AV不卡| 毛片大全免费观看| 91日本在线观看亚洲精品| 日韩福利在线观看| 亚洲码一区二区三区| 午夜精品福利影院| 热99精品视频| 欧美日韩国产系列在线观看| 免费看av在线网站网址| 欧美视频免费一区二区三区 | 国产欧美高清| 国产av一码二码三码无码| 精品人妻系列无码专区久久| 色悠久久久久久久综合网伊人| 国产成人久视频免费| 综1合AV在线播放| 国产精品xxx| 久久精品aⅴ无码中文字幕| 99免费在线观看视频| 亚洲欧洲日产无码AV| 91免费国产在线观看尤物| 日韩免费毛片视频| 日韩不卡高清视频| 亚洲国产日韩视频观看| 九九九精品视频| 欧美啪啪一区| 亚洲中字无码AV电影在线观看| 三上悠亚在线精品二区| 欧美一区二区自偷自拍视频| 亚洲另类色| 国产极品粉嫩小泬免费看| 久久夜夜视频| a亚洲天堂| 狠狠久久综合伊人不卡| 欧美性猛交一区二区三区| 国产成人高清精品免费| 欧美不卡二区| 综合色在线| 亚洲欧美日韩中文字幕在线| 国产成人三级| 99在线国产| 日韩美毛片| 无套av在线| 大陆国产精品视频| 看国产一级毛片| 操国产美女| 91无码人妻精品一区|