廉旭姣+周少鵬+張峰


摘要:檔案利用需求預測是檔案管理的重要環節之一。根據檔案利用的時序歷史統計數據,利用GM(1,1)模型、DGM(1,1)模型和OLS模型構建了GM-DGM-OLS檔案利用需求預測模型,并選取預測有效度方法測算了各模型的權重。采用重慶市長壽區檔案館2014年檔案利用數據作為研究樣本,分別將各單一預測模型的結果進行了對比分析,同時測度出組合模型的預測結果。對比發現,DGM(1,1)模型在檔案利用需求預測中呈現出高精度的特征,而組合預測模型的精度雖然弱于DGM(1,1)模型,但要高于GM(1,1)與OLS模型。因此,在檔案利用需求預測實際運用中,建議選用DGM(1,1)與GM-DGM-OLS模型。
Abstract: Demand prediction is an important part of archive management. Hence, the GM-DGM-OLS forecasting model for archival utilization was constructed based on the model of GM(1,1), DGM(1,1) and OLS, and then the weight of single model was calculated by the predictive validity method. Moreover, the archival utilization data of Changshou district archives in 2014 was used as a sample of research, and the prediction effect of each model was compared. The results showed that the DGM (1,1) model presented a high-precision feature in the file utilization predict, and the accuracy of combined prediction model was weaker than the DGM (1,1) model, but it was better than GM(1,1) and OLS model. So the DGM (1,1) or GM-DGM-OLS model could be selected to predicting the demand of archival utilization.
關鍵詞:檔案管理;灰色模型;需求預測
Key words: archive management;gray model;demand prediction
中圖分類號:G273.5 文獻標識碼:A 文章編號:1006-4311(2018)04-0029-03
0 引言
檔案利用需求預測通常是指運用檔案來滿足相關社會實踐活動或解決特定問題的要求。由于受到檔案的本身屬性與使用者主觀要素的多元特性與隨機性等影響,其管理過程具有較高的復雜性。對于檔案部門而言,全面及時了解檔案用戶的動態利用行為,挖掘其潛在的利用需求規律與特點,是提供更加高效可靠服務工作的基本前提。而在實際檔案管理過程中,一般可基于歷史檔案使用的時序數據對檔案變化進行監測反映,有效地剖析檔案統計數據及實時準確的估計其檔案的變動趨勢則直接影響到檔案部門管理的科學性與合理性。現階段對歷史檔案數據的統計還處于靜態分析為主,同時隨著影響檔案管理要素的復雜性愈加提升,對檔案利用需求把握的科學性、準確性與及時性均提出了更高的標準。因此,解決高效地利用檔案使用歷史數據預估檔案利用需求未來規模變動趨勢的難題是檔案管理的關鍵點。
針對檔案利用需求數據的特點,現有對其趨勢預測的分析主要集中在概念解析、標準論證[1-2],其采用的模型以時間序列分析、線性回歸分析等為主[3],而這些基于傳統概率視角的預測方法逐漸難以符合檔案管理中利用需求的實時性標準。考慮諸多學者將組合預測方法應用到相關領域取得的顯著性成效,但構成組合預測模型的相關單一算法還需要進一步探討的特點,本文利用GM(1,1)模型、DGM(1,1)模型和OLS模型構成“GM-DGM-OLS檔案利用需求預測模型”,嘗試在檢驗其單一模型優勢的同時,驗證該組合模型是否能夠提升檔案利用需求的預測精度,為檔案利用需求探尋適合的預測方法。
1 檔案利用需求預測模型構建
1.1 GM(1,1)模型
根據上述分析得到DGM(1,1)模型預測公式,并可利用該模型對檔案利用需求進行預測。
1.3 線性回歸預測模型
按照自變量與因變量的相關關系,可建立線性回歸方程的預測方法[6],假設(xt,yt)為檔案利用需求的時間序列,且t=1,2,…,m,則其基本步驟為:
Step1:繪制擬合散點圖,分析x、y之間是否存在線性關系。若線性關系存在,則可以構建線性回歸模型,否則不能建立。
Step2:構建線性回歸方程,其參數可運用最小二乘法(OLS)進行估計:
Step3:利用構建起的線性回歸方程對檔案利用需求進行預測。
1.4 基于有效度分析的GM-DGM-OLS預測模型
檔案利用需求GM-DGM-OLS預測模型的基本形式為:
1.5 檔案利用需求預測模型精度評價指標
2 實證分析
2.1 樣本數據說明
基于驗證GM-DGM-OLS預測模型在檔案利用需求趨勢分析中可行性的考慮,本文以重慶市長壽區檔案館2014年檔案利用數據為樣本進行統計,分別運用GM(1,1)、DGM(1,1)和OLS模型擬合相關參數,并預測檔案利用需求。同時,運用評價指標對單一預測模型與組合預測模型的測度結果分別進行比較。endprint
2.2 單一模型預測
2.3 GM-DGM-OLS預測模型
根據上述組合預測模型,可結合各單一預測模型結果取得預測值。
2.4 預測效果對比
通過檔案利用需求各單一預測模型與組合預測模型的擬合效果,可知DGM(1,1)模型的MRE與MAE評價指標均為各模型中的最小值,分別為0.3655307、162.11,說明該模型在預測檔案利用需求方面具有較好的優勢。同理,按照評價指標的大小,可依次認為單一預測模型的預測效果從良至劣,分別為:DGM(1,1)模型、OLS模型和GM(1,1)模型。而GM-DGM-OLS組合預測模型雖然在預測效果上要弱于DGM(1,1)模型,但兩者誤差的差異性較小,且效果要優于OLS模型和GM(1,1)模型,即在檔案利用需求預測中也具有一定的適用性。據此,可認為對于檔案利用需求預測的優選方法為:DGM(1,1)模型與GM-DGM-OLS組合預測模型。(表1)
3 結束語
檔案利用需求預測是檔案管理中的重要環節,針對檔案利用需求數據的復雜性與隨機性等特點,本文利用灰色理論分別構建了GM(1,1)、DGM(1,1)和OLS模型,并在此基礎上建立GM-DGM-OLS組合預測模型。選取預測相對誤差評價的方法對各預測模型在檔案利用需求預測中的適用性進行了對比分析,結果發現DGM(1,1)模型在該過程中具有較高的精度,其次為GM-DGM-OLS組合預測模型,而OLS與GM(1,1)模型預測精度相對較低。因此,在檔案利用需求預測中,建議優先選取DGM(1,1)模型與GM-DGM-OLS組合預測模型。
參考文獻:
[1]李正寧.檔案信息的利用預測與主動服務[J].上海檔案,2001(2):45-46.
[2]陳志宏.檔案信息資源的開發和利用[J].高教論壇,2004(1):159-160.
[3]李陽生.未來檔案利用趨勢的預測分析[J].檔案學通訊,2002(2):34-35.
[4]姚清云,張峰,殷秀清,等.基于組合灰色預測模型的物流企業運營成本預測[J].會計之友,2014(28):5-9.
[5]張峰,殷秀清,董會忠.組合灰色預測模型對物流需求預測效果的分析[J].物流技術,2014,33(9):221-223.
[6]王惠文,孟潔.多元線性回歸的預測建模方法[J].北京航空航天大學學報,2007,33(4):500-504.
[7]張峰,殷秀清,董會忠,等.導彈遙測故障的GM-Verhulst-SCGM預測算法[J].火力與指揮控制,2016,41(6):108-112.endprint