〔摘要〕運用回歸分析預測法和時間序列分析法兩種模型,以文獻計量學為例,對近年來相關文獻量的統計數據進行擬合與預測,并對兩種預測模型的結果進行對比分析。結果表明,時間序列預測模型對文獻計量學研究的模擬預測效果較好。兩種預測模型不僅適用于文獻計量學發展研究,對于其他領域也同樣適用。針對不同領域的學科發展趨勢,在進行數據模擬和分析預測時要根據統計數據的多少和分布情況,選取一種相對效果更好并且方便可行的預測方法。
〔關鍵詞〕文獻計量學;回歸分析;時間序列分析;發展趨勢
〔中圖分類號〕G255〔文獻標識碼〕A〔文章編號〕1008-0821(2013)02-0162-04
目前信息的分析與預測活動已越來越深入到社會發展、經濟生活、科技進步等各個領域,成為社會發展與進步的標志[1]。針對某一學科專業研究的發展趨勢進行分析與預測,不僅可以揭示該學科研究的特點和發展規律,而且為今后的研究和工作提供科學的依據。如今,無論是情報學還是文獻學的發展都與文獻計量學息息相關,文獻計量學也是情報學等相關學科的重要研究方法。對文獻計量學的發展趨勢進行預測,不僅可以預測出未來文獻計量學的發展趨勢,而且可為其他學科尤其是圖書館學、情報學領域的理論研究提供了參考和借鑒[2]。
本文以文獻計量學為實例,通過定量的方法分析其論文數量的變化情況,應用回歸分析模型和時間序列分析模型,對文獻計量學的發展趨勢進行擬合和預測,并針對兩種預測模型的預測結果進行比較分析[3]。
1統計數據的來源與統計結果
利用中國知網(CNKI)數據庫檢索系統,以文獻計量學為關鍵詞,統計時間為1996.01.01-2010.12.31進行模糊檢索,對所檢索到的數據進行處理后共得到論文2 100篇,按發表年份排列的論文篇數2.1回歸分析模型介紹
回歸分析法,是從各種現象之間的因果關系出發,通過對與預測對象有聯系的事物或現象的變動趨勢進行分析,進而推算出對象的未來數量狀態的一種預測方法。根據散布的數據點求出理想的回歸直線或曲線,建立起確定的回歸方程進行預測[4]。
一元線性回歸方程的一般形式:
時間序列分析是以研究對象的歷史數據為基礎,將研究對象的發展變化過程表述成時間序列,首先要識別時間序列的特征,進而分析它隨時間的變化趨勢,建立相應的時間序列分析模型,并通過一定的時間序列預測方法,推測出研究對象的未來變化趨勢。
通過分析統計數據,應用時間序列分析法中的移動平均法(M法)對文獻計量學的發展趨勢進行擬合和預測。其基本方法是每次在時間序列上移動一步求平均值。這樣的處理可對原始的無規則數據進行“修勻”,消除樣本中的隨機干擾成分,形成平滑的趨勢線,突出序列本身的固有規律,從而為進一步的建模和參數估計做好基礎[5]。
為進一步提高預測值和實際值的吻合度,可以采用在一次移動平均的基礎上再進行一次移動平均法,稱為二次移動平均法。二次移動平均是在一次移動平均的基礎上,對具有線性趨勢的數據再進行一次移動平均。其計算公式為:
在利用時間序列模型進行預測時,可將對應的T值代入式(7)中,通過線性時間關系模型求出i+T即為所要預測年份的論文篇數。
3文獻計量學研究發展趨勢的預測
3.1回歸分析預測模型
以文獻計量學發表論文的年份為自變量,各年份的論文篇數為因變量。通過散布的數據點繪制出散點圖,發現兩變量的關系近似于一條直線。為了方便計算,設1996-2010年時間t的取值分別為-7,-根據一元線性回歸方程的計算公式計算相關數據結果如下:
由此可知,回歸方程的擬合程度很好,可以應用回歸分析預測模型對未來的文獻計量學相關文獻量進行預測。
通過回歸分析預測模型可預測2011年文獻計量學的相關論文篇為2011=140+22.78t=322.24。
3.2時間序列分析預測模型
根據公式(4),分別取移平跨度n=3和n=5進行一次移動平均,如表3。
通常采用均方誤差(MSE)來檢驗n值選擇的效果。表3一次平均移動數據表
年份11論文篇數依據上述兩種預測模型,分別計算兩種模型1996-2010年的模擬值以及2011年、2012年的預測值,如表5。其中,
兩種預測模型的相關系數比較得:r1 5結語 以文獻計量學為例,采用兩種預測模型對其發展趨勢進行擬合及預測,克服了單一模型擬合和預測的局限性。預測結果表明,文獻計量學研究的論文篇數在未來3年將超過500篇,并且增長趨勢較快。通過對兩種預測模型相關系數的比較,得出時間序列模型對文獻計量學研究發展的預測效果相對較好。時間序列模型在預測時不必考慮其他因素的影響,僅從實際變動的數值序列自身出發建立相應的模型進行預測,避免了尋找影響因素及識別主要因素和次要因素的困難。回歸分析模型是從各種現象之間的因果關系著手,通過對與預測現象有聯系的事物或現象的變動趨勢進行分析。時間序列模型適用于某一領域的短期預測,而回歸分析方法是經濟預測的常用數學方法,利用統計數據確定變量之間的線性關系,并參考這種函數關系來預測未來發展趨勢,適用于某一領域的長期趨勢預測。兩種預測模型不僅適用于文獻計量學的發展研究,對于其他領域也同樣適用。針對不同領域的學科發展趨勢,在進行數據模擬和分析預測時要根據數據的多少和分布情況,選取一種相對效果更好并且方便可行的預測方法。 參考文獻 [1]查先進.信息分析與預測[M].武昌:武漢大學出版社,2009:2,193-201,205-208. [2]鄭懷國,趙靜娟,譚翠萍.基于文獻計量學的科技情報分析與服務[J].情報雜志,2010,(12):39-40. [3]吳淑玲.兩種數字圖書館發展趨勢預測模型的比較[J].情報科學,2004,(11):1317-1320. [4]王筠.專業研究發展趨勢的預測模型——以競爭情報研究為例[J].情報雜志,2010,(7):12-14. [5]江三寶,毛振鵬.信息分預測[M].北京:清華大學出版社,2008:56-63,77-90. [6]王筠.文獻老化的回歸分析與預測[J].情報雜志,2006,(6):68-69. [7]蔡時連.一元線性回歸分析模型在期刊訂購預測中的應用[J].圖書情報工作,2010,(2):112,126-128. (本文責任編輯:馬卓)