左 凱
(成都師范學院 數學學院,四川 成都611130)
統計資料表明,大量社會經濟現象的發展主要是漸進型的,其發展相對于時間具有一定的規律性[1-2].趨勢外推法是事物發展漸進過程的一種統計方法,主要優點是可以揭示事物未來的發展,并定量地估計其功能特性,常見的趨勢外推統計模型有多項式曲線預測模型、指數曲線模型、對數曲線預測模型和生長曲線預測模型.如果社會經濟現象的發展趨勢每期基本上按照相同的增長速度變化,則可采用指數曲線模型進行擬合;如果社會經濟現象的發展趨勢為初期增長迅速,隨后增長率逐漸減低,最終以一個常數為增長極限時,則可采用修正指數曲線模型進行擬合.
楊桂元[3]根據指數曲線預測模型的特點,對模型的假設、參數估計、擬合誤差以及無偏性等問題進行了討論,并與經典的線性回歸模型進行了比對.高燕希等[4]根據現有指數曲線模型計算方法的應用特點,對其計算過程進行了優化,并以湖南省岳陽市進港道路為例,分析路面沉降的變化規律.官陳平等[5]利用2004—2010年福州市細菌性疾病的發病率建立指數曲線方程,并進行外推5 a預測,取得了較為準確的計算結果.程健等[6]利用指數曲線法研究了在役儲罐發生不均勻沉降后的結構疲勞安全性問題.最近,左凱等[7]研究了具有時間一次項的指數曲線模型,采用分段求和的思想方法給出了模型各個參數的具體表達式,并通過一個例子詳細地給出了求解的具體步驟.2009年,吳新燕等[8]采用修正指數曲線模型對汶川地震各時刻的死亡人數進行擬合,并與指數曲線模型進行比較,同時又用集集地震和阪神地震的數據進行了驗證.計算結果表明,修正指數曲線模型能夠很好地對地震死亡人數進行估計,從而為各級抗震救災指揮部提供救災決策參考依據.
歐陽明等[9]在對已有的數學模型預測方法進行分析,并將指數曲線模型按照一定的修正方法進行優化的基礎上,提出了一個新的修正指數曲線模型.通過對不同類型的單樁靜載荷試驗數據進行擬合,驗證了提出的新模型能夠對單樁P-S曲線進行很好地描述.譚生源[10]在修正指數曲線模型的基礎上提出了具有振蕩項的修正指數曲線模型.針對模型本身的特點,采用最小二乘法給出了系統參數滿足的最優化問題,并結合Matlab軟件包求解出系統參數的具體取值.最后,將模型應用在一次能源消費分析中.最近,張萍等[11]結合指數曲線模型和修正指數曲線模型的特點,提出了具有時間冪次項的指數曲線模型,利用信賴域算法給出了模型參數的數值求解方法,并將其應用在西藏自治區水資源總量的分析中.
但是,值得注意的是,文獻[10-11]并沒有給出模型參數的具體表達式,而是通過數值計算方法給出模型參數的計算方法.本文在經典指數曲線模型、修正的指數曲線模型和文獻[7,10-11]的啟發下,提出了具有二次多項式項的新型指數曲線模型,并采用分段求和的方法給出了模型各個參數的具體表達式.最后,以我國稻谷產量為例,將數值計算結果與指數曲線模型、修正的指數曲線模型進行對比.從結果上可以明顯看出,本文提出的模型具有更高的精度和準確度.
1.1 指數曲線模型由文獻[1-2]可知,經典的指數曲線模型為

為了估計參數a、b的表達式,一般將方程(1)兩端取對數,得

從而估計出參數lna和lnb,再取反對數,即可得到參數a、b的估計值.
1.2 修正指數曲線模型由文獻[1-2]可知,在經典指數曲線模型的基礎上增加一個常數c,即得到修正指數曲線模型的表達式

其中,a、b、c為未知參數,a≠0,b∈(0,1)∪(1,∞),c∈(0,∞).
參數a、b、c估計的基本思想是三和法:把整個原始序列分成相等的3個數組,每個組有m項,根據趨勢值Y(t)的3個局部總和分別等于原數列觀察值3個局部總和來確定3個參數.具體設觀察值的3個局部總和分別為得:


在經典指數曲線模型、修正指數曲線模型上,本文提出了具有二次多項式項的指數曲線模型,其一般方程為

可以看出,當p=0、q=0、r=0時,新型指數曲線模型退化為經典指數曲線模型;當p=0、q=0時,新型指數曲線模型退化為修正指數曲線模型.
接下來,利用分段求和法的思想推導系統中參數a、b、p、q、r的具體表達式.首先,把用于建模的數據分成相等的5組,每組有m項,根據趨勢值Y(t)的5個局部和分別等于原序列的5個局部和來確定模型的參數.具體為設觀察值的5個局部和分別為S1、S2、S3、S4、S5,得到:


通過對方程(22)和(23)求解,并結合表達式(10)(15)(19)得到

至此,通過分段求和的方法得到了模型各個參數的具體表達式,一旦給定原始序列的具體取值,則可建立具體的模型并進行擬合和預測.
3.1 模型精度判斷準則在具體應用之前,給出衡量模型精確的幾個度量指標,分別是絕對百分誤差(APE)、平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)和希爾統計量(TIC).

在(26)式中,當l=2,v=5m,MAE為擬合誤差,記為MAEfit;當l=5m+1,v=n,MAE為預測誤差,記為MAEfore;當l=2,v=n,MAE為總誤差,記為MAEtotal,表達式中^Y(t)為計算得到的值,5m為用于建模的個數,n為原始序列的總個數.

3.2 對中國稻谷產量的分析使用2002—2018年共17 a的我國稻谷產量(萬t)的統計數據進行研究.首先,以2002—2016年共15 a的數據進行模型的建立,2017—2018年的數據進行驗證,將相應的數據代入分別得到3種模型的具體表達式為:
1)指數曲線模型

經典指數曲線模型、修正指數曲線模型、二次多項式項的指數曲線模型的數值計算結果見表1、表2.從計算結果看出,二次多項式項的指數曲線模型的值與真實的數據更接近.從平均絕對百分誤差看到:指數曲線模型的建模誤差、擬合誤差和總的誤差分別為26.887 3%、47.013 8%和29.403 1%;修正指數曲線模型的建模誤差、擬合誤差和總的誤差分別為1.154 0%、1.983 0%和1.257 6%;新型指數曲線模型的建模誤差、擬合誤差和總的誤差分別為1.115 3%、0.142 7%和0.993 7%.可以明顯看出,新提出的模型在稻谷產量中比經典指數曲線模型和修正指數曲線模型有更高的精度.

表1 指數曲線模型、修正指數曲線模型和新型指數曲線模型對稻谷產量數據的計算結果Tab.1 Calculations of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model

表2 指數曲線模型、修正指數曲線模型和新型指數曲線模型對稻谷產量數據的計算誤差Tab.2 Calculational errors of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model
本文討論了帶有二次多項式項的新型指數曲線模型,并充分利用分段求和的思想給出了模型中每個參數的具體表達式.最后,以我國稻谷產量為例說明了本模型在某些數據下的擬合精度和預測精度比經典指數曲線模型、修正指數曲線模型都要高.
相比較傳統的最小二乘法或者是對數變換等方法,本文的分段求和方法思想簡單,操作性好,且能夠得到滿意的結果.在今后的研究中,將考慮此方法在其他類似模型中的應用.
致謝成都師范學院校級重點項目(CS19ZA12)對本文給予了資助,謹致謝意.