楊嘉龍,肖生苓
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,哈爾濱 150040)
自國(guó)際林聯(lián)(IUFRO)1994年出版《國(guó)際森林監(jiān)測(cè)指南》將生物量列為全球、區(qū)域和國(guó)家級(jí)森林資源監(jiān)測(cè)的重要內(nèi)容,越來(lái)越多的專家和學(xué)者提出了更新的生物量研究方法和理論,從變量選取到模型優(yōu)化,生物量模型經(jīng)歷了從線性到非線性的結(jié)構(gòu)轉(zhuǎn)變。目前,應(yīng)用最廣泛也最被認(rèn)可的是建立非線性的相容性生物量模型[1-5]。非線性模型對(duì)生物量的擬合效果比線性模型好,模型評(píng)價(jià)指標(biāo)更高,更加符合林木的生長(zhǎng)規(guī)律。相容性生物量模型通過(guò)以總量或樹(shù)干生物量為基礎(chǔ)的分級(jí)控制理論,能夠很好的解決的總量和分量不相容的問(wèn)題,而且模型檢驗(yàn)指標(biāo)滿足建模要求。
非線性生物量模型的構(gòu)建不同于線性生物量模型,其中最主要的原因就是非線性模型中變量的方差非齊性,線性生物量模型的構(gòu)建就是基于方差齊性的假設(shè)前提,模型的誤差項(xiàng)期望Eζ=0,得到線性模型的最優(yōu)估計(jì)。而實(shí)際中,誤差項(xiàng)的方差隨自變量的變化而變化,如果忽略了模型中的異方差性,將會(huì)造成模型的參數(shù)估計(jì)值變化,不僅降低模型的估計(jì)精度,還會(huì)使估計(jì)值的檢驗(yàn)和置信區(qū)間失效。為此,對(duì)模型的異方差檢驗(yàn)和消除就顯得尤為重要。
由于調(diào)查數(shù)據(jù)往往存在測(cè)量誤差,以及樣本數(shù)據(jù)具有的個(gè)體差異性和建模模型的忽略因素,導(dǎo)致估計(jì)結(jié)果存在異方差性,在數(shù)據(jù)處理時(shí),往往首先要檢驗(yàn)誤差項(xiàng)間是否有異方差存在,從而不影響模型的建立和參數(shù)的估計(jì)。可采用的檢驗(yàn)方法有:圖示檢驗(yàn)法、帕克(Park)檢驗(yàn)、巴特利特(Bartlett)檢驗(yàn)、格萊澤(Glejser)檢驗(yàn)、斯皮爾曼(Spearman)等級(jí)相關(guān)檢驗(yàn)、戈德菲爾特-匡特(Goldfelt-Quandt)檢驗(yàn)、布勞特-陪干-戈弗雷(Breusch-Pangan-Godfrey)檢驗(yàn)、懷特(White)檢驗(yàn)、ARCH(自回歸條件異方差)檢驗(yàn)、Wald檢驗(yàn)、拉格朗日乘數(shù)檢驗(yàn)和似然比檢驗(yàn)[6]。其中,比較常用的是圖示檢驗(yàn)法、格萊澤(Glejser)檢驗(yàn)、斯皮爾曼(Spearman)等級(jí)相關(guān)檢驗(yàn)和懷特(White)檢驗(yàn)。


圖1 幾種可能存在異方差的殘差示意圖
圖示檢驗(yàn)法雖然簡(jiǎn)單直觀,但是只能夠作為一種趨勢(shì)的判定,不能通過(guò)圖形看出引起異方差的變量,也得不到異方差的具體形式。
格萊澤(Glejser)檢驗(yàn)是基于殘差和解釋變量間有顯著成立的關(guān)系,如果方程存在異方差,那么異方差與解釋變量的冪相關(guān),假設(shè)異方差σi與第j個(gè)解釋變量的關(guān)系如下:
(1)
由于異方差σi是經(jīng)過(guò)檢驗(yàn)后計(jì)算所得,格萊澤利用殘差絕對(duì)值|ei|代替異方差σi,得到:
(2)
假如δ1=0,則可以認(rèn)為異方差σ1與xi無(wú)關(guān),即隨即擾動(dòng)項(xiàng)ui的方差與xj無(wú)關(guān);δ1≠0,則隨即擾動(dòng)項(xiàng)ui的方差與xj的變化相關(guān)。異方差檢驗(yàn)就轉(zhuǎn)化為對(duì)δ1是否為0的檢驗(yàn),用T檢驗(yàn),如果參數(shù)δ1顯著的不為0,則認(rèn)為存在異方差。
此檢驗(yàn)不僅能對(duì)異方差的存在作出判斷,而且還能得到異方差隨變量變化的具體形式,檢驗(yàn)需要大量樣本數(shù)據(jù),而且誤差項(xiàng)本身可能含有異方差。
斯皮爾曼(Spearman)等級(jí)相關(guān)檢驗(yàn)不用考慮模型參數(shù),類(lèi)似于格萊澤(Glejser)檢驗(yàn),通過(guò)檢驗(yàn)殘差和解釋變量是否有顯著關(guān)系,來(lái)判定異方差性。基于公式(1)將求得的隨機(jī)變量的殘差ei取絕對(duì)值,并與xi以升序或降序排列,按斯皮爾曼(Spearman)等級(jí)相關(guān)系數(shù)計(jì)算公式:
(3)
式中:Di=xi-ei,N為樣本個(gè)數(shù)。

檢驗(yàn)需要對(duì)殘差和解釋變量進(jìn)行排序,樣本容量過(guò)小會(huì)導(dǎo)致數(shù)據(jù)變異程度較大,降低檢驗(yàn)可信度,而且此檢驗(yàn)也無(wú)法給出異方差的具體形式[7]。
懷特檢驗(yàn)?zāi)軌驅(qū)埐钆c不同形式的自變量結(jié)合起來(lái),建立多元回歸方程,其基本多元回歸方程形式如下:
yi=δ0+δ1x1i+δ2x2i+δ3x3i+…+σnxni+ui。
(4)
再通過(guò)建立輔助回歸模型的方式來(lái)判斷回歸方程的異方差性,假設(shè)自變量含3種形式,其輔助回歸模型形式[8]為:

(5)
以上常用檢驗(yàn)除格萊澤(Glejser)檢驗(yàn)?zāi)艿玫疆惙讲畹木唧w形式,其余檢驗(yàn)只能驗(yàn)證異方差性,圖示檢驗(yàn)可以依靠SPSS、SAS、MALTABLE等統(tǒng)計(jì)軟件直接給出,應(yīng)用最為普遍。
通過(guò)上述檢驗(yàn),可以知道誤差項(xiàng)是否具有異方差性,而且異方差的存在并不影響普通最小二乘法(Ordinary Least Squares,簡(jiǎn)稱OLS)估計(jì)量的無(wú)偏性,但是會(huì)造成估計(jì)量的方差變大,導(dǎo)致通常假設(shè)的檢驗(yàn)值失效。所以,對(duì)已經(jīng)驗(yàn)證的異方差要采用辦法去消除,以保證得到的模型具有最優(yōu)的無(wú)偏估計(jì)。通常采用加權(quán)最小二乘法(The Weighted Least squares,簡(jiǎn)稱WLS)、改變變量形式或重新設(shè)定模型這三種方法,這里只介紹最簡(jiǎn)單和最常用的方法——加權(quán)最小二乘法(WLS)。

應(yīng)用加權(quán)最小二乘法消除異方差已被得到廣泛證實(shí)。采用加權(quán)最小二乘法最回歸估計(jì)在消除異方差的同時(shí),能夠保證模型不含系統(tǒng)誤差,其權(quán)函數(shù)形式可由變量本身構(gòu)造,方便適用[10]。模型的擬合結(jié)果與普通最小二乘法相比,各項(xiàng)指標(biāo)均有明顯改善[11]。如果假定因變量yi的方差與自變量xi的某種形式成一定比例,權(quán)函數(shù)可以定義為wi=1/f(xi)消除異方差,但是要想得到準(zhǔn)確具體的f(xi)形式就相對(duì)比較困難[12]。在實(shí)際應(yīng)用WLS時(shí),常以SPSS、Eviews等統(tǒng)計(jì)軟件為工具,繪制殘差圖或?qū)ο惙讲畹臋?quán)函數(shù)進(jìn)行探討,理論上的最優(yōu)權(quán)函數(shù)應(yīng)該是與最大對(duì)數(shù)似然函數(shù)相應(yīng)的取值[13]。
以77株落葉松樹(shù)干生物量建模數(shù)據(jù)為例,擬合的單木樹(shù)干生物量?jī)?yōu)勢(shì)方程形式為W樹(shù)干=a(D2H)b,用此經(jīng)驗(yàn)?zāi)P妥鳛榉治霎惙讲畹幕A(chǔ)模型,通過(guò)SPSS軟件繪制的殘差圖可以看出方程存在異方差性,如圖2(a)所示。

圖2 存在和消除異方差的樹(shù)干模型殘差圖
對(duì)模型異方差的消除分兩個(gè)部分,首先是對(duì)經(jīng)驗(yàn)?zāi)P瓦M(jìn)行對(duì)數(shù)轉(zhuǎn)換,消除基于OLS下假設(shè)誤差期望為0而造成的參數(shù)偏小和異方差性,如圖2(b)所示。其次,建立樹(shù)干相容性生物量模型,做到總量和各分量和相等,為了消除模型間的度量誤差和異方差,要對(duì)干材和樹(shù)皮生物量方程進(jìn)行非線性聯(lián)合估計(jì),復(fù)雜生物量模型異方差的消除采取構(gòu)造權(quán)函數(shù)的方法,鑒于一元回歸方程與二元回歸權(quán)函數(shù)方程對(duì)消除異方差的效果差別不大,這里采用由胸徑D和樹(shù)干生物量預(yù)估殘差值方差1.06構(gòu)造的一元回歸方程作為權(quán)函數(shù)方程,即權(quán)函數(shù)為G=1/D1.06,模型通過(guò)決定系數(shù)(R2)、估計(jì)值的標(biāo)準(zhǔn)差(SEE)、平均估計(jì)誤差(MPE)、平均相對(duì)偏差(ME)、平均相對(duì)偏差絕對(duì)值(MAE)以及預(yù)估精度(P)作為選擇最優(yōu)模型的檢驗(yàn)指標(biāo)。消除異方差的樹(shù)干生物量模型擬合和檢驗(yàn)結(jié)果,見(jiàn)表1。
通過(guò)表1可以看出,消除異方差后的對(duì)數(shù)模型和相容性生物量模型SEE值減小,說(shuō)明采用模型轉(zhuǎn)換和加權(quán)函數(shù)的方法是可行有效的,而且對(duì)模型的預(yù)估效果起到了很好的作用。

表1 消除異方差的樹(shù)干生物量模型擬合結(jié)果和檢驗(yàn)結(jié)果統(tǒng)計(jì)
生物量建模過(guò)程中,往往存在著異方差性,會(huì)導(dǎo)致采用普通最小二乘法進(jìn)行回歸所得估計(jì)值有偏,參數(shù)值和有效區(qū)間失真。這就需要對(duì)誤差項(xiàng)可能存在的方差性進(jìn)行檢驗(yàn),并采取有效的消除方法,文章通過(guò)實(shí)例證明檢驗(yàn)和消除異方差的方法是行之有效的,而且能夠保證系統(tǒng)模型的建模要求。
【參 考 文 獻(xiàn)】
[1] 唐守正,張會(huì)儒,胥 輝.相容性生物量模型的建立及其估計(jì)方法研究[J].林業(yè)科學(xué),2000,36(1):20-27.
[2] 胥 輝,劉偉平.相容性生物量模型研究[J].福建林學(xué)院學(xué)報(bào),2001,21(1):18-23.
[3] 羅云建.森林生物量的估算方法及其研究進(jìn)展[J].林業(yè)科學(xué),2009,45(8):129-134.
[4] 翟 暢,胡潤(rùn)田,范文義.森林水源縣生態(tài)效益的估算與評(píng)價(jià)研究[J].森林工程,2012,28(4):69-72.
[5] 曾偉生,唐守正.利用度量誤差模型方法建立相容性立木生物量方程系統(tǒng)[J].林業(yè)科學(xué)研究,2010,23(6):797-802.
[6] 白雪梅.異方差性的檢驗(yàn)方法及評(píng)述[J].東北財(cái)經(jīng)大學(xué)學(xué)報(bào),2002(6):26-29.
[7] 徐唐先.關(guān)于等級(jí)相關(guān)中斯皮爾曼公式[J].統(tǒng)計(jì)與決策,1995,22-23.
[8] 申屠惠良.使用懷特檢驗(yàn)判斷生物量模型的異方差性[J].浙江林業(yè)科技,2012,32(3):43-45.
[9] 龔秀芳.回歸模型中異方差數(shù)據(jù)的處理[D].上海:華東師范大學(xué),2002.
[10] 唐守正,胥 輝.關(guān)于生物量模型中的異方差問(wèn)題[J].林業(yè)資源管理,1999(1):46-49.
[11] 鄭春茂.加權(quán)回歸及權(quán)函數(shù)的變換在生物量建模中的應(yīng)用[J].華東森林經(jīng)理,2012,26(2):77-79.
[12]胥 輝.生物量模型方差非齊性研究[J].西南林學(xué)院學(xué)報(bào),1999,19(2):73-77.
[13]宋廷山,李 杰.回歸模型的異方差性消除方法探討[J].統(tǒng)計(jì)教育,2007(4):6-7.