羅金炎, 徐 飛, 李 燕, 吳嘉穎, 沈 煜
(1.閩江學院 數學與數據科學學院, 福州 350108;2.閩江學院 新華都商學院, 福州 350108)
福建省地處沿海,其海岸線長度位居全國第二位,陸地海岸線長達3 751.5 km,其受臺風侵擾較為頻繁,從1945—2018年在福建省登陸的臺風多達130多起,造成直接經濟損失513.1億元。經濟發展的同時,臺風帶來的直接經濟損失也越來越高,臺風等氣象災害已經成為制約福建省社會經濟發展的主要因素。因此,在面臨巨大的自然災害時,如何基于預報信息和觀測數據對其可能造成的經濟損失分布進行研究是十分必要的.
極值理論創立之初常用來分析具有極端概率罕見的情況[1],如海嘯、地震、臺風等。后來在1990年左右,極值理論被證實能有效擬合出金融資產報酬率分布的厚尾特征,在貨幣和信用危機對金融市場的沖擊下,極值理論被廣泛應用于金融市場[2]的極端價格波動,因而極值理論的主要研究對象也變成了金融收益的尾部特征[3].我國對極值理論的研究起步較晚,現有的參考文獻相對較少。2006年李曉渝等[3]使用極值理論方法研究了期貨保證金設定的實證研究;2013年陸靜、張佳等[1]使用極值理論和多元Copula函數的商業銀行操作風險計量研究。
本文使用復合模型(POT模型與對數正態分布)對福建省1992—2018年臺風災害的經濟損失額進行擬合研究,分析福建省歷年臺風巨災損失的厚尾特征。因受極值數據的影響,福建省歷年臺風災害損失不符合傳統正態分布,所以使用廣義帕累托分布(GPD)與對數正態分布的復合分布來對樣本數據進行擬合,充分體現在極值數據影響下的優勢。為今后的氣象災害損失額度的分析、金融產品開發等提供科學依據,具有重要的實際意義。
極值理論[4]是次序統計學的重要分支之一,主要用于研究具有極端變異性的數據并進行建模,能有效的處理與概率分布均值偏離極大的數據。極值理論經多年的繼承和發展,現今超閾值模型(POT)和區間極大值模型(BMM)已較為成熟。POT模型與BMM模型都是根據樣本數據對分布的尾部進行擬合,與慣用的整體建模不同,主要差異在于樣本數據的選取方式。POT模型是設定一個閾值,選取超出閾值的樣本數據進行建模,該模型可用廣義帕累托分布(GPD)[4]擬合,但廣義帕累托分布(GPD)閾值的選取方法有多種,因此在選取閾值時使用的方法具有一定的主觀性,從而易導致閾值設定不合理。綜上所述,POT模型能彌補BMM模型的缺陷且所需的樣本數據量較少,在生產應用中更為有效。
超閾值模型(Peaks Over Threshold,POT)[4]基于廣義帕累托分布擬合超限分布。換言之也是對閾值(Threshold)超出額的所有觀測樣本數據來建模,從而漸近刻畫分布的尾部特征。
POT模型能最大限度的使用極值數據且其分布一般具有厚尾性[5]。缺失的數據與總體分布對POT模型影響比較小,但是POT模型在擬合福建省臺風災害損失分布時,選取的閾值具有較大的主觀性,而對數正態分布對福建省臺風災害損失分布的擬合有輔助作用,能彌補POT模型存在的一些缺陷。因此本文使用復合模型(對數正態分布模型與POT模型)來研究福建省臺風巨災的損失分布,能讓擬合更加準確和有效。
以福建省1992—2018年臺風造成的直接經濟損失作為直接觀測值。對數據進行整理優化, 剔除了一些殘缺的數據,總共留下有效數據47組。因為數據時間的間隔比較大,為消除一些不必要的影響因素如物價水平,本文將以福建省1992年的真實發展指數GPI(1992=100)為指定基指數,對福建省歷年每次臺風造成的損失數據進行優化調整,優化調整所需要的數據來自福建省統計局網站。
本文采用的優化調整公式[6]為
(1)
其中S=GPI(1992=100),調整后的數據為Yi(i=1,2,3,…),歷年臺風災害損失數據為Xi(i=1,2,3,…)。調整完成后用SPSS軟件對福建省1922—2018年臺風造成的直接經濟損失數據進行基本的統計描述,詳細情況見數據表1。

表1 福建省1992—2018年臺風災經濟損失額基本統計描述(億元)
經過基本統計描述,由表1可以看出,福建省臺風災害經濟損失額的偏度和峰度分別為3.19、14.48,而正態分布的值偏度為0,峰度為3,由此可知福建省1992—2018年臺風災害經濟損失額明顯偏離了正態分布。
其中峰度公式為
(2)
當Kurt=3時為正態分布,當Kurt>3時表現為厚尾,當Kurt<3時表現為薄尾。
使用SPSS軟件的正態P-P圖和頻率直方圖對福建省臺風災害損失額進行厚尾檢驗,畫出福建省臺風災害損失額的P-P圖和頻率直方圖,如圖1和圖2所示。

圖1 1992—2018年福建省臺風災害損失額正態P-P圖

圖2 1992—2018年福建省臺風災害損失額頻率直方圖
由圖2頻率直方圖可知,福建省1992—2018年臺風災害損失額有明顯的“厚尾、尖峰、右偏”等特征。為提高檢驗的可信度和證明福建省臺風災害損失額的厚尾特征,綜合圖1觀察可得,P-P圖偏離正態直線向下凸,福建省臺風災害損失額觀測的累積概率與期望的累積概率近似分布對角線在上,由此可知福建省臺風災害損失額符合厚尾特征。由于受極值數據的影響,單一的使用正態分布來擬合福建省臺風災害損失額已不適合,所以將使用廣義帕累托分布(GPD)與對數正態分布復合模型來對樣本數據進行擬合。
對樣本數據進行帕累托分布檢驗,將使用檢驗工具帕累托檢驗紙,其檢驗原理是在其變換下讓符合帕累托分布的函數表現出一條為直線的圖形。若樣本數據xi(i=1,2,3,…)來自帕累托分布,樣本數據經過標準化后得到yi=(xi-μ)/σ,則有點(xi,yj)組成一條近似直線。
使用電子表格Excel對福建省臺風災害損失額進行帕累托分布檢驗,觀察圖3可以看出福建省臺風災害損失額近似一條直線,滿足帕累托分布的前提假設,福建省臺風災害損失額滿足帕累托分布。

圖3 帕累托分布檢驗
對數正態分布檢驗只能使用SPSS軟件中的P-P圖或者Q-Q圖,本文使用P-P圖進行對數正態分布檢驗。P-P圖檢驗對數正態分布主要看其殘差圖形狀是否有規律,而不僅僅看其波幅,至于波幅在什么范圍并沒有一個通用的標準,一般波幅最大不超過0.06,其對應的累積百分點在0.6以上。對于樣本數據,數據點基本緊緊地圍繞在P-P圖的45度線上,基本上就符合對數正態分布。
本文使用樣本數據47組,為了提高檢驗的準確性,在進行對數正態分布檢驗時,將剔除樣本數據的異常值,即5組最大值和5組最小值。使用Excel對37組福建省臺風災害損失額取對數,再使用SPSS軟件對福建省臺風災害損失額的對數進行正態分布檢驗并繪制出檢驗的Q-Q圖,如表2、圖4所示。

圖4 1992—2018福建省臺風災害損失額對數正態檢驗Q-Q圖

表2 臺風災害損失額對數正態性檢驗
由表2可知,sig.=0.2>0.005,福建省臺風災害損失額的對數服從正態分布,進一步觀察其Q-Q圖確認,可見樣本點基本在直線附近,福建省臺風災害損失額的對數服從正態分布[7]。
POT模型閾值選取采用平均超出量函數(Mean Excess Function,MEF)[4]。當0<ζ
(3)
由式(3)可以看出超均值函數為閾u值的線形函數[8]。將福建省臺風災害損失額的47組數據導入到統計軟件R.studio中并畫出其平均超限函數圖和POT模型的Hill圖。如圖5福建省臺風災害損失數據的MEF圖可以看出,福建省歷年臺風災害損失數據觀測樣本的超額均值有明顯的上升趨勢,分析得出觀測樣本符合廣義帕累托分布(形狀參數ζ>0)。觀察圖6,看出尾部指數大概超過15個樣本數據以后變得相當平穩。綜上,可以將最初閾值u確定為45.07億元,小于閾值(u=45.07億元)的臺風損失認為是正常,超出閾值(u=45.07億元)的臺風損失將視為極值。

圖5 福建省臺風災害損失數據的MEF圖

圖6 福建省臺風災害損失數據的Hill圖
由于涉及的總體樣本極值數據量較小,所以將采用基于GPD分布的極大似然估計法進行相關參數的估計[9]。
使用MATLAB軟件進行擬合計算,得形狀參數ζ為0.493,尺度參數β為43.21。1992—2018年福建省臺風災害經濟損失分布函數為
(4)
文獻[6]給定某個p值,得出高分位數點的估計[7]公式:
(5)
由式(5),通過Excel分析計算得到結果,如表3所示。從分位數的統計角度觀察,福建省臺風災害損失額小于等于147.38億元的概率為0.95,小于等于335.96億元的概率為0.99,小于等于462.42億元的概率為0.995,小于等于828.85億元的概率為0.999。

表3 福建省臺風災害損失額的高分位數點估計
受極值數據的影響,福建省1992—2018年臺風災害損失額明顯不符合傳統正態分布,因此本文使用了超閾值模型復合對數正態模型對福建省歷年臺風災害損失額進行了分析研究。選取的POT模型能最大限度的使用極值數據并且缺失的數據對POT模型影響比較小,總體分布對其沒有影響,復合的對數正態分布能改善POT模型選取閾值具有的較大主觀性,因此復合模型能充分體現在極值數據影響下的優勢。結合復合模型對福建省1992—2018年臺風災損失額進行了對數正態分析、帕累托分析和高分位估計,并使用參數估計得出進行臺風巨災金融產品開發的相關參數。可為今后的氣象災害損失額度的分析、巨災類金融產品開發提供科學依據[10]。
致謝感謝閩江學院校長基金項目(103952019031)的資助。