吳垠豪
(河南省社會科學院,河南 鄭州 450002)
我國農作物保險費率精算最優方法的實證檢驗
——來自阿克蘇市棉花保險的證據
吳垠豪
(河南省社會科學院,河南 鄭州 450002)
保險費率是保險合同中的核心條款,準確厘定農作物的保險費率是現代農業保險持續、健康發展的基本條件。目前,研究者多采用參數法或非參數法來厘定農作物保險的費率,但國內外研究文獻對小樣本數據研究應采用參數法還是非參數法存在爭議。同時由于歷史的原因,國內各地區對農作物生產情況的記錄資料匱乏?;诖?,通過采用新疆阿克蘇市1949—2010年棉花生產的數據來驗證參數法和非參數法處理小樣本數據的優劣。分析表明,小樣本條件下參數法厘定的費率更可靠。
農業保險;小樣本數據;參數估計法;非參數估計法;農作物保險;費率精算
在全球氣候變化的背景下,近幾年中國干旱、洪澇、臺風、低溫、冰雪、高溫、沙塵暴、病蟲害等災害風險呈現增加的趨勢,并且各種災害的突發性、異常性、難以預見性將日顯突出①國家綜合防災減災規劃(2011—2015年)。;中國農民從事種植業的風險依然很大。在WTO“綠箱”政策的框架下,農業保險的主要功能是將農業易受自然因素影響的先天缺陷轉移、分散出去,從而穩定農業生產規模、給予農民長期穩定的平均收入預期;故此世界各國普遍采用農業保險來支持和保護本國的農業生產。2007年中國開始了新一輪政策性農業保險的試點,在各級財政的大力補貼下,中國的農業保險取得了巨大的成就。2007年以來,中國農業保險累計保費收入超過600億元,年均增速達到85%,共計向7000多萬農戶支付保險賠款超過400億元。目前中國農業保險業務規模已躍居世界第二,成為全球最重要、最活躍的農業保險市場之一②http://www.chinairn.com/news/20120409/446224.htm l。。
但是,隨著農業保險試點的逐漸深入,缺乏精準費率厘定等一些制約中國農業保險進一步發展的限制因素也逐漸引起相關人士的關注。農業保險推行效果很大程度上取決于保險費率厘定的合理性,而費率的厘定過程其實就是確定風險損失發生概率和損失分布的過程(于洋,2010)[1]。目前,國內外研究者主要采用參數法或非參數法來厘定農作物保險的費率。參數法首先假定農作物單產波動服從某種分布,然后用單產波動數據估算該分布具體參數值;非參數方法不需要事先假定作物單產分布模型,具有分布形式自由、對函數形式分布假設要求較寬松、計算結果準確等優點。為精準厘定不同地區不同農作物的保險費率,推進中國農業保險的深入發展,在中國保監會及各地保監局的支持下,全國許多地區都開展了厘定本地大宗農產品費率的工作。但由于中國縣級單位農作物單產、總產、播種面積是從1988年開始統計的,因此,截至目前全部縣級農作物的研究期限只有24年,屬于小樣本。而國內外研究文獻對于小樣本數據研究應該采用參數法還是非參數法存在爭議。基于此,本文采用新疆阿克蘇市1949—2010年棉花生產的數據來驗證參數法和非參數法處理小樣本數據的優劣,為各地的農作物保險費率厘定工作提供研究方法借鑒。
參數法和非參數法通常用于估計未知分布形態的樣本數據的相關分布模型,尤其是在擬合農作物單產分布函數時,運用更為廣泛。所謂參數法就是,首先假定作物RSV序列服從某一分布模型,然后用RSV序列估計該分部函數的相關參數,最終得到該序列的概率密度函數。在采用參數法進行估計分析時關鍵是選擇一個合適的分布函數,只有選取比較接近于待分析數據的真實分布形態時,得出的結果才比較可靠。目前,各國學者已提出了60余種概率密度函數(PDF)。同時,關于參數估計法在農業生產風險中的應用方面,國內外學者也進行了大量研究,并提出了多種參數分布模型,如Bate分布(Nelson and Preckel,1989)、Gamma分布(Gallagher,1987)、Weibull分布(Sherrick etal,1997)、Burr分布(Chen and Miranda,2004)、對數正態分布(Goodwin、Roberts and Coble,2000)和雙曲線反正旋分布(Ramirez,1997)等。中國學者庹國柱、趙樂等(2010)[2]采用Rayleigh(2P)、Weibull(3P)、JohnsonSB、JohnsonSU(后二者均屬于Johnson Family家族分布函數)、Logistic等9種可能的作物單產分布模型,分別擬合了北京市主要的糧食及經濟作物的單產分布情況,并在此基礎上厘定了北京市縣域農作物的保險純費率,取得了很好的效果。由于在小樣本容量中很難發現數據的“規律性”。因此,在小樣本數據中事先假定符合某種分布模型,能更好地排除其他分布函數所帶來的干擾,即參數估計法在小樣本數據容量中具有很好的適應性(張峭、王克,2007,2010)[3]。國內學者劉立新、黃崇福、史培軍(1998)[4],邢鸝(2004),于洋、王爾大(2010)[5],葉濤、聶建亮、武賓霞(2012)[6]等也分別先后得出:參數法需要事先假定模型形式,適用于樣本數據量較小的情況。而非參數方法不需要事先假定作物單產分布模型,受樣本觀測錯誤影響小,但對樣本數量要求很高,適用于大樣本情況的結論。國外學者Ker,Alan P and Allen M Featherstone&Terry L Kastens(2000)認為在數據容量嚴重短缺的農業經濟領域,尤其是關于農作物年均產量變化方面的研究,參數法依然是最有成效的。Octavio A Ramirezetal(2003)[7]也發現“在小樣本數據或者多變量統計中采用非參數估計法進行統計分析時,存在嚴重且難以克服的問題”。根據Alan PKer&Keith Coble(2003)[8]的工作,“在一個非常小的樣本容量中,即便是隨意選擇一個分布函數,如常見的正態分布,都要比采用標準的非參數核密度函數得到的結論精確”。Goodwin BK& MahulO(2004)甚至更進一步地給出:當樣本數據量較少(少于30-40)時采用參數方法;反之則建議采用非參數估計方法。
然而,也有部分學者對此持有不同看法。王麗紅、楊汭華、田志宏等(2007)[9],楊汭華、王麗紅、鮮祖德(2009),梁來存(2009)[10],李文芳(2012)[11]等先后指出:非參數估計法不限制樣本母體的分布形式,在小樣本中是穩定的,能夠更好地體現區域風險的差異性特點;并在此基礎上,他們分別采用非參數核密度法厘定了中國各區域糧食、小麥、玉米、谷物、棉花以及湖北省縣域水稻等農作物的保險純費率。
現有的關于兩種方法在小樣本農作物保險中運用優劣的討論主要集中于理論層面,而采用實證方法進行比較、證明的研究成果卻比較少。郭興旭、陶建平、曾小艷(2010)使用四種參數方法與一種非參數方法對湖北省78個縣市的油菜單產保險純費率進行厘定,發現不同分布下厘定的費率明顯不同,并對五種分布擬合的效果做出評價。但是,該文沒有得出非參數方法厘定出的費率是否優于參數方法的結論,僅從圖形上直觀地比較了其與其他分布之間的擬合優劣。
為了解決參數法需要事先假定分布形式、主觀性強,并且不適合大樣本數據統計的缺陷,20世紀70年代初期美國學者率先提出將非參數法運用到農業經濟研究之中。隨后一些具體的非參數密度估計函數先后被提出,主要有核估計、近鄰密度估計及投影尋蹤密度估計,這些非參數估計方法統稱為PDF。非參數估計法不需要事先假定分布形式,具有分布形式自由,對函數形式假設要求寬松,受樣本觀測錯誤影響小,計算結果準確等優點,但同時對樣本數據量要求較高,適用于大樣本條件下的風險分析。因此,在大樣本容量條件下采用非參數法自由擬合樣本的分布形態,可以得到更精確的概率密度函數。正如Goodwin Barry K(2000)所指出:在大樣本數據容量條件下,估計農作物產量的概率密度分布函數非常容易,研究者只需要簡單地選取非參數核密度法就能得到一個合理而準確的估計結果。
基于此,本文將大樣本條件下采用非參數(核密度)法得到的農作物保險費率作為參考標準;再在該大樣本數據中選取部分小樣本數據,分別采用參數法和非參數法厘定農作物保險純費率。最終,通過對比分析,得到小樣本數據下農作物保險純費率精算的合理方法。
新疆阿克蘇市是“國家級優質商品棉基地”,對棉花作物的單產資料記錄比較詳細全面,而且數據具有很好的連續性。同時,根據《中國氣象大典(新疆卷)》及新疆氣象局的農業氣象災害數據分析,阿克蘇市棉花生產自1949—1987年和1988—2010年兩個時間段的因災減產情況差異不大,因此,本文采取不同方法對阿克蘇市棉花保險費率進行精算,并根據各種模型需要的條件,選取不同大小樣本容量的單產數據來進行對比。
本文選取阿克蘇市62年的棉花單產數據,其中1949—1987年的數據來自《阿克蘇地區志》,1988—2010年的數據來自《新疆統計年鑒》(1989—2011)。在大樣本數據中(即1949—2010年的全部數據)采用非參數核密度法精算阿克蘇市棉花保險費率,計算結果記為r0,并將r0作為參考標準;在小樣本數據中(即1988—2010年的數據)采用參數法和非參數核密度法厘定阿克蘇市棉花保險費率,厘定結果分別記為r1、r2。最后,在對比r0和r1以及r0和r2差別大小的基礎上,推斷參數法和非參數的優劣。
(一)提出理論假設①在大樣本容量數據中非參數法是最有效的(由于在大樣本中比較參數和非參數估計法的優劣不是本文研究的重點,因此在此不再詳述),所以,本文采用在大樣本中采用非參數法厘定出的阿克蘇市棉花保險純費率r0作為參考標準,以此來評價小樣本中參數及非參數法的優劣。
(1)r1、r2分別與r0相比較,r1更接近于r0,則小樣本容量中參數法更有效;
(2)r1、r2分別與r0相比較,r2更接近于r0,則小樣本容量中非參數核密度法更有效;
(3)r1、r2分別與r0相比較,r1和r2基本一致,則小樣本容量中兩種方法沒有顯著差異。
(二)實證過程及結果
(1)大樣本下非參數核密度法實證過程及結果。
首先,根據1949—2010年阿克蘇市棉花單產變化的散點圖,確定采用四次方程來擬合阿克蘇市棉花單產的趨勢方程,具體方程如下:


表1 大樣本下非參數核密度法厘定純費率計算表
然后利用MATLAB-R2010a軟件的編程功能厘定大樣本下阿克蘇市棉花單產保障水平λ=100%條件下的期望損失率及保險純費率,結果見表1。
(2)小樣本下參數法實證過程及結果。
首先,根據1988—2010年阿克蘇市棉花單產變化的散點圖,確定采用三次方程來擬合阿克蘇市棉花單產的趨勢方程,具體方程如下:

然后,采用K-S、AD、C-S(卡方)三種檢驗方法判斷RSV是否符合某種分布,若三種檢驗方法得到的最優模型結論一致,則認定該模型為最優;如三種檢驗結論不一致,但其中兩種方法得出的結論一致,則最優模型選為這兩種方法得出的共同結論;若三種方法得出結論均不一致,則以AD檢驗結果為準,比較結果見表2。

表2 小樣本下RSV序列單產分布模型的擬合優度檢驗②在所采用的參數分布模型中只選取綜合排名位于前5名的分布模型,同時考慮到正態分布這一常用的分布函數,本研究也將該分布函數列出,供對比參考。
最后,根據單產數據確定各分布函數的相關參數數值,并在此基礎上厘定各種分布條件下100%保障水平下的保險純費率,結果見表3。

表3 小樣本下參數法厘定純費率計算表
(3)小樣本下非參數核密度法實證過程及結果。
根據已確定的1988—2010年阿克蘇市棉花單產趨勢方程,利用MATLAB-R2010a軟件的編程功能,厘定小樣本下阿克蘇市棉花單產保障水平λ=100%條件下的期望損失率及保險純費率(見表4)。

表4 小樣本下非參數核密度法厘定純費率計算表
(三)模型比較及選擇
(1)分別對阿克蘇市棉花RSV序列在大樣本條件下的非參數核密度分布及在小樣本條件下的六種分布函數即:Dagum(4P)分布、Johnson SU分布、Laplace分布、Log-Logistic(3P)分布、Cauchy分布、Normal分布進行擬合,如圖1和圖2。

圖1 大樣本條件下非參數核密度擬合阿克蘇市棉花RSV序列概率密度分布

圖2 小樣本條件下六種不同密度函數對阿克蘇市棉花RSV序列擬合圖
(2)從上圖可以看出,六種概率分布模型均能在一定程度上很好地擬合出阿克蘇市棉花RSV序列的概率分布。但是,采用Dagum(4P)、Johnson SU或者Laplacen等形式的單產損失分布函數厘定出的純費率r1(分別為3.78%、4.13%、3.96%)和參考費率r0(3.49%)比較接近;而采用非參數核密度法厘定出的純費率r2(5.09%)卻與r0相差較大。因此,小樣本條件下采用參數法厘定農作物保險費率更可靠。
(1)比較參數法和非參數法的優劣需要首先確定一個標準,然后拿參數法、非參數法厘定的結果與標準進行比較,結果接近的為優,因此,標準的選定十分重要,選取一個更為精確的標準是今后農作物保費精算的重點研究領域之一。
(2)目前,參數法有60多種分布,但只有一部分可以采用K-S、AD、C-S來檢驗優劣,這可能遺漏正確的分布模型,造成結果失真,因此,研究判定盡可能多的分布模型優劣的檢驗模型是今后農作物保費精算的研究方向之一。
[1]于洋.基于保險精算原理的政策性作物保險定價研究[D].大連理工大學,2010.
[2]庹國柱,趙樂,朱俊生,等.政策性農業保險巨災風險管理研究——以北京市為例[M].北京:中國財政經濟出版社,2010:156-158.
[3]王克,張峭.農作物單產生產風險分布對保險費率厘定的影響——以新疆3縣(市)棉花單產保險為例[J].中國農業大學學報,2010,(2):114-120.
[4]劉新立,黃崇福,史培軍.對不完備樣本下風險分析方法的改進及應用——以湖南省農村種植業水災為例[J].自然災害學報,1998,7(2):10-16.
[5]于洋,王爾大.政策性補貼對中國農業保險市場影響的協整分析[J].中國農村經濟,2009,(3):20-28.
[6]葉濤,聶建亮,武賓霞,等.基于產量統計模型的農作物保險定價研究進展[J].中國農業科學,2012,45(12):2544-2551.
[7]Octavio A Ramirez,Sukant Misra,and James Field.Crop-Yield Distributions Revisited[J].American JournalofAgricultural Economics,2003(85)1:108-120.
[8]Alan P Ker and Keith Coble.Modeing Conditional Yield Densities[J].American Journal of Agricultural Economics,2003(85)2:291-304.
[9]王麗紅,楊汭華,田志宏,等.非參數核密度法厘定玉米區域產量保險費率研究——以河北安國市為例[J].中國農業大學學報,2007,(1):90-94.
[10]梁來存.我國糧食單產保險費率厘定的實證研究[J].統計研究,2010,(5):28-38.
[11]李文芳.基于非參數信息擴散模型的湖北水稻生產災害風險評估[J].江西農業大學學報(社會科學版),2012,(1):58-62.
(責任編輯:賈偉)
1003-4625(2014)02-0085-04
F840.66
A
2013-11-20
本文為國家自然科學基金項目:《金融視角下的新疆棉花種植業風險管理研究》(70863009);新疆高??蒲谢鹬攸c項目:《新疆特色林果業生產風險評估與保險精算研究》(XJEDU2012I32)。
吳垠豪(1986-),男,河南許昌人,河南省社會科學院科研人員,研究方向:金融工程及保險精算。