劉倩
一、緒論
未決賠款數據作為準備金估計的基礎資源,只有得到精確的準備金估計值,才能準確反映保險公司當前的財務和經營狀況,為保險公司的運營決策提供合理依據。
在非壽險精算實務中,異常賠款額極有可能出現,需要采取合理的處理方法調整或保留異常賠款額,提高索賠準備金估計的準確性。本文將嘗試使用主成分分析法進行識別異常值,以得到更為科學合理的準備金估計值。
二、異常值
(一)異常值的概述
異常值是在數據集合中顯著偏離其他數據點或既定模型的數據點。統計結果常因異常值的存在而與準確結果產生偏離,也會給后續分析帶來麻煩。對于這些數據,人們經常不加區分一律剔除,這樣有意義的數據也極有可能被剔除,從而影響了最終結果的科學性和合理性。因此,我們應該找出原因,使取舍數據有更加充分的依據。但若不能找出原因,就不能輕易保留,也不能隨意舍棄,而應該進行統計檢驗,判明該數據是否為異常值。因此異常值的確定需要遵循一定的原則。
對于工作人員的操作失誤等造成的異常數據,應該及時修正或剔除,。而數據本身變異性造成的異常值,應該謹慎處理,不應籠統的一并剔除,需要有實際工作者的參與才可以進一步處理。所以,將異常數據一并處理可能會錯過一些重要信息,使統計推斷結果與實際情況發生偏離。
沒有一種檢驗處理方法適用于所有情況,在非壽險精算領域中,對異常值問題的研究更是少之又少。我們應該探究異常值對不同模型準備金估計的影響,嘗試建立更加有效的準備金估計模型以查找并規避原始數據中的異常值,為保險公司的運營決策提供參考。
(二)異常值的處理方法
在非壽險精算領域,如果忽視原始賠款數據中出現的異常值,可能會導致保險公司預留錯誤數據量的保證金,從而增加保險公司的運營風險,降低保險公司的競爭力,影響公司的經營狀況。
常常采用以下幾種方法對異常值進行處理。第一,直接將該異常值刪除。該方法簡單易行但很容易造成樣本量不足,使統計模型不穩定。
第二,暫且保留,結合整體模型進行綜合分析。如果觀測到的異常值對整個模型而言,沒有很明顯時應該進行綜合分析,建議保留。
如果樣本量很小,可以考慮使用均值或其它統計量取代。用均值取代異常值,雖補充了樣本,但丟失了樣本“特色”。
將異常值視為缺失值,利用統計模型填補。這個方法要視異常值的特點而定。
第三,使用抽樣技術或模擬技術,接受更合理的標準誤等信息。
本文將嘗試使用主成分分析法進行識別異常值。
三、診斷并調整異常值
本節將介紹在鏈梯法中嘗試使用主成分分析法和箱線圖進行識別異常值。
下面運用傳統的主成分分析法來診斷進展年1是否存在異常值。
首先運用SPSS進行主成分分析,將標準化后的數據選入Variables,結果如圖1所示。
由圖1可看出來,進展年1與其他進展年標準差相差很大,因此進展年1存在異常值。
再運用SPSS軟件再對第二列畫箱圖,做圖表分析,可以看出,進展年1的數據中的異常值是60000。
最后,進行調整異常值。
當診斷出進展年0存在異常殘差時,我們把對應的賠款額當做異常值進行調整。具體方法如下,如果相應的進展年1的數據也被診斷為異常值,就應該采用進展年0中所有數據的中位數來代替該異常值。也可以數據本身的特征,采用進展年0中除該異常值以外的數據的均值來代替該異常值。如果相應的進展年1的增量賠款數據沒有被診斷為異常值,那么進展年0的異常值可以用進展年1的數據與基于增量計算的穩健進展因子做商來代替。
用公式表示如下:如果進展年0存在異常殘差,假設為:。
第一,若是異常值,則:
(1)
第二,若不是異常值,則:
(2)
(一)診斷并調整其它進展年的異常值
若要查找其他進展年的異常值,我們仍需借助殘差,但擬合值的獲得通過另外一種方式。下面給出診斷并調整其他進展年異常值的步驟:
第一,通過上文我們已經知道,進展年0已經不存在異常值,所以其它進展年的進展因子可以基于進展年0的賠款額進行計算,即:
(3)
第二,將各列的進展因子乘以第一列數據,計算擬合的上三角賠款額:
(4)
此時,一個異常數據只對它對應的殘差產生影響。所有第一列的的殘差均為0,第一列可能的異常值也是通過這些殘差無法獲得的。
第三,類似式(4)計算殘差值:
(5)
異常殘差由除進展年0外所有殘差的中位數代替,最后的估計值由這些調整后的殘差反推得到,用表示。
第四,由新數據重新估計準備金。
由最終得到的穩健增量未決賠款數據,采用傳統鏈梯法估計準備金。需要注意,采用以上方法,流量表角上的數據和若出現異常值是無法診斷的。因為是最近事故年發生的第一個賠款額,因此很難確定該值是否為異常值,同樣,是進展年J的唯一增量賠款額,也無法檢查是否為異常值。
第五,對調整后的穩健增量賠款數據,應用傳統鏈梯法評估未決賠款準備金。
四、結論
通過以上分析,我們可以發現在含有異常值的情況下,使用主成分分析法和箱線圖可以有效地進行識別異常值,從而減小異常值對準備金估計的影響。
參考文獻
[1]段白鴿,張連增.考慮離群值的穩健鏈梯法[J].數理統計與管理,2015,06:989-1006.
[2]段白鴿.非壽險隨機性索賠準備金評估統計模型與方法[D].南開大學,2013.
[3]蔣青松,李保東,非壽險準備金及其評估方法[J].經濟研究導刊,2011,21:84-85.
[4]楊競,童禎恭,劉玉哲.SPSS軟件對飲用水水質進行主成分分析評價的運用[J].環境科學與技術,2011,07:171-174.endprint