黃山 尹龍威 孫海晨



摘要:近年來,國際保險行業穩步開展,機動車保險在我國的財險保費中所占比重最大。隨著我國汽車保有輛的持續增加和相關車險政策的出臺,投保率也呈持續上升趨勢。如何能精準判定客戶續保概率至關重要。為此本文建立一個預測客戶續保概率模型,首先將影響車險業務的因素潛在風險進行劃分,分別從“人”、 “車”、 “環境”三個方面考慮風險因素,對各項指標進行風險系數的劃分以及客戶精準畫像,然后以上述的風險因素的風險系數和是否續保作為輸入因素指標和目標類別,對貝葉斯分類器進行訓練學習,利用貝葉斯分類器對不同客戶進行續保概率求解,從1 000組數據的訓練樣本學習后的貝葉斯分類器分類精準度在80%左右,相對準確的從對客戶的畫像中得到了該客戶續保的概率。
關鍵詞:貝葉斯分類器;客戶畫像;續保概率;風險因素
0.引言
中國目前的車險費率制度,大多數符合“從車主義”。即車險保費多少,主要取決于這輛車本身的各項情況,如車的購置價、座位數、排量、購車年限等,根據這些數據計算出一個基本的車險保費價格,再根據這輛車的上年理賠次數來打不同的折扣[2]。這就導致了中國的車險定價模式非常的單調,相似情況的車型,保費也都差不多。想要改變這種狀況就需要使其變為“從人主義”。需要對客戶進行精準畫像也需要對客戶是否續保概率進行預測。
1.客戶精準畫像
本文從三個大方向車輛、環境、人;10個小方向種類、年齡、性別、NCD等對客戶進行精準畫像。針對重要的文字信息,本文通過風險厘定將文字信息轉化為了數字信息[1]。下面將選取這些數字信息以概率統計的方法對客戶進行精準畫像。
2.貝葉斯分類器
在上文我們對客戶車險的風險因素劃分了風險系數,將以上劃分標準作為類別集合,利用貝葉斯分類器對已有數據中的客戶進行分類,得到客戶的精準畫像。利用風險系數計算各類客戶的續保概率。貝葉斯分類器是一種分類的算法,但他是以概率統計的方法對類別進行劃分。利用概率統計中的貝葉斯公式進行計算,算法的特點就是不會確定樣本的類別,而是以概率的形式告訴這個樣本有多大可能屬于這一類。本文將續保不續保分為兩類,這樣通過將所得數據輸入分類器進行學習。當在輸入客戶得這些信息時,貝葉斯模型就會得到該客戶續保得概率[3]。
貝葉斯分類法基于簡單的貝葉斯公式(1),即通過某對象的先驗概率計算其后驗概率,選擇具有最大后驗概率的類作為該對象所屬的類[4].
根據貝葉斯公式(2)分別計算P(Y1|x)2P(y2|x),…,P(ym|x),其中,由于假設X中各個特征屬性是服從正態分布且條件獨立的,因此P(X|yj)可由式(3)計算,P(xi|yj)可由式(4)計算。
從P(y1| x),P(y2x|),…,P(ym|x)中找到最大值,對應的yj即為X所屬的類。由于P(X)是一定的,要求使得P(yj|x)最大的yj值,即為求使得P(X|yj)P(yj)最大的yj值,即為式(5)。
本文以同品牌同車系的1000組大眾帕塞特客戶相關信息輸入貝葉斯分類器進行學習。另找了10個大眾帕塞特客戶的信息輸入已經訓練好的貝葉斯分類器模型進行檢驗。
3.結論
選取10個大眾帕塞特客戶的信息輸入已經訓練好的貝葉斯分類器模型進行檢驗,結果如下:
從1000組數據的訓練樣本學習后的貝葉斯分類器分類精準度可以在80%。而且也成功的從對客戶的畫像中得到了該客戶續保的概率。
參考文獻
[1]李敬.中國商業車險費率市場化改革下多因子定價模型研究[D].電子科技大學,2018.
[2]胡伊.基于多源數據的車輛風險分析與保險定價模型研究[D].中央財經大學,2016.
[3]王夢晨.A公司車險業務續保率影響因素研究[D].湖南大學,2017.
[4]刁海軍,尹釗.一種基于樸素貝葉斯分類算法的數據預測[J].電大理工,2018( 04):1-3.