郭耘慧 江西省工業和信息化研究院 江西省南昌市 330036
高杰 江西財經大學現代經濟管理學院 江西省南昌市 330013
改革開放以來,特別是在中國正式加入世貿組織以來,我國的保險行業進入到了飛速發展時期,加上人口基數紅利期的到來,老百姓對自身健康的日益重視,保險業這個關系到國計民生的朝陽產業,受到了巨大的關注。市場主體不斷增加,同時也面臨越來越多的挑戰和競爭,數據處理成為很多保險公司最亟待解決的問題,如何能夠通過可靠有效專業的方式來對數據進行處理,為管理決策服務,成為了許多保險企業的迫切需要。很多保險公司在多年的發展之下已經累積了很多老客戶營銷數據,這其中很多客戶每年都會為保險公司增加大批的加保保費收入,同時,拓展新客戶的難度和所需花費的成本都比開發老客戶要大得多,客戶資源爭奪戰也逐漸發展成為保險業的競爭焦點。
因此對經營相互保險等產品的相關保險公司而言,通過相關數據挖掘工具自主發現海量數據庫中潛藏著的某些規律,為精確發現并且定位客戶投保的趨勢提供了很大幫助。同時給出了更為科學的支持理論以及決策方法,增強了企業在決策方面的科學性和有效性,直接降低了商業成本。相互保險在我國的保險行業中占有很少的市場份額,在市場競爭逐漸激烈的今天,保險企業必須要學會不斷地挖掘自身潛力,提升客戶服務品質。在相互保險行業中通過應用數據挖掘這一技術能夠更加有效的發現潛藏在客戶投保信息中有價值的規律,通過對客戶投保過的數據進行分析,挖掘出相關信息,對客戶下一步的投保進行預測,從而進行交叉銷售,改善服務質量,并且提高保險企業的盈利水平。因此,采用數據挖掘中的關聯規則技術對相互保險產品的交叉銷售進行研究,通過分析投保客戶的歷史數據來預測相關客戶下一步將會購買什么產品,從而更好的采取有針對性的銷售策略,提高相關保險產品的銷售量,達到為企業提高贏利的目的。
相互保險是當今世界保險市場上最主要的形式之一,它是指由一些對同一危險有某種保障要求的人所組成的組織,以互相幫助為目的,實行“共享收益,共攤風險”。集團成員交納保費形成基金,發生災害損失時用這筆基金來彌補災害損失。相互保險組織沒有外部股東,由全體投保人共同所有,不存在投保人與保險人之間的利益沖突。從國際上看,相互保險組織具有以下三個獨特優勢:一是投保人和保險人利益一致,能夠較好地實現以客戶利益為中心,并由客戶參與管理,從而有效避免保險人不當經營和被保險人欺詐所導致的道德風險。二是展業費用較低,核災定損準確度較高,可以有效降低經營成本,為會員提供更經濟的保險服務。三是由于沒有股東盈利壓力,其資產和盈余都用于被保險人的福利和保障,可以發展有利于被保險人長期利益的險種。
根據國際相互合作保險組織聯盟(ICMIF)統計數據,截至2014年,全球相互保險收入1.3萬億美元,占全球保險市場總份額的27.1%,覆蓋9.2億人。中金公司之前發布的一份研報預計,中國相互保險市場前景廣闊,預計10年后相互保險市場份額有望達到10%,市場空間達到7600億元左右。2015年1月,中國保監會出臺《相互保險組織監管試行辦法》,正式對相互保險公司這一組織機構開閘,目前已經有20多家機構申請牌照。雖然能借力“互聯網+”,但相互保險的發展仍面臨許多挑戰。
數據挖掘是人工智能和數據庫領域研究的熱點問題,所謂數據挖掘是指從數據庫的大量數據中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,作出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,作出正確的決策。知識發現過程由以下三個階段組成:①數據準備;②數據挖掘;③結果表達和解釋。數據挖掘可以與用戶或知識庫交互。
數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據準備、規律尋找和規律表示三個步驟。數據準備是從相關的數據源中選取所需的數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含的規律找出來;規律表示是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。數據挖掘的任務有關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。
我們主要將Apriori算法應用于相互保險產品的交叉銷售中,用關聯分析方法相互保險產品進形行處理,隱藏于某些產品的相關性我們可以發現。所以選取了某個保險公司的客戶投保記錄數據作為研究對象,選擇了其中投保險種在兩種以上的客戶作為輸入樣本進行相關性分析。下面我們用編號來表示各種險種,如下表1所述。

表1 險種代碼編號
收集到的客戶投保數據如下,見下表2。

表2 客戶投保數據庫樣本
如果一人同時投保了兩個險種,如個人意外傷害保險和重大疾病保險,則我們就可以表示成{I2,I5}的形式。
下面我們對表2進行處理,生成改進的客戶投保數據庫樣本,如下表3。輸出下列關聯規則:

表 3 改進的客戶投保數據庫樣本

圖1 頻繁集的產生過程
經常用于選擇關聯規則的度量有三個。第一,支持度(support),第二,置信度,第三,提升度。下面我們將分別對它們進行介紹:
(1)支持度是指事務集中既包含X又包含Y的事務數在所有事務數中所占的百分比。計算公式如下:
support(X→Y)=P(XUY)
(2)置信度是指事務集中含X也包含Y的事務數在包含X的事務數中所占的百分比。計算公式如下:
confidence(X→Y)=P(Y/X)=P(XUY)/P(X)
(3)提升度是指置信度與包Y的事務數所占百分比的比值。計算公式如下:

其中,P(X)為包含X的事務數所占的百分比。
由規則“I1,I2→I3”可以知道一般相互保險客戶在購買個人定期壽險和個人意外傷害保險時,同時選擇購買個人意外傷害醫療保險的可能性比較大。
由規則“I1,I3→I2”可以知道一般相互保險客戶在購買個人定期壽險和個人意外傷害醫療保險時,同時選擇購買個人意外傷害保險的可能性比較大。
根據上面的這些規則,相互保險公司就可以制定出合理的相互保險產品銷售匹配方案,例如將個人意外傷害保險和個人意外傷害醫療保險在一起對客戶進行推薦。從而使公司更有針對性的向客戶推薦產品,增加成功銷售的概率,進一步擴大公司收益。另外,公司也可以據此做一些特定的郵件跟蹤服務,進而掌控更多客戶資源。通過對上面的模型進行分析驗證,可以看出,Apriori模型在相互保險產品交叉銷售中應用的優良效果。隨著相互保險公司客戶數據的不斷擴大和完善,此模型也可以對后期的銷售工作起著一定的指導意義。但同時為了研究方便,選取的樣本數據較少,與實際應用的效果可能存在著偏差,模型的訓練結果也存在著一定的主觀性,這是在以后的研究過程中有待改善的地方。
隨著商業社會競爭愈演愈烈,相互保險公司為了增強自身的實力,必然在客戶關系管理方面更加廣泛的應用數據挖掘這一技術。相互保險公司通過應用數據挖掘這一技術,相互保險公司的歷史銷售數據進行深層次分析,挖掘出隱含其中的有用信息,從而找準客戶需求,對客戶進行有針對性的銷售,提升企業的競爭能力和企業的盈利水平,已經成為了未來的一種發展趨勢。數據挖掘中的關聯分析功能在推動銷售預測的發展中有著重要意義,這一技術在未來必將廣泛應用。同時這一技術在社會發展和技術人員的努力下,應用效果必將越來越準確,對相互保險公司的發展也占據著越來越重要的地位。