四川大學錦城學院計算機與軟件學院 池美伶 楊 杉
在獲取的理賠數據中包括機構、險種、案件號、保單號、賠款金額、賠款時間、費用類型、費用金額、總保費、保額、客戶號、性別、年齡、婚姻狀況、過去三年收入、職業;針對不同年齡段的賠款費之間的差異、費用類型對賠款金額的影響、賠款金額與總保費、保額之間的關系,采用了探索分析、排序、條形圖的可視化分析、相關性分析和線性回歸,得到青少年、中年和老年人的眾數區間是一樣的,未成年的眾數區間最高,青少年和中年的賠償金額中位數大致相同,大概處于一個平均的水平,而未成年的總保費是處于中位數偏上的水平,說明高賠償金額較多。對總保費、保額和賠款金額的分析中發現,賠款金額和總保費呈顯著正相關性、賠款金額和保額呈顯著正相關性、總保費與保額呈顯著正相關性。
近年來隨著我國環境污染加劇、工作壓力增大,惡性疾病發病率持續提高,重大疾病保險已成為人壽保險市場上重要的保障型產品,并有可能在未來3-4年進入新的市場爆發期。在政府發現新形勢助推民生保障下,全面開展醫保經辦服務、大病保險和長期護理保險,普惠補充醫??焖倥d起是目前發展重心。但大多數人對保險還不甚了解,且所購保險尚待改進,比如不同人群的不同保險需求、保額與總保費的比例關系、所購險種相應的疾病健康保障所對應的保額大小等問題都在一定程度上需要得到相應的改進和完善。
而隨著各大保險公司2020年理賠報告陸續出爐,那些藏在保險理賠報告里的關鍵數據可以成為保險消費者制定個人及家庭保障規劃過程中的新參考。諸如理賠獲賠率、理賠時效、理賠病種等藏在保險理賠報告里的關鍵數據亦新鮮出爐。對于關心保險的消費者來說,這些客觀數據在一定程度上集中反映出各家保險公司的整體理賠情況以及風險高發的“理賠重災區”,可為保險消費者制定個人及家庭保障規劃時提供不錯的參考。
由于現代社會的錯綜復雜,人們需要一份生活及健康的相應保障,所以選擇了購買保險這一方式。根據成都人壽保險數據發現,重大疾病是理賠的主要原因,因此,以重大疾病保險理賠的數據為研究對象,對其中各項因素,如:賠款金額、費用金額、總保費、保額、年齡、過去三年平均年收入進行探討,得出與理賠相關的各種因素,由此分析具有較強的現實意義。在國內外文獻綜述的基礎上,發現我國重大疾病保險市場的特點及其主要理賠風險的表現與成因,發現我國重大疾病保險理賠風險居高不下,其原因源于普通消費者對重大疾病保險理解不足。本文正是從成都人壽的保險數據進一步的分析賠款費之間的差異、費用類型對賠款金額的影響、賠款金額與總保費、保額之間的關系。
本項目是基于成都人壽保險客戶資料的excel數據分析,分析過程將通過應用SPSS軟件進行相應的數據可視化呈現。在隨著保險公司計算機系統應用的不斷推進,保險公司提出了對數據進行深入分析和應用的需求。該數據表中包含了機構、險種、案件號、保單號、賠款金額、賠款時間、費用類型、費用金額、總保費、保額、客戶號、性別、年齡、婚姻狀況、過去三年平均年收入、職業等16個屬性,共21萬條數據。
本文數據需要進行的數據清洗操作有刪除空值并將數據排序。在刪除空值的操作中,將原有數據表中帶有空值的數據進行刪除操作,同時為提高數據分析的有效性,刪除數值為0的整行數據。另外,為方便數據操作分析及查看,還可對數據進行排序操作。
自1979年,我國恢復財產保險業務以來,商業保險業經歷了三十多年的快速發展,保費收入逐年上升,從1980年僅有的2.9億元,到2014年突破2萬億大關,再到2016年迅速突破3萬億,保費收入年均增長率達29%,更是在2017年,位居全球第二位,成為名副其實的保險大國。保險行業的發展離不開國家宏觀經濟環境,消費者作為保險購買主體,其年齡結構的變化必然會對商業保險的發展產生深遠影響。
為探究不同年齡段的賠款金額,采用了SPSS探索分析。
在數據選項卡中選中“重新編碼到其他變量:舊值和新值”,按照“0”、“1”、“2”、“3”對各年齡段進行分類,并分別對“0”、“1”、“2”、“3”進行設置值標簽為“未成年”、“青年”、“中年”、“老年”。
另外,根據多次數據操作發現,保留退保費位于2000-10000之間的數據最為有效。不同年齡段的賠款金額如表1所示。

表1 不同年齡段的賠款金額
結論:賠款人群大部分屬于青年人和中年人,未成年人最少,老年其次。之后,再對這四類人群進行置信區間的劃分,得到如表2所示的數據。

表2 中年人和老年人的數據分析
結論:未成年人、青年、中年、老年的偏度和峰度是正數,說明他們的數據分布都是右偏并且是尖峰分布的,高賠償金額的人相對稀疏,大多數分布在較低的賠償金額或集中在平均賠償金額的水平;其中中年人和青少年的數據右偏和尖峰分布的更為強烈,說明高賠償金額的人更為稀疏,未成年人的數據右偏和尖峰分布的程度較為平緩,說明高賠償金額的人相對較多。
近年來,行業健康保險業務快速發展,年均增速超過30%,受到社會各界廣泛關注。加之,2020年一場突如其來的新冠疫情,黨和政府直面壓力,勇于擔當,始終將保障人民的生活和新冠患者的治療放在首位。我國醫療保障體系在這個過程中就體現了其獨特的優勢,在新形勢下,保險作為我國醫療保障體系的補充將面臨著新的機遇。
根據成都人壽保險數據,從不同費用類型對賠款金額的影響,本文采用了排序分析,并選用條形圖進行可視化展示。
所得SPSS條形圖如圖1所示。

圖1 各費用類型的均值賠款金額條形圖
由圖1所得,賠款金額較大的費用類型多為身體疾病,如胃癌、食道癌......等,所以,應倡導人們愛護身體,健康生活。
為了解賠款金額與總保費、保額之間的的關系,在SPSS中使用雙變量相關性分析與線性回歸。
在SPSS中選擇雙變量分析,其中選擇變量為賠款金額、總保費、保額,相關系數選中Pearson相關系數,得到的相關性如表3所示。

表3 賠款金額與總保費、保額的相關性
通過表3中查找分析,雙變量相關選擇變量為總保費、年齡和過去三年平均年收入,相關系數為Person。通過相關性分析,發現賠款金額和總保費呈顯著正相關性、賠款金額和保額呈顯著正相關性、總保費與保額呈顯著正相關性。
之后,我們再對賠款金額、總保費、保額進行線性回歸,通過設置因變量為賠款金額、自變量為總保費、保額,方法選擇逐步進入方法,可得到表4所示SPSS分析結果。

表4 線性系數
通過表4可看出sig小于0.05是有相關且有效,從而可得出:

結論:可通過表可得對相關性分析,發現賠款金額和總保費呈顯著正相關性、賠款金額和保額呈顯著正相關性、總保費與保額呈顯著正相關性。
通過對成都人壽保險理賠數據的一系列相關操作,得出了如下所示結論。從年齡,賠償金額,總保費,費用類型,保額這幾個方面入手,以條形圖呈現,得到賠款金額較大的費用類型多為身體疾病,如胃癌、食道癌......等;運用探索分析,發現未成年人、青年、中年、老年的偏度和峰度是正數,說明他們的數據分布都是右偏并且是尖峰分布的,高賠償金額的人相對稀疏,大多數分布在較低的賠償金額或集中在平均賠償金額的水平;其中中年人和青少年的數據右偏和尖峰分布的更為強烈,說明高賠償金額的人更為稀疏,未成年人的數據右偏和尖峰分布的程度較為平緩,說明高賠償金額的人相對較多;之后,通過對總保費、保額和賠款金額的相關性與線性回歸,發現賠款金額和總保費呈顯著正相關性、賠款金額和保額呈顯著正相關性、總保費與保額呈顯著正相關性。
隨著經濟的發展,人身意外保險市場作為與人民群眾生活息息相關的一個領域,也在不斷地調整發展。不同的行業類別,不同承保范圍內的保險金額隨著人民群眾收入也在不斷提高,人身意外保險這一涉及人民群眾切身利益的險種,成為了社會發展建設的基礎保障措施。如今全球人口老齡化的嚴重,通過這次數據的分析,年齡越大的人應該多注重保險的購買,降低醫療壓力,可以帶來一定的經濟保障,防止生活被意外所改變;雖然我國在發展涉外療養服務貿易上具備一定的優勢,但仍存在醫療保險理賠范圍局限、資源分散等問題。同時,上文顯示賠款金額較大的費用類型多為身體疾病,如胃癌、食道癌......等,應倡導人們愛護身體,健康生活的習慣,身體才是一切生活的保障。人們在購買保險時,也應該明確自己的需求,選擇合適自己的險種,對于平均年收入較低的人群,政府應與機構出面適當提高保額,保障弱勢群體的基本需求。
另外,建議政府規范保險理賠工作,提高涉保司法鑒定質量和保險理賠服務水平,適應人身損害賠償糾紛處理需要,切實維護人民群眾合法權益。針對如上各費用類型的理賠結果,建議保險機構增加人傷理賠崗位專業人員,建立系統化的培訓機制,實行案件責任制和對應的獎懲機制,讓理賠服務能夠更好的進行。