999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LightGBM算法的簡易險潛在客戶挖掘應用

2022-08-31 19:46:09樊曉唯蔣林岑劉向東
電腦知識與技術 2022年17期
關鍵詞:機器學習

樊曉唯 蔣林岑 劉向東

摘要:本文以某金融機構的一類保險產品——簡易險為例,詳細闡述LightGBM算法在金融產品目標客戶挖掘中的應用。經過參數優化和動態調整閾值,最終將目標用戶的預測準確率從原始的比例0.41%提升到14.96%,并且獲得了22.84%的召回率。同時,該模型可針對營銷活動和營銷資源的情況,實時調整概率閾值,從而調整營銷目標的輸出規模,對業務營銷推廣提供了積極的指導價值。

關鍵詞:機器學習;LightGBM;分類預測

中圖分類號:TP311? ? ? 文獻標識碼:A

文章編號:1009-3044(2022)17-0017-02

1引言

近年來機器學習被廣泛應用于金融產品領域,如投資組合管理優化、貸款和保險承保、風險管理,及市場營銷中的潛在目標客戶挖掘等場景[1]。本文以某金融機構的一類保險產品——簡易險為例,詳細闡述LightGBM算法在金融產品目標客戶挖掘中的應用。

簡易險是一種小面額、免體檢、適合一般普通工作者的綜合意外險保險。其保險責任主要為人身意外保險附加交通意外傷害保險、財產意外保險等[2]。隨著近幾年的發展,簡易險業務已在全國形成一定規模,但是與傳統金融業務相比,簡易險業務仍處于較小規模,占金融總收入比例不高。然而,簡易險業務保障屬性突出,符合未來發展趨勢,且市場空間巨大,是一類具有發展前景的產品。

本文探討了一種基于機器學習的潛在目標客戶挖掘方案,利用該金融機構的歷史數據,基于LightGBM算法構建簡易險潛在客戶挖掘模型。

2 LightGBM算法

LightGBM是 Light Gradient Boosting Machine 的縮寫,本質上也是一種Boosting算法,由微軟提供,是一種免費開源的分布式梯度提升框架。LightGBM與在此之前的XGBoost原理類似,都是對GBDT的高 效實現。兩者都采用損失函數的負梯度作為當前決策樹的殘差近似值,以此來擬合新的決策樹[3]。但是在很多方面,LightGBM都優于XGBoost,比如:更快的訓練速度、更低的內存占用、更高的模型準確率、并行計算、可直接支持離散特征作為輸入等。

LightGBM 算法主要使用了兩種新技術,第一種是基于梯度的單側采樣 (GOSS) ,以此減少算法輸入數據量;第二種是互斥特征捆綁技術 (EFB),將互斥的特征捆綁成一個特征,從而降低特征維度;除此之外,LightGBM還采用直方圖方法對連續特征進行處理,將連續特征離散化到多個分箱中,進一步提高分裂時的搜索速度[4]。

3基于LightGBM的簡易險潛在客戶挖掘模型

為了更好地發展簡易險業務,本節基于LightGBM算法,運用金融客戶歷史數據,研究建立能挖掘簡易險潛在客戶的模型。建模目的在于,在龐大的存量金融客戶群體中,找出最具有簡易險購買潛力的客戶,并且可根據營銷資源的情況,動態調整目標客戶規模。

3.1 特征選取

為應用LightGBM挖掘潛在簡易險客戶,首先對目標客戶做一個基本范圍限定,即:截至2020年底金融總資產大于100元的客戶,共計468萬客戶。為更好地評估本次模型挖掘的效果,選取2020年客戶的屬性及行為特征作為輸入,將預測結果與2021年的真實簡易險購買數據進行對比驗證。部分重要的特征說明如表1所示。

3.2 模型訓練

依照上一步特征篩選出的數據,訓練集和測試集數據的比例設定為3:1。對離散型特征變量進行預先配置,LightGBM算法參數主要如下:目標函數objective設置為二分類、迭代次數設置為200、學習率設置0.01、葉子節點數設置32、樹最大深度設置為6、 L2正則化系數為0.001、自動平衡正負樣本設置為True。最終訓練得到預測模型。

params = { 'objective': 'binary', 'metric': {'binary_logloss', 'auc'}, 'num_iterations': 200,

'learning_rate': 0.01, 'num_leaves': 32, 'max_depth':6, 'bagging_fraction':0.8,

'feature_fraction':0.8, 'lambda_l2': 0.001, 'is_unbalance': 'true' }

3.3 模型評價

在機器學習的分類任務中,經常使用混淆矩陣(Confusion Matrix)來作為評價模型好壞的指標,混淆矩陣有兩行兩列,分別對應預測數據和真實數據的分類情況[5]。在本案例中由于正樣本較少,且挖掘的目的是盡可能提升模型的準確率,所以通過選擇不同的分類閾值,來控制預測出的正樣本的數量和準確率。表2顯示的是當LightGBM分類概率閾值設置為0.96時模型的混淆矩陣。

由表2可計算得出:簡易險客戶預測的準確率為14.96%,召回率為22.84%。相比原始數據目標占總體樣本比例僅為0.41%,有大幅度的提升。模型的F1值,由公式可得出:

[F1_Score=2×準確率×召回率準確率+召回率=2×0.1496×0.22840.1496+0.2284≈0.18 ]

當概率閾值不同時,結果也會有一定差異,本模型求解了概率閾值0.5到1.0之間的各種情況,分別計算準確率、召回率、F1值,以及輸出的預測目標客戶的數量,來進行綜合對比。從圖1可以看出,當概率閾值取0.96時,F1值最高。

與此同時,從圖1中可以看出不同的概率閾值對應的準確率與回收率的關系,如果需要更高的準確率,可適當提高概率閾值;如果想要收獲更多的預測目標客戶和較高的召回率,則可以適當降低概率閾值。本文提供了一種可動態調整的分類模型目標輸出方案。

3.4 模型對比

為了驗證此模型具有相對優勢,筆者選用同樣的訓練數據集與測試數據集進行了傳統的決策樹二分類模型訓練與XGBoost模型訓練以作比較,準確率、召回率、F1值結果如表3所示。

不難看出,傳統的決策樹在這類稀疏目標預測上性能非常不理想,無論準確率還是召回率都遠低于LightGBM和XGBoost;LightGBM和XGBoost對比,準確率和召回率都有小幅優勢,更重要的是,LightGBM的模型訓練時間只有XGBoost的五分之一,效率優勢巨大。因此可以說,LightGBM模型在簡易險潛在客戶挖掘中取得了優良的效果。

4結束語

本文的重點內容是應用LightGBM算法對滿足一定條件的金融存量客戶進行建模,挖掘出簡易險產品的潛在目標客戶。經過參數優化和動態調整閾值,最終將目標用戶的預測準確率從原始的比例0.41%提升到14.96%,并且獲得了22.84%的召回率。該模型可針對營銷活動和營銷資源的情況,實時調整概率閾值,從而調整營銷目標的輸出規模,對業務營銷推廣提供了積極的指導價值。

參考文獻:

[1] 毛子林,劉姜.基于機器學習方法的信用風險評估綜述[J].經濟研究導刊,2021(23):117-119.

[2] 安真,楊帥.新發展格局下郵政消費金融轉型發展研究[J].現代金融導刊,2021(8):53-55.

[3] Ke G, Meng Q, Finley T, et al. Lightgbm: A highly efficient gradient boosting decision tree[J]. Advances in neural information processing systems, 2017(30): 3146-3154.

[4] 王思宇,陳建平.基于LightGBM算法的信用風險評估模型研究[J].軟件導刊,2019,18(10):19-22.

[5] Visa S, Ramsay B, Ralescu A L, et al. Confusion matrix-based feature selection [C]//Proceedings of The 22nd Midwest Artificial Intelligence and Cognitive Science Conference 2011, Cincinnati, Ohio, USA, 2011.

收稿日期:2022-02-10

基金項目:2020 年度江蘇省工業軟件工程技術研究開發中心開放基金項目(ZK20-04-02)

作者簡介:樊曉唯(1988—),女,江蘇蘇州人,講師/工程師,研究方向:職業本科教育、人工智能、機器學習、深度學習、計算機視覺;蔣林岑(1986—),女,江蘇南通人,講師/工程師,研究方向:職業本科教育、人工智能、大數據、數據清洗;劉向東(1971—),安徽蕪湖人,男,副教授/工程師,研究方向:職業教育、人工智能、機器學習、計算機視覺、知識圖譜。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲中文无码av永久伊人| 四虎免费视频网站| 免费无码又爽又刺激高| 激情综合网址| 日韩精品亚洲一区中文字幕| 丁香六月激情婷婷| 国产va欧美va在线观看| 国产激情无码一区二区免费 | 亚洲日韩精品伊甸| 天天做天天爱天天爽综合区| 欧美日韩成人在线观看| 网久久综合| 亚洲av片在线免费观看| 午夜在线不卡| 第一区免费在线观看| 狠狠色噜噜狠狠狠狠奇米777| 欧美亚洲日韩不卡在线在线观看| 亚洲精品777| 欧美国产日产一区二区| 日韩精品视频久久| 欧美日韩国产综合视频在线观看| 中文字幕亚洲专区第19页| 亚洲高清中文字幕| 毛片免费在线视频| 日韩精品一区二区深田咏美| 欧美福利在线| 99精品在线视频观看| 日韩专区欧美| 国产亚洲视频播放9000| 蜜桃视频一区二区| 5388国产亚洲欧美在线观看| 四虎精品黑人视频| 好吊妞欧美视频免费| 亚洲性网站| 青草娱乐极品免费视频| 久草视频中文| 国产亚洲精品无码专| 日韩精品欧美国产在线| 亚洲成人动漫在线| 国产女人在线视频| 亚洲最猛黑人xxxx黑人猛交| 激情综合网址| 亚洲成a人片| 免费国产福利| 好吊色国产欧美日韩免费观看| 亚洲六月丁香六月婷婷蜜芽| 亚洲成人精品| 国产高潮视频在线观看| 国内精品伊人久久久久7777人| 欧美精品影院| 国产精品久久自在自线观看| 亚洲午夜福利精品无码不卡| 免费无码又爽又黄又刺激网站| 一本大道香蕉高清久久| 国产在线98福利播放视频免费| 最新国产麻豆aⅴ精品无| 无码aaa视频| 99在线视频精品| 国产亚洲欧美日本一二三本道| 真实国产乱子伦高清| 国产av剧情无码精品色午夜| 日韩欧美中文字幕在线精品| 色噜噜久久| 亚洲狠狠婷婷综合久久久久| 97狠狠操| 国产成人亚洲毛片| 中文字幕无码制服中字| 国内自拍久第一页| 欧美一级在线播放| 欧美午夜在线观看| 大陆精大陆国产国语精品1024| 美女扒开下面流白浆在线试听 | 精品夜恋影院亚洲欧洲| 亚洲综合极品香蕉久久网| 伊人精品成人久久综合| 国产精品分类视频分类一区| 日本免费一级视频| 欧美中出一区二区| 五月婷婷综合网| 欧美日韩一区二区三| 精品久久久久久久久久久| 麻豆国产精品视频|