李 飛 馮強中 張雨晴 范文斌
(科大國創云網科技有限公司,安徽 合肥 230000)
近年來,金融行業普惠政策的推廣迎來了很多新用戶,同時,行業的特殊性對風險控制提出了很高的要求,新用戶的風控評估成了金融行業推廣普惠政策的關鍵,普惠政策作為新政策,樣本量不足的問題會給用戶風控水平預測造成困難。隨著人工智能領域的飛速發展,AI已經廣泛應用于醫療、金融以及通信等領域。但是考慮到金融領域新政策出臺時缺乏用戶數據,僅使用人工智能中的機器學習算法進行預測必將導致結果不準確的問題。為了豐富數據的來源,許多學者將遷移學習作為一個關鍵技術進行研究。遷移學習的思想是當目標領域可用數據量較少時,從不同但是相關的領域中尋找類似數據進行訓練,將大樣本遷移到小樣本中,以解決小樣本中樣本量稀疏的問題。根據遷移的過程不同,現在主流的遷移學習方法大致分為4種:基于實例的遷移、基于特征的遷移、基于參數的遷移以及基于關系的遷移。
該文利用遷移學習的思想,將與原任務樣本類似的數據遷移至訓練集中,以樣本量,結合訓練速度快、準確率高的LightGBM模型進行5折交叉驗證,從而有效地提高預測的準確率。
在遷移學習的數學定義中,源域是已知的、成熟的領域,目標域是數據量小的、新的且需要借助其他領域學習的領域,給出源域的數據和任務,目標域的數據和任務,使用源領域和任務中的知識去改進對于目標領域的預測函數。……