賽題背景
隨著社會信用體系建設的深入推進, 社會信用標準建設飛速發展,相關標準相繼發布,包括信用服務標準、信用數據釆集和服務標準、信用修復標準、城市信用標準、行業信用標準等在內的多層次標準體系亟待出臺,社會信用標準體系建設有望快速推進。社會各行業信用服務機構深度參與廣告、政務、金融、共享單車、旅游、重大投資項目、教育、環保以及社會信用體系建設。社會信用體系建設是系統工程,通信運營商需要打造企業信用評分體系,助推整個社會的信用體系升級。同時國家也鼓勵推進第三方信用服務機構與政府的數據交換,以增強政府公共信用信息中心的核心競爭力。
任務描述
中國移動福建公司提供2018年x月份的樣本數據(脫敏),包括客戶的各類通信支出、欠費情況、出行情況、消費場所、社交、個人興趣等豐富的多維度數據,參賽者通過分析建模,運用機器學習和深度學習算法,準確評估用戶消費信用分值。
賽題內容和方向
隨著社會信用體系建設的深入推進,社會信用傳統的信用評分主要通過客戶消費能力等少數的維度來衡量,難以全面、客觀、及時地反映客戶的信用。作為通信運營商,中國移動擁有海量、廣泛、高質量、高時效的數據。如何基于豐富的大數據對客戶進行智能評分是中國移動和新大陸科技集團目前亟須攻關的難題。運營商信用智能評分體系的建立不僅能完善社會信用體系,同時也為中國移動內部提供了豐富的應用價值,包括全球通客戶服務品質的提升、客戶欠費額度的信用控制、根據信用等級享受各類業務優惠等,希望通過本次算法比賽,征集優秀的模型體系,準確評估用戶信用分值。
賽題價值
傳統的信用評分主要以客戶消費能力等少數維度來衡量,難以全面、客觀、及時地反映客戶的信用。中國移動作為通信運營商擁有海量、廣泛、高質量、高時效的數據,如何基于豐富的大數據對客戶進行智能評分是中國移動和新大陸科技集團目前攻關的難題。運營商信用智能評分體系的建立不僅能完善社會信用體系,同時也為中國移動內部提供了豐富的應用價值,包括全球通客戶服務品質的提升、客戶欠費額度的信用控制、根據信用等級享受各類業務優惠等,希望通過本次比賽,征集優秀的模型體系,準確評估用戶信用分值。
賽題難點
本賽題的難點主要有幾個方面:
1.行業信用度評分與行業應用場景、行業特征息息相關,因此需要參賽者了解基本通信行業特征,通過對通信業務進行解讀,選取適合的字段進行建模。本賽題提供了涉及用戶的身份特征、消費能力、人脈關系、位置軌跡、應用行為偏好信息等多個字段,需要理解信用度同字段的相關性,取舍字段信息。舉例來說,透過用戶的位置軌跡可以識別用戶在不同熱點商圈的消費能力、是否居住在高檔小區、是否是商旅常客等高消費人群。同樣,對于一個網齡10年以上不換號、每月通信費用在200元以上,從不欠費的用戶,其對應的信用分也一定越高。
2.選擇合適的模型。傳統的評分模型通過對關鍵因素和權重的線性統計來評分,孤立、靜態的理解各變量,無法準確、實時、動態地評價和預測消費者的信用變化情況,參賽者應通過對樣本數據的分析,采用機器學習和深度學習等算法模型,更全面地進行綜合評分。