胡丁相,李新群
(1.中國移動通信集團浙江有限公司,浙江 杭州 310000;2.流量海科技成都有限公司,四川 成都 610000)
在電信運營商領域,全面﹑客觀地評估客戶的價值,對于更好地識別和挖掘風險用戶,優化業務規則,合理配置營銷資源,提升服務效果,降低跑冒滴漏等收入流失風險,具有重要意義[1]。
隨著業務的迅猛發展和客戶群規模的擴大,新業務層出不窮,IT支撐系統越來越復雜。不法分子(風險用戶)利用業務規則或系統支撐的漏洞,違規侵占或倒賣電信運營商營銷資源,極大地危害著公司利益。電信管理論壇《Revenue Assurance Survey 2016》顯示,歐美電信運營商的平均收入流失率為1.5%,而中國運營商由于客戶服務的標準要求更高,違規套利犯罪成本低,收入流失比例遠遠高于歐美。因此,亟需一種方法,找到藏匿在正常用戶群體的風險用戶,以供后續進一步分析其行為,挖掘深層次的風險。
在風險識別與特征分析過程中,如果數據相對完整,便可以定量的逐一分析風險,并建立對應的模型分析其產生的影響和損失。通常需要從兩個方面進行考量,即風險的嚴重性和風險可能帶來的損失。
當前,電信運營商通過數據一致性稽核﹑業務流程平衡性稽核等手段,已經具備一定的風險管控能力。但是,由于IT系統數量眾多﹑集成復雜﹑對接不暢且三域間數據未關聯,難以實現風險場景的自動識別﹑風險問題的精準定位。此外,企業外部欺詐形成產業鏈,欺詐分子可通過眾多手段侵占電信運營商營銷資源或通信資源,以謀取自身利益[2]。對于此類風險用戶,目前尚無有效全面的手段去檢測識別。當下,主要的手段有兩種。第一,欺詐規則檢測法。根據風險檢測對象,制定風險檢測規則和閾值門限,并通過風險檢測規則對用戶進行識別。第二,關聯用戶識別法。通過識別與 被處罰的用戶存在行為交互的關聯用戶,按照預設的風險權重計算用戶風險分值的方式識別風險用戶。本文主要論述基于用戶價值分析的風險識別方法,來尋找這些給電信運營商造成巨大損失的欺詐分子(風險用戶)。
現有風險用戶識別手段存在如下缺陷。對于欺詐規則檢測法,由于電信運營商用戶基數龐大,用戶消費水平﹑行為習慣各異,簡單的規則檢測容易造成較高的誤判率;檢測規則基于用戶行為特征提煉封裝,覆蓋范圍有限,存在較高的漏判率;該手段難以記錄風險用戶的全貌,不能對風險問題進行回溯,不利于進一步的分析挖掘。對于關聯用戶識別法,該方法要求足夠多的被處罰的用戶(壞樣本)作為輸入,進而識別壞樣本的關聯用戶作為潛在風險用戶,而實際生產的情況往往沒有現成的壞樣本,通常只有在造成重大影響或者被其他用戶舉報后,才會獲得被處罰的用戶。
通俗地,用戶價值就是用戶在特定的生命周期內,借助直接付費﹑口碑相傳等手段,為企業貢獻的所有價值。用戶價值是企業與用戶之間聯系的關鍵。基于用戶價值的風險識別模型,可以幫助電信運營商找出隱藏在正常用戶群體中的風險用戶,并對其進行深層次分析。挖掘業務規則或者系統實現上的漏洞,可為電信運營商制定更加完善的業務規則,修復系統漏洞,減少企業收入損失,保障業務健康發展。
下面結合附圖,對基于價值分析的風險用戶識別方法作詳細闡述。
圖1為基于價值分析的風險用戶識別方法示意圖,主要涉及構建用戶價值分析體系﹑用戶價值細分﹑篩選低利潤率用戶群﹑根據風險場景對低價值用戶群進行細分等。
圖2為基于用戶價值構成(充值本金)聚類分析示意圖。
圖3為基于用戶價值構成的細分示意圖。

圖1 本文中基于價值分析的風險用戶識別方法

圖2 本文中基于用戶價值構成(充值本金)聚類分析

圖3 本文中基于用戶價值構成細分
基于價值分析的風險用戶識別的詳細步驟如下。
步驟1:構建用戶價值分析體系。用戶價值的基本計算方法:用戶價值=用戶收益-用戶成本。收益主要為累計出賬收入;用戶成本主要為累計網間結算支出﹑累計SP(服務提供商)結算支出﹑累計營銷成本支出等。
步驟2:設計用戶價值評估指標。用戶收益主要包括用戶消費的價值(如繳費充值本金)和衍生消費的價值(如購買手機終端);用戶成本主要包括營銷活動成本(如入網送終端/饋贈金/積分)﹑用戶獲取成本(如渠道發展酬金支出)和結算成本(如網間結算/SP(服務提供商)結算)。
步驟3:計算用戶生命周期價值。計算通過資金相關數據的用戶畫像進行。例如,用戶生命周期價值=[累計充值本金收入+累計網間結算收入-累計網間結算支出-累計SP(服務提供商)結算支出-累計營銷成本支出]。通過計費賬務信息和成本使用信息確定用戶的價值,使評價結果更加客觀全面。
步驟4:根據用戶價值分析體系,計算所有用戶的價值,即利潤貢獻率。利潤貢獻率=所有用戶價值/電信運營商所有業務利潤。
步驟5:對用戶價值構成相關的數據進行聚類分析(圖2),其中包括用戶充值本金﹑饋贈金﹑酬金﹑SP(服務提供商)結算費和網間結算費等指標。投入計算公式:投入=饋贈金+酬金+SP結算費+網間結算費,產出計算公式:產出=用戶充值本金,并將投入產出的比例以及投入和產出的實際金額按照實際情況設定一系列等級,通過投入產出比例的等級劃分,將用戶群進一步細分為高投入-低產出﹑高投入-高產出﹑低投入-高產出及低投入-低產出。圖4顯示了細分用戶的等級。橫坐標為生命周期內用戶的成本和收益(單位為百元),縱坐標為收益和成本的比例。舉例說明,成本大于1000元,收益成本比例大于3,為高投入-高產出;成本大于1000元,收益成本比例小于1,高成本-低產出。具體的閾值可以根據實際情況進行設定。
步驟6:篩選貢獻利潤率低的低價值客戶群體,如高投入-低產出(如產出/成本<0.33),投入金額>100元(平均每月)。設定閥值可根據實際需求進行更改。
步驟7:對低價值客戶群體的行為數據進行二次聚類分析。基于用戶行為信息包括通信行為﹑消費行為﹑業務受理行為﹑繳費充值行為﹑流量使用行為和流量共享行為等信息進行二次聚類。例如,通過ARPU/業務受理記錄等指標的變異系數(消除平均值的影響),進一步細分低價值客戶群體。更進一步可以將篩選出的風險用戶利用規則漏洞辦理來套取酬金的業務列為敏感業務,更深層次可以對辦理這些敏感業務的用戶及受理渠道進行分析。
步驟8:根據預設風險場景對不同低價值用戶群體進行分類,如酬金套利風險用戶群﹑營銷資源倒賣風險用戶群[3]等。
步驟9:酬金套利風險場景的確定。對于低價值用戶群體,如其用戶成本主要由渠道酬金組成且存在渠道異常集中情況,則可確定為酬金套利風險用戶群[4]。
步驟10:對于未匹配上預設風險場景的用戶群,可通過關聯用戶識別法,將其作為潛在風險用戶群進行重點監控。可以分析風險用戶的交往圈,與風險用戶交往密切的用戶群體也需要重點監控。
步驟11:最終確定風險用戶。

圖4 用戶劃分等級三維圖
以酬金套利風險場景為例,對低價值甚至負價值的用戶群體,如其用戶成本主要由渠道酬金組成,且存在某個或某幾個渠道異常集中情況,則可確定為酬金套利風險用戶群。隨機選取部分疑似酬金套利用戶限制其業務受理渠道,收到這批用戶的投訴率極低,觀察受限渠道,疑似養卡套酬金額環比下降40%,基本證明基于用戶價值的風險識別方法具有很好的效果。
通過基于價值分析的風險用戶識別方法在沒有使用壞樣本的前提下找到了大量藏匿在正常用戶群體的風險用戶,并通過抽取樣本進行撥號測試﹑停機測試,接通率﹑投訴率極低。深入研究其通信行為﹑免費資源的使用情況,均發現極大的養卡嫌疑,基本論證了價值分析在電信運營風險識別中的重要意義,很大程度彌補了現有關聯用戶識別法需要足夠的被處罰用 戶(壞樣本)的不足,提高了風險用戶識別方法的實用性,同時解決了現有欺詐規則檢測法中對風險用戶覆蓋率和誤判率的不足。通過用戶價值構成的畫像分析,挖掘深層業務問題,使得運營商能夠及時精準發現風險用戶,減少收入流失[5]。
本文研究源于電信運營行業的欺詐行為,即代理商通過電信運營商系統的業務或者系統漏洞謀取自身利益。通過疑似風險用戶的特征——低價值甚至負價值,提出基于用戶價值的風險識別方法,將其應用于電信運營領域內,成功在沒有使用壞樣本的情況下找出大量藏匿在正常用戶群體內的風險用戶,減少了運營商損失,提升了管理效益。
本文論述的基于用戶價值的風險識別方法的應用模式是:構建用戶價值體系→根據用戶價值體系計算用戶的價值→對用戶構成的價值構成的相關數據進行分析→對于疑似壞樣本的典型行為進行二次聚類→將電信運營商數據依照體系進行分析→確定風險用戶。模型的應用模式還可以應用于其他行業,如信用卡惡意透支套現行為。通過本文的分析方法及結論,可針對信用卡用戶制定相應的用戶價值體系并進行分析。
[1] 上官曉麗,許玉娜,楊建軍.SP800-30‘風險評估實施指南“研究[J].信息技術與標準化,2011:44-47.
SHANGGUAN Xiao-li,XU Yu-na,YANG Jianjun.SP800-30 "Guidance on Implementation of Risk Assessment"[J].Information Technology and Standardization,2011:44-47.
[2] C C.Information Technology Security Evaluation Common Criteria[S].2004.
[3] 宋蕊.中國電信運營企業社會渠道傭金管理和渠道控制研究[D].北京:北京郵電大學,2011.
SONG Rui.Study on Commission And Control Management of Social Distribution Channels for Chinese Telecom Operators[D].Beijing:Beijing University of Posts and Telecommunications,2011:31-33.
[4] 王保華.利用大數據分析建立養卡模型[J].電信技術,2016(02):73-75.
WANG Bao-hua.Using Big Data Analysis to Build a Save Card Model[J].Telecommunications Technology,2016(02):73-75.
[5] 呂智超.基于hadoop平臺的電信養卡研究與分析[D].南京:南京郵電大學,2016.
LV Zhi-chao.Telecommunications Save Card Research and Analysis base don Hadoop[J].Nanjing:Nanjing University of Posts and Telecommunications,2016:34-40.