999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習在用戶行為審計中的應用

2021-07-13 08:12:20曾偉中國聯通江西分公司南昌市330000
江西通信科技 2021年2期
關鍵詞:用戶檢測系統

曾偉 中國聯通江西分公司 南昌市 330000

0 概述

目前傳統的用戶行為審計是依托于各個網絡設備及其附屬的網管設備進行,各設備單獨運行,缺陷主要表現在審計策略修改難度大,用戶行為越來越復雜,無法做到同步滿足業務需求。各個廠家間審計策略無法聯動。審計時效性不足,只能實現被動的事后審計。本文提出了使用機器學習技術對用戶行為數據審計的方法,使用機器學習中的異常檢測算法判定異常用戶。

1 機器學習的用戶行為審計系統概述

機器學習是一類算法的總稱,這些算法從大量歷史數據中挖掘出其中隱含的規律,并用于預測或者分類。異常檢測又被稱為是“離群點檢測”,核心是利用各種統計的、距離的、密度的量化指標去描述數據樣本跟其他樣本的疏離程度。審計系統從用戶消費數據、用戶繳費數據、用戶通信話單數據、用戶漫游話單數據、賬戶間融合關系數據等角度形成一個用戶的綜合數據標簽,利用各種異常檢測算法標注異常,在此基礎上利用大數據技術實現自動化。根據數據處理流程,審計系統包括以下模塊:

數據采集和清洗:數據是分析的基礎,從網絡設備、計費系統、財務系統采集數據,經數據格式轉換后統一錄入數據庫。

異常檢測:使用機器學期中的異常檢測(anomaly detection)算法對用戶行為標記。成熟的用戶行為異常檢測算法較多,有 iForest、LOF等,但由于各種算法原理不同針對不同類型的數據有效性也不同,本文提出將各種算法計算出來的結果經變化后加權使用,綜合各算法的優勢。

異常輸出:通過異常檢測算法,將用戶每個異常通信行為、消費行為標記為一個風險標簽,形成用戶行為畫像,可以做到可視化展示。

圖1 用戶行為審計系統框架圖

2 異常檢測模塊設計

數據進入異常檢測模塊后,分別經由4個異常檢測函數處理,輸出各自的檢測判斷結果(P1,P2,P3,P4),將結果變換加工后得到最終的用戶異常結果S,范圍[0,1],越接近0用戶行為越不可能發生,代表用戶行為異常。

2.1 iForest

Isolation Forest是一種適用于連續數據(Continuous numerical data)的無監督異常檢測方法。應用中l=ceiling(log2(ψ)),戶行為公式為,結果接近1就被模型判定為異常,結果接近0判定為正常,結果接近0.5表示選擇的樹深度不足以判定,需要增加最大深度l。根據2020年1月的用戶流量數據分析,取樣本ψ=4096和ψ=128的結果如下:

圖2 ψ=4096(左)和ψ=128(右)異常檢測結果

綜合考慮計算能力和區分度,ψ值為128可以滿足區分異常用戶的要求。

2.2 Local Outlier Factor(LOF)

通過比較每個用戶行為點和其鄰域點的密度來判斷該用戶是否為異常點,如果密度越低,越可能被認定是異常點。每個用戶行為點的密度表達公式為

這個比值越大于1,說明用戶行為點的密度小于其鄰域點密度可能是異常點。

通過LOF可以很明顯的找出流量異常高或者流量比例異常高的用戶。

2.3 高斯分布和泊松分布模型

用戶的總流量是典型的高斯分布,當用戶流量異常大或者上行流量與下行流量比值異常高時標記為異常。參數配置的重點是利用現網用戶數據作為樣例,計算出μ(平均值)和σ(標準差),使得分布函數將用戶流量數據盡量覆蓋。將2020年1-6月用戶流量數據(Xup,Xdown)作為訓練樣例可以得到,μup=53.67,σup=36.10,μdown=287.66,σdown=125.91。將某用戶的月度上下行流量帶入公式:

用戶裝機行為相對獨立,月度每個渠道的入網用戶數和裝機用戶數大致可以認為服從泊松分布:公式根據2020年1-6月用戶入網和裝機數據推算,月度渠道的入網用戶數與裝機用戶數大致相等,λ約為30.13,概率越小代表用戶行為越異常。

綜合前面的幾個異常檢測模型的輸出結果,統一將結果設置為[0,1]之間,其中0表示異常,1表示正常。P1-P4分別表示iForest、LOF、高斯分布和泊松分布的輸出結果,總得分:S =

S表示兩種異常檢測模型和兩種經典模型輸出結果的綜合評分,分值越接近0,表示這個用戶行為越不可能發生,也就代表用戶行為越異常。

3 系統應用案例

系統直接調用了Python相應函數計算每個用戶的S值,其中iForest調用sklearn庫中的IsolationForest函數:LOF調用sklearn庫中的LocalOutlierFactor函數。

2020年某月,系統對發現東北某省有一批寬帶用戶預警標識為異常,S值普遍小于0.1,用戶集中入網,上下行流量比例與大部分用戶不同。進一步分析這批用戶存在撥號時間、入網時間、繳費時間集中的現象。聯系當地分公司現場核實,發現這是一起通過系統漏洞,利用公眾寬帶匯聚后用于CDN業務,違反了工信部《關于清理規范互聯網網絡接入服務市場的通知》的規定,當地分公司立即關停業務,為企業挽回損失,降低運營風險。

圖4 違規用戶違規匯聚現場

4 結束語

本文設計了一種利用機器學習、異常檢測的方法,通過對不同設備采集的用戶通信行為和消費行為數據進行特征分析,有效的識別出異常行為用戶,為企業挽回經濟損失。

目前系統中對用戶行為的特征建模較為簡單,系統存在一定的誤判可能性。隨著用戶行為數據的積累和模型參數的優化,將著手進行用戶多維度行為分析,引入各特征之間的結合方法,進行更深入的研究。

猜你喜歡
用戶檢測系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 无码人妻热线精品视频| 亚洲欧美自拍中文| www.99精品视频在线播放| 亚洲色图欧美激情| 美女毛片在线| 欧美爱爱网| 日本免费新一区视频| 亚洲一区二区成人| 人妻精品久久无码区| 免费无码AV片在线观看国产| 日日拍夜夜操| 国产成人一区| 国产精品综合久久久| 农村乱人伦一区二区| www.亚洲一区| 国产成人8x视频一区二区| 99久久精品免费观看国产| 九色国产在线| 国产18在线播放| 国产精品女同一区三区五区| 国产网站一区二区三区| 狠狠色婷婷丁香综合久久韩国| 亚洲无码视频一区二区三区 | 538精品在线观看| 亚洲美女一区二区三区| 美女潮喷出白浆在线观看视频| 色精品视频| 国产成人亚洲毛片| 91欧美亚洲国产五月天| 国产天天色| 欧美精品在线视频观看| 色悠久久综合| 国产精品无码影视久久久久久久| 素人激情视频福利| 国产精品主播| 国产欧美在线| 亚洲视频免费在线| 国产精品亚洲αv天堂无码| 国产在线拍偷自揄观看视频网站| 国产91视频免费观看| 国产成人一级| 国产成人a毛片在线| aa级毛片毛片免费观看久| 久久综合色天堂av| a级高清毛片| 欧美日韩综合网| 日韩成人在线视频| 亚洲黄色高清| 中文字幕在线观| 久无码久无码av无码| 亚洲国产看片基地久久1024| 欧美午夜网| 久久精品国产免费观看频道| 日韩欧美国产成人| 91九色国产porny| 91精品啪在线观看国产91| 高清精品美女在线播放| jizz国产视频| 欧美视频在线不卡| 免费观看精品视频999| 国产精品久久久久久久伊一| 国产h视频免费观看| 久久久久久高潮白浆| 国产福利大秀91| 精品人妻无码中字系列| 中文字幕日韩欧美| 国产91丝袜在线播放动漫| 丰满人妻被猛烈进入无码| 婷婷六月综合| 免费在线成人网| 色婷婷电影网| 91小视频在线观看| 国产精品亚洲精品爽爽| 找国产毛片看| 日本欧美午夜| 国产1区2区在线观看| 午夜不卡福利| 九九热视频在线免费观看| 国产日韩欧美视频| 国产激情无码一区二区免费| 欧美成人午夜影院| 国产一区二区三区免费|