吳林慧,何毅斌,b,陳宇晨,杜 偉,汪 強
(武漢工程大學a.機電工程學院;b.化工裝備強化與本質安全湖北省重點實驗室,武漢 430205)
異常檢測是一種特殊的二元分類問題,在不同的應用領域中又被稱為:單類學習、孤立點檢測等。異常檢測主要用于解決現實中廣泛存在的諸如故障檢測、欺詐檢測、異常行為識別或者入侵檢測等異常樣本獲取困難甚至根本無法獲取的問題[1]。一般二元分類的方法要求正負樣本均勻分布,但如上述中某一類的樣本很少或不存在的不平衡類別問題,導致預測偏向樣本數較多的分類,因而對這種分類問題需要提出一些符合實際的解決方法[2]。
目前,為了解決異常檢測的問題已經提出了許多的方法,根據其原理可以分為4種,分別是基于密度估計的方法,即利用采集的數據估計訓練樣本的密度模型,并設置一個密度閾值,低于此閾值為異常數據,王康等[3]利用高斯核密度估計的方法,檢測運動手環健康數據的異常值;BREUNING等[4]利用K-最近鄰方法進行無監督的異常檢測,基于重建的方法,即估計模型及其參數,將偏離該模型的樣本判定為異常;薛晨杰等[5]基于K-平均算法對離群點進行檢測;HOFFMANN[6]利用基于核主分量分析實現異常檢測,基于支撐域的方法,即構建一個圍繞目標的支撐域,并最小化支持域的體積;ROA等[7]提出單類支持向量機用于異常檢測,取得了不錯的效果,基于深度學習的方法;SKILTON等[8]提出自編碼器提取信號特征的層次模型,結合生成對抗性網絡與目標檢測對數據的統計分布建模實現異常檢測。……