中圖分類(lèi)號(hào):TP393.08 文獻(xiàn)標(biāo)志碼:A
0 引言
網(wǎng)絡(luò)規(guī)模和復(fù)雜性不斷增加,網(wǎng)絡(luò)中潛在的異常數(shù)據(jù)越來(lái)越多,網(wǎng)絡(luò)流量數(shù)據(jù)具有高維度、非線性和動(dòng)態(tài)變化等特性,現(xiàn)有的基于統(tǒng)計(jì)的方法難以準(zhǔn)確捕捉異常模式。同時(shí),獲取大量精確標(biāo)注的訓(xùn)練數(shù)據(jù)成本高昂,且標(biāo)注過(guò)程容易受到主觀因素影響,導(dǎo)致標(biāo)簽質(zhì)量參差不齊。此外,網(wǎng)絡(luò)攻擊手段不斷演進(jìn),新型攻擊模式層出不窮,要求檢測(cè)方法具備良好的泛化能力。
楊茂等1通過(guò)構(gòu)建四分位模型,對(duì)風(fēng)電場(chǎng)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而識(shí)別出異常數(shù)據(jù)。該方法結(jié)合了四分位統(tǒng)計(jì)量與四分位模型的優(yōu)勢(shì),能夠較為準(zhǔn)確地識(shí)別出數(shù)據(jù)中的異常值。但風(fēng)電場(chǎng)數(shù)據(jù)具有高度的復(fù)雜性和不確定性,會(huì)導(dǎo)致四分位模型的參數(shù)設(shè)置難度增加。此外,該算法在處理大規(guī)模數(shù)據(jù)集時(shí),計(jì)算效率和實(shí)時(shí)性方面可能存在不足,須進(jìn)一步優(yōu)化以提高其實(shí)用性。凌繼紅等通過(guò)森林模型,對(duì)數(shù)據(jù)進(jìn)行異常檢測(cè),但供熱系統(tǒng)的數(shù)據(jù)受到多種因素的影響,孤立森林模型可能難以全面捕捉多種因素的復(fù)雜性。此外,該方法在處理具有強(qiáng)關(guān)聯(lián)性的數(shù)據(jù)時(shí),會(huì)產(chǎn)生誤報(bào)或漏報(bào)的情況,需要結(jié)合其他方法進(jìn)行綜合判斷。
為解決此方面問(wèn)題,提高無(wú)線網(wǎng)絡(luò)數(shù)據(jù)安全保障能力,異常數(shù)據(jù)流的檢測(cè)對(duì)于保障網(wǎng)絡(luò)安全、提升網(wǎng)絡(luò)性能至關(guān)重要。弱監(jiān)督學(xué)習(xí)作為一種在少量標(biāo)注數(shù)據(jù)或僅有粗粒度標(biāo)注數(shù)據(jù)下進(jìn)行學(xué)習(xí)的方法,為無(wú)線網(wǎng)絡(luò)異常數(shù)據(jù)流的智能辨識(shí)提供了有效途徑?!?br>