999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

日志異常檢測研究現狀及展望

2021-05-24 07:44:19李東昊
電腦知識與技術 2021年12期

李東昊

摘要:隨著金融信息化建設的不斷推進,系統規模與復雜性不斷增長,系統故障已成為金融業發展不可忽視的問題。日志作為唯一系統運行信息的數據源,具有重要利用價值。該文綜述了日志異常檢測的主流方法,并針對存在問題提出對未來發展方向的建議。

關鍵詞: 金融信息化;系統故障; 日志; 異常檢測

中圖分類號:TP391? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)12-0056-02

Abstract:With the continuous advancement of financia linformation construction, the scale and complexity of the system are growing, system failure has become a problem that cannot be ignored in the development of the financial industry. As the only data source of system operation information, log has important utilization value. This paper summarizes the mainstream methods of log anomaly detection, and puts forward some suggestions for future development.

Key words:financial information construction; system failure; log; anomaly detection

互聯網的出現拉近了人與人間的距離。伴隨著信息技術的發展,近年來,分布式系統頻繁出現在各個領域的信息化建設中,正發揮著極其重要的作用。由廣泛應用的分布式系統故障所造成的損失也日益增加。據統計Microsoft、Facebook、Twitter等互聯網公司每年因分布式系統宕機造成的經濟損失高達過億元[1],信息系統的穩定性與安全性成為人們關注的焦點。系統日志作為系統運行狀態的直接體現,包含著大量的信息,這使得利用日志信息對系統狀態進行診斷成為可能。早期系統運維人員通過使用關鍵字檢索、編寫日志規則,以人工觀察日志信息的方式進行系統巡檢。隨著對功能需求的提升,系統架構日益復雜,分布式系統(如hadoop,spark)每天產生海量的日志信息,傳統的基于經驗規則判斷的日志分析方法受數據量大、數據類型復雜的影響已經不適用于系統故障檢測。

1研究現狀

目前針對日志的異常檢測可分為三類:基于規則的異常檢測方法、基于無監督的異常檢測方法、基于有監督的異常檢測方法。

基于規則的異常檢測方法,基于統計學方法通過統計海量日志中的關鍵字出現頻率,結合專家經驗設計正則表達式,挖掘潛在檢測規則并根據規則匹配程度進行日志異常檢測。如文獻[2]通過定義系統正常行為規則,使用正則表達式識別日志異常信息。文獻[3]基于分析日志事件序列信息創建規則集,能夠有效降低系統誤報率,但是自動化程度低,人工成本大。

基于無監督的異常檢測方法,不需要預先標記的訓練數據,通過判斷待檢測日志序列與正常日志序列的差異檢測異常。主要依賴于機器學習中的聚類質量,通過日志相似性聚類分析,將從日志數據中檢測的離群點標記為異常信息。如文獻[4],作者通過解析原始日志,統計日志中的事件信息,提取日志的事件頻率特征,使用凝聚層次聚類進行異常信息識別。文獻[5],作者在傳統的基于聚類的異常日志檢測方法logcluster上引入滑動窗口的概念,提出了基于滑動窗口聚類的異常日志檢測方法SW-logcluster,滑動窗口豐富了提取的日志事件信息種類,通過實驗表明引入滑動時間窗口能夠有效提升檢測的召回率,豐富了日志特征的多樣性,提升了日志異常檢測的適用性。文獻[6]作者提出了一個完整日志異常檢測框架,基于狀態比向量和消息數向量構造日志特征向量,使用主成分分析(PCA)檢測日志異常,并將檢測結果以決策樹的形式進行可視化分析,在HDFS數據集中體現了較好的性能。文獻[7]提出了一種基于日志不變量的異常檢查方法,通過挖掘日志信息中的線性關系,當日志序列符合不變量定義,為正常日志序列,否則識別為異常日志序列。文獻[8]作者提出了一個完整的基于日志異常檢測的系統框架ADELE,該方法是一種通用領域的日志異常檢測方法。通過離群點檢測計算異常值,最后通過經驗檢驗,用異常區分故障,極大地減少了誤檢率。文獻[9]作者提出了一種基于概率后綴樹的日志異常檢測方法,提取日志源代碼集中的可達圖并關聯日志語義信息挖掘日志執行軌跡序列,最后通過計算異常度檢測異常信息。

基于有監督的異常檢測方法,需要使用帶有標簽的數據訓練模型,通過預訓練的模型進行日志異常檢測。如文獻[10]通過使用決策樹建模帶有標簽的日志信息識別系統故障,與其他分類方法相比具有高可解釋性,已受到網絡運營商的廣泛關注。文獻[11]使用日志事件計數向量訓練logistic回歸模型,通過模型計算日志序列的異常概率。文獻[12]將日志事件計數向量輸入SVM(支持向量機)訓練超平面,判斷檢測日志序列與超平面的位置關系進而判斷是否為異常日志序列。

隨著人們對人工智能領域的深入研究以及深度學習的發展促使一些學者將神經網絡與日志檢測關聯到一起,逐漸出現了一些基于神經網絡的異常日志檢測方法,在實際應用中也取得了較好的效果。文獻[13]依據自然語言處理的技術,將TF-IDF(詞頻-逆文檔頻率)特征引入日志異常檢測中,首次使用LSTM(長短時記憶網絡)挖掘日志序列的長程相關性,較傳統基于監督的日志異常檢查方法檢測質量有了顯著提高。文獻[14]提出一種利用長短時記憶網絡學習正常日志模式的無監督日志異常檢測方法Deeplog,將正常系統日志建模成自然語言序列輸入神經網絡訓練模型并由此檢測異常日志信息。為解決長序列異常日志檢測效率不足的問題,文獻[15]將時間卷積神經網絡引入到異常日志檢測中,使用自適應全局平均池化代替全連接層,有效解決了過擬合問題,同時提升了檢測效率。文獻[16]使用日志事件語義信息,通過Bi-LSTM模型提取日志序列上下文信息,有效提高日志異常檢測的準確率。文獻[17]將日志建模成時間序列進行日志異常檢測,在網絡安全數據挖掘競賽數據集中準確率達到了99.6%。

文獻[18]作者結合日志異常檢測的不同方法,發布了一個高可重用性的開源工具,用戶可以根據日志特性選取不同方法從而達到最優檢測結果,為日志異常檢測的蓬勃發展奠定了基礎。

2存在挑戰

日志異常檢測研究從單機系統發展到今天的分布式系統,受日志采集與解析的限制,檢測質量仍然存在很大的提升空間。受限于日志信息傳輸、存儲與計算的壓力,傳統的異常檢測方法已經不適用于大型分布式系統,因此,提高日志質量,豐富日志特征,依然是日志異常檢測領域的重要挑戰。

(1)目前人們使用的仍是海量日志信息的小部分信息或單來源的信息,多源日志數據(如應用、網絡日志等)仍未被利用,存在信息壁壘的問題

(2)不同故障類型可能引起的日志記錄相同,如何根據日志信息定位系統故障位置,為用戶提供直觀的檢測結果,提升異常的可解釋性是目前需要解決的問題。

(3)系統日志是典型的不平衡數據集,因此如何考慮數據不平衡造成的過擬合問題,提升基于模型的異常檢測方法的魯棒性是應用新檢測方法存在的障礙。

日志特征具有局限性。目前研究使用的日志數據,經過預處理后,變成了由系統事件序列組成的日志模板,在日志轉向模板的過程中,日志中的變量信息通過通配符*代替,這樣使得部分參數信息丟失,從而忽略了一些由系統參數異常導致的系統異常無法被檢測。如何利用日志中包含的參數信息與通用信息,結合當前新技術挖掘更符合系統故障的多源特征仍是值得關注的焦點。

3結束語

目前針對系統日志異常檢測的研究依然是通過數據驅動的,受訓練樣本的影響,日志樣本的多樣性決定了檢測的質量。因此隨著系統的更新與升級,收集全面大量的日志數據并探索行之有效的解析方案,完善日志異常檢測框架流程仍有許多工作。此外,目前研究均在實驗數據集下展開,在現實應用場景中應用較少。為了提升異常檢測的魯棒性,推動學術研究成果早日落地,相應檢測技術的可行性仍需在工業界進行調研。

參考文獻:

[1] 陸杰,李豐,李煉.分布式系統中的日志分析及應用[J].高技術通訊,2019,29(4):303-320.

[2] Prewett J E. Analyzing cluster log files using logsurfer[C]//Proceedings of the 4th Annual Conference on Linux Clusters. Citeseer, 2003.

[3] Rouillard J P. Real-time Log File Analysis Using the Simple Event Correlator[C]//Conference on Systems Administration. DBLP, 2004.

[4] Q . Lin, H. Zhang, J. Lou, Y. Zhang and X. Chen. Log Clustering Based Problem Identification for Online Service Systems[C]//IEEE/ACM 38th International Conference on Software Engineering Companion. 2016: 102-111.

[5] 馮士龍,臺憲青,馬治杰.改進的基于日志聚類的異常檢測方法[J].計算機工程與設計,2020,41(4):1087-1092.

[6] Xu W , Huang L , Fox A , et al. Detecting Large-Scale System Problems by Mining Console Logs[C]//AcmSigops Symposium on Operating Systems Principles. 2010:37-46.

[7] Lou J G, Fu Q, Yang S, et al. Mining Invariants from Console Logs for System Problem Detection[C]//USENIX Annual Technical Conference. 2010: 1-14.

[8] Khatuya S, Ganguly N, Basak J, et al. ADELE: Anomaly Detection from Event Log Empiricism[C]// 2018:2114-2122.

[9] Bao L, Li Q, Lu P, et al. Execution anomaly detection in large-scale systems through console log analysis[J]. Journal of Systems and Software, 2018:172-186.

[10] Chen M, Zheng A X, Lloyd J, et al. Failure diagnosis using decision trees[C]// International Conference on Autonomic Computing. IEEE, 2004.

[11] Peter Bodík, Moisés Goldszmidt, Fox A , et al. Fingerprinting the datacenter: Automated classification of performance crises[C]// European Conference on Computer Systems. ACM,2010: 111-124.

[12] Liang Y, Zhang Y, Xiong H, et al. Failure prediction in ibmbluegene/l event logs[C]//Seventh IEEE International Conference on Data Mining (ICDM 2007). IEEE, 2007: 583-588.

[13] Zhang K, Xu J, Min M R, et al. Automated IT system failure prediction: A deep learning approach[C]// 2016 IEEE International Conference on Big Data. IEEE, 2016: 1291-1300.

[14] Du M, Li F, Zheng G, et al. Deeplog: Anomaly detection and diagnosis from system logs through deep learning[C]//Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security. 2017: 1285-1298.

[15] 楊瑞朋,屈丹,朱少衛,錢葉魁,唐永旺.基于改進時間卷積網絡的日志序列異常檢測[J].計算機工程,2020,46(08):50-57.

[16] Zhang X, Li Z, Chen J, et al. Robust log-based anomaly detection on unstable log data[C]// the 27th ACM Joint Meeting. ACM,2019: 807-817.

[17] Vinayakumar R, Soman K P, Poornachandran P. Long short-term memory based operation log anomaly detection[C]// International Conference on Advances in Computing. 2017:236-242.

[18] He S, Zhu J, He P, et al. Experience Report: System Log Analysis for Anomaly Detection[C]// 2016 IEEE 27th International Symposium on Software Reliability Engineering. IEEE,2016: 207-218.

【通聯編輯:代影】

主站蜘蛛池模板: 成人在线不卡| 精久久久久无码区中文字幕| 欧美三级不卡在线观看视频| 亚洲无线一二三四区男男| 伊人久久久久久久久久| 亚洲人成网站色7799在线播放| 国产91蝌蚪窝| 91青青在线视频| 成年免费在线观看| 国产一级妓女av网站| 亚洲国产成人在线| 91美女在线| JIZZ亚洲国产| 成人国产小视频| 无码人妻免费| 一区二区日韩国产精久久| 在线免费不卡视频| 中文字幕人成乱码熟女免费| 国产一区亚洲一区| 99资源在线| 国产小视频a在线观看| 欧美无专区| 亚洲人成网址| 国产福利一区二区在线观看| 国产三级成人| 久久综合色天堂av| 国产激情第一页| 97se亚洲综合在线| 亚洲第一黄片大全| 免费可以看的无遮挡av无码| 91久久偷偷做嫩草影院精品| 偷拍久久网| 狠狠综合久久| 久久精品一卡日本电影| 成年女人a毛片免费视频| 美女无遮挡拍拍拍免费视频| 国产精品夜夜嗨视频免费视频| 黄色污网站在线观看| 亚洲人成影视在线观看| 黄网站欧美内射| 日韩专区欧美| 91高清在线视频| 久久一日本道色综合久久| 草草线在成年免费视频2| 青草精品视频| 野花国产精品入口| 特级欧美视频aaaaaa| 99国产精品国产| 国产精品任我爽爆在线播放6080| 中文字幕在线永久在线视频2020| 亚洲三级色| 中文字幕无码av专区久久| 亚洲中文字幕无码mv| 亚洲国产成熟视频在线多多| 综合亚洲色图| 欧美成人看片一区二区三区| 亚洲中文字幕23页在线| 亚洲无码A视频在线| 99人妻碰碰碰久久久久禁片| 欧美色图久久| 国产69精品久久久久孕妇大杂乱 | 国产va欧美va在线观看| 国产91透明丝袜美腿在线| 91亚洲视频下载| 精品一区国产精品| 色综合久久无码网| 国产在线观看99| 国产激爽爽爽大片在线观看| 四虎亚洲精品| 欧美成人h精品网站| 成人免费黄色小视频| 国产00高中生在线播放| 亚洲一区二区视频在线观看| 91免费在线看| 热久久综合这里只有精品电影| 99久久亚洲综合精品TS| 欧美日本在线| 国产精品理论片| 在线观看免费国产| 国产成人区在线观看视频| 国产91色在线| 又爽又黄又无遮挡网站|