
圖1 IBM 黃衛
在數字化和云化轉型時代,云數據中心的IT運維面臨著挑戰。IBM 認知IT運維能夠基于洞察以提升效率、提前預判,基于Watson認知決策。IBM混合云顧問工程師黃衛告訴記者,IBM認知IT運維有三個指導原則,分別是持續學習、預測修正、推薦決策。持續學習以揭示海量數據內在特征和變化規律,認知分析以在重大故障之前揭示異常征兆, 跨混合云端到端的可視化、可控化、自動化和敏捷性,雙模態深度集成、一致統一的IT運維平臺, NLP輔助問題診斷和修復。并且機器自學習策略可設定強、中、弱關系學習,并且,機器學習自動識別事件間相關性可以顯著提升IT運維甚至運營效率。
IBM認知IT運維由Netcool提供創新的大數據智能分析,提高運維價值并在整個IT環境降低成本。能夠進行事件日志上下文歷史挖掘和規律分析,事件日志周期性規律分析,事件日志成對成組出現分析和事件日志相關與因果分析。

圖2 IBM 認知IT運維結構化數據認知學習和預測
而結構化數據認知學習和預測,能夠使用統計學工具,和行為學知算法,揭示指標間的數學關系。
多KPI相關性認知學習和預警功能中,PI學習到“業務響應時間”與“用戶請求”有正相關因果關系,且隨著用戶負載增加而變慢。如果這一正常歷史規律被破壞,比如說由于內存泄漏,造成即便用戶請求數下降了,業務響應時間還很高,異常預警信號將立即發出。盡管這時業務服務質量仍處于“好”的區間,問題已被發現。
同時,該功能具有強大的實時分析能力和伸縮性,普通刀片服務器上每一分析引擎支持多達500,000個指標每5分鐘粒度的數據。一個全裝備的關鍵業務應用可產生多達50,000個指標數據。
黃衛最后表示,IBM認知IT運維實現了敏捷運維與知識共享,提升了運維的自動化能力:日常操作自動化,交流與知識共享,以加速解決日常運維常見問題。