西安銀行的IT運維管理面臨的主要問題是缺少對各業務應用交易的運行情況的監控,難以全面、準確、及時地掌握業務應用系統的運行情況;無法自動發現應用拓撲關系和交易訪問路徑,并以此為基礎實現故障應用系統的自動定位。
在業務交易監控方面,需要能夠對業務流程進行梳理,按業務交易路徑實時監控各業務組件的狀態,覆蓋網絡和業務系統,真正做到端到端的業務交易性能監控分析。

圖1 應用監控系統功能框架
當故障發生時,業務交易監控系統能夠根據各組件的性能參數,自動化定位故障根源,提供故障處理速度。
針對以上痛點和需求,通過運維開發、擁抱開源、互聯網經驗借鑒三個歷程,西安銀行結合天旦BPC產品,成功完成智能運管平臺的建設。
在本屆論壇中,該項目榮獲“2017中國IT運維最佳技術突破”大獎。
這一項目的創新點包括如下:集中監控、數據可視化、開放的IT服務管理平臺、自動化運維平臺以及數據分析平臺。
應用監控系統通過純旁路方式(交換機鏡像或分光)在網絡上獲取業務系統的數據包,不會對業務系統產生任何影響,通過服務器網卡直接捕獲數據包并進行過濾,然后由解碼引擎(Decode Engine)對業務數據包進行解碼分析和重組分析。系統功能框架如圖1所示。
業務交易路徑信息可由服務路徑自動發現模塊(SPVD功能)進行應用訪問關系梳理,包括IP地址/端口號、服務訪問路徑、協議類型等。
最終通過應用監控系統對業務系統進行交易性能可視化呈現、應用異??焖俣ㄎ缓透婢⑦M行多維度統計和單筆交易追蹤。
該系統實現了通過網絡數據進行精確梳理,自動分析同步/異步TCP連接模式;應用組件的交易性能評估,提供交易量、成功率、響應時間、響應率、返回碼、網絡流量等精細化服務質量指標;支持基準線的生成和呈現等14項核心功能點。
在系統部署方面,支持分布式部署,包括雙中心、多中心部署模式,以及負載分擔部署模式,可以跨多個服務器對于所收集數據進行分布式統計和集中呈現。