關鍵詞:業(yè)務交易;監(jiān)控系統(tǒng);應用系統(tǒng);關聯(lián)關系
中圖分類號:TP277 ? ? 文獻標識碼:A 文章編號:2096-4706(2019)06-0134-03
Keywords:business transaction;monitoring system;application system;relationship
0 ?引 ?言
在當前財務公司業(yè)務規(guī)模快速擴張、新業(yè)務需求高速增長,新興技術不斷涌現和深化的新形勢下,保障信息系統(tǒng)安全生產運行已然成為當務之急,通過搭建業(yè)務運行實時監(jiān)控系統(tǒng),對各類復雜電子交易進行實時檢測與分析,及時發(fā)現各類交易異常情況、分析交易動態(tài)數據。
1 ?監(jiān)控系統(tǒng)建設的背景
1.1 ?外部監(jiān)管審計要求
銀監(jiān)會、人民銀行等監(jiān)管部門對于財務公司關鍵業(yè)務系統(tǒng)的應用整體監(jiān)控運行能力,均提出了明確的要求,需要能夠及時發(fā)現業(yè)務系統(tǒng)交易故障,并明確定位和處置故障,盡快恢復營業(yè),降低業(yè)務風險。
1.2 ?關鍵業(yè)務高可用性的要求
財務公司關鍵業(yè)務系統(tǒng)承載著絕大多數業(yè)務的運行,只有對于應用系統(tǒng)業(yè)務運行故障的有效監(jiān)測與處置,才能確保生產系統(tǒng)穩(wěn)定地對外提供服務,確保財務公司業(yè)務服務的連續(xù)性,為業(yè)務擴展保駕護航。
1.3 ?關鍵業(yè)務隱患排查的需求
通過對應用系統(tǒng)全面的實施監(jiān)控,才能采集到各層面的細粒度運行數據,并通過對這些數據的有效分析,排查各類隱患,并及時處置,提高應用系統(tǒng)整體運行的可靠性。
1.4 ?業(yè)務系統(tǒng)架構優(yōu)化的需求
通過應用整體監(jiān)控數據的采集與分析,在發(fā)現運行隱患的同時,總結應用系統(tǒng)開發(fā)的架構設計技術規(guī)范,從根源上加固應用系統(tǒng)的抗風險能力。
2 ?監(jiān)控系統(tǒng)建設的目標
2.1 ?應用整體結構梳理
在應用管理員對于關鍵應用系統(tǒng)的深入分析,掌握應用整體結構信息基礎之上,通過技術手段實時監(jiān)測這些動態(tài)信息,全面掌握應用系統(tǒng)結構的動態(tài)信息,為運行資產管理、運行故障管理等提供準確的實時數據。
2.2 ?應用運行性能監(jiān)控
通過對于應用系統(tǒng)的整體監(jiān)控,實現對各類應用性能指標的實時采集,動態(tài)評估系統(tǒng)的健康運行狀態(tài),為運行決策提供有效支持。
2.3 ?應用運行故障定位
實時監(jiān)測并分析應用運行關鍵指標,并結合邏輯運算,做動態(tài)關聯(lián)分析,在應用系統(tǒng)出現運行異常的情況下,及時預警,快速定位異常環(huán)節(jié)并提高故障恢復效率,減少故障造成的影響,提高業(yè)務運行的可用性。
2.4 ?應用運行異常指標報警
通過對于應用系統(tǒng)各類性能指標的實時監(jiān)測與分析,在關鍵應用系統(tǒng)發(fā)生指標異常的情況下及時報警,縮短技術人員的故障響應及恢復時間。
2.5 ?面向服務的性能指標分析
能夠通過業(yè)務類型、業(yè)務渠道、外連機構等不同維度,以及不同的時間段、顆粒度對業(yè)務系統(tǒng)關鍵性能指標進行分析統(tǒng)計,提供詳細的業(yè)務性能指標數據以幫助技術人員持續(xù)優(yōu)化業(yè)務系統(tǒng)性能。
3 ?監(jiān)控系統(tǒng)建設的思路
3.1 ?技術原理分析
通過旁路監(jiān)聽的方式,解碼業(yè)務交易流量,并獲得應用性能指標,一是在業(yè)務主機上安裝代理程序,會大量消耗業(yè)務主機運算資源,給業(yè)務主機正常運行帶來風險;而旁路監(jiān)聽的方式給業(yè)務系統(tǒng)帶來的運行風險則幾乎為零。二是大量異構的業(yè)務系統(tǒng)使得程序代理難以適用于所有類型的業(yè)務主機,旁路監(jiān)聽的方式由于采用統(tǒng)一的流量采集解碼,面對異構的業(yè)務系統(tǒng)環(huán)境時,僅需要配置使用相應的解碼程序即可。三是基于代理的方案可能無法獲得實時的指標數據,由于代理程序的運行本身占用主機資源,導致指標采樣頻率不能設置過于頻繁(容易過量占用主機資源),因此難以獲得實時的應用性能指標數據。旁路監(jiān)聽的方式由于無序占用業(yè)務主機資源,而可以實時采集、解析業(yè)務交易流量,獲得更為實時的應用性能指標數據。四是基于代理的方案無法獲得端到端交易關聯(lián)能力,不同的業(yè)務組件上運行的代理程序截然不同,而業(yè)務路徑上的防火墻、負載均衡等設備上更是無法安裝代理程序。另一方面,各業(yè)務主機上的時鐘也無法確保絕對同步。因此,采用代理的方案并不能做到真正意義的、準確的端到端交易關聯(lián)結果。
3.2 ?技術方式分析
利用基于網絡數據包解碼技術的旁路監(jiān)聽方案,充分利用可靠的網絡數據資源,建立應用性能管理及告警平臺。以服務為中心,提供交易量、成功率、響應時間等應用性能關鍵指標,并區(qū)分交易類型、交易渠道等統(tǒng)計維度,展現服務組件的實時運行狀態(tài)。采用旁路監(jiān)聽方式的技術方案一方面不會對被管理的應用產生任何影響,完全避免了傳統(tǒng)監(jiān)控方式所帶來的性能風險;另一方面也具備快速部署的特點及指標實時統(tǒng)計能力,提高系統(tǒng)上線速度以及應用性能指標實時監(jiān)控能力。
4 ?監(jiān)控系統(tǒng)建設的設計方案
4.1 ?方案設計原則
一是最小風險接入原則,監(jiān)控系統(tǒng)的接入應遵循零風險接入原則,在不影響網絡的正常運行和系統(tǒng)穩(wěn)定的前提下,采用旁路(非串接)方式進行部署接入。二是有效性原則,監(jiān)控系統(tǒng)的部署要結合實際運維需求,明確監(jiān)控范圍,充分評估產品的功能、性能,確保監(jiān)控系統(tǒng)對數據分析的準確性、有效性。三是安全性原則,監(jiān)控設備具有記錄應用交易詳細數據的功能,對于敏感的業(yè)務數據應遵循數據安全性的原則,從管理上和技術上嚴格控制敏感數據的外泄。四是可擴展性原則,系統(tǒng)部署應具有較好的可擴展性,網絡流量和應用交易量擴大后的應用業(yè)務性能監(jiān)控系統(tǒng)的平滑擴展能力。五是可管理性原則,遵循建設規(guī)范,監(jiān)控系統(tǒng)接入網建設要考慮可管理性,分配網管安管地址,實現用戶的分權限分級管理。
4.2 ?系統(tǒng)邏輯部署架構
由業(yè)務性能監(jiān)控系統(tǒng)服務器網卡直接抓包,實時輸出數據;解碼引擎對業(yè)務數據包進行實時解碼,并且解碼引擎可靈活配置;可以自動發(fā)現節(jié)點之間的連接關系,為業(yè)務路徑配置提供信息;最后由上層的業(yè)務性能監(jiān)控系統(tǒng)服務和呈現層進行業(yè)務性能指標監(jiān)控、統(tǒng)計輸出、追蹤和告警。
4.3 ?性能與容量設計
業(yè)務性能監(jiān)控系統(tǒng)具有較強的擴展性,能夠在包括監(jiān)控范圍、管理功能、管理對象數量等方面提供靈活、多樣的擴展能力;可以適應生產系統(tǒng)新業(yè)務、新技術的要求,適應于系統(tǒng)未來發(fā)展的需要,并能與其他基于業(yè)界標準的軟件進行集成。業(yè)務性能監(jiān)控系統(tǒng)采用“分布部署、集中監(jiān)控”模式,在業(yè)務擴展時,可根據系統(tǒng)性能和容量的要求,增加相應的服務器就可以實現系統(tǒng)處理能力的擴展。
5 ?監(jiān)控系統(tǒng)建設的技術方案
5.1 ?整體技術方案
按照“分布部署、集中監(jiān)控”原則,對監(jiān)控系統(tǒng)進行設備部署和統(tǒng)一分析與告警。技術方案包含完整的應用性能監(jiān)控的功能,包括實時監(jiān)控、指標趨勢分析、指標統(tǒng)計分析、業(yè)務查詢、端到端業(yè)務追蹤、實時告警、故障自動定位、API數據輸出接口等,能夠支持云環(huán)境下的監(jiān)控分析,同時具備可用性及易用性高的特點。
5.2 ?數據采集方案
應用服務層級劃分非常清晰,層級間的交易全部通過網絡傳輸完成,基礎設施和交付設施本身都以服務為中心向應用提供界限明確的服務功能,無論是雙中心同時運行、多層網絡區(qū)域控制或雙機雙網的環(huán)境下,采集設備可以輕松獲得關鍵交易環(huán)節(jié)的網絡數據,這給網絡數據源的獲取帶來極大便利和靈活性。
5.3 ?業(yè)務梳理方案
業(yè)務交易路徑信息可由服務路徑自動發(fā)現進行應用訪問關系梳理,包括IP地址/端口號、服務訪問路徑、協(xié)議類型等。最終通過業(yè)務性能監(jiān)控系統(tǒng)對業(yè)務系統(tǒng)進行交易性能可視化呈現、應用異常快速定位和告警,并進行多維度統(tǒng)計和單筆交易追蹤。業(yè)務性能監(jiān)控系統(tǒng)的拓撲發(fā)現功能,能自動呈現被監(jiān)控網絡數據的IP連接性,快速梳理應用組件之間的邏輯訪問關系,為業(yè)務性能監(jiān)控系統(tǒng)提供SPV定義的準確數據,以及應用層協(xié)議信息。
5.4 ?業(yè)務實時監(jiān)控方案
5.4.1 ?業(yè)務性能監(jiān)控系統(tǒng)基于協(xié)議解碼技術
充分利用網絡數據資源,幫助用戶快速建立應用性能管理平臺。業(yè)務性能監(jiān)控系統(tǒng)提供交易量、成功率、響應時間、響應率、返回碼五大關鍵指標,并區(qū)分交易類型、交易渠道兩個統(tǒng)計維度,展現服務組件的運行狀態(tài)。
5.4.2 ?業(yè)務性能監(jiān)控系統(tǒng)的技術關鍵點和創(chuàng)新點
協(xié)議解碼、故障定位、交易追蹤和可靠落地。一是業(yè)務性能監(jiān)控系統(tǒng)目前已經支持解碼銀行業(yè)常用協(xié)議,而且對SOA中廣泛使用的協(xié)議,也都支持快速解碼,另外對于用戶的私有協(xié)議,也能根據項目情況快速進行解碼。二是業(yè)務性能監(jiān)控系統(tǒng)基于內置的故障判定邏輯,在出現問題時能自動進行故障定位。
5.4.3 ?業(yè)務性能監(jiān)控系統(tǒng)的交易性能追蹤
根據交易的基本信息,以及特定應用的專屬字段作為復合查詢條件進行交易查詢追蹤,并支持自定義交易關鍵字,可以選擇任意解碼字段作為交易關鍵字,以用作單筆交易追蹤的關聯(lián)字段。另外,交易查詢結果還能展開為交易的原始記錄,原始記錄信息中包含應用協(xié)議中所有的被解碼字段,以輔助用戶做更加深入的故障排查。
6 ?監(jiān)控系統(tǒng)的展示
6.1 ?業(yè)務監(jiān)控大屏展示
針對業(yè)務系統(tǒng),將抽象出重要的渠道系統(tǒng)、前置系統(tǒng)、核心系統(tǒng)、外聯(lián)系統(tǒng)四個層級進行大屏展現,反映出業(yè)務系統(tǒng)的邏輯關系同時并實時展現該業(yè)務系統(tǒng)交易量、響應時間等交易性能指標。
6.2 ?業(yè)務板塊大屏展示
選擇業(yè)務系統(tǒng)的服務路徑、監(jiān)控指標等信息進行任意組合顯示。包括全部被監(jiān)控系統(tǒng)展示、分業(yè)務條線的被監(jiān)控系統(tǒng)展示、單獨系統(tǒng)信息展示、同一系統(tǒng)不同主機的展示、不同系統(tǒng)在同一主機的展示、儀表盤等。
6.3 ?一線運維大屏展示
為運維人員提供一個監(jiān)控儀表盤,可以包括多個關鍵應用,每條琴鍵告警代表的含義為對應的應用在30分鐘內的服務質量,如果發(fā)生故障,實時告警自動定位故障,并可以下鉆到對應的視圖,系統(tǒng)自動判斷故障節(jié)點。
6.4 ?二線專家大屏展示
業(yè)務系統(tǒng)快速故障定位到某個節(jié)點組件,二線專家可以通過該視圖進行快速定位和對單筆失敗交易進行交易追蹤。
7 ?結 ?論
財務公司業(yè)務性能監(jiān)控系統(tǒng)基于協(xié)議解碼技術,充分利用可靠的網絡數據資源,建立應用性能管理平臺,以服務為中心,提供交易量、成功率、響應時間、響應率、返回碼五大關鍵指標,并區(qū)分交易類型、交易渠道兩個統(tǒng)計維度,展現服務組件的運行狀態(tài)。實現應用可用性、性能、負載量的全面可視化,通過多維度復合告警、基線告警等,提取發(fā)現系統(tǒng)性能問題,及時告警潛在的性能風險。
參考文獻:
[1] 張曉丹.面向業(yè)務應用交易的IT運維監(jiān)控系統(tǒng)建設思路 [J].中國金融電腦,2015(1):38-41.
[2] 劉廣鋒.高校財務信息化建設存在的問題及對策 [J/OL].現代信息科技[2019-03-05].http://kns.cnki.net/kcms/detail/44.1736.TN.20180212.1020.016.html.
作者簡介:葛斌(1986-),男,漢族,山東棗莊人,工程師,學士學位,研究方向:業(yè)務監(jiān)控系統(tǒng)的應用。