如今,電子渠道的業(yè)務量已經(jīng)占到銀行業(yè)務量的80%以上,電子渠道用戶的體驗變得比以往任何時候都更加重要。作為業(yè)務系統(tǒng)的建設者與維護者,運維部門同樣需要從客戶的體驗出發(fā),實時感知用戶辦理業(yè)務的真實體驗,及時定位和解決影響用戶體驗的隱患和故障,以持續(xù)提升用戶滿意度,滿足行內(nèi)業(yè)務發(fā)展的要求。
浙江省作為全國民營經(jīng)濟最發(fā)達的地區(qū),金融業(yè)務的需求非常旺盛。作為浙江省內(nèi)最大的金融機構,浙江省農(nóng)村信用社聯(lián)合社(以下簡稱省聯(lián)社)負責對浙江省農(nóng)信系統(tǒng)(包括農(nóng)信聯(lián)社、農(nóng)村合作銀行、農(nóng)村商業(yè)銀行)進行管理、指導、協(xié)調(diào)和服務。本行下轄81 家行社,擁有4100 多個營業(yè)網(wǎng)點及5 萬多名員工,規(guī)模大、網(wǎng)點多,業(yè)務穩(wěn)定性要求高,因此對運維品質(zhì)和質(zhì)量的要求極高。
隨著省聯(lián)社業(yè)務發(fā)展及IT 管理的需要,服務器、網(wǎng)絡、中間件、業(yè)務應用等面臨的監(jiān)控壓力也越來越大,運維監(jiān)控開始出現(xiàn)短板:
1.業(yè)務系統(tǒng)多,缺乏統(tǒng)一的應用性能監(jiān)控平臺,無法實時把控業(yè)務系統(tǒng)的運行質(zhì)量;
2.故障可能的種類和原因愈發(fā)復雜,完成告警、定位、排障流程的耗時越來越長;
3.對應用監(jiān)控的指標和維度不夠豐富,缺乏能夠反映用戶真實體驗的監(jiān)控數(shù)據(jù)。
針對以上問題,運維部門開始著手建設應用性能監(jiān)控平臺,幫助快速提升運維能力。
1.方案選型
經(jīng)過對行業(yè)內(nèi)相關技術的廣泛調(diào)研和考察,目前主流的三種監(jiān)控技術手段為:網(wǎng)絡旁路、埋點和日志。經(jīng)過詳盡的對比和評估,省聯(lián)社認為旁路式監(jiān)控對生產(chǎn)系統(tǒng)無影響,實施周期短,可快速提高科技部門的業(yè)務運維能力,成本低,見效快。由此決定進行網(wǎng)絡旁路式監(jiān)控的部署。
2.覆蓋范圍
采用網(wǎng)絡旁路式應用性能監(jiān)控技術的適應性強、時間短、成本低,適合多套業(yè)務系統(tǒng)的端到端全鏈路部署。所以在一期項目中,省聯(lián)社選取了行內(nèi)16 套重要業(yè)務系統(tǒng)進行了全鏈路監(jiān)控,包括:核心系統(tǒng)、網(wǎng)上銀行、手機銀行、大小額支付(超級網(wǎng)銀、農(nóng)信銀)、綜合前置(渠道接入)、信用卡、電話銀行、第三方中間業(yè)務、銀行卡前置、綜合前端、國際業(yè)務、資金業(yè)務、短信平臺、信貸管理以及互聯(lián)網(wǎng)金融等系統(tǒng)。
3.系統(tǒng)主要功能
應用性能監(jiān)控平臺作為省聯(lián)社在運維方面的主要監(jiān)控系統(tǒng),提供了絕大部分應用監(jiān)控的功能實現(xiàn):
(1)業(yè)務架構梳理
通過分析網(wǎng)絡數(shù)據(jù)包來自動繪制應用訪問關系,使省聯(lián)社實現(xiàn)了業(yè)務流程流轉關系的動態(tài)刷新,并可在業(yè)務系統(tǒng)變更后快速梳理業(yè)務架構。
(2)統(tǒng)計指標計算
通過網(wǎng)絡數(shù)據(jù)包的自動解碼、關聯(lián),實時計算交易量、響應率、成功率、響應時間等應用性能指標,實現(xiàn)了高實時性的業(yè)務運行狀態(tài)把控。
(3)性能展示
實現(xiàn)了對16 套重要業(yè)務系統(tǒng)的實時監(jiān)控覆蓋,并可根據(jù)需要自定義展示的指標數(shù)據(jù),通過數(shù)據(jù)掌握用戶的真實體驗情況;并且可根據(jù)運維和管理需要靈活采集不同維度的數(shù)據(jù),將監(jiān)控平臺所展示的指標與信息集中于當下運維關注點。
(4)實時告警
通過與行內(nèi)事件平臺的集成,通過動態(tài)基線和固定閾值組合的模式實現(xiàn)實時預警與快速定位,第一時間發(fā)現(xiàn)業(yè)務運行的隱患和故障,提高故障排除與系統(tǒng)恢復的處理效率。
(5)交易查詢
通過精確到逐筆交易的明細數(shù)據(jù)字段,實現(xiàn)對單筆交易的查詢、追蹤、分析、定位等操作,滿足快速查障排障的工作需要。
(6)數(shù)據(jù)輸出
通過API 接口應用將監(jiān)控平臺的實時監(jiān)控數(shù)據(jù)與監(jiān)管報送平臺對接,滿足浙江省銀監(jiān)局信息科技風險動態(tài)監(jiān)測數(shù)據(jù)的報送要求。
(7)大屏展示
通過接入監(jiān)控平臺實時數(shù)據(jù),模塊化自定義大屏可提供針對業(yè)務運行、用戶體驗、系統(tǒng)性能、交易分布等多種維度的信息展示,在重大保障、系統(tǒng)變更、壓力測試等場合可實時、快速掌握各系統(tǒng)的全局運行態(tài)勢。
通過此次項目建設,省聯(lián)社大大改善了業(yè)務系統(tǒng)的監(jiān)控粒度和實時性,促進了運維水平和服務質(zhì)量的極大提升,保障了業(yè)務系統(tǒng)可用性及連續(xù)性的進一步提高。
省聯(lián)社在較短的時間完成了行內(nèi)主要業(yè)務系統(tǒng)的端到端的全鏈路監(jiān)控覆蓋,建成了一體化應用監(jiān)控平臺,實現(xiàn)了運維部門應用監(jiān)控能力的極大增強,改善了運維工作的效率和品質(zhì)。
新系統(tǒng)建成后,省聯(lián)社擁有了對業(yè)務系統(tǒng)中各項數(shù)據(jù)的采集、處理、分析能力,為后期金融科技項目建設提供了技術支持和數(shù)據(jù)來源;高度靈活性的運維管理平臺能夠很好地應對和滿足業(yè)務系統(tǒng)不斷擴張升級帶來的運維需求和壓力,支撐未來多年的業(yè)務系統(tǒng)發(fā)展。
近幾年,浙江省農(nóng)村信用社聯(lián)合社逐步建成了管控平臺、部署平臺、日志平臺、應用性能管理四大運維平臺。應用性能管理平臺自上線運營以來,在新業(yè)務上線、業(yè)務變更、重大活動保障、災備演練等各方面成效顯著,已多次幫助運維部門及時預警、及時處理業(yè)務故障;幫助業(yè)務運維部門掌握業(yè)務系統(tǒng)的實時運行狀況,實時監(jiān)測用戶的業(yè)務體驗;同時,保質(zhì)保量地完成數(shù)據(jù)監(jiān)管報送要求。后期,省聯(lián)社將持續(xù)提高監(jiān)控覆蓋率,力求實現(xiàn)對行內(nèi)重要業(yè)務系統(tǒng)的端到端監(jiān)控全覆蓋,實現(xiàn)用戶業(yè)務體驗的全流程監(jiān)測。
點評
隨著金融電子化的深入推進,電子渠道的業(yè)務量大大增加,業(yè)務系統(tǒng)對客戶體驗和滿意度的影響作用也大大提升,浙江省農(nóng)村信用社聯(lián)合社通過建設新一代應用性能監(jiān)控平臺,實現(xiàn)用戶業(yè)務體驗的全流程監(jiān)測,在改善運維工作效率和品質(zhì)的同時,也增加了客戶滿意度。