中國石油吐哈油田是我國較大的陸上油田之一,經過多年企業信息化建設,逐步建立了涵蓋油田公司各個單位、涉及油田所有員工的各類信息應用系統近百套,信息系統已經成為油田生產、生活、經營、管理必不可少的一部分。
不足的是,在網絡及系統之上的應用層缺乏相應的監控告警手段,處于被動維護模式,無法從根本上保障各個應用系統的穩定運行,也無法在第一時間內獲知應用系統的狀態,往往是在用戶告知后,信息中心才開始根據告知尋找應用系統故障。油田公司信息系統運維所面臨的主要問題是缺乏以終端用戶體驗管理為綱、以應用性能管理為目的、以IT基礎設施管理為基礎的完整運維管理體系。
基于此,吐哈油田引進了以美國Compuware公司Vantage為基礎的信息運維管理套件,參考中石油總公司、工信部、國家及國際組織信息建設、維護標準,建設了一套完整的吐哈油田信息系統運維管理系統。
業務應用
與用戶體驗雙保險
為了讓信息系統應用得更順暢,吐哈油田信息中心采用了國際成熟、先進的模型來構建信息運維保障系統,目的是保證業務應用功能高效且穩定地實現。
首先是采用了強大的數據塊技術,分別為基層技術、中層管理、高層決策等不同角色、不同層次的人員提供了個性化的信息門戶。全方位、大縱深、多角度、積木式地展示整個油田各個業務部門信息應用系統、相關IT基礎架構的實時狀態,以及歷史統計報表。
其次是通過自動化與手工相結合的建模引擎來保證業務邏輯與信息基礎架構的有效關聯,當應用系統性能下降或IT設備發生故障時,能迅速、精準、正確定位故障原因,并快捷、全面評估故障影響范圍,引導相關部門根據事件輕重緩急來采取響應措施。
最后是多種數據采集接口將企業所有的信息管理工具軟件、業務部門考核指標、流程規章管理制度,甚至場地安防管理等與信息相關的數據全部集成到統一的管理平臺上。
而在用戶體驗保障方面,信息中心能通過網絡端口鏡像分析出用戶操作在客戶端、網絡段、服務器端、頁面生成等4個時段的精確用時與流量,7×24小時監測所有用戶在所有地點對油田內部網絡和業務應用的使用體驗。
以用戶體驗監測為例,這套系統不僅能自動從IP地址、OA用戶名、VPN用戶名、Web網頁用戶名等監測用戶訪問應用系統每一個頁面、每一個動作的響應時間與數據量,而且能夠按頁面訪問組合來監測完整事務性能。具體到隔離故障區域,強大的多種數據專家分析模塊可以綜合分析多種數據源,對TCP/UDP/HTTP/HTTPS/DNS/SMTP等協議、VOIP質量、數據庫查詢、Exchange收發郵件、SAP GUI操作、XML/SOAP訪問等等進行詳細分析,在不干擾用戶前提下準確隔離用戶性能問題發生的具體區域,如客戶端、網絡、服務器端或者頁面設計問題等。而通過優化運維流程,可以引導相關專業部門、人員根據用戶體驗監測主動優化業務應用,并利用系統報表以及靈活的數據挖掘接口DMI按照企業運維要求建立起持續優化的信息運維流程體系(如圖)。
保障基礎架構性能
與國內外多數網絡系統綜合管理軟件類似,吐哈油田現有的網管系統重點要解決的是信息基礎架構所涉及資源的監測管理問題,即對網絡設備、服務器、數據庫、存儲設備等等IT基礎架構的相關參數進行實時、定時、連續性監測,顯示資源的邏輯拓撲結構以及物理地理分布圖,并按某種邏輯進行業務關聯等等。
在此基礎上,吐哈油田新建成的運維保障系統將對基礎架構所承載的業務系統進行端到端的性能管理監測,重點包括三方面。
一是在網絡上,采用無干擾的探針方式對網絡上的數據流量按照業務、協議、鏈路、設備進行解碼分類并計算出應用響應時間,自動生成應用訪問拓撲邏輯,評估系統運行效能,發現網上應用漏洞。
二是在服務器上,采用統一的管理模板和先進的專家經驗庫對業務性能相關的IT基礎架構進行監測,包括各種硬件平臺、操作系統、數據庫、應用服務器、虛擬機服務器等等,降低技術人員對運維管理的學習難度,提高系統運行效率與排錯能力。
三是在業務應用上,可以根據需要在生產環境中分布式部署代理程序,深度分析應用性能的根本原因,為軟件開發人員提供精準的優化指導。