管理實踐的目的是確保服務達到商定的績效,以成本效益的方式滿足當前和未來的需求。
服務性能關聯兩個方面:服務行為的數量和所需的時間。
服務能力是指配置項或服務所能夠提供的最大產量。
管理實踐涉及到對服務本身及其所依賴的資源,如基礎架構、應用程序、第三方服務,以及人員能力等方面的分析、建模、需求預測、資源規劃,以及事件處理等。
如果說前面的業務分析是保障服務質量的前提,那么能力和性能管理則起到了承前啟后的作用,它能夠為后面馬上要提到的變更管理實踐提供參考與依據。
為了實現目標與成本的平衡,也就是俗稱的“花得值”,我們應當主要著眼于:提供方能夠在恰當的時間,提供恰當的服務水平。
具體而言,它涉及到如下管理實踐:
通過適當的建模,對現有的流程予以掌控,進而精準地錨定業務性能的預期、并做好前期的規劃。
充分了解當前服務的交付能力、以及整體的技術走勢。根據現有的SLA 和OLA,建立各項服務的現狀基線、與閥值警報機制,進而為可能出現的性能問題,提供可參考的診斷依據。
通過監控、記錄、分析、報告各類資源的使用情況,發現配給的不足、找到不同應用場景下的臨界點、以及可能出現的資源閑置狀況,進而在成本最優的前提下,實現供求的平衡。
與此同時,能力與性能管理也能夠為企業帶來一定的為前瞻性,通過監視當前服務中的所有組件,評審各項運能指標,以確保出現服務質量拐點,但尚未構成嚴重故障或中斷時,就能夠被及時地發現并予以解決。
由于我們企業的IT 服務架構具有地理上分布較廣的特點,因此我們曾經碰到過:局部調整對于整體服務性能產生影響的問題。
當時,我們有一個云計費模塊,持續判斷并記錄著,那些由各個用戶所觸發的、滿足計費條件的打印與復印作業。
然而,在某一次局部升級調整之后,它出乎意料地影響到了全球各地辦公站點的打印與復印服務的輸出性能與速度。由于我們缺乏對打印速度的監控,因此直至造成了一定規模的影響后,才發現并予以糾正。
另外,為了避免出現以往對于物理資源,所采取的死板預分配以及對網絡帶寬的被動管理模式,我們在云服務的“彈性伸縮”特點上“做足功課”。通過與云服務商的協作,我們對現有的云服務資源,實施了全面的端到端式的狀態監控。有了第一手的數據指標,我們就能夠及時地了解業務方的需求、實際的消費狀況以及當前的安全態勢。
籍此,我們能夠在兼顧成本績效的前提下,動態調整容量,實時改進運能,進而修正監控基線,從而形成了正反饋。