文/本刊記者 邢鋮

當前,IT運維自動化管理已經成為趨勢。隨著企業業務的不斷增長,企業的IT運維也由過去的簡單變得愈發復雜,這對企業的IT運維人員可謂是苦不堪言:系統隨時故障、網絡出現阻塞、系統遭遇病毒等等一系列的問題正困擾著IT運維人員。而除了這些,IT運維自身和外界環境也存在不小的挑戰!
IT運維管理一直在行業內被熱議、被聚焦、被廣泛關注。廠商廣告很多,產品的性能介紹很多,方案和技術的講解也很多。但真正困擾企業網絡管理者,讓他們在IT運維管理的門前一直躊躇不前的疑惑始終沒有給出答案!
有故障發生才有運維存在的價值,最有效的運維管理也不會避免故障的出現。然而當IT運維出現問題之時,人們的觀念往往是歸罪于運維基礎管理,造成的后果就是,對IT運維的信任度越來越低。但是事實并非如此。
眾所周知,IT管理已經成為當前信息化建設時代的主旋律,當企事業單位IT規模達到一定程度之后,其網絡、IT設施、業務等眾多IT資源都需要得以有效管控,從而確保其IT系統正常運行,為正常辦公以及業務生產提供支持,但這些IT要素的管理卻不再是單純的人工管理可以實現的,因此安裝IT運維軟件似乎已經成為IT項目的必備環節。
而自動化趨勢成為未來的發展模式。自動化運維管理平臺稱之為員工全生命周期的IT運維流程,它是伴隨著其它管理流程并行化生產。比如員工的入職、離職在整個并行化過程中使用不同的模塊以及功能來實現自動化管理。
事實已經證明,IT運維管理在企業發展過程中擔負起越來越重要的角色,企業利潤來源也越來越依賴于IT系統的建設水平,而企業信息化的建設水平取決于兩個方面,一方面是基礎設施的搭建,這是硬件基礎;另一方面是管理層面,就是如何將已有的硬件基礎設施的效能更好的發揮出來,這就和IT運維水平的高低息息相關。
換句話說,如何把IT運維管理與企業的生產模式和管理系統進行科學匹配,已經是現代企業提升效率,增強核心競爭力的砝碼。
未來國際運維中心總經理白峰表示,當前IT管理系統越來越深入地切入管理決策,從網絡管理向業務服務管理過渡、從參數讀取管理向智能分析管理過渡、從網管員設置與維護向多部門信息共享與協同管理過渡。在此基礎上,傳統的方式已經漸漸落伍,采用以企業業務為核心的流程化IT綜合管理迫在眉睫。
從實際的案例看,許多標桿企業IT運維水平的提高給企業發展所帶來的好處是實實在在的,拿金融行業舉例來說,如果離開了IT系統,離開了IT運維管理,各種金融業務顯然就無法正常展開。
同樣的,其他企業和機構在工業化和信息化發展的過程中也越來越依賴于IT系統。在目前經濟條件下,如果企業的IT運維水平好的話,它可以直接降低運營成本,給企業帶來新的利潤增長點。
可以說,IT運維管理的重要性直接提升了IT部門在企業的地位,逐漸從一個支持部門向企業的核心價值部門轉變,這也是一個企業信息化建設歷程中不斷前進的必須趨勢。
北京冠華融鑫運維部宋曉凱說:“換言之,正是由于企業用戶分層次的管理需求,直接決定了BTIM系統平臺按照分層架構設計思想進行建設,實現網管數據采集與處理的分離,數據處理與呈現的分離,共分為三個層次:數據采集層、數據處理層和功能顯示層。數據采集層是位于數據處理層與管理對象之間的數據采集子系統;數據處理層主要是將數據采集層所獲得各種數據進行清洗、整理和標準化處理;功能顯示層針對分類管理信息進行統一匯總和多維展現。無疑,這樣的設計增強了系統的靈活性和擴展性?!?/p>

去“頑疾”,讓IT運維真正促進“兩化融合”。
IT運維中雖然很多產品的基本功能已經可以滿足企業的大部分需求,但是每個企業都有自身獨特的特性和業務模式,這就對產品以及產品質量提出了更高的要求。
在國外,企業對于產品質量管理的重視程度較高,已經滲透到了開發、生產和銷售等多個環節。企業從開發階段起,就對每個環節進行追蹤和檢測,從而保證低成本、高效率地進行研發、生產和銷售。而在國內,企業對于應用質量管理、自動化測試等概念的認知,仍處于懵懂狀態。相關人才的缺乏是導致這一現象的重要因素,但歸根結底,還是企業重開發、重業務,而對于測試和質量管理的重視程度不夠高。而所謂設備原廠服務,就是IBM、HP等硬件產品生產商,在產品銷售之后,由其服務團隊為用戶提供運維服務,解決使用過程中的種種難題。但在企業實際操作中,往往是隨著信息化建設推進,會采購多個品牌的軟硬件設備,想要選擇一家原廠服務商解決所有需求并不現實??蛻羧绻霈F因故障造成業務中斷,將會面臨原廠服務只針對自家產品進行問題排查,而不對整體系統負責的情況,致使業務中斷時間延長,這將給企業帶來巨大損失。
解決之道:在這種背景之下,應用質量管理對于企業的重要意義不言而喻。所以必須實施應用質量管理,企業能夠從開始到最后為產品的整個生命周期保駕護航,從而保證產品質量,控制風險并降低成本,使IT運維真正幫助企業在競爭激烈的市場上保持并確立優勢地位。

隨著國家大部委制的整合進程逐漸加快,問題暴露得更加明顯。以前原本獨立的兩套IT系統,現在要完成協同辦公,多部門統一協調管理則面臨不小的挑戰。
因為當兩個部委在業務流程上有重合時,就難免發生推卸責任,糾纏不清的扯皮事件。諸如不能上網這樣的簡單問題,很可能會牽涉到幾個部門之間配合。而問題出現時,A部門找B部門反饋,B部門又找C部門處理,C可能說是D部門的問題,這樣導致很簡單的問題無法得到及時有效的處理,影響的不僅僅是業務本身,部門之間也會怨聲載道。問題不僅在政府行業中出現,最主要的還是很多企業也會面臨。而且最主要體現在私企里,因為私企經過一段時間的發展,自身需要一個新的整體企業效益的飛躍,迫切需要業務的轉型或者需要運維來幫助解決自身的問題,而這些企業需要運維的根本原因是各部門之間無法形成統一協調的IT系統管理,問題得不到有效的跟蹤,也就談不上及時解決?,F在,如何實現各部門之間的統一協調,以及如何對問題進行有效的跟蹤和量化的管理已經成為政府和企業不得不著手解決的難題。
解決之道:要使IT部門成為溝通連接企業業務和技術的平臺,就必須要有合適的管理工具,幫助企業的IT服務部門實現標準化運維,量化管理,從而擺脫人的制約。這種管理工具應該融入國際倡導的ITIL服務管理理念,達到技術、人員和流程三方面的整合。
IT運維企業很多時候因為不知道用戶的上缺少什么,使用戶的機構面臨更高風險。用戶安裝沒有的到許可的軟件是非法的,可能引起訴訟或高額的罰款。沒有得到許可的軟件不會得到支持,可能引起安全性、性能和兼容性問題。
另一方面,過濾保障雖然安全,但卻是一種昂貴和浪費的策略,需要占用更多的寬帶和服務器容量。
解決之道:由于客戶和用戶遍布于世界各地,商業機會正日益變得更加分分散。因此,IT基礎架構分布廣泛。用戶通常不理解IT運維的價值,導致理解錯誤、誤解并且錯失商機。你必須讓客戶清楚地了解你已經完成的工作、IT系統目前的狀態以及為了更好地支持用戶的企業目標你還需要做些什么。不管你喜歡不喜歡,數字永遠是最能說服用戶繼續合作的因素。而且管理IT基礎架構不應當成為吃力不討好的工作。既不應當非常復雜,也不應當需要經常加班。
隨著虛擬化、云計算和分布式計算等技術不斷地滲透IT業,IT基礎架構正日益復雜。和諧解決方案可以幫助用戶的業務按指數規律增長,但和傳統架構相比也要求管理員投入更多的精力。遺憾的是,很多機構依賴的是一種“獨占式”的管理策略,部署分別管理每一個網絡和層的多點產品。
未來國際運維中心總經理白峰指出,“欠管理”是指管理力度不夠,方法不當造成管理上疏漏,使運維工作達不到預期目標;“過管理”是指過于盲目投入管理而不切運維發展現狀,不注重實效,造成大量人力財力浪費,效率低下。例如:許多工作因為管理不當而反反復復,處理故障10分鐘,流程環節1小時。
解決之道:業務的需求的增長促使IT基礎資源(服務器容量、應用程序、存儲空間等等)需要跨機構整合,并且在不同地區的用戶之間共享。這種新的架構可以提升生產率、節約資金和提升效率,然而它的維護也相當復雜和昂貴。
安裝對于新的雇員來說是一件痛苦的工作。他們需要一臺新的計算機、一個新用戶名、一個新的電子郵件地址以及訪問他們工作所需的文件和應用程序的權限。之后他們需要接受關于IT策略和程序的培訓和教育。
但是所有的這一切都需要迅速完成,以便他們可以盡快開始履行他們新的職責。這項工作不僅耗費很多時間,而且有關訪問的權限的信息需要直接上司和人力資源部門提供這種信息是必須的,但不一定可用。
解決之道:所有IT基礎設備都應該在遇到問題時要自動報警,無論是系統自動報警還是使用人員報的故障。然后IT運維人員只需要按照相關知識庫的數據,一步一步操作就可以。如果重新安裝一套新程序、新軟件,將是事倍功半。因此,企業需要事先建立自動工單式流程管理,當設備或軟件重新安裝或者發生異常、超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關IT運維人員。IT運維人員必須在指定時間內完成流程所規定的環節與工作,以提高IT運維響應問題的效率。
一臺一臺機器地處理問題,不僅令人發狂,也非常低效。而當問題出現時,仍然采取亡羊補牢的形式來進行運維顯然已經落后,傳統被動的、孤立的、分散的“救火隊”式IT運維管理模式,讓IT部門疲憊不堪,而且運維人員很少能準時下班,處理突發技術故障也時有發生,運維人員往往像救火隊員一樣去處理故障,在“救火式”的IT運維管理模式下,是很難進行有效的IT管理,無法有效地保證運維的有效性和統一性。
隨著公司業務模式的復雜化和多樣化,更帶來IT運營環境的復雜性和不確定性,凸顯出了企業綜合布線信息化IT系統被動管理是軟肋。就像醫生從來不會簡單地治療癥狀。他們會使用預防性的藥物,努力給他們的病人最好的護理。
解決之道:IT運維應當以相同的方式處理。主動性、預防性的方法將提升效率、性能和可用性。而現在的運維手段則是采用先進網絡監控與管理手段,實行集中統一的監控,及時發現、解決問題,并可以通過分析手段,進行主動性和預防性的維護,將故障提早排除。
在網絡運維管理中,人的因素成為企業急需解決的第七個問題。有人會問,為什么是人呢?我們都清楚的知道人可以解決問題,這是人在網絡運維管理中起到的重要作用,也是無須質疑的。但問題也同樣隨之而來,如果一個熟練運維人員的崗位發生變更,當問題在出現時,就很難得到迅速處理。即使會有新人繼承前人的工作,但他卻無法繼承前人的運維經驗,這成為企業運維成本增加,重復投資的重要原因。
對人的依賴越大,網絡管理中的不穩定因素就越多。在企業的IT系統中,如何減少對人的依賴,避免出現因人員變更導致運維無法有效進行,是企業IT部門面臨的重大考驗。
解決之道:設立IT運維關鍵流程,同時,在設置自動化流程時還需要引入優先處理原則,這樣就跳過了“人”的因素。
通過運維管理工具,可以跟蹤事件的流程,實現整個IT系統的統一與協調;通過運維管理工具,幫助運維人員監控和定位問題根源;通過知識庫的積累可以有效解決人員變更后的管理問題。可以說,IT系統不僅僅需要人的運維,為了發揮IT系統的最大作用,利用工具來量化、標準化管理,已經成為企業網絡管理的一個趨勢,這是符合客觀發展規律的。
那么也許有人會說,我們很多年前就已經利用工具來管理網絡和IT系統了!沒錯,這是事實,但前面提到的問題,恰恰是在已經部署網管系統的政府部門或企業中發生的,他們的IT基礎設施相對比較完善,也部署了相關的管理工具,但問題還是有,依然無法保障IT系統的發揮最大的作用,甚至影響到業務流程。為什么會出現這種情況呢?其實根本原因在于IT服務部門沒有真正的從成本中心向價值中心轉變。
解決之道:IT部門不能只停留在日常的支持運維水平,不能局限于企業中的一個封閉部門,必須使IT部門適應公司其他業務部門的需求,只有這樣才能從根本上解決問題。
如果說統一協調管理問題不得不解決,那么當IT系統的某個流程出現問題時,往往因為找不到故障原因,而無法從根本解決問題的情況,卻成為企業很難解決的問題。舉個最簡單的例子,當員工反應上網速度變慢時,網絡運維人員查找了半天問題,也許會想到非法流量占用帶寬,但網絡中的應用繁多,哪種應用才是罪魁禍首?無法判斷哪些P2P是正常應用,哪些是非法應用?到底是外來攻擊造成的安全問題還是確實該增加帶寬?這種情況對于缺乏管理工具的IT部門來說,很難找到答案。就算是對網絡應用進行優化,但沒有相應的監控和分析工具,該對什么進行優化又衍生了新問題。
問題原因不清,給許多企業帶來不小的麻煩。這使網絡運維人員疲于奔波,卻始終解決不了問題,挨累不討好的事情令他們叫苦不迭。更為重要的是,因為找不到病根兒而導致問題無法根治,才是企業IT部門最為頭痛和急需解決的事情。
解決之道:這是因為很多企業對IT運維管理系統都有誤解,認為部署了網絡管理系統,就可以高枕無憂了。這是錯誤的觀點,雖然網管系統可以解決很多問題,但這并不能說明,有了運維管理系統就能一勞永逸,在實施部署前對運維人員進行相關的培訓,根據企業自身的業務流程進行適當的調研和咨詢都是必不可少的。如何滿足符合中國市場環境的網絡運維管理需求,為中國企業用戶量身打造符合實際的IT運維管理解決方案,則成為國內IT運維管理解決方案提供商必須要面對的挑戰。

這是大多數初次接觸ITIL或ITIL實施初期企業的直接感受,比如原來工程師接到電話把故障直接處理完后就算結束,現在還要填寫表單、做記錄,這無疑是增加了一定的工作量,其實這是很片面的說法,在ITIL實施初期必須要以效率換規范,逐漸將規范轉換為一種工作習慣。
經過一段時間的積累很多事情會迎刃而解,比如知識管理、客戶滿意度、年度規劃等都會有準確的數據來支撐。試想孫悟空戴上緊箍咒的那刻他是什么感受,當他成佛后緊箍咒自然會沒有,實施ITIL也是這個道理。
解決之道:要使IT部門成為溝通連接企業業務和技術的平臺,就必須要有合適的管理工具,幫助企業的IT服務部門實現標準化運維,量化管理,從而擺脫人的制約。這種管理工具應該融入國際倡導的ITIL服務管理理念,達到技術、人員和流程三方面的整合。這種管理工具至少應該具備下面幾個特點:
1.統一的運行展現:可以給運維管理人員提供網絡管理、業務應用管理、機房環境等資源監控系統的集中展現與處理平臺,這即方便運維人員操作,也解決了IT系統的統一協調問題;
2.問題的管理功能:可以幫助運維人員查明突發事件或錯誤產生的根本原因,并制定解決問題的方案和防止錯誤再次發生的有效措施;
3.變更的管理:通過分析、計劃、執行和回顧四個階段,最大限度控制變更的風險,保持企業IT部門和客戶之間的信息溝通,這不但降低了對人的依賴,而且還同時實現了運維的量化、標準化管理;
4.符合ITIL管理理念中的知識庫:通過知識提交、審核、發布,以及查詢等功能自動積累IT部門的日常運維的工作經驗,從而幫助各級支持人員提高技能水平,簡化IT服務認為,也最大程度的降低了對具體個人的依賴。