鄧曉蕾
東軟云計算提出了“上云三步走”的解決方案,涵蓋了私有云環境的建設和管理方案、原有系統云化改造方案,以及云應用性能分析和決策支持方案,解決了不同階段遇到的不同問題,最符合城區云化改造建設的需求。
全面提升信息化水平,形成信息化與城市經濟社會各方面深度融合的發展態勢,從“數字城區”向“智慧城區”全面躍升。
上云是必經之路
北京市某城區原有的各個業務系統,最初都是基于傳統“煙囪式”的架構建立的,以物理機環境為主,業務資源不能實現有效共享。隨著業務的快速發展,IT資源成了業務的掣肘,這是政務信息化發展中普遍存在的一個問題。如果不從基礎架構層面打破原來的管理模式和方法,智慧城區的工作將很難開展。
目前該城區已有獨立的數據中心,但是2015年~2016年,服務器的數量猛增到200多臺,機柜容量趨近飽和,而且機房的散熱和電力供應壓力較大。那么,是在原有機房的基礎上擴容,修修補補,還是來一次徹底的云化?權衡之后,城區政府決定將業務遷移到云上,這樣不僅可以保證以后業務的連續性,而且可以讓整體基礎設施長久、健康的發展
上云或者不上云,這對城區政府來說并不是一個選擇題。從促進業務的角度出發,上云的大方向是確定的。
上云按部就班
城區政府若希望借上云契機,將全部業務流程云化,涉及服務器、存儲、網絡和不同的負載,這就需要一個整套的云化解決方案。
東軟云計算提出了“上云三步走”的解決方案,涵蓋了私有云環境的建設和管理方案、原有系統云化改造方案,以及云應用性能分析和決策支持方案,解決了不同階段遇到的不同問題,最符合城區云化改造建設的需求。
第一步,用好云環境(SaCa Aclome)。私有云的基礎環境建設都大同小異,但是在IaaS資源層建設完成后,如何有效地實現對云環境整體運行情況的監控,如何快速創建云主機,以及自動安裝常用的中間件,如何在云主機創建后自動完成相關防火墻、負載均衡和堡壘機的規則配置,如何屏蔽底層多種虛擬化軟件來的技術差異,這些才是能否用好云環境的關鍵。東軟提供的SaCa Aclome敏捷云管理平臺是一款專為私有云構建的企業級云計算管理平臺,提供對數據中心全方位的監控運維能力,還可快速交付和管理基礎架構和云應用,可為VMware、OpenStack、CloudStack、Docker和公有云等云平臺提供一整套全面的管理體系,實現統一的管理體驗。城區政府在部署SaCa Aclome云管理平臺之后,不僅實現了底層多個國產化虛擬軟件的統一管理,還通過自定可視化展示和云服務目錄管理功能,不僅實現了對云數據中心的監控,還搭建私有云服務門戶,讓業務人員自助申請云資源。并且云平臺提供應用倉庫和軟件自動安裝功能,從而讓業務人員快速獲得主機和軟件自動安裝部署功能,而且還提供自動化腳本配置功能,可以自動完成防火墻和堡壘機的配置,減少了人工的參與,有效提升了云資源交付的效率,為后續的應用上云提供了強有力的支撐。
第二步,建好云應用(SaCa ACAP)。基礎設施云化,已經使得整個系統邁入了云化的大門。建好適合于云環境的、可以充分利用云環境特征的應用,才是整個改造的核心目標。云環境資源具有隨需即取的特性,可以實現應用規模的彈性伸縮,實現快速應用部署及交付,提升整個城區應用系統的服務質量,但云環境的這些優勢,需要有相配合的應用架構進行支撐。
采用微服務架構構建適合于云環境的應用,無疑是上佳選擇。所謂微服務架構,是指將一個應用系統拆分為多個微小、具有獨立功能的小的應用,這些小的應用可以獨立地編譯及部署,并通過各自的API接口相互通信,它們彼此相互協作,作為一個整體為用戶提供功能,又可以獨立地進行擴容的一種應用構建方式。微服務架構應用,每一部分都可以獨立彈性伸縮,獨立地部署上線,可以很好地利用云環境的資源。但瑕不掩瑜,采用微服務架構也會為應用構建帶來麻煩。微服務架構涉及技術眾多、涉及面廣,對開發人員技術能力要求很高,使得測試難度較傳統應用更為困難,微服務使得系統部署規模急劇增大,管理運維難度較高,這些問題,成了云應用系統構建的攔路虎。
智慧城區采用了SaCa ACAP(敏捷云應用支撐平臺)來應對這個難題。SaCa ACAP提供一整套成熟的微服務開發框架、開發工具及運行支撐的中間件。通過開發框架及工具,屏蔽了絕大部分構建微服務應用需要了解的底層技術,使得開發人員可以專注于業務邏輯開發,而不必將精力浪費在了解各種底層框架、進行大量復雜配置。SaCa ACAP的微服務測試工具,可以自動分析待測試微服務應用外部依賴,生成模擬的外部依賴對象及測試模板,提供與傳統應用開發一致的測試體驗。SaCa ACAP還提供了微服務網關、服務注冊中心、服務配置中心、服務治理監控中心等等一系列運行中間件,在保障微服務應用穩定運行同時,極大地降低了微服務應用管控運維的難度。
通過使用SaCa ACAP平臺,智慧城區實現了應用云化的核心目標,應用構建、上線及響應業務需求的速度也獲得了極大的提升,實現了建好云應用的目標。
第三步,管好云應用(RealSight APM)。經過前面的上云兩步走,順利地將原有業務系統遷移到云上,但是這些應用的性能分析、決策支持目前還依賴于手工統計、人工計算的方式,缺乏科學有效的手段,一旦決策失誤,造成的影響是長遠的、重大的。科學決策的重要前提是對各類信息的廣泛和精確地掌握,以及能夠見微知著,發現這些信息和數據的內在聯系。
“互聯網+”在各領域的快速推進使得軟件滲入了業務的方方面面,所有公司都在考慮應用軟件性能對業務的影響。任何應用軟件性能波動將直接影響用戶體驗和工作效率。政府、企業對應用軟件依賴程度逐漸提高,使得對應用性能及其依賴(中間件、數據庫、云環境、服務器等)的監管比以往更加重要。企業在應用性能管理方面的投入逐年升高。
根據 Forrest的統計數據,有57%的企業IT運維部反饋至少每周會發生一次影響應用性能和可用性的問題;每天發生問題的比例占到28%。對于愈加依賴應用面向客戶實現企業價值、提升工作效率的當今企業來說,這種問題越來越無法忍受。
雖然政府、企業投入很大,但在應用性能管理方面獲得的收益卻并不明顯。通常企業構建部署的應用管理系統采集管理的大量應用性能指標數據僅服務于運維人員基礎統計查詢及告警機制觸發。隨著政府、企業部署應用數量迅速增加,以及新技術(如混合云、虛擬化、大數據等)、新需求(如支持移動終端、信息主動推送等)促使應用系統復雜化、多樣化,使得穩定性、性能保障更加困難。
城區云面臨的應用性能管理被動的局面,首先需要變被動解決風險告警為主動發現潛在問題和風險。然而,并非每個政府部門都擁有經驗豐富、響應迅速的應用性能管理、運維團隊。除此之外,政府內應用數量,以及應用架構復雜度的增加,監控指標及單位時間產生的監控數據量成倍增長,加之運維數據本身有價值的信息密度較低,人工篩選分析工作量巨大,運維人員難堪重負。如何通過更加智能的方式實現應用性能管理(APM),是當前應用性能管理面臨解決的關鍵問題之一,需要建立應用性能管理平臺,才能長期解決這些問題。
圍繞核心需求,城區云應用系統基于東軟RealSight APM應用性能管理平臺產品規劃、建設一站式云應用性能管理平臺,實現了云環境下海量應用系統的集中監控及運維管理。相比傳統應用運維方式,該平臺的核心優勢有以下幾點。
更簡單的運維管理模式。簡化海量監控指標數據分析工作, 以聚合指標指示應用性能,將海量基礎指標轉換為容易理解的應用健康狀態聚合指標,并實時更新,避免人工篩查海量數據,簡化告警策略,提升管理效率。
主動防御應用性能風險。變被動解決風險告警為主動發現預防問題及風險。在給定預期負載條件下分析預測潛在問題及風險,使企業能夠提前發現風險,防患未然。降低由應用穩定性、性能問題帶來的經濟損失。
自動化的應用容量規劃。預測應用性能及負載變化趨勢, 提前發現應用資源配置存在的問題,定位應用資源超配或資源配置不足,幫助運維人員找到最優資源配置方案,提升資源利用率,節約成本。
智能化風險根源問題分析。以更加自動、智能的方式分析應用性能異常,生成指定時間段內的詳細診斷分析報告,輔助快速排查、定位根源問題,將運維人員從繁雜的海量運維數據分析工作中解放出來。
客戶價值
將部分業務遷移到城區云后,數據中心資源利用率整體提升至70%,總體能耗降低30%,業務部署周期從月級縮減到小時級;全自動監控,降低運維人員90%以上的工作量;業務運行全程預警,快速定位根源問題;完美大屏展現方案,滿足參觀、檢查、驗收等需求;業務性能與資源動態匹配,提升了IT系統服務水平。
截至目前,城區政府已經把部分政務系統遷到了云上,預計到明年年底之前,會按照從非核心業務系統到核心業務系統的順序,陸續將所有政務系統遷移到云平臺上。