為響應中國聯通集團公司網絡線運營組織體系改革精神,推進資源統籌布局共享,實現云資源統一規劃布局、統一投資建設、統一資源調動和統一維護,針對江蘇聯通IT 云、CT 云、業務云,尤其是行業云如地(市)政務云、私有云,當前缺乏統一運營管理手段、云技術架構分散、集中維護管理難度大、IT 專業人員缺失的現狀,本文探討了一種多云環境下的集約化運營平臺的功能建設方案,希望能解決痛點問題,滿足業務需求,面向政企云客戶提供電信級的保障手段,有效推動全省云運營集約化體系的改革落地,提升客戶感知和服務質量。
江蘇聯通目前建設有IT云、CT云、各類業務云,包括行業云、私有云等多種云資源池,這些云資源池的維護統一由省市兩級云資源池維護團隊負責,業務運營由產互公司負責。全省共有DC 數據中心15 個,云資源池23 個,資源池類型包括Xen、OpenStack+KVM、裸金屬等,云廠商有中興、華為、愛立信、沃云、華三、阿里、騰訊等,硬件設備廠商繁雜。上云的業務系統有410 個,物理設備1 457 臺,云主機2 776 臺。DC 組網方式有傳統三層架構、硬件SDN 和軟件SDN 架構。各云資源池均有獨立的操作平臺,有的云平臺運營面和運維面無法分離,存在審計風險。
目前多云資源池的運營主要存在以下問題。
a)資源交付效率低下:主要以線下方式為主,通過電話、郵件、紙質單據等完成資源審批,周期長。
b)網絡資源管理混亂:不同資源池的網絡架構不一致,VLAN/VXLAN/IP等用戶配置只能用Excel管理。
c)自助服務能力不足:云資源通過4A 堡壘機登錄較多,但系統級故障處理仍依賴運維團隊。
d)資源效率無法評估:硬件資產、虛擬化資產的使用情況無法得到有效評估。
e)運維工作量大且故障無法快速感知:硬件設備數量龐大,類型眾多,多種虛擬化技術與云平臺分開使用,維護人員需要在各種管理工具之間來回切換。傳統的網管監控系統無法覆蓋云資源池內的虛擬資源,無法及時感知云自身的運行狀態。
云網業務應以高質量發展為目標,通過數字化轉型,提升業務的運營管理水平。集約化的多云管控平臺的建設需求應運而生。該平臺應具備以下基本功能。
a)縮短資源交付時間:將本系統與企業OA 或CBSS 流程結合,實現線上流程和資源發放全自動,顯著提升資源交付效率,資源全流程開通平均時長由之前的數天縮短到小時或分鐘級。
b)異構網絡自動開通:將云內多種網絡架構有機整合,通過統一的運維平面消除底層技術差異、簡化配置步驟,網絡開通方式由原來的手動和專業人員操作轉變為業務部門自助按需開通,并且開放自助配置能力。
c)資源管理統一視圖:將整體納管本地行業云、私有云等多個異構云網資源池,提供全局資源評估和調度機制,有效平衡和提高云資源使用效率,方便從業務運營視角客觀評價當前網絡資源使用效能和收益情況。
d)簡化運維工作:通過建立數據中心資產臺賬,增強設備帶外管理、補全云內監控機制,建立應用和設備的端到端拓撲;通過自動化工具和智能算法進行異常檢測和容量預測,以此簡化運維工作,降低故障風險。
針對不同業務場景對多云集約化運營平臺的要求,站在不同使用者的視角,集約化平臺應同時具備資源管理、運營、自服務和運維管理能力,滿足以下用戶場景需求。
a)外部客戶可感知多樣化的云產品和云服務,自助訂購使用云網資源,及時掌握資源使用量和成本;內部用戶通過合規流程獲得云能力,自主維護云網資源,通過運維工單得到快速支撐。
b)外部系統調用API 進行數據集約共享、能力注冊和開放,具備第三方快速適配和接入能力,可集成和擴展系統規模。
c)運營決策者可設計云產品和云網融合套餐,快速發布上線,靈活配置計費規則,感知云能力容量變化并做好預測、規劃。
d)運維管理員整合云平臺,統一視圖,監控云資源運行狀況,并根據負載進行調度,及時發現和處理故障。
多云集約化運營平臺通過屏蔽云之間的差異、抽象功能、統一概念,以標準化視圖來簡化全省業務云/產業云的業務運營、網絡運維工作。平臺主要功能模塊包括資源管理、運營管理、自服務、運維管理和南北向API總線。異構云環境的統一視圖主要是通過南向API 實現各云的對接納管。北向API 用于對接第三方應用或集團平臺,提供平臺能力輸出(見圖1)。
運營管理模塊主要實現產品配置和上線、客戶和租戶管理、訂單管理和流程設計、計量計費、運營統計和分析。運維能力模塊主要實現云資產管理、拓撲發現和可視化、自動化作業、異常檢測、故障定位、故障預測。自助能力模塊主要實現自服務、云資源自助開通/變更/注銷、資源管理控制、訂單/賬單/清單管理。資管能力模塊主要實現異構云平臺統一視圖、全生命周期管理、資源調度和編排、容量監控和預測、資源適配擴展API。
如圖2 所示,各地的行業云、私有云可以通過DCI或城域網進行互聯,在省中心部署多云集約化運營平臺,各級用戶分權分域在統一的平臺上進行操作。

圖1 集約化平臺架構設計圖
平臺應具有以下5 種常用角色和標準工作流程,同時支持根據客戶需求進行定制。常用角色分為系統管理員、運維管理員、運營管理員、租戶管理員和普通用戶。系統管理員負責維護人員組織架構和用戶權限、設置系統基本參數。運維管理員負責云資源生命周期管理、性能監控、操作維護、資產管理、自動化運維、告警監控、報表管理、云資源工單處理。運營管理員負責維護租戶及成員、發布服務、管理訂單賬單和訂單審批。普通用戶負責資源申請、監控、操作和查看申請單和流程。租戶管理員負責管理普通用戶所有功能、維護租戶內項目和成員、審批租戶內訂單、查看租戶賬單。
圖3 為5 種用戶角色之間的標準工作流程圖,體現了各角色的不同功能職責和工作流程。
集約化平臺不僅支持云資源的全自動開通,同時也支持下發物理/虛擬網元參數,完成租戶VPC、出口網關和防火墻的全鏈路自動配置,實現從“開資源”到“開業務”的轉變,一體化交付應用系統所需的計算、存儲、網絡資源和服務。
云網融合借助于資源管理模塊,通過資源適配總線完成各類設備的納管(見圖4),在此基礎上實現云資源和網絡資源的一站式開通。
服務目錄是運營管理中的重要功能。服務目錄可以將云能力封裝成標準服務發布上線,自定義服務費率和生命周期策略,自定義服務模型,滿足各類云業務場景,如圖5所示。
a)支持合規化發放。服務目錄可配置多場景不同流程,確保資源使用合規,支持根據IT 規范定制開發流程。
b)自動化配置。在資源交付之前可根據企業內控和基線要求,對資源進行初始配置、安全加固。
c)標準化封裝。服務目錄將公有云標準服務和私有/第三方非標準服務,采用統一標準封裝對齊,統一面向業務部門提供能力。

圖5 服務目錄運行結構
集約化運營平臺應為企業租戶提供多種異構云的統一管理界面,一站式滿足企業上云、用云、管云需求,為企業上云消除最后一公里障礙。由于現網的復雜性和多樣性,可以分階段規劃實施多云環境下集約化運營平臺方案。初期主要指云網協同,以各類云專線為代表,為企業提供云網套餐,幫助企業實現安全可靠的上云和組網。中后期運營商以云網融合為目標,實現關鍵能力垂直和水平擴展。垂直維度向上與企業應用深度融合,實現“云+網+X”,向下實現企業組網及IT 集成服務延伸,以云服務方式提供ICT 服務。水平維度向云網融合體驗和產品創新方面持續擴展,優化用戶體驗,做強云計算產品。