



關鍵詞: 云計算 行業(yè)發(fā)展 數(shù)據(jù)中心 超融合 自助云服務
中圖分類號: V351.3 文獻標識碼: A 文章編號: 1672-3791(2023)16-0034-06
上海浦東國際機場立足中國長三角世界級城市群,2019 年旅客吞吐量為7 615 萬人次,航班起降達51萬架次,是全球最繁忙的機場之一。隨著業(yè)務的快速發(fā)展,機場內(nèi)部各單位陸續(xù)建設投產(chǎn)數(shù)十套信息網(wǎng)絡系統(tǒng),對業(yè)務起到良好的支撐作用,但從信息系統(tǒng)基礎設施的管理角度也暴露出設備分散采購成本高、算力資源利用率低、存儲空間浪費嚴重、信息孤島普遍存在、技術標準不統(tǒng)一、故障搶修效率較低等問題。因此,需要研究構建統(tǒng)一集約的云數(shù)據(jù)中心,進一步提升浦東機場新技術應用水平,研究選擇更優(yōu)的采購模式與合規(guī)的技術路線,降低采購成本和運維復雜度,打造新一代基礎架構底座,促進浦東機場的數(shù)字化轉(zhuǎn)型。
1 云數(shù)據(jù)中心行業(yè)的發(fā)展模式
1.1 云計算及云服務
云計算(Cloud Computing)是指通過網(wǎng)絡調(diào)用信息通信資源,實現(xiàn)大規(guī)模計算的方式。利用分布式計算、虛擬化技術,通過網(wǎng)絡將計算與存儲集中起來,形成共享資源池,并向用戶提供動態(tài)按需和可度量的服務,用戶可通過終端獲取資源服務[1]。云計算具備高速網(wǎng)絡連接、資源靈活共享、按需彈性的服務以及服務可測量等特點。
按照云計算服務提供的資源所在層次,可分為基礎設施即服務(Infrastructure as a Service,IaaS)、平臺即服務(Platform as a Service,PaaS)和軟件即服務(Softwareas a Service,SaaS)。
1.2 云數(shù)據(jù)中心行業(yè)發(fā)展模式
目前,云數(shù)據(jù)中心行業(yè)主要有以下4 種發(fā)展模式。
1.2.1 互聯(lián)網(wǎng)巨頭創(chuàng)辦的大型公有云
如亞馬遜云、微軟云[2]、阿里云、騰訊云、百度云、京東云等互聯(lián)網(wǎng)企業(yè)研發(fā)的公有云數(shù)據(jù)中心,主要面臨互聯(lián)網(wǎng)反壟斷、業(yè)務連續(xù)性、數(shù)據(jù)安全、客戶隱私保護等挑戰(zhàn)。
1.2.2 電信運營商
其在原來IDC 基礎上,逐漸轉(zhuǎn)型變成云服務商。電信運營商既能做公眾服務的公有云,也能做企業(yè)獨享的私有云,如天翼云、移動云、聯(lián)通云。該模式主要面臨大規(guī)模服務器采購成本、客戶對運營商技術認同度、計費模式標準化[3],以及與互聯(lián)網(wǎng)公司同業(yè)競爭的挑戰(zhàn)。
1.2.3 本地化部署的企業(yè)私有云
主要指VMware、浪潮、華為、華三、深信服等國內(nèi)外高科技企業(yè)向企業(yè)客戶推出的私有云(虛擬化)軟硬件產(chǎn)品服務,也包含最近幾年逐步興起的國內(nèi)科創(chuàng)企業(yè),如青云、優(yōu)刻得等公司的產(chǎn)品,這些產(chǎn)品都可以在企業(yè)客戶的數(shù)據(jù)中心上私有化部署[4]。從企業(yè)客戶角度講,最主要的需求——云資源,是彈性的、池化的、服務自助化的,可以消除異構系統(tǒng)架構,且最終可以降低整體維護壓力。該模式主要面臨技術研發(fā)投入成本高、客戶長期留存率較低、中美科技競爭導致的高技術軟硬件限制出口等挑戰(zhàn)。
1.2.4 老牌IT 服務商
這些企業(yè)在國內(nèi)承擔大量行業(yè)用戶的數(shù)據(jù)中心的代維或者托管的服務,如東軟、浪潮、寶信等國內(nèi)著名IT 集成企業(yè)和服務企業(yè)。由于云計算是非常重要的發(fā)展趨勢,這些IT 服務商會把傳統(tǒng)的數(shù)據(jù)中心往云數(shù)據(jù)中心的方向改造和推進。該模式主要面臨如何打通整個行業(yè)、吸引更多大企業(yè)入駐、提升設備使用率、降低云數(shù)據(jù)中心運行成本的挑戰(zhàn)。
2 浦東機場云數(shù)據(jù)中心建設研究
2.1 挑戰(zhàn)與需求
在傳統(tǒng)模式下,浦東機場新建的信息系統(tǒng)、網(wǎng)絡系統(tǒng)均處于設備獨立采購、業(yè)務煙囪式發(fā)展格局。數(shù)據(jù)中心機房疲于應付各種業(yè)務系統(tǒng)設備的入駐和退場。IT 運維面臨巨大挑戰(zhàn),因此基于云計算的數(shù)據(jù)中心建設需求也應運而生,相關挑戰(zhàn)和需求如表1 所示。
2.2 總體策略
浦東機場云數(shù)據(jù)中心主要遵循“動態(tài)規(guī)劃,一體兩翼,邊緣先試,核心跟進,應上盡上”的建設原則。浦東機場認為,云計算是一個快速發(fā)展的技術領域,機場作為技術應用者難以洞見廠商在長期市場競爭下的走勢,在建設和擴容云平臺的過程中,需根據(jù)市場、技術、成本、環(huán)境等因素動態(tài)調(diào)整采購策略,盡量多元化地選擇符合浦東機場實際運行需求的產(chǎn)品,在硬件環(huán)節(jié)盡可能不被單一技術綁定,在虛擬化平臺選擇上必須確保國際國內(nèi)至少兩個品牌同時存在、且具備同等量級保有量的建設模式。在項目上先對浦東機場非關鍵的新建系統(tǒng)或重要等級一般的存量系統(tǒng)進行虛擬化遷移開發(fā)測試,在驗證此類系統(tǒng)可以穩(wěn)定運行的前提下,穩(wěn)步推進核心生產(chǎn)系統(tǒng)的虛擬化改造。只要技術和成本允許,盡快將全部系統(tǒng)遷移至云計算環(huán)境。
2.3 建設歷程
浦東機場在2014年首次對新建的協(xié)同決策系統(tǒng)的IaaS 層運行環(huán)境開展云計算試點并獲得成功。2015—2018 年開展航班集成、航班顯示、國際離港等核心業(yè)務系統(tǒng)的底層支持架構的云計算改造。2018 年,在視頻監(jiān)控系統(tǒng)嘗試使用運營商公有云降低本地磁盤陣列采購運維成本。2019 年,浦東機場三期弱電工程項目中大規(guī)模采用超融合虛擬化等技術[5]。經(jīng)過上述系列項目的實踐,使浦東機場具備充分的云計算產(chǎn)品選型和部署經(jīng)驗。主要的建設歷程如表2 所示。
2.4 建設特點
浦東機場云數(shù)據(jù)中心的建設過程既要充分考量市場、技術、成本、環(huán)境、政策等因素,也要結合內(nèi)部信息系統(tǒng)所處的生命周期,分批采取配套的建設方案。
2.4.1 保持國內(nèi)國際虛擬化產(chǎn)品并重
浦東機場主要采用華為fusion 系列虛擬化產(chǎn)品與VMware Vsphere 系列虛擬化產(chǎn)品,總體上使兩大軟件供應商形成價格競爭的態(tài)勢,確保采購成本合理。
2.4.2 堅持多種硬件架構并存
浦東機場根據(jù)業(yè)務系統(tǒng)應用場景的多樣性,采用了多種硬件架構形態(tài)。例如:主要使用計算虛擬化功能的集成系統(tǒng),將刀片服務器虛擬化為單個虛擬機的形態(tài);使用集中式存儲虛擬化技術的航班顯示系統(tǒng),用以支持Oracle 數(shù)據(jù)庫的高效運行;使用跨資源池設備的航班查詢系統(tǒng),將其應用系統(tǒng)部署在華為fusion 虛擬化服務器,將其數(shù)據(jù)庫部署在VMware 虛擬化服務器及存儲上。
2.4.3 探索運營商公有云服務
浦東機場根據(jù)《中華人民共和國反恐怖主義法》要求,將重點區(qū)域的視頻存儲時間延長到90 天,為減少本地機房采購專業(yè)存儲設備的成本,在2018 年積極探索采用運營商提供的公有云服務,采用“本地15 天高性能存儲+云端90 天低頻存儲”的方式,在保證日常使用的高并發(fā)和高可靠性的同時,滿足法律法規(guī)要求。但隨著本地視頻云存儲技術的成熟和成本的下降,2023 年浦東機場將停止使用視頻公有云存儲服務,轉(zhuǎn)而使用本地化方案。
2.4.4 集中式存儲、分布式存儲向超融合存儲轉(zhuǎn)變
近年來,隨著超融合技術的快速發(fā)展,浦東機場已經(jīng)逐步停止如華為OceanStor 系列產(chǎn)品的集中式存儲的采購,也逐步停止技術封閉程度較大的華為刀箱的采購,逐步轉(zhuǎn)向開放架構的超融合產(chǎn)品[6],例如:基于vSAN 分布式存儲架構和NSX 網(wǎng)絡虛擬化的VMware 產(chǎn)品。集中式存儲架構與超融合架構對比如圖1 所示。
2.4.5 建立統(tǒng)一云管平臺
浦東機場現(xiàn)有兩個虛擬化管理平臺,未來會引入第三個虛擬化管理平臺,為加強當前華為云管fusionmanager 和VMware 云管Vcenter 共存的管理難題,降低IT 人員對設備管理的復雜度,浦東機場引入符合信創(chuàng)要求的國產(chǎn)云管統(tǒng)一平臺,如圖2 所示,實現(xiàn)異構設備納管、多資源池納管、虛擬機實時監(jiān)控以及資源自助化申請分配等功能。
2.5 建設成效
(1)在資源利用方面,浦東機場云數(shù)據(jù)中心的服務器容量規(guī)劃大致按照1∶5 的虛擬化比例,每年下半年根據(jù)業(yè)務單位的需求持續(xù)采購補足設備資源,存量資源基本能夠滿足未來18 個月的需求。信息系統(tǒng)的基礎環(huán)境交付時間從原來的一周時間縮短到1 h。設置專門的系統(tǒng)主管崗位審核云資源的部署,有效保障云主機的標準化、合規(guī)性和健壯性。此外,在測試實驗室環(huán)境和系統(tǒng)監(jiān)控室環(huán)境部署了桌面云,進一步提升私有云整體安全性。
(2)在運行維護方面,通過生產(chǎn)云、管理云資源池建設,原先需各單位(如場區(qū)管理部、運行指揮中心等機構)自行管理的基礎設施規(guī)模大幅減少。目前,仍然運行在物理服務器的系統(tǒng)下降到10%,機柜槽位占用量下降到30%,該模式大幅度降低人員維護工作量,使更多IT 人員投入應用系統(tǒng)層面工作。
(3)在災備建設方面,借助云平臺的大二層網(wǎng)絡以及先進的VMware SRM(站點恢復管理技術)工具,對航班集成、航班顯示等核心系統(tǒng)建設第三機房備份項目,實現(xiàn)在原先的雙機房熱備遷移的基礎上,可以將業(yè)務系統(tǒng)整體漂移至第三機房連續(xù)運行。滿足業(yè)務及監(jiān)管機構對于跨樓異地災備的要求。
(4)在成本控制方面,浦東機場云數(shù)據(jù)中心采用嚴進嚴出的規(guī)則。IT 部門要求業(yè)務單位在資源申請階段填寫業(yè)務量分析表、虛機資源配置表、系統(tǒng)日志用量評估表。在實際使用階段加強資源使用率監(jiān)控,對于CPU、內(nèi)存占用率連續(xù)3 個月低于20% 等現(xiàn)象,采取和業(yè)務部門協(xié)商資源調(diào)整。生產(chǎn)云經(jīng)過持續(xù)優(yōu)化,資源實際有效利用率在80% 以上,為其他系統(tǒng)臨時資源擴容預留了空間。
2.6 建設不足
2.6.1 系統(tǒng)尚未全部云化
浦東機場云計算堅持從邊緣系統(tǒng)到核心系統(tǒng),從生產(chǎn)系統(tǒng)到管理系統(tǒng)的分批遷移策略,大約85% 的系統(tǒng)已完成遷移。但由于一些技術或商務原因,依然有行李、廣播、國內(nèi)離港、樓宇自控等系統(tǒng)運行在物理服務器上。例如:國內(nèi)離港數(shù)據(jù)庫運行在物理機上本身較為穩(wěn)定,運行環(huán)境變更要看投入產(chǎn)出比,不僅考慮遷移成本,還要考慮面臨的技術、管理風險。
2.6.2 資源池過度分散
在系統(tǒng)遷移至云計算平臺過程中,由于項目時間緊任務重以及軟件供應商技術主導等原因,無法從云平臺的角度確定應用系統(tǒng)技術架構的標準,部分項目例如集成、航顯等系統(tǒng),采用“一系統(tǒng)一策略”模式,建成后資源池基本為獨享模式,導致私有云的“云朵”過多,形成相對割裂的資源池,無法實現(xiàn)多系統(tǒng)有效共享。
2.6.3 云資源申請隨意回收困難
由于云計算平臺暫無計費能力,虛擬化資源表現(xiàn)出公共事業(yè)的特征,各單位申請?zhí)摂M機資源規(guī)格較為隨意,在一定程度上造成了算力資源的浪費。部分系統(tǒng)隨著業(yè)務的變化早已失效,但虛擬機仍舊在運行,IT部門對資源回收也存在較大的困難,表現(xiàn)出整體管理科學性不足。
2.6.4 難以預見技術路線風險
華為虛擬化底層技術在2017 年曾經(jīng)歷從XEN 架構升級到KVM 架構的過程,所有刀片服務器的底層云操作系統(tǒng)都要逐個升級,這給當時機場安全運行帶來風險。2018 年以來隨著中美貿(mào)易戰(zhàn)的深入及高科技產(chǎn)品的限制,華為公司難以獲取最新的英特爾CPU 造成硬件斷供,X86 產(chǎn)品生產(chǎn)線整體出售,導致機場相關備件不足,對應的華為私有云軟件可持續(xù)升級也帶來潛在風險,因此浦東機場需要盡快轉(zhuǎn)型至其他國產(chǎn)品牌。
2.6.5 云計算專業(yè)人才稀缺
云操作的便捷性、云資源的易獲取性屏蔽了設備底層的復雜結構,但無法回避云計算技術對機場專業(yè)技術人員的知識結構的高標準嚴要求,云計算IT 專員需要對主機、網(wǎng)絡、存儲甚至業(yè)務場景、高可用性、災備等知識體系要有系統(tǒng)性認知和充分實踐經(jīng)驗,這也是這一關鍵領域人才稀缺的主要原因。
3 云數(shù)據(jù)中心建設展望
3.1 實現(xiàn)浦東機場資源池集中管理
根據(jù)公司對各單位私有云的統(tǒng)管要求,浦東機場應創(chuàng)新性地通過一套云管理平臺與一套管理制度實現(xiàn)對全公司及子單位的兩級資源池的集中管理和資源的集中供給,實現(xiàn)對IT 基礎設施的全面掌控。后續(xù)通過硬件生命周期的迭代機制,將運行在孤立資源池的系統(tǒng)遷移至集中資源池,再分批淘汰孤立資源池。
3.2 優(yōu)化云數(shù)據(jù)中心的管理職能
驅(qū)動云數(shù)據(jù)中心的管理轉(zhuǎn)型,即以當前以建設與運維為主的工作模式,增加云數(shù)據(jù)中心的運營職能,實現(xiàn)云基礎設施的一體化管理。增加規(guī)劃建設崗位,擬向產(chǎn)品供應商等單位的專業(yè)人員開展社會招聘,增強私有云產(chǎn)品選型的科學性;提升運維崗位的故障處置能力,給予更多的原廠培訓和考試認證的機會,使運維人員專注于軟件定義一切(SDX)能力、標準化快速部署能力以及故障恢復能力的建設;增設云服務運營崗位,主要職能為對硬件設備、機房設施以及人力資源成本進行核算,以開拓云計算的計費計量服務,設計不同用戶的SLA協(xié)議,提升內(nèi)部單位云資源服務使用的滿意度。
3.3 促進云管平臺自助交付落地
隨著統(tǒng)一云管平臺的建成,未來浦東機場應實現(xiàn)更便捷的資源交付能力。各業(yè)務單位用戶可以自行登錄云管平臺的主頁,從目前可以選擇操作系統(tǒng)提升至可以選擇標準化應用架構,進一步提高用戶對云資源的申請效率。統(tǒng)一云管平臺的運維人員可以將機場信息系統(tǒng)的應用架構予以總結和提煉,再結合外部行業(yè)的最佳實踐,將各項技術規(guī)范以自動化的方式固化和部署,確保用戶所獲資源的高度標準化。只有真正實現(xiàn)流程自動化,才能真正實現(xiàn)云環(huán)境的價值。
3.4 關注信創(chuàng)超融合技術演進
隨著國內(nèi)信創(chuàng)轉(zhuǎn)型的發(fā)展,浦東機場應認真檢視IT 層級短板,“VMware 替換”是其中之一,外部行業(yè)已出現(xiàn)從VMware 遷移轉(zhuǎn)型的實際案例。近期VMware 對俄羅斯停服事件,更加劇國內(nèi)客戶尋求“VMware 替換”的步伐。浦東機場在后續(xù)的私有云建設中應適當限制海外產(chǎn)品的規(guī)模和選擇,重點關注國內(nèi)頭部公司,采購技術上完全自主可控的可替代軟件產(chǎn)品,未雨綢繆,積極嘗試替換和遷移工作;浦東機場生產(chǎn)系統(tǒng)應用場景的實證表明,大多數(shù)信息系統(tǒng)適用于超融合架構。該技術具有硬件品牌的完全解耦性,可以規(guī)避硬件廠商通過特定技術手段對業(yè)主方的隱性綁定。目前,國內(nèi)已有多家廠商具備超融合技術,通過虛擬化技術融合計算、存儲、網(wǎng)絡和安全等資源,提供運維管理、容災備份、智能監(jiān)控等高級特性,實現(xiàn)單個節(jié)點故障不影響業(yè)務,支持橫向擴展,節(jié)省機柜空間和電力,降低維護成本,幫助用戶構建極簡、穩(wěn)定、高性能的云數(shù)據(jù)中心基石。超融合架構VM傳統(tǒng)架構與超融合架構對比如表3所示。
3.5 積極探索混合云的應用
近年來,隨著視頻分析技術的快速發(fā)展,人工智能(AI)技術逐漸應用到浦東機場視頻監(jiān)控、作業(yè)分析等系統(tǒng)。此類系統(tǒng)一般需要本地服務器自帶GPU 顯卡,而顯卡價格昂貴,設備生命周期較短,且高端型號屬于海外高科技限制出口產(chǎn)品,自建特大型圖形算力平臺并不符合浦東機場利益,建議在本地云平臺維持一定規(guī)模GPU 算力的基礎上,可將測試階段的AI 訓練工作或階段性突破本地峰值性能的需求轉(zhuǎn)移到公有云的虛擬私有云(Virtual Private Cloud)上,采用短期租賃的方式實現(xiàn)混合云的應用。混合云的選擇需要尋求安全與合規(guī)的平衡點,可重點考慮“國資云”,其建設方式類似“政務云”,是由國資背景的云服務商建設國有企業(yè)共享云。
4 結語
綜上所述,浦東機場云數(shù)據(jù)中心的建設受到業(yè)務需求、技術選型、資金投入、政策指引等多重因素的共同影響,是超越一般信息系統(tǒng)建設模式的系統(tǒng)工程,需要持續(xù)投入研究與實踐,確保建設成本和管理效益獲得最佳平衡點。云數(shù)據(jù)中心對浦東機場的數(shù)字化轉(zhuǎn)型、智慧機場建設,以及更好地服務民航行業(yè)發(fā)展具備重大的基礎意義,浦東機場應乘勢而上,以合理規(guī)劃匹配未來浦東機場四期建設工程的需求,適度超前,建設高質(zhì)量云數(shù)據(jù)中心,為數(shù)據(jù)中心行業(yè)探索和進步推波助瀾。