郭濤
10月25日,每半年一屆的OpenStack峰會(OpenStack Summit)即將在西班牙的巴塞羅那揭幕,中國移動參加了峰會的重頭戲之一“超級用戶大獎”的競逐。看看以往那些超級用戶——CERN(歐洲核子研究組織)、AT&T、NTT DOCOMO(日本最大的移動通信運營商)等,正是它們所起到的帶頭和示范作用,才讓OpenStack快速走向了企業級應用市場。
無論中國移動能否在本屆OpenStack峰會上最終贏得超級用戶大獎,它都是中國的驕傲——中國移動在全球范圍內首次構建了超過1000個節點的OpenStack單集群,并因此成了OpenStack千節點工作組的牽頭人。基于OpenStack架構,中國移動在云計算的道路上進行了諸多有益的探索,以及具有獨創性的開發和應用,積累了豐富的經驗。
OpenStack不僅要做大,更要做強。中國移動的實踐已經證明,中國企業有能力構建超大規模的OpenStack集群。接下來,擺在所有中國OpenStack廠商和用戶面前的一個挑戰就是,如何將OpenStack應用引向縱深,將應用OpenStack的成功經驗在全球范圍內進行分享,并引領OpenStack未來的發展。
OpenStack是云計算
最好的支撐
中國移動在云計算方面的探索起步很早,2007年就開始了針對云計算的研究工作。2009年,中國移動正式開始構建自己的IaaS平臺,考慮到傳統的IT架構并不能滿足應用的需求,所以決定采用開放的平臺和軟件。不過,由于當時OpenStack還不太成熟,所以中國移動在幾個備選的開源軟件中最終選擇了OpenNebula。
中國移動第一次就這樣與OpenStack擦肩而過了。從2013年開始,OpenStack步入快速成長階段。2015年的OpenStack項目研究報告顯示,累計有4.1萬余人為OpenStack貢獻了2000多萬行代碼,180個國家的近600個公司支持OpenStack項目,OpenStack是全球發展最快的開源社區之一。正是看到OpenStack整個產業環境趨于成熟,完全可以支持商業化的運營,中國移動再次將關注的目光投向OpenStack。
經過謹慎的評估和測試,中國移動逐漸將云計算的重心向OpenStack傾斜,并于2014年和2015年分別發布了基于OpenStack的“大云”3.0和“大云”4.0兩個版本。據中國移動(蘇州)軟件技術有限公司副總經理孫少陵介紹,中國移動基于OpenStack kilo版本的“大云”4.0已經實現了大規模應用,總計部署規模超過4000個節點。
“OpenStack是開放架構,具有平臺無關性、分布式、標準化、易用性和可持續交付等優點,所以我們才選擇了它。”孫少陵表示,中國移動基于OpenStack建立了完整的產品線,即基于OpenStack構建了管理域和業務域共計12個主要產品、三大類操作系統,形成了完整的IaaS、PaaS和SaaS產品體系和解決方案。
在云計算方面,中國移動并不是一時心血來潮,而是有備而來,甚至將自己的未來交到了云計算手上。2013年12月24日,中國移動決定在蘇州成立研發中心,注冊資金6億元,計劃招聘4500人,主要開發與云計算、大數據和IT支撐系統相關的產品。蘇州研發中心將成為中國移動內部產品開發的重要力量和支撐。
蘇州研發中心的職責主要有三方面:第一,為集團內部提供一些核心的軟件產品;第二,打造IT整體解決方案,為集團業務的運營提供強有力的IT支持;第三,不斷提升自身在產品開發和運營方面的能力,為集團實現向IT服務商轉型奠定基礎。孫少陵進一步解釋說:“AT&T正欲轉型為一家軟件公司。我們成立蘇州研發中心也有類似的愿景,以便更快速地交付更多的產品和解決方案,從而改變中國移動的基因,從一個傳統的管道服務商向數字化服務商轉變,不斷增強自身的IT能力。”
一座現代化的占地500畝的研發中心已經在蘇州拔地而起。中國移動的這個研發基地現有700多人,其中研發人員占85%,專門從事OpenStack研發的有200多人。有了在研發上的如此大的投入,中國移動距成為國內一流、世界領先的IT服務商又近了一步。
越過OpenStack那道坎
在云計算平臺全面轉向OpenStack后,中國移動的私有云和公有云建設突飛猛進。
按中國移動的既定計劃,2016年底即將完成共計6000個節點的公有云建設,其中廣州和北京的兩個集群已經上線運行。另外,到2017年5月,中國移動還將建成兩個新的數據中心,即呼和浩特和哈爾濱兩個數據中心,各有3000個節點,以支持私有云的運行。無論是公有云還是私有云,都是基于OpenStack構建的。
目前,中國移動最近上線的OpenStack單群位于北京的云數據中心,共有1000個物理節點,主要包括650個計算節點、20個控制節點、20個網絡節點和250個存儲節點。
中國移動基于OpenStack構建的私有云承載著中國移動內部所有的業務,同時支持物理機和虛擬機,未來還要支撐NFV,其業務不僅規模大,而且復雜度非常高,堪稱全球范圍內最大的OpenStack商用案例。中國移動對整個平臺的可靠性、安全性、靈活調控能力和彈性伸縮能力提出了極其嚴苛的要求。中國移動與英特爾合作,解決了系統面臨的高并發、吞吐量瓶頸等問題。
“在全球范圍內能夠進行數千個節點的OpenStack測試和應用,目前只有中國移動擁有這樣的能力。”孫少陵介紹說,“我們與英特爾一起在廣州和北京的兩個數據中心機房進行了測試,在部署數個千節點的過程中,雙方的工程師共同設計和完善測試方案,分析系統存在的問題,進行系統調優,不斷提升吞吐率。”
上千個節點的OpenStack集群是一個門檻,以前在全球范圍內還沒有其他用戶進行過如此大規模的測試和應用。這說明中國移動具備了企業級OpenStack的部署和應用能力。
OpenStack到底能夠支撐多大的規模,以前業內并沒有一個標準。通常情況下,在200個節點以下,OpenStack不會有明顯的性能瓶頸,但是隨著節點數量不斷增加,千奇百怪的問題就會暴露出來。眾所周知“木桶”原理,為了保證OpenStack大規模集群的平穩運行,英特爾的主要工作是將系統結構中存在的短板提高,從硬件平臺的角度對OpenStack進行優化,使之達到最佳的性能。英特爾和中國移動合作,努力使OpenStack集群在超過4500個節點時仍然可用。
為了提升OpenStack大規模集群的性能,中國移動與英特爾從多個層面對集群進行了優化。中國移動準備將這些系統調優的經驗在OpenStack巴塞羅那峰會上進行分享。
對于未來在云計算方面的探索,中國移動早就有了全盤規劃,那就是實現“四化”:實現統一化的管理,讓分散在全國各地的異構的數據中心資源進行充分的資源共享,這樣云平臺才能真正發揮其作用;在云數據中心規模不斷擴張的情況下,人工管理不太現實,因此必須實現管理的自動化或者說智能化,在減少人工介入的情況下,仍然能夠實現高效的管理,以及故障后的及時恢復;實現各種功能模塊的服務化,通過平臺化和開放API,讓更多的人可以在平臺上進行應用開發;實現層次化,對平臺進行分層解耦,各司其職。
OpenStack在企業級應用中不斷走向成熟
從其他開源平臺轉向以OpenStack為核心,中國移動的這種轉型不僅需要魄力,更需要能力。中國移動本身具有大規模云計算應用的需求,同時具備強大的研發能力,還有像英特爾這樣的合作伙伴作為助力,因此才能在OpenStack的應用方面走在全球前列。
中國在OpenStack方面的進展比國外快。一方面,中國的企業更強調自主創新;另一方面,中國有各種類型的客戶、各種不同的OpenStack需求和應用場景,這將有力地推動OpenStack生態和技術的創新,促進OpenStack在企業級應用中不斷走向成熟。
毫無疑問,中國移動在OpenStack方面的創新具有引領作用。孫少陵表示:“我們在公有云、私有云等不同的應用環境中對OpenStack的能力進行了測試和驗證,找出在各種應用場景中存在的問題,不斷試錯,并將問題和解決方案反饋給社區,這樣才能真正推動OpenStack走向成熟。”
中國移動的經驗雖然是個性化的,但是對于其他用戶來說仍有很多值得借鑒的地方。在基于OpenStack的軟硬件結合的SDN實施上,中國移動是首創。在應用過程中,中國移動發現某些接口不開放會影響SDN的應用。中國移動的做法是將這些接口進一步標準化,并反饋給社區。另外,中國移動也會主動發起一些項目,不斷積累OpenStack的實踐經驗。比如,中國移動發現OpenStack在管理上還有欠缺,必須通過更多的實踐加以改進。
云計算的生態環境越來越復雜。OpenStack要想更好地支持云計算就必須與容器、大數據等新興的技術和應用對接。英特爾也十分強調生態的重要性,發布了Cloud for All計劃,在生態系統方面進行廣泛投資與合作,不斷優化SDI(軟件定義的架構)解決方案,以便充分發揮英特爾平臺的能力,通過開放的行業標準積極推動社區發展。
OpenStack市場出現了新的拐點,中國能否抓住此契機,在OpenStack領域實現引領和主導呢?我們拭目以待。