焦旭
“你好,我是阿里云數據庫團隊負責人,我叫鳴嵩(曹偉)。”初次見面的印象,讓筆者覺得鳴嵩并不像一個IT男,形象陽光、精神抖擻、嘴角帶著一點點微笑。就在筆者還在回味《復聯3》中小蜘蛛和奇異博士有關“花名”的梗時,鳴嵩讓我有了新的認識。
采訪過程中,鳴嵩的語速一直很快,語言簡練,思維清晰,不斷出現的術語和數據說明了他的專業性,喜歡列舉實例。整個人總是帶著一股濃郁的自信。好像,每一個阿里人都是那么的自信。
那些在一線才知道的
一位工作在云數據庫一線的開發和運維人員,在云棲社區做了以下分享:
“我在4天前,手工做了一個備份,數據庫比較大,3T,你們說差不多要70個小時備份,這個…有沒有什么辦法加快一點,我老板還著急要數據呢”
“你好,我們公司有個數據庫,想遷到阿里云RDS上,對RDS的產品品質我們很滿意,只是我們的數據庫有10T,請問一下,支持這么大的實例么?”
“你好,我用了你們的MySQL數據庫,最近幾天在做活動,主庫壓力比較大,只讀實例就延遲了,現在看過去貌似很難跟上,有什么辦法么?”
這些抱怨也好,吐槽也罷,都來自云數據庫用戶的真實案例,總結起來,傳統的云數據庫由于自身架構原因,會遇到很多問題:
讀寫實例和只讀實例各自擁有一份獨立的數據,用戶購買只讀實例,不僅需要付出計算的成本,也需要付出存儲資源的成本;新建一個只讀實例需要重新拷貝數據,考慮到網絡限流,速度不會很快;傳統備份技術,由于涉及到拷貝數據,并上傳遠程存儲,速度因此也受網絡影響等等。
隨著數據庫數據量的增大,各行各業對云數據庫業務的需求增加,這些問題就會不斷加劇。鳴嵩說:“這些困擾大家已久的問題, PolarDB都可以從本質上解決,而不是想個trick繞過去?!?/p>
核心優勢有5個
PolarDB是阿里云數據庫團隊過去3年間自主研發的一個企業級數據庫。鳴嵩總結了其5大核心優勢。
第一,兼容性。PolarDB兼容了當下最主流的、開發者最喜歡用的MySQL和PostgreSQL兩種數據庫生態,這意味著MySQL和PostgreSQL的老用戶,在一行代碼不用改的前提下,可以把業務從原來的開源數據庫遷移到阿里云的企業數據庫平臺上。
鳴嵩說:“從第一天起,我們做任何東西,不接受99%的兼容,我們只有100%的兼容。這是不會妥協的?!?/p>
第二,性能好。對比MySQL有6倍性能提升及相對于商業數據庫實現大幅度降低成本。拿Sysbench跑Benchmark做測試,開源的原生數據庫性能是每秒3.5萬的TPS,PolarDB的性能可以達到22萬,有6倍的提升,但是價格不變。
第三,容量大。傳統的數據庫會受限于物理機能的磁盤大小,數據增長后面臨著要么擴容,要么定期遷移,這種方案不僅開發成本高,還會造成業務中斷。PolarDB則支持單庫容量擴展至上百TB以及計算引擎能力及存儲能力的秒級擴展能力。
第四,技術更新換代。云數據庫的發展趨勢出現了一種更好的模式,Serverless按使用量付費??雌饋碇皇怯嬞M模型的一種變化,事實上對技術本身有很大挑戰。Serverless意味著彈性擴展、調度能力、資源隔離需要做得更加精細,使得能夠支持這種計費模式。
鳴嵩直言:“PolarDB的目標就是從過去云計算的1.0時代走向云計算的2.0時代。數據庫從經典時代走向Serverless時代。“
第五,一寫多讀。鳴嵩以淘寶為例,介紹道:“電商業務,讀的壓力要比寫的壓力大很多,傳統的‘一主多從模式存在空間浪費和擴容時間長的弊病?!?/p>
PolarDB讓“一主多從”共享統一一個數據副本,同一個實例的所有節點(包括讀寫節點和只讀節點)都實現訪問存儲節點上的同一份數據,使得數據備份耗時實現秒級響應,實現了無縫擴展,不管數據量有多大,幾分鐘內即可實現只讀副本擴容,以及數據的全量備份。
何謂國之重器
據了解,PolarDB發布以來,在公有云上已經累計了超過600家用戶,涵蓋金融、電商、游戲、IoT等各行各業。
在被問及為何阿里云在已經擁有關系型數據庫的情況下,仍舊開發出PolarDB時,鳴嵩表示:“企業級數據庫一定是國之重器?!?/p>
鳴嵩介紹道,企業級數據庫,往往要求零宕機,7×24小時的可服務性,數據絕對不能丟。這是對數據庫技術更苛刻的要求,同時還需要高安全性和無限擴展能力?!癙olarDB的目標就是將來能在有關國計民生的行業、金融產業或者政府核心業務中用上國產自研的數據庫。我認為,這是我們這一代做數據庫技術人的使命。”
此外,鳴嵩還指出一種技術趨勢。過去十年,大量互聯網企業為了解決業務發展數據膨脹的問題,都在使用一類基于Share Nothing架構做水平擴展的數據庫,演化出了很多NoSQL和NewSQL產品,但這類產品都有對使用場景的假設和限制。而ORACLE、DB2、Aurora、PolarDB這些企業級的通用數據庫,都在使用Share Everything共享存儲技術。鳴嵩判斷,在未來的5年之內,隨著云時代的到來,隨著企業級云數據庫的興起,Share Everything基于共享存儲架構的數據庫會成為新的熱點。
性能源于對硬件的訴求
為了追求性能的不斷提升,技術人員對于硬件的訴求也在不斷提高。鳴嵩介紹了PolarDB所采用的領先的硬件技術:包括使用3DXpoint存儲介質的Optane存儲、NVMe SSD和RoCE RDMA網絡。同時面向新硬件架構實現軟硬一體優化:從數據庫、文件系統到網絡通訊協議、分布式存儲系統和設備驅動,實現縱貫軟件棧各層次的整個IO鏈條的深度優化。
談及Optane存儲卡,鳴嵩毫無吝嗇地給了一個贊,他表示:“3D XPoint介質比NAND顆粒提供了更好的I/O延遲和I/O QoS穩定性,因此在數據庫整體QoS上我們在95%延遲的指標上提升了76%的性能。我個人認為這也是非常有工匠精神的一個介質、一個產品。如果說SSD把HDD延遲降低了一個數量級,3D XPoint又把SSD降低了一個數量級”
鳴嵩認為,Optane很可能會打破傳統的Memory金字塔體系,過去的模型是CPU、內存、SSD的三角形結構,內存是很快的但是比較小,掉電會丟;SSD是很大,延遲比較高,吞吐有限,但是掉電數據不會丟。而Optane在這個體系中加入了一層Apache Pass或稱之為NVDIMM(非易失性隨機訪問存儲器)。新的體系變成了CPU、內存、NVDIMM和SSD,新加入的結構,性能和內存很接近,而且空間可以很大,掉電不會丟。
最后鳴嵩表示,Apache Pass未來很大程度上會改變數據庫軟件,也意味著數據庫的性能可以再向上提高一個檔次。