□ 劉 佳
“讓世界用上中國的數據庫”,是自2004年成立至今,天津南大通用數據技術股份有限公司(以下簡稱“南大通用”)始終牢記的使命。正是基于這份使命感,公司總經理兼首席技術官武新帶領核心研發團隊歷經10年磨礪,以市場需求驅動核心產品的研發,在國際數據庫軟件群雄割據的狀態下突破技術壁壘,憑借自主品牌GBase數據庫系列產品走出一條獨特而卓越的創新之路。
構建世界首個基于融合架構的關系與非關系模型、OLTP與OLAP融合的平臺產品,是這家企業闡明優越價值的開始;憑借GBase數據庫系列產品和技術,以亞太地區唯一一家獨立軟件公司的身份入選世界頂級咨詢機構Gartner魔力象限,是它備受領域肯定的表現之一;連續5年在賽迪顧問發布的《平臺軟件市場研究報告》中勇奪國產數據庫銷售額桂冠,打破了國外數據庫廠商對國內市場的長期壟斷局面,是市場對由它所形成產業影響的高度評價。
數年來,南大通用始終瞄準數據庫高新技術、產品的研發工作,在多地區、多行業成為了頗具影響力的代表:
世界500強企業中,中國地區的占有量為160家,其中大約平均每5家企業便有一家在使用南大通用的GBase數據庫產品;
GBase客戶橫跨金融、電信、電力、軌道交通等行業,涉及政府社會安全、監管機構和各個類別的大中型企業。僅2017年一年,GBase數據庫系列產品已在國內領域達到40%的市場占有率;
超越國際同期產品,構建起中國金融行業內最大的數據倉庫——農業銀行大數據平臺。作為世界首例PB級數據量的雙活數據庫集群,其已連續、穩定運行逾1000天,總數據量超過20PB,且仍在以每年5PB的數據量持續增長;
…………
盡管在外界看來,在10年的研發之路上,南大通用所鍛造的每一顆碩果都足夠鮮活、富有說服力,但身為總經理、技術領頭人的武新卻認為還遠遠不夠,“我們跟國際大企業、全球化公司相比,規模差距還很大,在高科技領域的社會價值認可度還不夠”。正視企業發展不足,作為一家致力于數據庫基礎軟件研究和大數據核心應用的公司,南大通用不但要成為跨進尖端軟件開發領域的高新技術企業,更要成為讓國人驕傲、受國際尊重的世界級企業!
數據對于大多數人而言并不陌生,尤其是在當今的信息化時代,個體與群體、單一機構與連鎖式企業每時每刻所噴薄的數據量數以億計。當海量數據來襲,大數據和云計算的概念被人們逐漸熟知,數據庫連同數據處理技術研究也被社會寄予更高的期望。
“其實‘云計算’和‘大數據’是一個硬幣的兩面。云計算改變了用戶對IT資源的使用模式和習慣,提升了資源的使用效率和靈活性,優化了IT的投入產出。而大數據的核心則是從海量數據中提取出潛在的價值。”從一個研發者的角度出發,武新如今對于市場需求和數據庫發展潛能有著充足的認識和準備,但其實對他來講,早年間選擇并投身數據庫研究,著實是一次堪稱冒險的未知旅程。

2016年7月,時任科學技術部部長萬鋼在南大通用考察工作。
1984年畢業于中國地質大學礦物化學專業后,武新在隨后的5年時間內學習法語、前往法國奧爾良大學攻讀博士學位,只不過彼時,他的研究方向與計算機、數據庫沒有絲毫的關聯。直到20世紀90年代初期,再三考慮過時代技術大趨勢和自身從事研究工作的發展局限性,武新決定轉投計算機行業,并用兩年的時間獲得了計算機專業碩士學位。也正是在不斷學習的過程之中,他接觸到數據庫技術最核心的內容,由此便與數據庫研究一生結緣。
在法國工作的10余年是武新成長最為迅速的階段。在甲骨文(Oracle)公司,他從事過售前服務,研究了系統優化設計模型;他成為了數據庫的架構師,融入高級技術團隊深入探索了數據庫的內部機制、技術要領。“在幫助客戶解決問題的同時,我也在研究一些數據庫的技術與理論。”當看到價格昂貴的軟件產品備受追捧時,他不免想要一探究竟。通過幾番研究,他第一次認識到分布式數據庫的奧妙,發現與傳統數據庫存儲形式不同的列存數據儲存優勢。武新回憶道:“那個年代的磁盤設計是短板,計算機的計算能力也嚴重不足,恰巧列存數據存儲性能優越,對磁盤的要求也極低。”這樣的發現無疑讓他十分驚喜,同時也為他日后加盟南大通用走上數據庫創新之路埋下了伏筆。
2004年,當時的大數據尚未如現下一般盛行于世,致力于數據庫技術研究和軟件開發的南大通用在濱海城市天津悄無聲息地成立了。5年后,當剛剛回國想要進行技術創新、挑戰難題的武新,遇到將“打造國產原創品牌數據庫”視為企業信條的南大通用,分布式數據庫與列存、集群的優勢融合理念再一次碰撞出新的火花。武新表示,“大數據對數據庫和數據處理技術帶來的挑戰遠比云計算要大得多”,對于大型的核心應用,需要新一代的基于分布式和大規模并行計算(MPP)的數據庫支撐,來解決大規模數據分析面臨的系列問題。
長期以來,新型數據庫軟件廠商以滿足市場需求為己任,而產品研發方向則更多地依靠決策層敏銳的洞察能力和果斷的執行手段。倘若說清晰的局勢分析能夠影響企業發展規劃的制定,預見性的思考與判斷便直接決定了技術路線的整體走向。
一直以來國內數據庫產品水平良莠不齊,技術研究受制于人。武新指出,人們都忽視了國外數據庫開源并不是永久性和完全性的,“國外數據庫公司沒有承諾永久開源,這就代表著他們完全有隨時收回開源數據庫的可能性”。在他看來,開源本身是一件好事,但國內數據庫廠商一旦過度依賴開源則會導致創新能動力的喪失,“擁抱開源的同時不應該忘記自主創新,尤其是原創性的研究,畢竟只有形成以創新為主導的產業發展模式才能使國內數據庫行業步入全球信息化產業的一流陣營”。
面對傳統數據的層層累積、新型數據的不斷迭起,以武新為核心負責人的南大通用一方面遵循“高鐵模式”,在科技部、工信部的幫助下,積極從IBM引進世界級數據庫產品,通過引進、吸收、消化、再創新的技術路線,成功打造出一款支撐高端業務的事務型數據庫產品——GBase 8t。它通過了《信息技術安全技術信息技術安全特性評估準則》,符合《事務型數據庫產品安全技術要求》,得到了一系列知識產權相關認證,成為可以在各個行業核心業務系統替換Oracle的數據庫產品。在技術層面,其首次突破國際廠商的壟斷束縛,接受著來自電力、電信、銀行、地鐵、國防等行業的市場考驗,累計形成了億元以上的營銷收入。

GBase InfiniData 產品正式發布
另一方面,武新一再強調:“改是改不出來世界一流數據庫的。數據庫架構如同基因一樣,從軟件角度來講,軟件的‘基因問題’不解決,一開始便注定存在量級的差距。”針對新型數據分析的發展特點和市場需求,武新所在的南大通用領導層較早地認識到分布式和大規模并行計算系統融合的重要性,早在多年前,便開展了面向大數據分析為主的產品研發,自主構建起大規模并行數據庫集群——GBase 8a MPP Cluster。其擁有超高可用性、高存儲密度、高效計算性能等優勢,與世界同類產品相比,部分技術已達到國際領先。自2016年起,它全面覆蓋金融、電信、政企、安全、軍工等多行業,成為國內市場占有率第一的MPP數據庫“明星”產品。
自20世紀80年代商業數據庫萌芽初現,以關系型數據庫為主導的數據庫管理系統順應計算機發展潮流,相關技術與產品日漸趨于成熟化。
通過武新的介紹可知,半個世紀以來,包括Oracle、IBM公司在內生產的4款數據庫產品備受國際青睞,一度包攬了近幾十年的數據庫和大數據處理核心技術。反觀國內,即便數據庫理論出現時間較早,但由于改革開放初期,技術研究及人員不到位,錯失良機,也就未能搭上傳統數據庫技術步入大發展時期的快班車。因此,對于正處在跟隨、追趕地位的國內數據庫廠商來講,除了需要認清“傳統數據庫研究的追趕、超越難以在短時間內實現”的現實以外,還必須抓緊新型數據興起帶來的前所未有的挑戰與機遇。
“大數據不再局限于結構化數據,而是包括了結構化、半結構化和非結構化數據的各類數據”。過去幾十年間,作為最擅長處理結構化數據的關系型數據庫,迎合了各行業核心數據建立、發展的過程,有效應對數據增長帶來的種種問題。
隨著互聯網的出現,全球化數據規模呈現指數級增長,移動、智能終端、各類傳感器進一步加大了大數據的翻涌速度。武新強調,譬如日志、網頁、文檔、圖片、語音、視頻以及氣象、遙感等領域的各類專業數據,代表著日常可見但關系型數據庫無法有效處理的一大類數據。這意味著亟需新的技術和計算模型,對此類半結構化、非結構化數據進行特征提取,轉化成結構化數據進行進一步地分析、挖掘。
作為南大通用數據庫研究的領路人,基于對業內局勢的明確認識,武新帶領南大通用技術創新團隊用10年的時間“磨刀鑄劍”,既要追趕傳統交易型數據庫的研究步伐,又要把握新型數據庫的創新脈絡。以持續投入改進、技術優化為永久發展目標,他們創下了一年內單個軟件產品銷售收入突破1.5億元人民幣的國內紀錄,實現了國際新興技術的局部領跑,讓更多的國產數據庫產品進入國內外市場,融入國際化技術發展格局。
武新說,在GBase數據庫系列產品中,不同的英文字母代表著其所面臨的不同市場:
——GBase 8a MPP Cluster ,一款面向海量數據分析的基于列存儲和MPP大規模分布式架構的新一代分布式數據庫產品
作為國內自主研發達到國際一流水準的分析型MPP數據庫,GBase 8a MPP Cluster與國外同類主流產品技術同步、市場同級,在大規模并行處理、列存儲以及高壓縮和智能索引技術的基礎上,具備滿足各個數據密集型行業日益增大的數據分析、數據挖掘、數據備份和即席查詢等需求的能力。自2008年以來,經10年開發與市場突破,它已在國內分析型數據庫市場占據主導地位,為數百家用戶部署了5000+節點,總數據量超過100PB,支撐了農行核心數據倉庫,國家電網全業務統一數據中心,以及移動、聯通、電信在全國20多個省的大數據平臺、經營分析等關鍵業務系統,在金融、電信、電力、政府、安全、軍工等十幾個行業實現規模化應用,并遠銷海外。
——GBase UP,將事務型數據庫、MPP數據庫、Hadoop等不同類型的數據組織管理技術和數據處理技術融合的統一數據平臺

赴美國奧蘭多參加Gartner國際研討會
大數據融合架構平臺產品,是大數據與云計算的最核心技術。在云計算進入2.0時代,基礎設施、服務器硬件和分析系統等基本成熟的情況下,以數據為核心以及實現數據資源的虛擬化應用價值是數據庫踐行服務職責的根本。GBase UP是世界上首款商用的融合關系型模型與Hadoop開源非關系模型的大數據平臺產品,在融合技術、數據跨域訪問、大規模讀寫分離、數據生命周期管理、跨引擎優化與查詢等領域獲得了多項專利,鞏固了南大通用的技術領跑地位。它廣泛應用于電信、電力、軍隊、鐵路、氣象、金融等行業結構,被譽為我國打破國外在大數據平臺技術壟斷的代表性產品。
——GBase InfiniData,提供靈活軟硬件配置方案的超融合架構數據庫一體機
拋開采購服務器、網絡設備,自主搭建及調試優化等復雜過程,一體機開啟了用戶群的“懶人模式”,實現了硬件和軟件的融合,能夠降低使用者的操作難度,節約時間和人力成本。對比國外動輒上億的一體機產品,基于x86的超融合架構數據庫一體機能夠根據需求,靈活組合不同的數據庫產品,幫助用戶平滑地將業務過渡到新的數據庫架構的同時,達到超高的性價比。
多項產品經受住來自市場的嚴苛考驗,解決了企業核心數據安全問題之際,也為國家安全可控戰略提供了有力支撐。產品表現出的高可用性和穩定性贏得合作單位的一致認可,同時也收獲了社會各界的普遍肯定。在中國首席數據官聯盟·中國大數據企業排行榜上,GBase數據庫相關產品位居國產數據庫第一名;在中國大數據產業生態大會中,南大通用入選大數據企業50強;參加第20屆中國國際軟件博覽會,GBase 8a被評為中國軟件行業數據庫軟件信賴產品……
在武新看來,每一項榮譽都屬于團隊,屬于每一個不懈奮斗的南大通用人。10余年來,能與南大通用結緣,能心無旁騖地開展數據庫研究工作,他感念在心:“慶幸自己不忘初心,更感謝多年來南大通用給予的平臺和支持”。
2008年,武新深感國外生活過于安逸、缺乏挑戰,“我覺得一輩子很長,這樣舒坦地待下去好像有些不甘心”。為了響應祖國創新驅動科技發展的全面號召,為了回報國家、回報父母的心愿,他舉家歸國,并于次年作為核心領導者加入南大通用創新團隊,一頭扎進產品研發的工作之中。
位于北京市北部山區的一串窯洞,是這個不到100人的筑夢團隊夢想開始的地方。用一年的時間走遍大江南北,完成充分的市場調研之后,他們將一眾研發資料、機器設備搬到了窯洞內。3個月的封閉研發,軍事化管理,集中的設計調試……GBase 8a MPP Cluster的產品原型便是在這里誕生。身為隊伍領頭人,武新坦言那段時間遇到的質疑和壓力是無法言說的。他需要不斷鼓舞團隊士氣,提升研究人員面對疑難問題的信心,還需要做好監督,逼著他們按時休息。“有些人可能半夜突然有了靈感,就悄悄地爬起來工作……”如今,武新回憶起那段艱苦的日子格外欣慰,除了順利完成產品的研發任務,培養出多名核心數據庫研究人才,團隊配合能力也得到了質的提升。
從研發走向市場,讓產品應用于各行各業,讓世界用上中國的數據庫,對南大通用而言,中國農業銀行大數據平臺項目尤為值得一提。
隨著數據量的逐年增長,中國農業銀行原有數據分析平臺已無法承受越來越多的系統接入,系統加工效率也開始逐步降低。為此,圍繞農行發展戰略,圍繞數據管理和數據服務的兩個基點,按照全行大數據平臺統一框架,遵循“統籌規劃、頂層設計、共享復用、分步實施”的設計思路,南大通用技術團隊擊敗業內多家企業,憑借GBase 8a MPP Cluster脫穎而出。隨后,他們構建出全行企業級大數據平臺,實現了數據資源統一管理,全面提升了農行數據服務能力,充分挖掘出數據價值,滿足了全行客戶營銷、風險管控、經營管理及外部監管的需要,推動了數據治理,并全面提升了行業數據資源管理水平和數據資產綜合應用能力。
在技術攻關過程中,為實現MPP數據庫與Hadoop平臺完美混搭、大規模集群環境的統一規劃、部署、管理和監控等任務,武新率領團隊成員采用GBase 8a MPP集群間同步工具識別主集群增量數據,解決了大數據場景中PB級數據備份的難題,也提升了大數據平臺業務高可用性、穩定性、連續性以及整體服務能力;使用GBase 8a MPP數據庫提供的透明網關機制,則化解了MPP集群間數據交互過程中的種種難題……
促進業務要用數據說話,貫徹服務要用行動證明。平臺建設期間,大數據平臺接入超過90個業務系統源數據,向資產負債決策支持、定價管理、資金及FTP管理等20個應用提供數據服務。與此同時,為了保障平臺的適配性和穩定性,南大通用積極展開數百項包括底層架構、高可靠性、高可用性、性能等方面的優化與改進。平臺投入前期,他們7X24小時現場輪流值守,一旦出現問題馬上分析,不出當晚便能解決。
正是由于這份認真負責的態度,鑒于產品性能的優越價值,南大通用不但促成了國產化數據庫首次進入4大行的核心業務系統,還接連拿下招商銀行、中國銀行等大型數據庫建設項目,在金融行業為國產數據庫軟件發展豎起標桿。除此之外,他們的產品應用遍及國內20多個省,顯著提升了電信、電網、交通、保險等政、企單位的數據庫運營效率及能力,同時還遠銷五大洲的30余個國家和地區。

客戶交流會后留影
“中國的市場其實提出了世界一流的需求標準,只要踏踏實實地滿足市場需要,產品必定也能達到一流的水準……”
“做高精尖的軟件系統沒有任何捷徑、秘訣可尋,必須保證實實在在的資金和人才投入……”
“所謂創新就是面對未知,勇氣、獨立思考的能力、批判的眼光缺一不可……”
由產品研發到企業管理,從產業驅動至人才培養,武新以一個過來人的身份關心著整個行業發展的大事小情。他表示,從企業生存的角度而言,盈利是推進自身進步的首要因素,因此短期效益明顯的產業其實并不乏競爭力。但想要真正推動各行各業的自主創新進程,實現核心技術研究驅動產業發展,還需要更為積極的宏觀調控,需要扭轉企業發展的價值導向,給予涉及高風險、長周期的研究與開發工作更多的重視,更有效的社會資源和政策幫扶。
著重強調社會對知識產權、知識分子價值認可和保護的重要意義,武新以推動領域發展為己任,同時指出國內正面臨資金、用戶、產業不協調等問題。“如今國家經濟實力提升,企業融資并不是問題,重點問題在于責任的落實”,他倡導免責而非問責,不論是否成功,希望有越來越多的聲音支持有膽識的人開展局部實驗,從而以局部帶動整體,形成良好的創新產業聯動效應。對于惡性招標、競爭,武新深惡痛絕,控訴其扼殺了創新能動力,呼吁整個行業及相關部門共同整治國內產業環境。

攝于美國納帕山谷( Napa Valley)
談及人才培養與企業發展規劃,武新坦言自己在主持或參與國家發改委、工信部、科技部下發項目,以及校企合作項目中成長頗多,同時也利用產學研聯合培養模式為社會輸送了一批批優質人才。根據多年的管理經驗,他指出,人才培養首要注重個人價值與崗位的匹配程度。“每個人都有獨特的價值,如何進行崗位安置才能最大限度地發揮能力,這是一個難題。”
依據從業者的個人表現,武新遵照按需分配的原則進行企業崗位管理,使具備自我驅動能力、心態積極的人成為團隊領軍力量,進而督促團隊的整體發展;使研究能力突出、工作表現優異的人擔當團隊中堅力量,進一步提升產品攻關效率;使恪守工作秩序、認真履行職責的人作為團隊保障力量,切實做好后勤安排,為各項任務的順利推進把好關口。組織架構方面,武新表示會將研究人員化整為零,組建數個5~6人的小團隊。通過設置獎勵機制,促進積極的團隊競爭和隊內競爭,增強了個人發展動力的同時,也為新技術的鉆研和開發提供了一定的自由空間。“始終以技術創新和產品帶給客戶實際的使用價值為標準,我們需要不斷促進研發能力,更需要讓優秀的人脫穎而出。”除此之外,武新大力倡導所有人勇敢說出“不知道”,杜絕“應該、差不多、我覺得”等多種語言腐敗,致力營造出嚴謹務實的企業文化氛圍,提升企業整體發展效率。
每件產品的成熟必要經過千錘百煉,如今面對科技發展的日新月異,武新說:“未來的路還很長,我們需要持續地投入。現在的基礎遠比10年前要好得多,我們肯定也會越做越好。”在數據庫產品國產化的政策保障下,借助市場形勢帶來的時代東風,基于大數據和云計算的數據庫技術、產品發展需求,南大通用立志要讓數據服務走進千家萬戶,讓數據資源的使用如同用水、用電一般方便。
順勢而為,隨著時間不斷地積累產品、人才的同時,積極鼓勵創新型人才發展,向社會傳達實用可靠的信息,讓世界用上中國的數據庫,是以武新為代表的南大通用人筑夢未來、奏響數據華章的不變信念。