孟祥飛:懷揣一顆振興中華的心
——國家超級計算天津中心應用研發部部長

他帶領團隊不斷探索創新,研發出中國第一臺世界第一的超級計算機——天河一號。從被質疑中看不中用的“大游戲機”,到真正能“算天算地算人”的“國之重器”。
1946年,世界上第一臺計算機叫ENIAC,它誕生的時候占地170平方米,相當于兩個教室那么大。它的功耗有150千瓦,而它的計算速度是每秒5000次。當然,相比我們人類已經挺快了。但是,現在我們小小的智能手機,它的功耗不到1瓦,而它每秒鐘的計算速度可以達到幾十億次,這是計算機的發展速度。實際上,超級計算機更是突飛猛進,它的計算能力在指數級增長,甚至超出了科幻作家的“腦洞”。劉慈欣的《三體》中提到一個世界上當時最快的計算機每秒鐘能計算500萬億次。而在2010年,我們“天河一號”問世的時候,它的計算速度已經是《三體》里計算機速度的10倍。現在,我們最快的超級計算機叫“神威·太湖之光”,它的計算速度每秒達到9.3億億次,是《三體》里這臺計算機性能的186倍。
我們周圍充斥了各種計算機,為什么還需要超級計算機?可以簡單地拿步槍和大炮做一個比喻,普通的計算機就像步槍,靈活實用。但是要去攻城拔寨,就需要大炮,超級計算機的作用就是來攻城拔寨。2016年,有一個人工智能橫空出世,就是AlphaGo。2016年,它以四比一的成績擊敗了李世石,今年又擊敗了柯潔。AlphaGo為什么有這樣超強的能力?首先是因為新的人工智能算法的更新推動了AlphaGo的能力,同時它后臺的超級計算給它帶來超強的算力,成為它重要的一個支撐。AlphaGo的后臺,具備千萬億次的一個計算能力,也就是說,它工作1小時,相當于中國13億人上百年的工作量。所以說,人要是跟它拼速度,那可能跑斷腿、跑掉鞋也難望其項背。超級計算,在AlphaGo里的應用只是一個小小的例子。
超級計算在很多領域都有它的重要價值,簡單概括成“算天”、“算地”、“算人”。“算天”是什么?就是天氣預報,同時研究宇宙起源和演化的能力;“算地”是什么?也就是算地質的演化,還有油藏等地下能源的勘探,我們把它比喻成“給地球做CT”;“算人”又是什么?基因數據是一個龐大的數據群,我們需要用超級計算機來進行基因大數據的分析,來揭示人類基因的密碼。所以說,超級計算是解決人類和社會發展重大問題的一個“超級利器”。
我國的超級計算機來得沒那么容易。世界上第一臺超級計算機是1976年美國研制成功的,而我們開啟超級計算機研制的步伐是在1978年,我們跟世界基本同步。但由于我們研發設計的基礎非常薄弱,制造能力也有限,所以長期以來,我們的超級計算機研制都處在一個“跟跑”的狀態。在這個領域,非常有代表性的一個故事叫“玻璃房子”。當時我們的中石油、國家氣象局需要超級計算機,花高價從國外的一些機構購買了超級計算機。但買回來以后,要建獨立的機房,把數據交給他們,由他們的工程師進入機房進行數據處理,我們自己的人員只能隔著窗戶看一下這臺超級計算機。講到這里,我不知道大家是什么感觸。
2007年后,在國家重大專項的支持下,在天津濱海新區開始啟動我國第一家國家級超算中心的建設。我毅然加入到這個籌建當中的團隊,當時我們六、七個人連辦公室都沒有,大家吃、住、辦公都擠在一個兩居室的公寓里。2010年,我們開始正式安裝調試“天河一號”系統,全面安裝時已經進入到七、八月,外面30多攝氏度,因為沒有空調,機房里40多攝氏度。大家累了就躺在我們設備的大紙箱子上休息一下,醒了再接著干。用了7個月左右的時間完成了別人要一年多才能完成的工作。
2010年11月17日,喜訊傳來,“天河一號”取得了世界第一的突破。我們覺得心潮澎湃,有一些老專家,因為他們經歷過整個發展過程,他們覺得“天河一號”就是一個“爭氣機”。
說實話,幸福的時光總是短暫的。在“天河一號”取得世界第一不久后,質疑的聲音又接踵而來。當時很多國內外專家和媒體質疑中國的“天河一號”是一臺為排世界第一而造的超級計算機,中看不中用,甚至有專家調侃中國的“天河一號”實際上就是一臺大游戲機。我怒了!我給我們主任立了個小軍令狀:干不好“天河一號”的應用,我卷鋪蓋卷兒走人!拉弓沒有回頭箭,只能拼了。我們面臨的第一個挑戰就是如何將自主的技術與原來傳統的應用相兼容。“天河一號”剛開始運行的時候,我們部署一套國際上藥物研發領域的一個通用軟件,遇到了非常嚴重的不兼容問題。用了20多個日夜、上千次的調試、編譯,在里面尋找問題,最終把不兼容的問題解決了,保障了我們“天河一號”在藥物研發領域的應用基礎。現在再看我們的“天河一號”,每天完成近萬項的任務,這種應用規模實際上是很多歐美超算中心都很難達到的。我們現在的“天河二號”、“神威·太湖之光”等這些超級計算機都在國家的科技創新和產業領域發揮著越來越強大的作用,所以說我現在更興奮。

實際上,創新并不都是艱苦卓絕或者“高大上”的,有的時候創新也來自于我們日常的生活。2012年,我們做了一個海洋動力學計算的軟件優化,我們遇到了一個非常嚴重的問題:隨著并行計算規模的擴大,用的CPU越來越多,數據開始出現嚴重擁堵的問題。這是個什么概念呢?比如一個超級大工廠,它的每一個車間生產能力都很強,能生產出各種產品,而這些產品在運到倉庫存放的時候都堵在了倉庫門口,所以說車間就只能“歇菜”了。如何解決這個問題?當時我經常出差,發現在車站人流密集的地方,會把一個大的進出口用安全柵欄隔離開,分成很多小的通道,提升了通行的效率。這個設計啟發了我,我回去把我們整個數據的輸出分成很多通道,把我們數據的存儲效率提升了大概一倍。通過我們不斷地積累和創新,不僅在高端芯片方面形成了完整的產品體系,同時為我們國家的信息安全也提供了堅強有力的保障。
我們說,青年興則國家興,青年強則國家強。超級計算機領域的老一輩奠基人慈云桂教授,當時在承接我們第一代自主超級計算機“銀河一號”的時候,他說:“拼上這條老命也要把我們中國自主的巨型機研制出來。”而現在青年一代的科學家可能不用再像老一輩科學家那樣去篳路藍縷,但是我們同樣有一顆振興中華的心,我想我們新的青年一代將不辱新時代的歷史使命。
李雪源據央視綜合頻道《開講啦》節目整理