張健 國家超級計算天津中心
2018年6月8日,計算峰值速度為200PFlops的超級計算機“Summit”在美國的橡樹嶺國家實驗室發布。自2016年以來一直保持世界第一的部署在國家超級計算無錫中心的超級計算機“太湖之光”的峰值計算能力為125PFlops,“Summit”比“太湖之光”快了60%。
超級計算機的結構組成和我們家用的PC電腦類似,但是在規模和性能上要遠遠超過普通的PC電腦。超級計算機除了具有很強的計算能力,還具有大規模的數據存儲能力和高速的網絡傳輸能力。同時,超級計算機還配有豐富的操作系統、編譯環境、并行開發環境和軟件環境,能夠給不同應用領域的用戶提供合適的編譯、開發和運行環境。
高性能計算領域通常用浮點運算能力來描述超級計算機的運算能力,單位是Flops,含義為每秒執行了多少次浮點運算。超級計算機“Summit”能夠每秒鐘進行20億億次浮點運算,也就是說它運算1分鐘,相當于13億中國人同時使用計算器連續計算80年。
超級計算機對任何國家來說,不但能夠促進經濟、社會的發展,也對保障國家安全發揮著不可替代的作用,更重要的是很多國家的重大科學與工程領域的關鍵問題都需要超級計算機那強大的計算能力才能完成。
中國的計算機行業從1958年開始發展,中國的科學家根據蘇聯提供的計算機設計圖紙進行研究,然后在此基礎上進行修改,研制出了中國第一代計算機,實現了中國計算機零的突破。中蘇關系在60年代以后開始惡化,中國得不到蘇聯的技術支持,計算機的發展停滯不前。到了70年代,中國對于超級計算機的需求日益激增,中長期天氣預報、模擬風洞實驗、三維地震數據處理、以至于新武器的開發和航天事業都對計算能力提出了新的要求。中國的科學家經過幾年的摸索、嘗試,終于在1983年12月由國防科大成功研制了中國第一臺超級計算機“銀河I號”,每秒鐘能夠進行1億次浮點運算。從此,中國超級計算機的發展明顯加快,先后研制了銀河、曙光、神威這三個系列的超級計算機,計算能力也在階梯式提升,2008年研制成功的超級計算機“曙光-5000A”的運算速度達到了每秒鐘230萬億次。2009年,國防科大經過不懈努力成功研制了“天河一號”超級計算機,這是國產第一臺運算速度達到每秒鐘千萬億次的超級計算機,它在2010年的全球HPC TOP500中第一次成為世界冠軍。雖然“天河一號”很快就被其他國家的超級計算機超過,但是2013年,由國防科大研制的“天河二號”超級計算機再次成為了世界第一,并且從2013年至2015年在全球HPC TOP500中連續6次蟬聯世界第一。這個記錄一直到2016年被我國自主研制的超級計算機“太湖之光”打破,此后“太湖之光”連續4次蟬聯世界第一。
中國超級計算機的應用門檻并非“高不可攀”,氣象預報、醫療檢測、城市交通等領域都跟我們的生活息息相關,超級計算機也有科學和工程上的應用,如工程仿真、數值模擬、新材料、航空航天等。這些應用領域的任務基本都屬于計算密集型,也就是說任務大部分在做高密度的數值計算,這跟采用分布式計算方式的云計算和網格計算是有明顯區別的。
隨著中國社會的發展、進步,中國超級計算機在新興領域也有大量應用,如人工智能、深度學習、生物醫藥、基因工程、動漫渲染、過程控制、數據挖掘、金融分析、公共服務等。2017年中國HPC TOP100發布了國內的應用領域分布情況,國內超級計算機的應用領域可以主要歸納為互聯網信息服務、科學計算與工程計算、大數據分析三個領域,其中互聯網信息服務所占比例為30%、科學計算與工程計算所占比例為14%、數據分析與機器學習所占比例為56%。由此可見,目前中國的超級計算機應用領域最明顯的特點就是大數據分析和互聯網信息服務成為最主要的應用熱點,這兩個應用熱點除了對超級計算機的密集計算能力有很高要求之外,對大數據的存儲能力和網絡的傳輸速度也有很高的要求。
高性能計算領域的“下一座珠峰”是E級超級計算機,它的計算能力將達到1000PFlops。E級超級計算機將為解決全球的能源、環境及氣候氣象等重大難題發揮作用,每一個國家都希望盡快研制出E級超級計算機。目前,中國、美國、日本和歐盟各國先后部署了E級超級計算機的研制計劃,計劃在2020年至2025年完成E級超級計算機的研制。在中國的“十三五”規劃里,在經歷科技部的科研管理體制改革之后,國家設立了三個E級原型系統的研制課題,分別由國家并行計算機工程中心(計劃安裝在山東)、曙光公司(計劃安裝在上海和深圳)和國防科大(計劃安裝在天津)牽頭負責研制,并在2018 年選定沖擊E級超級計算系統的研制方和安裝地點。
2015年美國以莫須有的理由禁止銷售英特爾至強芯片給中國的四個國家級超算中心,這使得逐步實現國產自主將是未來中國超級計算機行業的發展趨勢。在今后國產自主的超級計算機上,應用軟件的移植和優化將面臨重大挑戰。