距離2010年秋季高性能計算TOP500榜單發布后半年,新一期的HPC TOP500榜單新鮮出爐。6個月代表了27個星期、180天而已,但就在這段時間里,這張榜單發生了翻天覆地的變化。
“K”的勝利
在2010年秋季的榜單上,“天河一號”以2.56petaflop/s的性能一舉奪冠。但遺憾的是它也成為了到目前為止,只在榜首位置停留一期而沒能蟬聯的“冠軍”。來自日本的,橫空出世的富士通“K ”超級計算機以8千萬億次(8.162petaflop/s)——近3倍于“天河一號”的性能擠掉了后者的榜首位置。
據悉,“K”是日語中10的16次方的縮寫。排名第二到第十的超級計算機依次分別是“天河一號”、美國橡樹嶺國家實驗室的Jaguar超級計算機(1.75petaflop/s)、中國深圳星云超級計算機(1.27 petaflop/s)、東京技術研究所的Tsubame 2.0超級計算機(1.19 petaflop/s)、新墨西哥州洛斯阿拉莫斯國家實驗室的Cielo超級計算機(1.11 petaflop/s)、美國航天局艾姆斯研究中心的Pleiades超級計算機(1.09 petaflop/s)、美國能源部國家能源研究科學計算中心的Hopper超算 (1.054 petaflop/s)、法國的Tera 100超級計算機(1.05 petaflop/s)、美國洛斯阿拉莫斯國家實驗室的走鵑Roadrunner超級計算機(1.04petaflop/s)。
資料顯示,“K”這臺超級計算機內含68544個 SPARC 64 VIIIfx處理器,每個芯片擁有8個核,總共擁有548352個核。這個數字是榜單中余下系統所含核的數量的兩倍。雖然“K”的功耗達到了驚人的9.89兆瓦,但是由于性能出眾,它也是榜單中能效最高的系統。
本次榜單前10名的超級計算機中,有三臺是2011年新上榜,而且第一次排名前10系統的性能全部達到了千萬億次的級別。來自中國的上榜系統達到了62套,依然落后美國,后者以256套系統的數目占據了整個榜單的近半壁江山。
上榜系統中有77.4%采用了英特爾至強處理器,而且其中169套系統采用了Westmere處理器,采用AMD處理器和IBM處理器的數目分別是65和45。
這張榜變化速度到底有多快?一個數字也許能夠反映出它的速度。那就是本次第500位的系統,在去年11月的榜單中還能排在262位。
據悉,基于最新款國產龍芯處理器的高性能計算機也在緊鑼密鼓的研制中,能否在下一期排行中有所斬獲,值得期待。
百億億次再進一步
自從IBM走鵑Roadrunner超級計算機突破千萬億次的計算門檻后,整個HPC業界都把目光投向了下一個“不可能完成的任務”——百億億次。
根據英特爾的預測,到2015年,全球高性能計算機500強(TOP500)排行榜上排名第一的系統在性能上將有望達到每秒十億億次浮點計算,2018年時,它將越過每秒百億億次浮點計算的標桿,而到2011#12316;2020這個10年期的末期時,地球上最快的計算機的性能則有望超過每秒4百億億次浮點計算。“K”的出現,可以說是人類在通向百億億次的路上跨出了非常大的一步。
愿景總是美好的,要想達到百億億次的目標,所要走過的道路絕非一馬平川。英特爾中國有限公司服務器平臺產品經理張振宇就向記者表示,雖然高性能計算機的性能在不斷提升,但是對于真正的用戶而言,還面臨著很多挑戰。“例如構建了一臺高性能計算系統,如何在有限的運維成本、能耗和占地面積等條件下盡可能優化性能,如何應對不同的應用特征所帶來的計算能力、內存、帶寬和網絡對于整體性能的影響,這都是用戶在未來HPC發展道路上需要面對的情況。”
英特爾公司副總裁兼數據中心事業部總經理施浩德(Kirk Skaugen)表示,要在未來實現百億億次級別的性能,不僅需要行業與政府的通力協作,還需要有開創性的技術和方式,而英特爾所倚重的就是集成眾核(MIC)架構所開創的新方法。“英特爾正在進一步擴展它對高性能計算的關注,利用我們針對千萬億次以及未來百萬萬億次工作負載的集成眾核架構,引領行業開辟下一個領域。”施浩德說,英特爾擁有領先于整個行業的制造技術、全新的架構創新成果以及讓用戶感到熟悉的軟件編程環境,它們都將推動逐步實現激動人心的百億億次高性能計算目標。
在本次TOP500的榜單中有19套系統采用GPU加速的模式,不過就目前應用情況來看,高效的軟件編程模式以及出色的系統可擴展性將是跨越千萬億次計算極限,進入百億億次計算時代的關鍵要素,而MIC恰恰在編程模式方面有著其自己獨特的優勢。
據悉,MIC架構具有更小的內核和硬件線程,以及更寬的矢量單元。
背景資料
集成眾核架構(MIC)是英特爾于2010年國際超級計算機大會上正式發布的一種眾核架構,MIC主要面向高性能計算領域,完全基于x86處理器架構,因而能夠很容易地進行應用程序的編程。從英特爾正式發布MIC以來,英特爾一直加緊其產品的研發工作。去年,英特爾還在日本展示了其采用MIC架構的32核超級計算加速卡。為了解決并行編程的問題,MIC采用在至強處理期的開發平臺上進行擴展,從而簡化了應用程序的遷移工作。
在2011年6月于德國漢堡舉行的國際超級計算大會(ISC)上,英特爾演示了MIC架構的早期成果。據悉,這一開發平臺已經在SGI公司和韓國科學技術信息研究院(KISTI)得到了應用,其平臺和開發工具得到了初步驗證。
6月21日,日本神戶的理化研究所發布了最新的超級計算機“K”照片。