文/
這次,日本超算贏了!
2010年之前,超算領域呈現美日競爭格局,之后則是中美競爭。在TOP500超算榜單上(每年更新2次),中國超算226套,份額45%;美國113套,份額22.8%;其余份額由日、法、德等國瓜分。
然而,在今年6月底的榜單上,富士通和日本理化學研究所聯合開發的“富岳”,奪得冠軍,其浮點運算力是前冠軍、美國“頂峰”的2.8倍。而且,在模擬運算方法、AI學習性能、大數據處理等4個性能單元名列第一。
繼2011年拿到冠軍的“京”之后,“富岳”時隔9年再次登頂,喻示了日本并未在超算競爭中出局。巧合的是,在研發階段,“富岳”工程機一直是作為“京”的升級版開發的。
作為老牌超算強國,日本超算在算力功耗比上向來享有獨特優勢。架構上,“富岳”和中國的太湖之光都采用了“同構”模式(純CPU),有別于美國超算普遍采用的CPU+GPU的異構計算。中日兩國不約而同地避免使用英特爾和英偉達的芯片,以規避美國的技術鉗制?!案辉馈甭氏仁褂肁RM指令集芯片,恐怕也有同樣的考慮。
有評論認為,“富岳”崛起,而且顯示了獨特的技術優勢,標志著算力競爭重新回到中美日競爭格局。
不過,超算研發周期長達5-6年。目前中、美、歐都在下大力氣研發新架構E級超算,目前是新一輪競爭高潮的“間歇期”?!案辉馈钡念I先地位,可能不像日本媒體認為的“長期存在”。
日本超算另一個特點是算力集中。如果按照TOP500的算力份額來看,富士通僅靠著13套超算,就實現了21.7%的算力。

超算一直是國力象征,各國都采取國家研究機構、大學和企業聯合的方式,日本也不例外。到了單純的企業運營層面,對技術規避考慮就少得多。和“富岳”回避使用英偉達芯片不同,豐田在超算服務器上,正在與英偉達進行密切合作。
英偉達一方面給大型超算提供GPU,另一方面則擅長搭建“積木式”中小型超算,追求的是低功耗下的算力累積。英偉達一直夢想作為云端算力和車機算力平臺的提供者,在自動駕駛領域實現算力制霸目標。
看上去,豐田與英偉達的合作,有助于實現后者的目標。豐田的愿景則是最終部署完全自動駕駛汽車,英偉達能夠幫助豐田實現愿景嗎?
目前,雖然自動駕駛技術正在步入低潮,但車企核心競爭力,正在從規模生產和供應鏈管理,轉變為車機算力和云端算力。趨勢不會改變,只是路徑尚未明確。
去年豐田正式成為英偉達超算的第一個客戶。豐田的雙軌研究機構——TRI(豐田北美研究院)和TRI-AD(豐田日本研究院),都使用了英偉達超算服務器,部署自己的“Guardian”(守護者系統)。目前,這套系統仍處于后臺“影子運行”中,在車主授權下,“守護者”會觀察司機的操作,積累數據,并對復雜甚至極端的場景做出虛擬決策,但不參與實際駕駛。
豐田強調,高度自動駕駛軟件并非依賴人類編寫程序,而是靠數據驅動。也就是在英偉達平臺上,以算力為依托,利用神經網絡訓練AI。而豐田的優勢則是在全球巨大的產品存量,這意味著TRI幾乎擁有無限量數據資源,去“填喂”AI,使其勝任復雜駕駛。
在本地(車機),英偉達低功耗算力負責處理來自車輛傳感器數據,而部署于云端的“守護者系統”則幫助車機了解其所處的環境,預測潛在風險。眾所周知,豐田發誓最終實現零死亡數字的自動駕駛愿景,他們正處于仿真工具測試和路測結合的階段。
以“富岳”為代表的大型超算,發展到當前水準,讓日企看到AI訓練突破的契機。
此前,AI在圍棋領域擊敗最強的人類棋手,讓人們認為AI完成高等級自動駕駛指日可待,但事實恰恰相反。AI最大的短板,在于缺乏常識。在人類駕駛員直覺就可以判斷的時候,AI目前笨得驚人。
圍棋對AI來說,任務邊界清晰,而自動駕駛則經常碰到意外的場景輸入條件,后者經常讓AI無所適從。
這是眾多高等級自動駕駛項目遲遲未能落地的原因。雖說數據是新的石油,但數字石油的冶煉術還很原始。短期內該局面不會改變,但算力空前強大的超算,可能另辟蹊徑,就是用暴力運算窮盡所有“邊緣場景”。理論上,影響駕駛安全的邊緣條件可以是無數個,再強的超算也無能為力。但放在具體的街道、有限天氣和光照條件、有限交通參與者的情況下,超算可能實現“窮舉”。
譬如在一個電子圍欄范圍內,實現場景窮舉,就意味著該范圍內實現高等級自動駕駛。這意味著后臺系統必須部署于功耗巨大、運算能力空前強大的超算,而非英偉達追求的算力功耗比。
“富岳”的誕生,為豐田這樣的企業提前部署實用型云端算力,提供了可能性。同時,英偉達兩端(云端、車機端)制霸的雄心,可能會被削弱。