李璐璐

2022年5月7日,陳云霽展示由他帶領團隊研制的“寒武紀1號”芯片。
在聯系近一周之后,陳云霽才擠出時間接受了采訪。見面時,這位中科院計算技術研究所研究員正忙著編程序,辦公桌旁是一張折疊床,側面墻壁的白板上寫滿了各種結構圖。目前,陳云霽正帶領團隊全力攻克處理器設計的共性技術壁壘。“一直在忙,每天都搞不清楚是星期幾!”他笑著說,“但只要把研究當成興趣,也不覺得累。”這位“80后”科學家,已在國產處理器芯片研制領域耕耘了20余年。
“讓計算機更聰明”“讓機器更好地服務人類”……這是陳云霽科研路上的夢想和追求。這份夢想在兒時便埋下了種子。“我小時候喜歡看書,家里書架上有很多工程、歷史類的書籍。”陳云霽說,“我也喜歡玩游戲,街機、‘星際爭霸’等玩了不少。”漸漸地,他對計算機產生了濃厚的興趣。
興趣和求知欲驅動的探索習慣為陳云霽的科研之路打下了良好的基礎。陳云霽從小在數學上展現出了過人的天賦,三年級時就學完了全部小學數學課程,9歲小學畢業時已經把初中數學課程學完,同時考上了南昌十中的少年班。
14歲時,陳云霽考入中國科學技術大學少年班。大三時,他把計算機系所有實驗室的門敲了一遍,問是否接收本科生。最終,教計算機體系結構的周學海教授所在的實驗室收下了他。在研發過程中,盡管做的都是些打下手的“雜活”,卻讓陳云霽感受到計算機的巨大魅力。2002年,陳云霽如愿以償來到了中科院計算所,跟隨胡偉武研究員碩博連讀。當時,計算所正在研制國產通用處理器(龍芯1號),陳云霽成為當時龍芯研發團隊中最年輕的成員。博士畢業后,陳云霽順理成章留在了計算所,成為8核龍芯3號的主要架構師。 “龍芯3號與龍芯1號、2號有所不同,已從單核發展到多核了。”陳云霽解釋說,“好比以前一桌菜給一桌客人吃,現在一桌菜要給8桌客人吃。”
在資源十分匱乏的條件下,陳云霽和同事們邊干邊摸索,提出訪存協處理器結構,有效緩解了龍芯3B運算帶寬比問題;提出片上多核處理器的有界誤差全局時鐘理論,解決了多核處理器驗證和調試的一系列難題,保障了龍芯3號的研制。研究成果論文被體系結構領域旗艦會議HPCA(高性能計算架構國際研討會)錄用,這也是HPCA上第一篇第一作者來自中國大陸的論文。2013年,時任中科院計算所所長孫凝暉讓年僅30歲、只做了1年研究員的陳云霽作為學術帶頭人主導智能處理器基礎研究。
2010年,以深度學習為代表的人工智能技術在全球范圍內飛速發展,然而,智能算法規模快速增長,硬件系統的發展仍異常緩慢。為了解決這個矛盾,研究計算機架構的陳云霽與計算所研究人工智能的同事展開了交流合作。“未來的智能計算系統應該是什么樣的?”成為了陳云霽每天思考的問題。
科研路上,弟弟陳天石也來到了他的身邊。陳天石同樣畢業于中科大少年班。2007年,陳天石作為客座博士生從中科大來到了計算所,研究方向是人工智能算法。一個做硬件、一個做軟件,兄弟倆決定聯手做人工智能和芯片設計的交叉研究。這是他們年少時的一個想法:“做一個東西讓計算機更聰明,終極目標像人一樣聰明”。
當時,人工智能研究正處于低谷期,人工智能和芯片設計的交叉研究更不被業內人士認可。學生們擔憂:做完研究,發不出論文是不是沒法畢業?項目申請也不順利,兄弟倆只能在日常工作之余開展研究。他們經常吃過早飯就坐在電腦前不間斷地工作,等感覺餓了已是晚上。熬夜是家常便飯,累了就在折疊床上囫圇一覺……他們先后提出一系列基于人工智能方法的處理器研發技術,多次向體系結構頂級會議投稿,但都一一被拒。“困難一個接著一個,但問題解決之后的喜悅是常人無法體會的。”陳云霽說。

陳云霽( 右一)與龍芯研發團隊成員合影(2007年1月1日攝)。

2022年5月7日,陳云霽(前右)與科研團隊。
功夫不負有心人。2014年,他們研制的國際上首個深度學習處理器芯片與電腦主板成功連接,能效達到傳統芯片的近百倍,圓滿實現預期目標。在美國鹽湖城召開的國際計算機體系結構支持、編程語言和操作系統國際會議(ASPLOS)上,陳云霽與法國國立計算機及自動化研究院的奧利弗·特曼教授合作的“一種小尺度的高吞吐率機器學習加速器”,獲得了最佳論文獎。這是中國內地科研機構首次在計算機系統和高性能計算領域頂級國際會議上獲得最佳論文獎,也是亞洲首次、美國之外國家第二次獲得ASPLOS會議的最佳論文。以“DianNao”和“DaDianNao”中文拼音命名的深度學習處理器架構正式出現在了計算機體系結構的國際舞臺上。參加國際會議時,陳云霽一遍遍地給外國同行糾正發音,他自豪地說:“之前沒有中文發音的芯片,我們借此也傳播了中國文化。”

2021年7月27日-28日,第二十三屆中國科學技術協會年會在北京召開。圖為陳云霽在閉幕式上作《深度學習處理器》主旨報告。
這之后,陳云霽全身心投入實際芯片研發,挑戰深度學習處理器芯片。他帶領團隊突破深度學習處理器設計中的規模、適配、能效三個核心挑戰,最終,研發出國際首個深度學習處理器芯片“寒武紀”。“‘寒武紀’是顯生宙的開始,希望能開啟人工智能的新紀元。”陳云霽說。“寒武紀”誕生的那一刻,陳云霽高興地隨手抓起身旁的拖把,和身邊的同學們即興表演了一段“棍棒舞”。
2018年2月,世界權威學術期刊《科學》雜志刊文稱,寒武紀的一系列成果為深度學習處理器領域作出了“開創性貢獻”,陳云霽和他的團隊被評價為該領域的先驅和引領者。陳云霽也被評為2015年度全球35位杰出青年創新者。
回顧科研生涯,陳云霽說:“從導師胡偉武身上,不僅學會如何設計芯片,更明白了一個深刻的道理,科學研究從來沒有捷徑可走,需要苦干實干。 ”
歷時十余年,深度學習處理器芯片已經應用在數千萬智能終端上,涉及智能手機、可穿戴設備、無人機和智能駕駛等多種場景。
除了研發強大的人工智能處理器,陳云霽尤為看重人工智能時代的生態布局。“開發芯片的同時,我們提出了一種與通用計算完全不同的指令集。”陳云霽解釋,指令集就是電腦硬件與軟件之間互相“對話”的語言,是構筑信息產業生態的基礎之一。以往信息產業主要應用X86和ARM兩種指令集,大部分軟件和應用程序都以此為基礎開發——這讓所有后來者難以在傳統信息產業中做大做強。
“我們原來在這方面幾乎沒有發言權,但智能時代給了一個機會。”陳云霽說,“我們已經邁出第一步,未來或許能夠建立起開放共贏的信息產業新生態。”他經常用自己的經歷啟發學生:“不要為了發論文而一味去追逐熱點,要努力去做那些未來有前景、現在沒被關注的方向。”
即使碩果累累、榮譽加身,對于陳云霽而言都已經是過去時,如今的他,仍然奮斗在智能計算系統研究的前線。“科學技術的發展路徑往往會出人意料。未來50年,計算機的計算能力將達到人類大腦的幾十億倍。智能硬件在提升計算能力的同時,也在推進著智能算法的快速發展。近乎無窮的計算能力也許會革新當前符號主義主導或聯結主義主導的已有智能計算范式,帶來人工智能能力的跨越式提升。”陳云霽說,“作為一名科研人員,做未知領域的科研探索會很孤獨,特別是做別人沒有做過的無人區,會更加孤獨。但是,在我看來,有科學理想的人應該偏離一般意義的最優路徑,有勇氣探索冷門、未知的領域,人工智能的星辰大海是他值得投入全部精力去探索奮斗的畢生事業。”
陳云霽喜歡引用茨威格在《人類群星閃耀時》的一段話:“一個人生命中最大的幸運,莫過于在他的人生中途,年富力強的時候,發現了自己的使命。”他說:“能把興趣和工作結合在一起,我感覺特別幸運。”
1983年出生于江西南昌,中國科學院計算技術研究所副所長,研究員,博士生導師。主持的項目“深度學習處理器體系結構新范式”獲2020年度國家自然科學獎二等獎。2022年,獲得“全國五一勞動獎章”。