
耄耋之年的他,說話邏輯清晰、思維敏捷,輸出觀點快而密。說不到兩句,你就能感受到從他身上彌漫過來的強大自信。他就是張鈸,中國人工智能領域的奠基人之一,他的四代學生組成了中國最具代表性的一支AI隊伍——“清華代表隊”,其中一些人已成為國內大模型建設的重要力量。
1978年,清華大學進行部分院系調整,張鈸所在的電子系(原自動控制系)改為計算機技術與應用系,系中原來從事自動控制研究的老師面臨兩個選擇:待在計算機系,或去新成立的自動化系。他選擇了前者。
很多老師勸他:國家未來要大力發展工業,自動化是最有前景的方向之一。張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什么?我說,還剩一個腦袋。”
帶著“唯一的腦袋”留在計算機系,張鈸遇到的第一個任務是尋找有潛力的新方向。他翻閱國外學術期刊,發現美國很多大學的計算機系里都有一個方向:人工智能。
“當時,對于人工智能是什么,我也不是特別清楚,但它對我有極強的吸引力,因為這個領域里充滿了大量的未知。AI在國際上剛發展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我干什么?”張鈸說。
數學是張鈸最拿手的學科。閱讀大量人工智能文獻后,他敏銳地發現:多數AI研究中沒有使用任何數學工具,這意味著,很多還未解決的問題有機會用數學辦法解決。

1980年,作為改革開放后的首批出國訪問學者之一,張鈸來到美國伊利諾伊大學香檳分校進修。從1978年暑期起,他就開始研究機器人運動規律,他出國第二年,就與在安徽大學任教的弟弟張鈴投出中國AI領域的第一篇論文。此時,距離他決心轉戰AI還不到三年。
張鈸成為國際上第一批提出用數學模型解決AI問題的學者之一。
2002年,袁進輝還在西安電子科技大學計算機系讀大三,成績年級第一,想申請清華直博,當時,張鈸是清華計算機系唯一的中國科學院院士。
此前,袁進輝已讀過張鈸和張鈴共同撰寫的一本關于人工神經網絡的專著。該書出版于20世紀90年代,那時人工神經網絡是AI里很小眾的領域。

早期的人工神經網絡只是淺層神經網絡,難以解決稍微復雜的現實問題。于是,連接主義起步不久就陷入低谷,只有少數人認定這條路是正確的,其中就包括張鈸。
2012年,以深度神經網絡為基礎的深度學習徹底出圈。與早期的神經網絡相比,深度神經網絡“把深度加深了”,即中間的網絡層數變多之后,性能發生了重大變化,只需輸入大量的原始數據,就可以“自學成才”。張鈸最初感到興奮,但隨后開始思考:深度學習的邊界在哪兒?
清華大學計算機科學與技術系教授、人工智能研究院副院長朱軍是張鈸的學生。“2013年前后,正是深度學習最熱的時候,很多激進的觀點認為,AI三五年內就可能在自動駕駛等復雜場景量產,但張鈸是國內最早公開談論深度神經網絡存在缺陷的專家之一。”朱軍說,此時,張鈸快80歲了。
深度學習的一個關鍵弱點是容易被欺騙。張鈸團隊發現,深度神經網絡的圖像識別很脆弱。一張以雪山為背景的圖片,只要加入一點“噪聲”,“自學”之后的AI就會將其識別成一條狗。這一問題絕非“雪山還是狗”這么簡單,而是指向一個困擾張鈸多年的更大難題:深度學習往何處去?
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此強大。“絕大多數AI研究者感到非常震驚。”張鈸說。
袁進輝指出,ChatGPT的誕生讓人工智能進入截然不同的發展階段。模型變大后,人們突然發現,過去多少年解決不了的問題可以用統一的方法搞定。“這是一次工業革命級的技術革命。”
張鈸說,多數人理解ChatGPT就是“大數據+深度學習”,其實它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作為數據來處理,而是把文本當成知識(內容)來處理。“只有當機器可以從大量的數據中獲取到知識,真正的轉變才會發生。所以,ChatGPT能力的強大源自兩點:一是大模型;二是大文本。”
可以說,ChatGPT是張鈸預測中的第三代人工智能的雛形,但還遠遠不夠。
迄今為止,人類一直通過模擬的方式讓機器的行為與人類相似,但大模型還是一個“黑匣子”,這正是張鈸認為AI理論下一步可能突破的地方。
在張鈸的倡議下,2018年,清華大學成立人工智能研究院基礎理論研究中心,朱軍為研究中心主任。
在張鈸看來,中國學生解決問題的能力很強,但提出問題的能力不足。因此,在培養學生時,張鈸格外重視訓練學生“提出問題的能力”。
袁進輝2003年起跟隨張鈸讀博,不像有的導師會出于“更容易出成果”或“項目有需要”等原因給學生指定博士選題,張鈸總是讓學生自己找題,鼓勵大家自主探索無人區。
AI領域最激烈的變化就集中在短短十幾年內,這一切都發生在張鈸77歲之后。朱軍說,張鈸自我要求極高,有強烈的好奇心與求知欲,快90歲時每天還在看國外最新的論文。“他是我見過的學習能力最不可思議的人之一。最前沿的模型,他玩得比我們還溜。”
(摘自《中國新聞周刊》)