今天所說的人工智能,它是指在機器上實現的人類智能。包括認知智能、感知智能、決策智能等。我們通常所說的人工智能,實際上是廣義的人工智能。現在技術實現的智能,其實分成兩類:一類叫做強人工智能也叫廣義人工智能,幾乎所有人類擁有智能的行為機器都能做,這叫通用人工智能;另外一類人工智能叫狹義人工智能或專用人工智能,它是指特定的智能。比如人臉識別系統,它只能做人臉識別,它是特定人工智能系統或狹義人工智能系統。狹義的人工智能和廣義人工智能并不等同,并不是用幾個狹義人工智能堆起來就是廣義的人工智能,沒有這么簡單。了解了這個概念,我們可以講人工智能的“3144”了。
人工智能三個階段
人工智能的3144,第一個“3”,是指人工智能到現在為止經歷了三個歷史階段。第一個階段,叫做基于符號邏輯的推理證明階段,第二個階段,叫做基于人工規則的專家系統階段。第三個階段,是從2006年到今天,叫做大數據驅動的深度神經網絡階段。第一階段從1956年開始,當時大家認為,所謂人工智能是在機器上實現人的智能,人和動物最大的差別是邏輯推理,如果能進行邏輯推理就有智能。所以用計算機實現邏輯推理是當時最核心的動機。為了實現邏輯推理,當時采用布爾代數、演繹推理、三段論,后來又專門設計。
第一階段數學的幾何定理證明。1956年,卡內基梅隆大學就羅素所著《數學原理》的定理做了證明。到1959年,洛克菲勒的數學家王浩把所有350條都證明了,這是比較頂級的工作。由于開始時很順暢,大家很樂觀,1958年有兩位非常著名的人工智能專家,提出非常著名的四個寓言:十年內,計算機將戰勝國際象棋冠軍;十年內,計算機將證明數學定理;十年內,計算機能譜曲;十年內,計算機將能實現心理學理論。只做了數理證明其他遙遙無期,再加上一個英國學者在1973年寫了一篇文章,對人工智能狠狠地潑冷水,人工智能第一次跌入低谷。
1976年以后人工智能慢慢回暖,有兩個原因:一是研究人工智能的人反思了一下,人工智能總做陽春白雪、數學定理證明不行,必須接地氣,要做專家系統,讓老百姓真正接觸到。當時有人做心理咨詢專家系統、故障診斷專家系統、治病專家系統、醫生專家系統,各種專家系統。國內在20世紀80年代開始有各種各樣的系統,比如農業專家系統,是那個階段主要的方向。在那個時期,專家系統主要用兩種工具,一個工具是用邏輯推理的,基本是基于規則的。另外一個技術基礎是神經網絡。
又發展了十多年,遇到瓶頸,總有壓倒駱駝的最后一根稻草。第一根稻草是日本研究第五代機器化,不成功,草草收場;第二根稻草是美國以斯坦福大學的專家為主做知識圖譜,把百科全書所有知識輸入到計算機,有什么問題,百科全書都可以回答。這個系統做了十多年,互聯網興起后,很快被互聯網超越。所以這個項目也失敗了。這兩個項目的失敗,導致大家又對人工智能失去信心。
第三次是算力加上大數據共同發力導致的人工智能的浪潮。這次完全是從數據驅動的,這也是這次和前兩次的區別。
這次人工智能浪潮的里程碑是2006年有一名加拿大學者叫Geoffrey在科學雜志上發表了一篇論文,提到深度神經網絡可以進行大規模的學習,可以訓練、進行推理。2012年Geoffrey的學生用他的思路做了神經網絡并參加比賽,一鳴驚人,把第二名遠遠甩在后面。
華人的貢獻在2015年,當時在微軟亞洲研究院工作的孫劍博士,領著他的團隊提出“殘差網絡”。殘差網絡提出后,在比賽里取得第一的好成績。孫劍錯誤率降到了3.57%,遠高于排在第二名的谷歌團隊的6.7%。當時孫劍的成績已經超過人的圖像分類的能力,當然他使用的網絡也不一樣,別人用的網絡是22層、19層的,他是用152層的網絡。這個網絡現在非常有名,大家知道,AlphaGo后面是AlphaZero,AlphaZero用孫劍的網絡,這個網絡就是非常有名的深度學習的工具。
AlphaGo,2014年4:1戰勝韓國的當時世界圍棋冠軍李世石。回去以后團隊進行了分析,原來李世石走了一步棋譜里沒有的棋,機器不知道怎么下,隨機走了一步就輸了比賽。當時人類能夠有記錄的棋譜共3000副,所有可能的棋譜是1.5億副,當時用來訓練AlphaGo的數據,占所有可能數據的20%多,還有70%多的數據是沒有的,因為沒有數據,當遇到你沒有的數據時可能會輸。最后AlphaGo重新設計了系統,設計了AlphaZero,并讓其自己互相下,走棋譜里沒有的棋,把所有可能的棋都下了一遍,用1.5億個棋譜訓練了AlphaZreo,所以AlphaZreo是無敵的。
人工智能的一個判斷
做智慧廣電,要用深度網絡學習,深度網絡學習要有最全的數據、好的算法、足夠的算力,三個加在一起會做出出色的智慧廣電。數據、算力、算法是這一輪人工智能最基本的三個要素。這輪人工智能發展還有一個特點,所有頂級的人工智能科學家都是和企業一起研究。因為企業的數據是最完整的,要想做一個好的智慧系統,沒有大數據是不能實現的。
人工智能3144,“1”一個判斷。現在就弱人工智能或專項人工智能來說,只要數據夠全,就可以做得不錯。為什么會有那么成熟的人臉識別系統、語音識別系統、機器翻譯系統?因為數據用訓練可以做得好。弱人工智能大規模應用已經“成勢”,要乘勢而上,順勢而為。人工智能是不是行了呢?強人工智能現在還不行,還有非常長的路需要探索,可能是10年、20年,30年、40年也都有可能,這個取決于現有的機器架構,做強人工智能是馬太效應,大車要用更強的系統拉,那個系統是什么,現在不知道。有可能是類腦系統、量子系統,也可能是其他系統,現在的算力做強人工智能還不夠,弱人工智能沒有問題,這是基本判斷。
人工智能的四個優勢與短板
3144中的第一個“4”,是我們國家發展人工智能有四個優勢條件。第一是有政策優勢,我們國家對人工智能非常重視。第二是數據資源的優勢,我們國家擁有海量數據,這是其他任何一個國家沒有辦法比擬的。第三是豐富的應用場景優勢。我們有非常豐富的應用場景,不管是城鎮化、老齡化、制造業轉型升級還是互聯網市場。所有這些都給我們提供了非常好的應用場景。第四個是我國的青年人才,儲備非常充足。我們有全世界最大的高等教育體系,工科學生占的比例非常高,這些學生都是將來進入人工智能領域潛在的青年才俊。當然我們也有四個薄弱環節:一是起步晚,再加上前些年科技領域的評估需要短平快,所以一個人很難研究一件事,冷板凳坐30、40年。像有一位加拿大那位教授研究了40年,最后發出一篇論文引爆這個領域。由于這兩個原因,我們原創性的東西略微差一些,這個我們實事求是,必須要承認。所以真正原創的研究,大多數來自美國、加拿大和英國。二是高端芯片。不管GPU、ASIC、FPGA,主要掌握在別國企業的手里。不光是芯片,也包括傳感器,對這部分研究,我們也需要補短板。三是缺乏有國際影響的人工智能開源開放平臺。現在有影響的開源開放平臺基本都是別國做的,像谷歌、微軟、亞馬遜、Facebook、IBM。國內企業也在推廣,但影響力非常小。第四是高端人才的短板。我們高端人才不足,剛才說青年才俊很多,但是高端人工智能的人才和美國相比,只是美國總數的20%左右。
(根據高文院士的公開演講整理而成,未經本人確認。)