文 / 吳飛 浙江大學人工智能研究所
人工智能:從規則學習,到數據驅動,再到能力增強
文 / 吳飛 浙江大學人工智能研究所

1955年8月,John McCarthy(時任美國達特茅斯學院數學系助理教授,1971年圖靈獎獲得者)、Marvin Lee Minsky(時任哈佛大學數學和神經學初級研究員,1969年圖靈獎獲得者)、Claude Elwood Shannon(時任貝爾實驗室數學研究員,后來被譽為信息論之父)以及Nathaniel Rochester(時任IBM公司信息研究經理)四位學者聯名給美國洛克菲勒基金會提交了一份名為“人工智能達特茅斯夏季研討會”的項目申請書,在這個申請書中首次提出“人工智能(Artificial Intelligence,AI)”這一術語,并指出“人工智能”研究目標是實現能模擬人類的機器,機器能使用語言,具有概念抽象和理解能力,完成人類自身才能完成的任務并且不斷提高機器自己。
實際上,在這份申請書中,四位學者希望洛克菲勒基金會能夠于1956年夏季資助10個人在美國達特茅斯學院工作2個月,解決如下人工智能領域的7個問題:自動計算機、計算機編程、神經網絡、計算復雜性理論、計算的自我改進提升、計算抽象(直覺)、隨機性和創造性。從現在的眼光來看,這份申請書中提出了一些時至今日也無法解決的難題,如難以用形式化方法來精確描述的直覺和創造性等,而這些難題也正是當今從弱人工智能(也稱領域相關人工智能)向強人工智能(也稱通用人工智能)邁進突破的艱辛所在。
人工智能從其誕生之日開始,就在人類追求“類人智能”這一樸實夢想感召下獲得了蓬勃發展。圖靈獎獲得者、美國卡耐基梅隆大學Raj Reddy教授曾對21世紀之前的人工智能研究劃分為定理證明和象棋博弈(1950s)、問題求解和語言理解(1960s)、語音-視覺和專家系統(1970s)、機器人和知識系統(1980s)、語言翻譯-搜索和神經網絡(1990s)等幾個階段。
但由于各種原因,人工智能在70年發展過程中曾經遭遇過三次挫折。
1973年,英國科學研究理事會委托劍橋大學盧卡斯講席教授、物理學家James LightHill爵士領導了一個小組對當時英國人工智能研究現狀進行調查,這個小組提交了一份獨立報告,指出自動機和神經網絡研究有價值,但是進展令人失望,機器人的研究沒有價值,進展非常令人失望,建議取消機器人的研究。這一報告的發表,直接導致英國政府幾乎停止了對人工智能相關研究的資助,被稱為人工智能發展史上的嚴冬(AI Winter),也就是人工智能發展史上的第一次挫折。從第一次嚴冬挫折可以看出,從一個新生事物初始階段,很難預測其未來,因此需要對其抱以一定的寬容之心。應該說,英國在人工智能早期研究中表現得十分活躍,如理論計算機之父圖靈提出了對機器智能進行評測的“圖靈測試”、Donald Michie教授在愛丁堡大學建立了英國第一個(也是世界最早之一)的AI實驗室且逐步發展成為歐洲人工智能研究中心,而這些陡然而來的努力進步隨著第一次嚴冬的到來戛然而止。
1982年,日本啟動了研制第五代計算機的計劃,其動機在于從單純計算與存儲的計算機模型向知識推理的新型結構過渡,即從“計算”向“算計”躍升。第五代計算機應該具有邏輯和推理等高級功能的“語言”(如類似邏輯編程語言Prolog等),有別于第一代以0和1構成的機器指令編碼、第二代的匯編語言、第三代的高級語言(如C等)、第四代的領域相關高級語言(如用于數據庫操作的SQL)。同時,為了支持邏輯和推理,第五代計算機還被要求連接一個龐大的知識庫以支撐并行推理。但是,由于目標過于龐大和當時人工智能水平尚未具備這樣的能力,1992年第五代計算機研制宣告失敗,這是人工智能發展歷史上的第二次挫折。第五代計算機研制的失敗告訴我們:類似人腦推理的“工具”需要軟件、硬件和知識的相互配合。
對知識的獲取是人工智能的一個本質功能,即從各種感知數據(如視覺、聽覺和自然語言文字等)獲取人類社會所普遍認同的概念、實體和關系等知識。知識的不斷累積將會推動智能產生質的飛躍。20世紀80年代開始,人工智能學者開始嘗試通過手工來建設涵蓋人類常識性概念和關系的知識庫,如1984年開始建設的知識庫Cyc。但是,在建設過程中,人們發現這種通過手工方式來編制本身就具有不確定性的知識網絡是一項無法完成的任務。如果沒有知識庫,則知識推理等活動則會變成無源之水,于是人工智能發展遭遇了第三次挫折,這次挫折帶來的后果是歷史上出現的若干專家系統難以在更為開放的環境中使用。這次挫折帶給我們的啟發是知識不能完全依賴于專家產生,而是要將專家智慧與機器學習(即從數據中學習)結合起來。
早期人工智能重點研究的是基于規則的知識推理方法。在這種方法中,會有一些規則和一套推理方法,其目標是基于推理方法去驗證命題或謂詞正確與否,或者學習推導出新規則/新知識。如IBM的沃森和卡耐基梅隆大學研制的NELL(永不停息的語言學習)。基于規則學習的人工智能方法解釋性強(與人類邏輯推理過程相符),但其可拓展性較弱,難以構建完備的知識庫以及具有完善的推理方法,。
當前不斷涌現的大數據史無前例地記錄和鏈接人類社會中個體和群體,刻畫個體和群體生活、生產復雜模式或規律的知識隱藏在這些大數據本身之中,難以事先定義。因此,數據驅動的人工智能方法成為熱點,這一方法利用機器學習等手段直接從數據中直接析取深層次知識(而不是事先定義)。如谷歌公司利用網絡搜索引擎得到的大數據來預測疾病流行、百度公司利用手機APP數據和商業信息來預測“鬼城”等等。
目前,深度學習已經成為數據驅動學習方法的一種主流技術,深度學習是一種端到端(end-end)的機器學習方法,其基本動機在于構建多層網絡來學習隱含在數據內部的關系,從而使學習得到的特征具有更強、更泛化的表達能力。在大規模數據上所進行的實驗表明,通過深度學習所得到的特征表示在自然語言處理、知識圖譜構建、圖像分類、語音識別和視頻識別等領域表現了良好性能。但是,深度學習這種“端到端”學習機制解釋性較弱,并且其依賴于標注大數據,難以利用未標注數據,這是深度學習下一步要攻克的“黑洞”難題。
人類在學習過程中還存在另外一種學習方式,即問題引導下的試錯學習。在這種學習方法中,我們事先不知道最終答案,于是在學習過程中不斷嘗試各種解決問題的可能途徑,然后根據結果反饋來相應調整學習方法,這一學習機制叫強化學習。強化學習是一種學習的能力,從過去的經驗中不斷學習,提升能力。如Deepmind公司研制的圍棋人工智能AlphaGo就是在自我博弈中不斷提升棋力、卡耐基梅隆大學研制的德州撲克人工智能Libratus在與人類選手對弈中不斷提高牌技。
規則學習是通過邏輯推理引擎來學習新知識,數據驅動是基于假設空間和先驗來學習潛在模式,能力增強是通過問題引導來學習策略,這三種人工智能形成了從知識到數據、從數據到能力的三部曲。這三種方法各有優劣,目前正在走向相互融合的過程,如AlphaGo身上凝聚著蒙特卡洛樹搜索,深度學習和強化學習就是一次將傳統規則學習方法、數據驅動模式和能力提升手段相互結合的一種嘗試。
當前,人工智能正成為提升國家競爭力、維護國家安全的戰略利器,成為社會經濟發展的新引擎,世界主要國家紛紛出臺規劃和政策,圍繞核心技術、頂尖人才和標準規范等展開激烈爭奪,力圖在新一輪國家競技場中搶占主導權,如美國決定在國家科學技術委員會中設立“人工智能和機器學習委員會”來協調指導全美各界在人工智能領域的行動。
為了推動人工智能與經濟社會深度融合、提升我國人工智能科技創新能力,中國政府正布局2030年的一項中國人工智能2.0重大科技項目。
中國工程院原常務副院長潘云鶴院士2016年12月在中國工程院院刊《Engineering》發表了題為“Heading toward artificial intelligence 2.0”的論文,從人工智能60年的發展歷史出發,通過分析促成人工智能2.0形成的外部環境與目標的轉變,提出了人工智能2.0的核心理念,并結合中國發展的社會需求與信息環境特色,給出了發展人工智能2.0的建議。潘云鶴院士指出,人工智能2.0將著眼于人工智能從1.0到2.0的如下五個方面的躍變:從人工知識表達技術到大數據驅動知識學習;從處理類型單一的數據到跨媒體認知、學習和推理;從追求“機器智能”到邁向人機混合的增強智能;從聚焦研究“個體智能”到基于互聯網絡的群體智能;從機器人到自主無人系統的跨越。
杭州市目前是人工智能產業應用的高地,如阿里巴巴電商大數據的智能服務、海康威視2016年在智能安防躍居全球榜單。我們相信,在人工智能2.0這一背景下,杭州市將迎來更加美好的智能社會。
從我國古代的偃師造人、木牛流馬到希臘神話中赫菲斯托斯的黃金機器女仆,人類從未放棄過對人工智能的追求與探索。站在當前背景下進行歷史回顧與未來展望,我們認為可解釋、更魯棒和更通用的人工智能是今后重要發展方向,其表現為:從淺層計算到深度神經推理;從單純依賴于數據驅動的模型到數據驅動與知識引導相結合學習;從領域任務驅動智能到更為通用條件下的強人工智能(從經驗中學習)。
我們深信,下一代人工智能(AI 2.0)將改變計算本身,它會將大數據轉變為知識以支持人類作出更好決策。
(作者系浙江大學計算機學院副院長、浙江大學人工智能研究所所長,博士生導師。主要研究領域為人工智能、跨媒體計算、多媒體分析與檢索和統計學習理論。)
