當前人工智能的一個困境是處理“部分與整體”之間的關系。一個人工智能系統的創建需要依賴有效的算法,但往往只有將系統建立好之后,我們才能知道具體需要哪些核心算法。為了解決這個“雞和蛋”的問題,必須同時研究兩者。在這個過程大量探索可能不會有結果,但這又是不可避免的。
近日,人工智能公司開設的首個非英國研究實驗室,發表了一篇題為《為了AI研究的阿爾伯塔計劃》的文章,并提交在arXiv上。該篇文章的三位作者里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基,是Deep Mind Alberta的領導者,并都在加拿大阿爾伯塔大學擔任教授職位。
本次DeepMind Alberta將其人工智能研究方法,稱為阿爾伯塔計劃。
它主要針對未來5年~10年計算智能的基本理解問題,旨在填補目前研究的空白領域,并不關注現有方法的立即應用。
文章主要對該機構的人工智能愿景和這些愿景可能實現的方向,以及將探索的研究問題和項目進行了說明。雖然這些愿景還有著不確定性,但研究人員盡可能具體地描繪了未來的道路。
按照阿爾伯塔計劃,研究人員試圖理解和創造一個富有生命力的計算代理。該文章還提到,代理的初始設計往往盡可能簡單,且具有通用性和可擴展能力。但它們在不斷與外界交互過程中,逐漸變得復雜。

從左至右分別為里奇·薩頓、邁克爾·鮑林和帕特里克·皮拉爾斯基
為了適應世界的變化,它們必須持續學習,用一個“博學”的模式來做理解和規劃。文章中還提到:“智能是一段時間內的信號處理。”
該研究愿景的第一個特點是強調普通經驗,而不是特殊培訓集或人力干預。盡管有許多方法可以使用人為輸入和領域知識來提高人工智能的性能,但這些方法通常不能適應計算資源,因此并不是本次研究的優先事項。

第二個顯著特征可以概括為時間一致性。這意味著關于在代理上運行算法的所有時間都是相同的。時間統一問題涉及非平穩、持續的環境與學習算法。
保持所有東西在時間上的統一可以減少自由度,并縮小代理設計空間。不過,文章也提到,在某些情況下,最好是背離絕對的時間一致性。但當這樣做的時候,可能會脫離原來的研究領域。
研究愿景的第三個顯著特征體現在它對計算因素的考慮。
目前,計算機的能力雖然仍呈指數級增長,但并不會永遠持續下去。計算能力越強,有效地使用它越就顯得重要。因為這是決定代理績效的重要因素。
此外,計算方面的考慮還體現在智能代理設計的各個方面。例如,通常一個智能代理能夠對其觀察結果的變化做出快速反應是很重要的。但是,考慮到計算的限制,反應時間和決策質量之間總是存在權衡。
研究愿景的第四個顯著特點是,它包括一個聚焦環境中含有其他智能代理的特殊情況。
在這種情況下,主要代理可以學會與環境溝通、合作和競爭,并能認識到環境可能對其行為做出不同的反應。這個案例被研究為人機交互的一個子領域智能放大。
阿爾伯塔計劃將人工智能問題描述為通過持續地感知和行動、有限的計算,在其他代理存在的情況下,在線最大化獎勵。這種描述可能看起來很合理,但它與當前的實踐相反。
現實中,通常集中于離線學習、準備好的訓練集、人工輔助和無限計算。所以以上研究愿景既是經典的,也是逆向的,甚至是激進的。
本次提到的研究計劃更多是為了就現有的工作達成共識,從而能進行更有效地溝通和合作。

值得一提的是,研究團隊主要圍繞基礎代理進行設計,其本身是基于“智能代理的通用模型”,該模型也被認為是人工智能、神經科學等多領域的共同模型。如上圖所示。
基本代理有4個主要的內部組件,分別是“感知、反應性策略、過渡模型和價值函數”。它們也由感知組件構造的狀態信號相互連接。所有四個組件都是通過在前臺運行的學習過程來做更新。
最后,文章中還描述了人工智能原型的路線圖,總共涉及12個步驟。從開發核心能力(表示、預測、規劃和控制)的新算法,到將這些算法結合起來,為連續的、基于模型的人工智能生成完整的原型系統。
對計算智能的理解,或會影響到社會每一個角落,包括每個人的生活。盡管它有被濫用的可能性,但其存在總體上將對世界有利。
研究團隊還在文章中表示,阿爾伯塔計劃具有臨時、草稿性質,未來或會繼續完善編輯它們。特別是最后的步驟還不夠具體,隨著不斷地研究,該部分會取得更多進展。同時,他們也正在考慮關于智能放大和機器人技術的研究。