周吉帆 徐昊骙 唐 寧 史博皓 趙 陽 高 濤 沈模衛*
(浙江大學心理與行為科學系,杭州 310028)
?
“強認知”的心理學研究:來自AlphaGo的啟示*
周吉帆徐昊骙唐寧史博皓趙陽高濤**沈模衛***
(浙江大學心理與行為科學系,杭州 310028)
本文從AlphaGo戰勝李世石的熱議話題出發,簡要介紹了AlphaGo的算法,通過比較和分析當前先進人工智能技術與人類智能的特點,就當前人工智能迅猛發展背景下心理學的研究取向進行了探討。筆者認為,心理學研究應重視計算科學這一理論基礎與工具,從計算理論取向探討核心認知問題,重點關注人類所擅長的,而人工智能尚無法解決的計算難題。這一研究取向對進一步推動心理學從定性到定量,從現象到理論的發展具有重要意義。同時該研究取向下所獲的研究成果也能在與人工智能、機器學習及神經科學等多學科交叉中,體現出獨特的價值。我們將這一類聚焦于“人類智能優越特質”的心理學研究,命名為“強認知”研究。
強認知人工智能認知心理學AlphaGo計算理論
谷歌(Google)公司研發的圍棋程序AlphaGo近期與人類圍棋冠軍李世石的對戰轟動了全世界。李世石作為人類圍棋界最高水平的代表,竟然以1∶4的結果慘敗于一臺冰冷的機器。這一結果使無數專業人士和非專業人士感到震驚、迷茫甚至憤怒,人類脆弱的自尊受到嚴峻挑戰。其實2015年10月,AlphaGo就曾以5∶0完勝歐洲圍棋冠軍樊麾,只不過當時人們尚存僥幸,認為有種種理由可以解釋該結果:樊麾在對弈中并未發揮其應有水準;樊麾并不能代表人類圍棋界的最高水平;樊麾可能由于種種原因有意輸掉了比賽。然而,當此次大戰落幕后,再也無人質疑AlphaGo的棋力,一致承認其具有超一流圍棋棋手的水平。于是在最新世界圍棋排行榜上出現了一個沒有性別、沒有國籍的非人類名字——AlphaGo,排名世界第二,僅次于柯潔。
這場圍棋大戰引發了輿論狂潮,人們紛紛驚呼“奇點”*“奇點理論”是美國學者雷·庫茲韋爾提出的假設(Kurzweil,2005),他認為,隨著科學技術的不斷加速發展,人工智能將在不久的將來超越人類,到達一個人類無法理解的高度,并取代人類成為科技繼續發展的智能主體。來臨,認為人工智能即將超越人類智能,并脫離人類的控制,迅速改變甚至終結人類文明。也許人工智能在某些方面和某些領域終有一天會比人類更強,但這一天的來臨可能還需要幾十年,或許上千年,且需要以人類智能的深入研究為基石。作為心理學工作者,我們尚無法對人工智能的未來做出準確預測,然而更重要的是,在人工智能迅猛發展的形勢下,心理學研究的走向卻值得深思。本文從AlphaGo的實現方式和工作原理出發,著重探討人工智能技術對于心理學研究的啟示,提出了“強認知”的心理學研究取向,旨在為推進學術研究提供新思路。
AlphaGo的圍棋算法并不神秘,相關論文(Silver et al.,2016)已于今年1月發表于Nature,一些前期的技術積累(e.g.,Mnih et al.,2015)則更早見諸學術期刊。計算理論認為,棋類游戲屬動態規劃(dynamic programming)問題(Bellman,1954),其核心原理是在所有可能的行為空間中尋找最優解。Bellman(1957)提出了此類問題的理論解法,也就是人工智能領域所熟知的貝爾曼方程(Bellman equation),該方法已廣泛應用于離散時間最佳化問題的動態規劃。然而,正如貝爾曼本人所指出的,雖然他的解法理論上可行,但受到了維度的詛咒(curse of dimensionality)。一旦行為空間的維度過高(每一步可能的行為過多,或達到目標所需步數過多),將導致運算量過大,從而使解法無法實現。具體到棋類游戲上,國際象棋每手棋有35種可能的走法,完成一盤棋約需80手,共計3580種可能。1997年,IBM的深藍計算機采用手工編碼規則,通過搜索所有可能的走法,擊敗了當時的國際象棋世界冠軍。圍棋平均每手有250種走法,每盤約需150手,共計250150種可能。因此,即使在20年后的今天,電腦運算速度獲得了大幅提升,但遍歷搜索所有的行為空間也是難以實現的。
解決維度的詛咒問題必須縮小搜索空間,降低搜索的廣度和深度。許多傳統圍棋程序通過啟發式策略、學習算法等方法達到該目的。AlphaGo則結合了當今人工智能中三個本無太大交集的研究領域:強化學習(reinforcement learning)、深度學習(deep learning)、蒙特卡洛模擬(Monte-Carlo tree search),實現了高效的搜索。
強化學習是其核心思想,即個體通過感知環境狀態選擇下一步的行為,并接受環境返回的反饋,強化那些得到高獎賞的行為。針對圍棋問題,就是通過學習,使AlphaGo在輸入當前局面信息后,輸出能導致較高勝率的一手棋。基于該思想,谷歌公司工程師們設計了兩個人工神經網絡——策略網絡(policy network)和估值網絡(value network)。前者用于產生下一手棋,而后者用于評估某個局面的勝率。策略網絡采用人類棋手數據進行訓練,以學習人類下棋的策略。由于訓練人工神經網絡需要大量數據,工程師們從國際圍棋網站上選取了三千萬局對弈數據,從每局中抽取一手,共三千萬手,用以訓練策略網絡。為達到更好的訓練效果,在此之后AlphaGo用策略網絡與自己對弈,產生出新的三千萬局數據,再次用于訓練。AlphaGo由此習得了人類棋手的下棋策略,學會針對某個特定局面,大多數人如何選擇下一手的策略。僅使用策略網絡,AlphaGo已經能戰勝大多數棋手和其他圍棋程序,但面對圍棋高手仍有差距。因此工程師們加入估值網絡,用以精確計算每一種走法所產生的收益。工程師同樣采用大數據對估值網絡進行訓練,使之能根據當前局面較為準確地估計出勝率。在對弈過程中,AlphaGo采用蒙特卡洛模擬方法,針對當前局面,根據策略網絡的建議,有限制地向前模擬展開行為樹,并用估值網絡對每種走法的勝率進行估計,在展開足夠的搜索后選擇最優的下一手棋。
綜上所述,AlphaGo的致勝關鍵可簡要概括如下:采用策略網絡和蒙特卡洛模擬縮小搜索廣度和深度,同時采用估值網絡精確評估每一種走法的勝率,并將線下深度學習與在線高效搜索相結合,從而獲取圍棋問題的有效解法。這是谷歌工程師們創造性地結合了當前人工智能領域數種最先進技術的結果。
當人類在引以為傲的圍棋項目上落敗后,一個令人焦慮的問題浮出水面:人工智能是否已經(或者即將)全面超越人類智能?基于對心理學理論和AlphaGo算法的深入分析,筆者的回答是否定的。筆者認為,在相當長的一段時間內,對人類智能的心理學研究都能對人工智能的發展起積極的導向作用。
諸多原因導致人們產生了人工智能已經超越人類智能的錯覺,其中最主要的是對“智能”不全面的理解。在很多場合中,人們習慣把各種“智力游戲”當作衡量智能水平的標尺,其作用之一就是對個體的智能水平做出區分,如圍棋的段位就是這種標尺的體現。人工智能恰恰對這種從生活的豐富情景中剝離出來,且規則明確的游戲非常擅長。相反,人類(甚至包括其他動物)所共同具有的智能,由于不具備對個體的區分度,往往被當成物種存在的背景而未引起人們的關注。這類“背景智能”恰恰是人工智能最難把握的。例如,普通的3歲兒童就能通過語言、視覺與行為的整合,對我們所處的世界有了深刻的理解。這種理解難以定義,而又隨時隨地以“常識”的形式表現出來。如此內涵深刻的人類智能是當今人工智能無法實現的。然而,挖掘和洞察“3歲兒童”的超越人工智能之長,對心理學工作者而言,不僅需要系統、扎實的心理學訓練,而且需要“從平凡中見偉大”的視角。
通過系統比較AlphaGo與人類的特點,筆者認為,此次圍棋大戰在展現人工智能快速進步的同時,也凸顯了人類智能在諸多方面的優越性。強大的人工智能就像一塊試金石,可以使心理學工作者更清晰地捕捉到人類智能的偉大之處。與AlphaGo相對照,筆者將心理學研究值得關注的人類智能優勢從如下角度加以歸納。
3.1學習量與計算量
由前述可見,AlphaGo從三千萬局人類對弈棋譜中采集數據進行學習,隨后又加入了自己與自己對弈產生的三千萬局。可見,其棋藝是通過千萬級的學習和訓練量達到的。這是人類任何一個個體所無法企及的,即使專業棋手如李世石,一輩子又能研讀多少局棋譜?此外,硬件上AlphaGo采用分布式計算技術,由幾十到上千個CPU和GPU支撐其運算,使其可以達到2μs一步棋的計算速度,保證其在實戰中能完成足夠深度的蒙特卡洛模擬。換言之,AlphaGo在以每秒一百萬手棋的速度思考棋局。然而,實戰中的李世石每秒能做多少手精算?跟AlphaGo相比恐怕望塵莫及。因此,要達到AlphaGo的訓練水平和計算速度,人類棋手大約需要活上好幾萬年,并將大腦容量增加幾十萬倍。然而,李世石竟然與AlphaGo的棋力相去不遠——畢竟還贏了一局。更何況這是谷歌公司集合了當今世界最優秀算法和最先進計算硬件才得以實現的智能系統。因此就這次人機對戰而言,應該是人類的而非人工智能的奇跡。AlphaGo向人們展現了當今人工智能解決計算問題的復雜性與難度,而李世石卻展現了人類自身計算系統的優越性。那么,人類是怎樣在如此之少學習樣本的條件下,習得如此之高效的下棋策略的呢?這恰恰是值得心理學著重探討的問題。由此可見,對人類智能的心理學研究,在相當長的一段時間內,仍將指引人工智能的發展方向。
3.2信息不確定性
AlphaGo所面對的圍棋問題,屬完全信息(perfect information)問題,即解決該問題所需的信息都是已知的。具體到AlphaGo所采用的強化算法,該算法所需的狀態信息(即當前局面)、所能采取的行動(下一手棋)以及行動所能獲得的獎賞(落子之后根據圍棋規則所能獲得的收益)都是可以獲知的。一旦上述信息存在缺失,該算法將無法有效運作,即使采用某些彌補措施,其計算效能也將大打折扣。目前谷歌公司DeepMind項目所解決的問題,都屬于完全信息問題,如圍棋(Silver et al.,2016)和簡單電子游戲(e.g.,Mnih et al.,2015)。他們計劃挑戰的下一個目標,就是與人類對戰“星際爭霸”,該游戲中戰爭迷霧的設置使信息并非完全可見(知識核,2016)。這表明,處理不確定性,哪怕是電腦游戲這種被人視為“小兒科的把戲”,都是當今人工智能的難點。
人類所面臨的環境,恰恰充滿了不確定性,我們不確定一扇門打開后有什么,不確定紅綠燈什么時候會變色,更不確定明天股市的漲跌。然而人們在這個不確定的世界中生活游刃有余,并沒有太多的無所適從。以至于很多人無法理解,為什么在谷歌的工程師看來“星際爭霸”居然是比圍棋更困難的游戲。因此對不確定性的處理是人工智能領域一大難點問題,同時也是反映人類智能更為優越的重要方面,從而更是心理學應關注的重要課題。
3.3視覺
谷歌公司選擇圍棋作為突破口,部分原因是因為圍棋中所涉及的視覺處理比較簡單。機器視覺是人工智能領域的傳統難題,很多解決方法的實現采用了繞開視覺的策略。例如在無人駕駛領域,目前對環境的感知主要是通過雷達和各類傳感器獲取周圍空間信息的方式加以實現的,由此避開了從二維視覺圖像還原三維空間的棘手問題,而依靠視網膜投影圖像認知三維空間正是人類感知空間環境的主要途徑。目前卷積網絡(convolutional network)技術的發展很大程度上提升了機器圖像處理的能力,使谷歌團隊可以完成對圍棋棋局和簡單電子游戲畫面中視覺特征的抽取和計算,從而實現從前端視覺到后端行為的完整人工智能系統。然而面對更復雜的視覺場景,現有的圖像工程技術仍然力不從心。
大多數人并未意識到視覺的計算難度,不是因為視覺問題本身簡單,而是因為人類擁有一套強大的視覺系統,使我們在睜眼的一瞬間就能毫不費力地感知并理解了自己所處的空間環境。僅從數據量上比較,AlphaGo一局對弈中僅需處理幾百張(一手棋一張圖)棋盤大小的圖像(分辨率19×19就夠用),而人類日常生活中需每秒處理多幀高清圖像,二者遠遠不在同一個數量級上。而且人類可以輕易識別物體,并“看到”事物間的關系,例如看見書桌旁有個“被壓扁了”的易拉罐。對這類從圖像中抽取語義信息的任務,當前人工智能尚無高效、普適的解決方案。因此,對人類視覺及其機制的深入研究將為此類計算問題提供有效的解決思路,從而推動人工智能系統的跨越式發展。
3.4知識驅動的內部模擬
雖然AlphaGo的策略網絡和估值網絡是通過人工神經網絡技術加以實現的,其中并不包含有關圍棋的顯性知識。然而,其對弈中的關鍵算法之一——蒙特卡洛模擬,卻是按照圍棋的規則,在內部模擬比賽的進程。因此一個與外界動態交互的系統,需要有關于外部世界的知識和模型,并基于此模擬事件發展,以對未來進行預測,從而決定當前行為。在圍棋世界中,知識相對簡單,也即幾條圍棋規則的集合。而對于復雜度稍高的問題,例如前述的“星際爭霸”游戲,解決方法就變得難度陡增。且不說如何實現一個可以學會游戲規則的算法,即使將“星際爭霸”的游戲引擎原封不動地“教”給人工智能系統,它也不可能達到AlphaGo下圍棋時的速度,則蒙特卡洛模擬無法有效進行。
在人工智能面臨上述難題時,許多相應的心理學課題就顯得尤為重要。例如人是如何在上物理課之前就擁有了關于這個世界的樸素物理常識;如何形成關于他人內心活動的心理模型(即心理理論,theory of mind);兒童需要哪些核心知識(core knowledge)才能完成對常識的學習等等。這些對“他人”及“環境”的樸素知識和模型,可以讓人基于此對事物的發展進行快速模擬和預測。有關人類常識問題的解決,可以為人工智能技術帶來革命性的進展。
由上述分析可見,從人工智能的視角去看待問題,有助于充分理解人類智能的優越所在。這不僅讓我們能辨析哪些方向的心理學研究對當前科技的發展會有所促進,更重要的是,作為檢視心理學的一面鏡子,人工智能讓心理學工作者把握計算問題的關鍵和難點所在,從而明確探究心理機制的著力點。在技術迅猛發展的背景下,人工智能無法匹敵的能力,往往也正反映了人類心智的精華。我們將這一精華定義為“強認知”。
筆者認為,心理學研究應更積極地以“強認知”為取向。這要求心理學工作者,在正確理解計算理論的基礎上,重點關注人類在面對各種復雜計算問題時超越機器的“聰明”之處,而不是滿足于揭示人類面對各種簡單問題時所表現出的“愚蠢”(即“弱認知”)。我們并非要否定“弱認知”研究的重要性:弗洛伊德對“無意識”的揭示(Freud,1949)是現代心理學的開端;卡尼曼對人類“非理性”的研究(Kahneman & Tversky,1979)為心理學贏得了學術界的最高榮譽“諾貝爾獎”。我們所主張的重點是,任何人類智能的局限性與消極面,都應置于“人為萬物之靈”的背景下加以考慮。人類是地球40億年進化史上最為智能的物種:人類的智慧突破了感官的局限,揭示了牛頓三定律、元素周期律與進化法則等一系列科學規律;人類的智慧還讓我們的身體擺脫引力的束縛,進入太空,登上月球。因此,如果心理學的研究僅關注于人的局限,則始終無法回答這些“揭示世界運行規律”、“改變世界發展進程”的創舉是如何由人的認知活動而產生的,也注定無法對人工智能、機器學習、計算機視覺等相關學科產生積極的引領作用,進而限制了心理學的社會影響力。
更為重要的是,缺乏對計算理論的理解與把握,很可能會使心理學工作者將“強認知”誤認為“弱認知”,從而讓認知研究南轅北轍。以筆者熟悉的視知覺為例,過去30年關于人類視知覺的大量研究成果表明,人類的視覺加工資源極為有限:例如注意瞬脫(attentional blink;Shapiro,Raymond,& Arnell,1997)、變化盲(change blindness;Simons & Levin,1997)、工作記憶(working memory;Baddeley,1992)的容量限制(Cowan,2012;Luck & Vogel,2013)、多客體追蹤(multiple-object tracking;Sears & Pylyshyn,2000)的目標數量限制(Cavanagh & Alvarez,2000)。如果缺乏對“強認知”的自覺及對計算理論的理解,很容易得出人類的知覺被層層鐐銬所束縛的“弱認知”判斷。相反,如果對人工智能及計算機視覺有所了解,就會得出完全相反的“強認知”判斷。因為人類基于如此之少的計算資源,仍能近乎完美地實現對視覺場景從局部到整體、從具體事例到抽象概念的實時加工。這是任何人工智能及機器視覺系統,在耗費了大量的計算資源(無任何注意、記憶、追蹤限制,可調用大量GPU做并行計算)的條件下,都無法達成的壯舉。人類計算資源的局限必然意味著認知算法的優越。如果心理學工作者能跳出對資源限制本身的關注,而揭示其在有限資源下高效運行的計算原理,那么將對人工智能和機器視覺產生巨大的推動作用。心理學在與多學科的合作與競爭中的強勢地位也可望得以確立。
為了推動“強認知”取向的心理學研究,重新認識計算理論作為心理學理論基礎和理論工具的重要性,把握當代計算理論的最新趨勢,顯得尤為重要。筆者將與心理學密切相關的計算科學領域新近成熟的思想和技術歸納為以下幾方面:
(1)產生式計算模型。與傳統辨別式計算不同,產生式計算是一種自上而下的計算方式,與心理學中的構建概念類似。它可以實現基于少數樣本的學習(人工智能一大難題),通過幾個甚至一個樣例就可習得概念,并舉一反三產生出同類刺激。該特性與人類(尤其是兒童)的學習特點極為相似(Lake,Salakhutdinov,& Tenenbaum,2015)。因此,產生式模型在心理學領域最成功的應用體現為對兒童概念學習的建模,已有研究近乎完美地模擬了兒童由具體對象習得抽象概念的過程,并建立了概念間的層次表征(Hamlin,Ullman,Tenenbaum,Goodman,& Baker,2013;Kemp,Perfors,& Tenenbaum,2004)。
(2)以貝葉斯推理為代表的逆向推理技術。此類技術可以幫助我們實現對不確定問題的逆向求解,其核心思想是,猜測什么原因最有可能導致目前狀態的結果。該技術可用于解釋人類心理理論,即通過對個體行為的觀察,尋找最有可能產生當前觀測行為的內部因素,從而理解他人的心理狀態(Ondobaka,Kilner,& Friston,2015)。此外,貝葉斯技術在心理學其他領域,如眼跳和注意(Chikkerur,Serre,Tan,& Poggio,2010;Hoffman,Grimes,Shon,& Rao,2006;Mihali,van Opheusden,& Ma,2015)、決策(Krynski,& Tenenbaum,2007)、記憶表征(Turner,Dennis,& Van Zandt,2013)等課題的心理建模中均有成功應用。
(3)深度學習。與傳統神經網絡技術不同,深度學習將抽象問題分解為多個層次加以學習,極大地提高了神經網絡的計算效率。借助于深度學習技術,機器在圖像識別和分類(Krizhevsky,Sutskever,& Hinton,2012)、主題和語句識別(Cho,Memisevic,& Bengio,2015)等任務中均有接近于人類的出色表現。深度神經網絡學習本質上是數據驅動的辨別式模型。辨別式模型和產生式模型在績效上均有不俗的表現,但同時也存在各自的缺陷或不足。前者需要大量數據的驅動,而后者則在構建合適的產生和推論規則時存在一定困難。新近有研究指出,兩類模型可以加以結合,從而得到更優的效果(Jampani,Nowozin,Loper,& Gehler,2014)。這種結合算法有望在很大程度上逼近人類自上而下與自下而上過程協同運作的心理加工模式。
上述計算科學的新進展,使人工智能表現出人類問題解決的特征成為可能,從而拉近了人工智能與心理學的距離。這些思想和技術也可以通過認知建模應用于心理學研究,成為構建心理學理論的工具,以推動心理學的加速發展。沿著該路徑發展的心理學理論必將更利于應用,因為其理論本身即采用計算模型表達,可以很自然地與人工智能無縫對接,從而實現心理學理論研究與社會應用的高度統一。最核心的心理學理論問題恰恰能釋放出對現代產業最大的推動力量。結合最新計算科學技術的心理建模研究,可望在人工智能多個領域取得突破性進展:如跨情境的機器視覺、具有獲取規律能力的學習機、具有社交智能的社會機器人、可靈活處理復雜路況的無人駕駛。
綜上所述,借當前人工智能快速發展的東風,發展“強認知”取向的心理學,既有助于心理學在重大理論問題上取得突破,又可與高新科技領域的應用實現更緊密的結合,以促進其加速發展。
知識核.(2016,Apirl 02).為什么AlphaGo的下一個對手是星際爭霸2.[Web log post].Retrieved from http://mp.weixin.qq.com/s?__biz=MzIyMDI1MTI2NA==&mid=402457734&idx=2&sn=f37b884440306bfb79fdb8fff8fcec11
Baddeley,A.(1992).Working memory.Science,255(5044),556-559.
Bellman,R.(1954).The theory of dynamic programming(No.RAND-P-550).RAND CORP SANTA MONICA CA.
Bellman,R.(1957).Dynamic Programming Princeton University Press.Princeton,NJ.
Cavanagh,P.,& Alvarez,G.A.(2005).Tracking multiple targets with multifocal attention.TrendsinCognitiveSciences,9(7),349-354.
Chikkerur,S.,Serre,T.,Tan,C.,& Poggio,T.(2010).What and where:A bayesian inference theory of attention.VisionResearch,50(22),2233-2247.
Cho,S.J.K.,Memisevic,R.,& Bengio,Y.(2015).On using very large target vocabulary for neural machine translation.
Cowan,N.(2012).Working memory capacity.Psychology Press.
Freud,S.(1949).Abriβ der Psychoanalyse-An Outline of Psycho-Analysis.
Hamlin,J.K.,Ullman,T.,Tenenbaum,J.,Goodman,N.,& Baker,C.(2013).The mentalistic basis of core social cognition:Experiments in preverbal infants and a computational model.DevelopmentalScience,16(2),209-226.
Hoffman,M.W.,Grimes,D.B.,Shon,A.P.,& Rao,R.P.N.(2006).A probabilistic model of gaze imitation and shared attention.NeuralNetworkstheOfficialJournaloftheInternationalNeuralNetworkSociety,19(3),299-310.
Jampani,V.,Nowozin,S.,Loper,M.,& Gehler,P.V.(2014).The informed sampler:A discriminative approach to bayesian inference in generative computer vision models.arXivpreprintarXiv:1402.0859.
Kahneman,D.,& Tversky,A.(1979).Prospect theory:An analysis of decision under risk.Econometrica:JournaloftheEconometricSociety,263-291.
Kemp,C.,Perfors,A.,& Tenenbaum,J.B.(2004).Learning domain structures.InProceedingsofthe26thannualconferenceoftheCognitiveScienceSociety(pp.672-677).
Krizhevsky,A.,Sutskever,I.,& Hinton,G.E.(2012).Imagenet classification with deep convolutional neural networks.InAdvancesinneuralinformationprocessingsystems(pp.1097-1105).
Krynski,T.R.,& Tenenbaum,J.B.(2007).The role of causality in judgment under uncertainty.JournalofExperimentalPsychology:General,136(3),430-450.
Kurzweil,R.(2005).Thesingularityisnear:Whenhumanstranscendbiology.Penguin.
Lake,B.M.,Salakhutdinov,R.,& Tenenbaum,J.B.(2015).Human-level concept learning through probabilistic program induction.Science,350(6266),1332-1338.
Luck,S.J.,& Vogel,E.K.(2013).Visual working memory capacity:From psychophysics and neurobiology to individual differences.TrendsinCognitiveSciences,17(8),391-400.
Mihali,A.,van Opheusden,B.,& Ma,W.J.(2015).A Bayesian model for microsaccade detection.JournalofVision,15(12),1275-1275.
Mnih,V.,Kavukcuoglu,K.,Silver,D.,Rusu,A.A.,Veness,J.,Bellemare,M.G.,...& Petersen,S.(2015).Human-level control through deep reinforcement learning.Nature,518(7540),529-533.
Ondobaka,S.,Kilner,J.,& Friston,K.(in press).The role of interoceptive inference in theory of mind.Brain&Cognition.
Ponzo,M.(1910).Intornoadalcuneillusioninel campo dellesensazionitattilisull'illusione di Aristotele e fenomenianaloghi.ArchivfürdieGesamtePsychologie,16,307-345.
Sears,C.R.,& Pylyshyn,Z.W.(2000).Multiple object tracking and attentional processing.CanadianJournalofExperimentalPsychology/RevueCanadiennedePsychologieExperimentale,54(1),1-14.
Shapiro,K.L.,Raymond,J.E.,& Arnell,K.M.(1997).The attentional blink.TrendsinCognitiveSciences,1(8),291-296.
Silver,D.,Huang,A.,Maddison,C.J.,Guez,A.,Sifre,L.,van den Driessche,G.,...& Dieleman,S.(2016).Mastering the game of Go with deep neural networks and tree search.Nature,529(7587),484-489.
Simons,D.J.,& Levin,D.T.(1997).Change blindness.TrendsinCognitiveSciences,1(7),261-267.
Turner,B.M.,Dennis,S.,& Van Zandt,T.(2013).Likelihood-free Bayesian analysis of memory models.PsychologicalReview,120(3),667.
Abstract
Inspired by the recent event that AlphaGo defeated the human world champion—Lee SeDol on the Go games,the present article discusses the implications of fast-evolving artificial intelligence (AI) research for psychological studies,based on the comparison between human intelligence and the currently most advanced AI that AlphaGo represents.We highlight several computational problems that humans are quite capable of solving which AI could not handle,to emphasize the importance of continued efforts on the advantageous aspects (rather than the disadvantageous aspects and limits) of human intelligence in future psychological studies.We are convinced that computational sciences are essential to build theories about the core cognitive mechanisms that make humans highly intelligent.This research orientation,we assert,will facilitate the development of psychology from being qualitative to being quantitative,and from phenomena to theories.Consequently,relevant research findings will demonstrate their unique values in the context of interdisciplinary interaction with AI,machine learning and neural sciences.Here,we name such a research orientation in psychology focusing on the advantageous aspects of human intelligence as “strong-cognition”.
The “Strong-Cognition” Psychology Research:Implications of AlphaGo
ZHOU Ji-fanXU Hao-kuiTANG NingSHI Bo-haoZHAO YangGAO TaoSHEN Mo-wei
(Department of Psychology and Behavioral Science,Hangzhou 310028,China)
strong cognition,artificial intelligence,cognitive psychology,AlphaGo,theory of computation
國家自然科學基金項目(31571119,61431015)和中央高校基本科研業務費專項資金資助(2015QNA3021)。
B84-05
A
1006-6020(2016)-01-0003-09
**通信作者:高濤,男,博士,麻省理工大學博士后,E-mail:taogao@mit.edu。
***通信作者:沈模衛,男,博士,浙江大學教授,E-mail:mwshen@zju.edu.cn。