吳向東
最近,谷歌的阿爾法狗(AlphaGo)戰勝了人類頂尖圍棋九段李世乭,真是讓人堵心!一些人工智能專家們借此大談特談“奇點來臨”,即在不久的將來,人工智能將會把人類智能甩下十幾條街,快速進入機器人大行其道的后人類智能時代,這是不是相當驚悚?更讓人堵心的是,一直享受著空谷幽蘭般隱居生活的老友相當應景地發來了憂郁的詩句:“我悲劇的性格被你強化/請回過頭來 聽我說/我將在奔流的鮮血中/等你擦肩而過”。人類的悲劇,難道就是拼命發展人工智能,然后讓它擦肩而過——把人類的身軀和文明交由機器主宰?
回想1997年深藍戰勝國際象棋大師卡斯帕羅夫時,我沒有如此驚悚過,因為深藍就如我們應試教育下訓練出來的解題機器,它是用暴力算法( brute-force)應對人類智能。
為什么這樣說呢?深藍的數據庫雖然存儲了一百多年來優秀棋手的兩百多萬對局,足以應付一般的棋手,但遇到庫中沒有的走法,就只能依賴暴力計算。這種死腦筋機器,在1996年挑戰卡斯帕羅夫時落敗。于是在1997年,深藍運算速度提升了2倍,運算能力為每秒113.8億次浮點運算,在當時的超級電腦中排名第259位。另外,深藍在強大的32顆CPU之外又另加了480顆特別制造的超大規模集成電路國際象棋芯片,使得1997年的深藍可搜尋及估計12步棋,而人類國際象棋高手大約只可估計10步棋。也就是說,深藍就是為應付“考試”(國際象棋)而定制的考生,除了會考試(國際象棋)外,其他的事都不會!
更為可笑的是,在對局時,還有一些國際象棋高手和計算機專家在幕后隨時調整深藍的參數,以便在對局時有利,即為了考試成功,還有幕后團隊幫它作弊!所以,卡斯帕羅夫很不服氣,要求來年再戰,但IBM卻說,已經將深藍解體,不了了之。
花這么大的人力和金錢就是為了打造一個只會下國際象棋的呆板的“考生”,你說我會崇拜IBM的人工智能嗎?不會,IBM無非是用此噱頭多賣機器。
但這次不一樣了,谷歌的阿爾法狗接入到1202個CPU組成的網絡中,運算能力比深藍要強至少2.5萬倍,不僅有人類圍棋棋譜庫,更可以通過自身對弈來完成深度學習。對戰前,它已在人類棋譜的基礎上積累了3000萬次的自我對局訓練,以優化它比深藍更優更有效的算法。從實戰的結果來看,它的這套算法無論是在總體棋局的判斷,還是在近身博弈的策略上,都體現出相當高的水平。在以絕對優勢連勝3局之后,李世乭在第4局近身博弈時險中取勝,使得阿爾法狗表現出了莫名其妙的混亂。人類棋手似乎找到了救命稻草,紛紛認為這可能是它的死穴。但機器可以從失敗中學習來豐富大數據并優化算法,落子選擇是不會像人類那樣受到情緒的影響。認識到這一點,果然看到第5局時阿爾法狗毫無懸念地又奏凱歌,讓人類黯然神傷。
人機大戰結束,人類圍棋頂尖高手們紛紛表示要向機器學習如何下圍棋,而冷靜的人工智能專家們卻站出來給人類打氣,“蒙特卡洛樹搜索法在阿爾法狗身上異常有效,但用到其他棋類游戲就沒有這么明顯的作用了?!薄翱傮w上看,目前的人工智能產品都還處于弱人工智能階段?!痹圃?。
但無論如何,人工智能的研究已掀開了新的一頁。從學習科學領域的視角來看,有幾點值得時下的教育好好反思。
一是死記硬背的學習與抽象出策略的學習。深藍與阿爾法狗都有大量的死記硬背,人類的高水平棋譜均囊括其中為大數據。但不同的是,深藍的算法更死腦筋,遇到不熟悉的變式就較容易出現不知所措,且不會自學。阿爾法狗則不同,基于大數據可以抽象出策略,并可以不斷地自學,不斷地完善自己。
一次去農村初中聽課,生物老師在課堂上對關節的一個個結構進行了詳細的講解,書寫了滿滿一黑板的知識點,課堂練習時設計了大量的填空、選擇和判斷題。課后,對于這種滿堂灌我們不想多說什么,只是弱弱地問了一句:“為什么不讓學生畫關節示意圖呢?從視覺上去記憶知識點會更好。”但那位老師卻回答:“這幾年沒考過畫圖的題了!”后來我在武漢農村初中教師的培訓中詢問同樣的問題,一位年長的老師說:“那還用說,肯定不考啦!”我表示驚訝:如果學習就是窮盡海量題庫記憶其答案,那么與深藍死腦筋的暴力算法又有何異?練習的本質是為了如阿爾法狗那樣抽象出策略,獲得“棋感”,鍛煉出靈活的頭腦,這樣才能讓學生的智能得以進步,讓他們在遇到不熟悉的變式時能靈活應對。
二是蜻蜓點水式學習與深度學習。從小學到大學,我們為學生安排了眾多的課程內容。教育部門和課程專家們編排的這張知識大網容納進去了許許多多的知識點,猶如一個龐大的數據庫。一個知識點接著一個知識點的學習,我們以為學生可以記住,記住了可以使用。可惜人腦比不上深藍和阿爾法狗的存儲器,放進去的信息可以隨時檢索出來,人類大腦卻會把不常用的遺忘掉。經常聽到的聊以自慰的話是:“教育就是當你把學校里學到的東西都忘掉后剩下的東西?!比绻逃侨绱蓑唑腰c水,無異于在浪費孩子們童年和青春的大好時光,這不是犯罪嗎?
許多普遍存在的現象值得反思。為什么熟讀唐詩三百首,不會作詩只會吟?為什么學了那么多力學知識、練習了那么多力學的習題,卻不會玩機械?為什么學了C語言編程,卻寫不出小軟件?這種“為什么”可以無窮盡地問下去。學了不會用,頂多只能回憶出來,懷特海稱之為惰性知識,中國人的說法是死知識。阿爾法狗的學習就不一樣,它存儲了人類的棋譜,通過算法從中獲得策略,然后又通過無休止的自我對弈不斷調整策略,使得圍棋智能不斷精進。
深度學習的奧妙就在于通過不斷使用知識獲得靈活的智能。學了就要給學生大量的時間和機會去使用,使得陳述性知識和程序性知識統一,認知與元認知統一,理論和實踐統一。做到了這些,人類的創造力才有機會得到培育。蜻蜓點水式的學習適于20年前的機器(深藍),如果我們現在還不采取比阿爾法狗還要好的深度學習發展學生的創造力,人類將極有可能受制于機器。何去何從?我不想再拿“奇點來臨”來“驚悚”世人。
三是發展與機器協同學習、工作的能力。把機器擅長的交給機器,教育要把時間和精力專注在人類的創造力培養和美好人性的發展上。
棋類游戲是完全信息的零和博弈,參賽者可以在棋盤上看到對手的一切信息,它適合人工智能的機器。零和博弈的雙方要么贏,要么輸,是不可能合作共贏的,但人與機器不是這種關系,人與機器的協同才能使人類在未來獲得更大的解放,幾次工業革命已經證實了這種樂觀預期。但在人類大量的活動中,信息是不完全的,在此情況下,人工智能要勝過人類大腦就缺少了先天條件。為什么大數據這么熱門,無不與此有關。數據越多越充分,機器就越有優勢。人不如把大量已有的數據交付給機器,并建立豐富的傳感網絡不斷豐富大數據,讓機器去做它擅長的事。將騰挪出的時間和精力,去專注于發展人的創造力和美好人性。
在一些自然觀察活動中,傳統的做法是手繪觀察到的事物。對于科學啟蒙來說,自然觀察的重點將不在于手繪記錄,更重要的是發展學生美好的人性——熱愛生命、熱愛自然、思考自然界中的一些問題。
在一些制造活動中,傳統做法最關注的是動手。而現在好了,有了各種智能的制造機器,我們可以把重點放在用電腦去做創造性的設計上,讓機器去代替動手。
高水平的創造力和人性是現在的人工智能所不具備的,是時候全力以赴去關注了。幸好在老友發來的詩句里還有這樣幾行在喚我驚醒:“那依然艷麗至極的/是我們看不見的鮮血/它勃勃流動在脈管里/我們擁有 卻不予關注”。是的,創造力和美好人性是艷麗至極的,向內關注,發展人自身,“奇點來臨”的驚悚就讓它留在科幻里吧!
教育,到了全面反思和全新設計的時候了。