999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

阿爾法狗與人工智能

2017-04-06 21:44:10劉宗凡
中國信息技術教育 2017年5期
關鍵詞:深度學習

劉宗凡

圖靈與人工智能

談到人工智能,我們就不得不提起計算機先驅——圖靈。艾倫·麥席森·圖靈(Alan Mathison Turing,1912—1954),英國數學家、邏輯學家,被稱為計算機之父、人工智能之父。

圖靈在1950年發表了一篇論文《計算機器與智能》,提出了著名的“圖靈測試”,指出如果第三者無法辨別人類與人工智能機器反應的差別,則可以論斷該機器具備人工智能。后來人們根據圖靈的描述,將圖靈測試具體化了:測試者在與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進行多次測試后,如果有超過30%的測試者不能確定出被測試者是人還是機器,則這臺機器被認為具有人類智能。

在圖靈提出這個構想以后,不斷有科學家試圖挑戰,但眾所周知,圖靈提出的人工智能,是具備了人類思維方式的,要挑戰的難度可想而知。圖靈測試沒有規定問題的范圍,如果某臺機器能夠通過測試,則其必須存儲人類所有可能想到的問題及合適的回答,還需要理智地做出選擇。

2014年,英國雷丁大學宣稱人工智能軟件尤金·古斯特曼(Eugene Goostman)通過了圖靈測試。尤金·古斯特曼是由Vladimir Veselov(現居美國)開發的智能軟件,模仿的是一位13歲的男孩,尤金設法讓測試人相信被測試者33%的答復為人類所為,這意味著這臺超級計算機通過了圖靈測試。

當然,圖靈測試中所謂的30%,是當時圖靈對2000年時機器的一個預測,并且雷丁大學宣稱尤金讓測試人相信33%的答復為人類所為,和圖靈所稱的30%以上的人完全分辨不出來對方是人類還是機器,其實差別是非常大的:雷丁大學進行的測試,只不過是測試人員相信其33%的答復為人類所為,換句話說沒有一個人完全被機器所騙,和圖靈所稱讓30%的人完全上當,其實并不是一個標準。所以這次測試結果并沒有在科學界引起大的波瀾。

以后還會不斷有人挑戰圖靈測試,可以想象,如果真有一天有機器能通過圖靈測試,這將是人工智能的一場狂歡,是一次質的突破。

人工智能(Artificial Intelligence,AI)一詞,是1956年于Dartmouth學會上提出的,比圖靈提出圖靈測試的時間遲,至今也沒有一個統一的定義。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能包含非常多的學科和領域,如機器學習、計算機視覺、語言識別、自然語言理解、控制系統、仿真系統等,并且仍在不斷擴展之中。總的說來,人工智能的目的就是讓計算機能夠像人一樣思考。

現在我們普遍把人工智能分成三個層次:①弱人工智能Artificial Narrow Intelligence(ANI)。弱人工智能是擅長于單個方面的人工智能。比如能戰勝象棋世界冠軍的人工智能,但是它只會下象棋,回答不了其他任何方面的問題。目前我們的人工智能研究,可以說還停留在弱工人智能的起步階段,只有去年在圍棋大戰中戰勝李世石的“阿爾法狗”,堪稱弱人工智能里程碑式的突破。②強人工智能Artificial General Intelligence(AGI)。人類級別的人工智能。強人工智能是指在各方面都能和人類比肩的人工智能,人類能干的腦力活它都能干。Linda Gottfredson教授把智能定義為“一種寬泛的心理能力,能夠進行思考、計劃、解決問題、抽象思維、理解復雜理念、快速學習和從經驗中學習等操作”。③超人工智能Artificial Super Intelligence(ASI)。牛津哲學家、知名人工智能思想家Nick Bostrom把它定義為“在幾乎所有領域都比最聰明的人類大腦還聰明很多,包括科學創新、通識和社交技能”。

圍棋與“阿爾法狗”

棋牌類運動是人類智慧的結晶,人們把戰場的金戈鐵馬、自然的山川丘壑、人生的酸甜苦辣等都融入其中,在方寸之間殫精竭慮、斗智斗勇。棋牌體現出無窮的魅力,國際象棋和圍棋是其中的佼佼者,深得人們喜愛。

把時鐘撥回到二十年前的1997年5月,國際象棋屆發生了一件轟動一時的大事:國際象棋世界冠軍、人類有史以來最頂尖的棋手卡斯帕羅夫和IBM公司的超級電腦“深藍”進行了6盤對弈,最終以2.5:3.5的比分告負,這標志著計算機在智力領域正式對人類吹響了挑戰的號角。

深藍是一臺超級計算機,在當年的超級電腦中排名259位,每秒鐘可以運行113.8億次浮點運算,可以計算出2億步棋(當然,在現在動輒每秒億億次浮點運算的超級計算機面前,深藍的計算速度已經不值一曬)。IBM公司將100多年來所有國際象棋特級大師的開局和殘局的下法輸入電腦,共有約200萬局。比賽時每場對局結束后,IBM深藍小組都會根據卡斯帕羅夫的情況相應地修改特定的參數,深藍雖不會思考,但這些工作實際上起到了強迫它學習的作用,這也是卡斯帕羅夫始終無法找到一個對付深藍的有效辦法的主要原因。

從現在的發展來看,深藍之所以能戰勝人類最頂尖高手,主要是依靠它無窮無盡的計算能力。冷酷無情的機器,只要抓住人類下法中的一個失誤,就可以將人類打敗。但是,它的最大的一個缺陷就是不會“思考”,所以只能說它是一個集人類國際象棋經驗大成的一位“智者”。在卡斯帕羅夫以后,人類還和電腦進行了多次較量,雖然電腦勝多負少,但也不是說它是不可戰勝的。因為雖然國際象棋每走一步后對手能走的方案是有限的,但要算盡所有可能,目前也是不可能的。如果從人工智能的角度來說,深藍還處于“暴力”搜索的初級階段。

雖然計算機早早就戰勝了國際象棋的頂尖高手,但在圍棋方面,人工智能卻遲遲無法取得突破。雖然圍棋在全球普及程度遠不如國際象棋,但作為中國四大藝術“棋琴書畫”之一,它在中、日、韓等國深受人們喜愛。圍棋是我國的傳統棋種,它的發明可以追溯到堯舜以棋教子的傳說。圍棋在春秋戰國時期就廣為傳播,歷史悠久,源遠流長,歷朝歷代都涌現出許多才華蓋世的棋手,留下了許多膾炙人口的棋壇佳話。

和國際象棋相比較,圍棋規則非常簡潔,棋盤上縱橫十九道,三百六十一個交叉點,只有沒“氣”的點不允許落子,此外可以說沒有任何禁忌。從理論上來說,一手棋后,對方的應對,可以有三百余種可能。雙方交替落子,這意味著圍棋總共可能有10^171(10的171次方)種可能性。這個數字到底有多大,你可能沒有感覺。按通行的說法,宇宙中的原子總數是10^80(10的80次方),即使窮盡整個宇宙的物質也不能存下圍棋的所有可能性。所以中國歷來就有“千古不同局”的說法。將國際象棋和圍棋的復雜性相比較,可以說它們是一滴水和大海的關系。正因為如此,計算機技術在圍棋領域一直沒有什么突破。

2016年3月9日開始,谷歌旗下DeepMind團隊開發的阿爾法狗(AlphaGo)程序和韓國頂尖棋手之一的李世石(李世乭)進行了一次五番棋對決,結果震驚全球:阿爾法狗以4:1的絕對優勢擊敗了集十四個國際冠軍頭銜于一身的人類代表!

這是一個令絕大多數人目瞪口呆的結果。如果按照深藍的思路和圍棋的復雜程度,這個結果確實有些不可思議。我們可以簡單地說,阿爾法狗令人震驚的地方,是它不是利用計算機超快的速度來窮舉各種可能,而是它具備了“思考”的能力!它不是亦步亦趨地將以往棋手的經驗集中起來對付人類,而是具有自己的圍棋觀點和思路。在棋戰中阿爾法狗下出了很多人類不能理解的招數,開始的時候被職業棋手評論為錯招、臭棋,但最后證明這只不過這些職業棋手無法理解的招數,也就是說,阿爾法狗已經有了“創新”的能力。不僅是程序作者不理解它的下法,連最強的職業棋手也無法理解。阿爾法狗顛覆了職業棋手的圍棋觀,讓幾千年來的圍棋理論出現了動搖。

由于圍棋的變化太過復雜與多樣,于是,人們認為,在可以預見的時間里,人工智能可以在所有智力游戲中戰勝人類。阿爾法狗的橫空出世,橫掃了人類高手,展示了人工智能取得的突破性進展。阿爾法狗的這次勝利,無疑將會載入人工智能發展的史冊。

深度神經網絡與蒙特卡洛樹搜索

我們在驚嘆于阿爾法狗的所向無敵之余,會禁不住思考,到底是什么造就了它如此的輝煌?

對于人工智能來說,圍棋因其巨大的搜索空間、評估棋局和評估落子地點的難度而被認為是最具有挑戰性的經典博弈游戲。我們給電腦圍棋程序引入一種新的方法,這個方法使用估值網絡來評估棋局,以及使用策略網絡來選擇如何落子。這些深度神經網絡被一種新的組合來訓練:使用了人類專業比賽數據的監督學習,以及自我對弈的強化學習。沒有使用任何預測搜索的方法,神經網絡下圍棋達到了最先進的蒙特卡洛樹搜索程序的水準,該這程序模擬了數以千計的自我對弈的隨機博弈。我們同時也引入了一種新的搜索算法,該算法把蒙特卡洛模擬和估值、策略網絡結合在一起。(谷歌研究人員發表于《自然》雜志的論文Mastering the game of Go with deep neural networks and tree search的摘要)

從論文中我們可以看出幾個關鍵詞,即神經網絡、深度學習、蒙特卡洛樹搜索。

1.神經網絡

神經網絡作為一個計算模型的理論,最初是由科學家Warren McCulloch和Walter Pitts在1943年提出來的。康內爾大學教授Frank Rosenblatt于1957年提出的“感知器”(Perceptron),是第一個用算法來精確定義神經網絡、第一個具有自組織自學習能力的數學模型,是日后許多新的神經網絡模型的始祖。Rosenblatt樂觀地預測,感知器最終可以“學習、做決定、翻譯語言”。神經網絡沒有一個嚴格的正式定義,它的基本特點是試圖模仿大腦的神經元之間傳遞,處理信息的模式(如下頁圖)。

一個計算模型要劃分為神經網絡,通常需要大量彼此連接的節點(也稱“神經元”),并且具備兩個特性:①每個神經元,通過某種特定的輸出函數(也叫激勵函數activation function),計算處理來自其他相鄰神經元的加權輸入值。②神經元之間的信息傳遞的強度,用所謂加權值來定義,算法會不斷自我學習,調整這個加權值。在此基礎上,神經網絡的計算模型依靠大量的數據來訓練。

神經網絡算法模擬生物神經網絡,是一類模式匹配算法。通常用于解決分類和回歸問題。人工神經網絡是機器學習的一個龐大的分支,有幾百種不同的算法。而深度學習就是其中的一類算法。

2.深度學習

深度學習算法是對人工神經網絡的發展。在計算能力變得日益廉價的今天,深度學習試圖建立大得多也復雜得多的神經網絡。很多深度學習的算法是半監督式學習算法,用來處理存在少量未標識數據的大數據集。常見的深度學習算法包括受限波爾茲曼機(Restricted Boltzmann Machine,RBN)、Deep Belief Networks(DBN)、卷積網絡(Convolutional Network)、堆棧式自動編碼器(Stacked Auto-encoders)。

監督式學習:在監督式學習下,輸入數據被稱為“訓練數據”,每組訓練數據都有一個明確的標識或結果。在建立預測模型的時候,監督式學習會構建一個學習過程,將預測結果與“訓練數據”的實際結果進行比較,并不斷調整預測模型,直到模型的預測結果達到一個預期的準確率。阿爾法狗在早期輸入了大量人類高手對局的棋譜,用KGS圍棋服務器的3000萬個棋局,訓練了13層的策略網絡。在輸入留存測試數據的所受特征時,這個網絡預測人類專家下棋的精準率達到了57%。

非監督式學習:在非監督式學習中,數據并不被特別標識,學習模型是為了推斷出數據的一些內在結構。阿爾法狗借助現在無窮的計算機能力,不斷進行自我對弈,在海量的對局中,提高對局勢的判斷能力,這就是非監督式學習。

半監督式學習:在此學習方式下,輸入數據部分被標識,部分沒有被標識,這種學習模型可以用來進行預測,但是模型首先需要學習數據的內在結構,以便用合理的組織數據來進行預測。

3.搜索與蒙特卡洛樹搜索

計算機最大的優勢在于計算能力,而搜索的本質是窮舉——列出每一種可能出現的情況,所以計算機能戰無不勝了。

搜索在實現時的最普遍方法有兩種:一種是深度優先搜索,另一種是廣度優先搜索。以“走迷宮”為例,深度優先就是按照規則一直往前走,直到無路可走時往回走,再按照規則往前走,這種方法一定可以找到出口或證明沒有出口。無路可走時往回走,這種方法也叫回溯法。在玩游戲《仙劍奇俠傳》時,面對復雜的迷宮,我們有一種笨辦法,從起點往前走,如果有分叉就選左邊的路走,走到路的盡頭就往回走,再在分叉的路口選左邊的路走(已經走過的路在意識中將它刪除),用這種方法一定可以走出迷宮。這種方法就是深度優先搜索。

與深度優先搜索不同,廣度優先搜索是站在某個路口,先試探所有可以走一步的路,看有沒有哪個路口到達了出口。如果沒有,則把所有相鄰路口記下來,按某種規則搜索這些路口所有相鄰的路口,直到到達出口。廣度優先搜索找到的第一個出口是最近的出口,但搜索樹的寬度擴展太快,需要大量空間來存儲已經走過的路口。

這兩種搜索的過程,都會形成一棵搜索樹。比如下棋,有些地方是根本不允許落子的,我們花力氣去搜索是沒有意義的;有些地方明顯是敗招,也不需要去搜索。不需要搜索的路徑我們不再走,就是在搜索樹上把某些枝條去掉,我們稱為搜索剪枝。搜索剪枝能大大減少計算機的搜索量,但相對棋類運動來說,工作量還是太大。

下棋時,每個棋子代表的價值和走在不同位置的作用都不同,我們在搜索時要區別對待。我們引入一個估值函數,對下一步要走的路口進行估值,選一個最值得走的路口走,這樣就能最快走到終點,這就是A*搜索。

當然,迷宮是一個人走,下棋是兩個人下,在搜索中,人們發明了“極小化極大算法”(minmax algorithm),就是計算機在尋找下一步棋的時候,優先選擇不管對方怎么下,對我們都不會太壞的地方。我們進一步縮小搜索空間,以便計算機能在某些分支搜索得更深,而不把時間花在一看就不行的廢棋上,其中一個重要的算法叫Alpha-Beta剪枝。深藍就是主要運用了Minmax搜索和Alpha-Beta剪枝,并加上局勢評估和往前看。深藍的局勢評估考慮了棋子的重要性、每個棋子的影響范圍、王的安全系數、先手等因素。這個評估是動態的,要往前窮舉數步棋中的所有變化。據說深藍可以往前推12步,12步大概有10^ 24(10的24次方)種變化,加上剪枝和深藍強大的運算能力,是可以實現的。而人類頂尖高手大概可以推算10步,因此計算機面對人類高手基本上穩操勝券。

但圍棋的變化實在過于復雜,遠遠不是國際象棋可以比擬的。不過深藍還是帶給我們非常多的啟發,就是如何尋找一個精確的形勢評估函數。圍棋的形勢判斷非常微妙,并沒有一個比較客觀的方式。不同的職業棋手對同一步棋,可能會形成截然相反的評判意見。比如什么是勢?什么是厚?什么是薄?不同風格的棋手都會有不同看法。

那圍棋中有沒有絕對客觀的呢?只有一條,那就是最終的勝負。但要窮盡整個搜索樹,在可預見的未來那是不可能實現的。在搜索樹中,我們可能有幾個分支是導向勝利的,那我們需要把所有分支都窮盡找到最優的方法嗎?不需要的,我們可以抽樣統計其優劣。如何抽樣?當然在計算機允許的時間內越多越好。比如下在某個位置的這手棋到底好不好?我們可以在這個基礎上下一千局、一萬局乃至更多。到底多少局好?我們可以算到讀秒時間結束為止。像這樣在確定時間內完成的隨機算法,就叫做蒙特卡洛算法。深藍用過的搜索算法,現在一樣能用:只要把局面評估方法換成蒙特卡洛就行了(用模擬對局的最終勝率而不是評分值來評價當前局面的好壞),這就是所謂的“蒙特卡洛樹搜索”。

因為圍棋之樹實在太大,每個結點模擬次數多,時間不夠用,模擬次數少,答案又不精確。阿爾法狗的主體仍然是蒙特卡洛樹,但它巧妙地用了兩個深度學習模型,一個預測下一手,一個判斷形勢。預測的結果,降低了搜索寬度;而形勢判斷,則減小了搜索深度。深度學習從人類的經驗中學來了棋感與大局觀,它們使蒙特卡洛如虎添翼。

人工智能與“后圍棋時代”

2016年12月29日,一位名叫“Maser”的棋手登錄弈城網、野狐網(專業圍棋對弈網站),掀起了圍棋界的“腥風血雨”,以60連勝的戰績橫掃當前所有頂尖高手。現在我們已經知道,“Master”就是阿爾法狗的升級版本。

DeepMind公司創始人哈薩比斯此前在一次采訪中曾透露,他們的團隊正在嘗試訓練一個沒有學習過人類棋譜的人工智能,這也可能就是Master和阿爾法狗不同的原因。如果Master真的沒有學習過人類棋譜,卻有了突飛猛進的實力,那就恰恰印證了谷歌AI技術的全新突破。

如此強悍的阿爾法狗,是不是已經成了“圍棋之神”?也就是說它是不是已經對圍棋的每一步都能應對正確、永無失誤?其實,要成為“圍棋之神”,就要窮盡圍棋的每一種可能,而我們知道,圍棋的可能性是趨向無窮,目前還不能說阿爾法狗的每一步棋都是圍棋真理,只是它的每一步棋,都盡量保證必勝。

在大戰Master以后,古力說:“夜深了,心情漸漸平復,但腦海里依然浮現著這幾天的奇幻之旅——從勇士集結到一一抬走,從信心滿滿到麻木絕望。相對于恒定的Master大師,我們人類的喜怒哀樂,對未知的憧憬與探索,也許正是我們活下去的最深層的動力。阿爾法狗的出現已經徹底顛覆了我們棋手對局勢原有的掌控、判斷。那我不禁要問,多年后的某一天,當你發現自己曾經的意識、認知、抉擇都是錯誤的時候,你會一如既往地錯下去,還是否定自己,給自己重新開始的機會呢?致最好的時代or最壞的時代!”

最好的時代or最壞的時代?這就是人工智能對圍棋領域的顛覆。圍棋千百年來積淀的理論、定式等,在人工智能的幫助下,將揭開新的一頁,圍棋正式進入“后圍棋時代”。

小米總裁雷軍說:“相比以往人工智能的嘗試,阿爾法狗的表現空前地像人,又超越人。策略、直覺、意識等方面,從來都被認為是人類的專屬能力,而現在阿爾法狗的表現完全顛覆了這些過往的‘定論。過去,科技帶來的人類能力的延展基本是物理性的,遠的有紡織機代替手工作坊、汽車代替馬車,近的有GPS實現全球定位,‘通信+智能終端實現實時資訊傳輸、交互等,但眼下則是完全不同的維度。這應該是第一次進入了真正思維領域,可能將為人類帶來分析、判斷、決策思維的直接效率提升。”

日本現代圍棋史上最杰出的棋手之一藤澤秀行曾經說過,“棋道一百,我知七”。人們以前都認為這是棋圣的謙虛說法,現在我們再來看這句話,何嘗不是人類的真實寫照。在人工智能領域,我們所知的也許還不到百分之七,但阿爾法狗引領的這次人工智能的突破,將如旭日東升,噴薄而出,開啟一個新的時代。

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 国产色伊人| 精品国产乱码久久久久久一区二区| 国产三区二区| 国产成人精品午夜视频'| а∨天堂一区中文字幕| 国产网站一区二区三区| 亚洲欧美另类中文字幕| 久久精品人人做人人综合试看| 香蕉在线视频网站| 热这里只有精品国产热门精品| 男人天堂亚洲天堂| 久爱午夜精品免费视频| 欧美亚洲另类在线观看| 自拍偷拍一区| 国产jizz| 国产伦片中文免费观看| 亚洲精品动漫| 国产91在线|日本| 国产乱人视频免费观看| 蜜桃视频一区二区三区| 91久久国产综合精品女同我| 亚洲另类国产欧美一区二区| 欧美a在线视频| 三上悠亚精品二区在线观看| 国产成人啪视频一区二区三区| 久久这里只有精品66| 亚洲无码精彩视频在线观看| 亚洲av无码专区久久蜜芽| 国产成人乱无码视频| 亚洲大尺码专区影院| 九色视频在线免费观看| 亚洲高清在线天堂精品| 中文字幕永久视频| 性视频久久| 欧美日韩福利| 亚洲人成在线免费观看| 国产精品福利在线观看无码卡| 女人天堂av免费| 亚洲午夜片| 日本一区二区三区精品国产| 亚洲第一成年免费网站| 国产福利拍拍拍| 青青国产在线| 亚洲视频免| 欧美专区日韩专区| 一级毛片在线播放| 欧美精品二区| 成人免费午夜视频| 日韩无码视频网站| 久久久精品无码一区二区三区| 欧美在线综合视频| 一本一道波多野结衣一区二区 | 亚洲一区无码在线| 2021国产乱人伦在线播放| 亚洲第一香蕉视频| 国产精品林美惠子在线观看| 久久精品嫩草研究院| 亚洲一区二区约美女探花| 国产精品无码一区二区桃花视频| 久久综合久久鬼| 99久久精品美女高潮喷水| 免费高清毛片| 婷婷综合亚洲| 亚洲日本www| 午夜无码一区二区三区在线app| 欧美中文字幕无线码视频| 成人午夜福利视频| 欧美一级专区免费大片| 国产精品视频a| 狠狠综合久久久久综| 无码精品一区二区久久久| 亚州AV秘 一区二区三区| 国产极品美女在线| 九色在线视频导航91| 在线观看国产精品日本不卡网| 日韩高清无码免费| 91精选国产大片| 国产在线精品香蕉麻豆| 熟妇丰满人妻| a毛片免费观看| 亚洲色图另类| 99热最新网址|