999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

會玩德州撲克的AI,為什么比AlphaGo更厲害?

2017-08-11 00:07:34金姬
新民周刊 2017年30期
關鍵詞:深度人類游戲

金姬

沒有追隨深度學習潮流的“冷撲大師”,或許在現實生活中擁有更廣闊的用武之地:金融交易、網絡安全、商業拍賣、政治談判……因為這些情景都是充滿了各種博弈的“非完美信息”游戲。

提到人機大戰,普羅大眾比較熟悉的是戰勝人類圍棋的AI“阿爾法狗”(AlphaGo)。但在人工智能(AI)界,業內人士更關注的是另一項人機大戰——德州撲克。因為在這個領域,AI系統沒有海量的棋譜可以深度學習,比賽雙方掌握的信息也不對等,這就需要AI系統利用博弈論等其他理論來進行決策。

2017年1月,美國賓州匹茲堡的大河賭場(Rivers Casino)舉行了一場德州撲克的“人機大戰”——連續20個比賽日中,一個名為“冷撲大師”(Libratus)的AI在共計12萬手的一對一無限注德撲比賽中擊敗了四名頂尖人類高手,共計領先人類團隊176萬美元籌碼。令人咋舌的是,這是“冷撲大師”第一次和人類交手。

3個月后,“冷撲大師”又在中國海南戰勝了6位頂尖華人撲克選手。此次比賽發起人、人工智能工程院院長李開復賽后如此評價道:“如果AlphaGo是超級IQ天才,那么‘冷撲大師就是超級EQ天才。”

7月下旬,“冷撲大師”的開發者、美國卡內基梅隆大學(CMU)計算機教授托馬斯·桑德霍姆(Tuomas Sandholm)再次來到中國,在“2017鈦媒體-杉數科技AI大師圓桌會”現場與他的學生、清華大學計算經濟學研究室主任、博士生導師唐平中,上海財經大學教授、國際奧數金牌、杉數科技科學家何斯邁,上海財經大學交叉科學研究院院長、杉數科技首席科學家葛冬冬討論了商業實際場景中真正需要的AI,給大家分享了“AI賭神”的獲勝秘訣。他表示:沒有追隨深度學習潮流的“冷撲大師”,或許在現實生活中擁有更廣闊的用武之地:金融交易、網絡安全、商業拍賣、政治談判……因為這些情景都是充滿了各種博弈的“非完美信息游戲”(imperfect-info games)。

為什么要讓AI玩德撲?

“德撲AI之父”桑德霍姆用帶有芬蘭口音的英語說,之前著名的人機大戰,無論是IBM的國際象棋AI“深藍”、還是谷歌的圍棋AI“阿爾法狗”,比賽雙方獲得的信息都是一樣的,這就是“完美信息游戲”。但現實生活中這種信息完全對等的情況很少發生,而更多是“非完美信息游戲”,德州撲克就是這樣一例。也就是說,即便在一對一的情況下,比賽雙方獲得的信息是不一樣的、或者說只是部分的——雙方都不知道五張公共牌會開出怎樣的結果,也不知道對手猜測自己握有怎樣的手牌。這樣的游戲就不存在單一的最優玩法。

對于AI團隊而言,研究“非完美信息游戲”不但更富挑戰性,也更有實際運用價值。而“冷撲大師”打開了AI解決隨機事件和隱藏信息的大門。

根據《量子位》的報道,“德撲AI”的最早研發可以追溯到2014年8月,當時剛剛完成碩士學業的諾阿姆·布朗(Noam Brown)繼續留在CMU攻讀計算機科學的博士學位。當年,他就和導師桑德霍姆教授一起開發出德撲AI:Tartanian7以及后續版本Baby Tartanian8,并且連續贏得電腦撲克大賽(電腦VS電腦)的冠軍。

師生倆乘勝追擊,開始研究德撲人機大戰。兩人創造了Claudico,當時的桑德霍姆以為Claudico有五成勝算。誰知,在2015年4月美國匹茲堡的大河賭場,Claudico在兩周時間內和四位人類頂級玩家交鋒8萬手,累計輸掉73.2萬美元的籌碼。之所以選擇這個賭場,因為卡內基梅隆大學也在匹茲堡。

2017年1月11日,全新的“冷撲大師”(Libratus)卷土重來。還是四位人類對手,不過時長變為20天,累積交鋒12萬手。這次德撲AI沒給人類玩家機會,一路以碾壓的態勢完勝。

“冷撲大師”的獲勝秘籍是什么?

以往AI處理“不完美信息游戲”采用一種縮略的方法,例如將對手下注249美元近似為200美元進行簡化處理,采用這一模式的Claudico在人類面前不堪一擊。而“冷撲大師”就不同了,它會對每一手牌進行單獨的處理,根據不同的牌面制訂出不同的戰略。對它而言,249美元就是249美元,它不會像以往的AI那樣嘗試聚類,而是馬上實時計算,得出勝算最大的策略。

這種算法最大的特點,是開發者可以獲得一定程度的“確定性”。而“確定性”正是時下大熱的深度學習最缺乏的。有評論指出,深度學習有兩大局限性:一方面,深度學習的本質是機器通過分析海量數據習得一些模式,但并不是所有領域都能采集到海量數據。以自動駕駛為例,顯然通過積累海量事故經驗來習得避免事故發生是不現實的。另一方面,深度學習是一個知其然而不知其所以然的“黑匣子”,這在許多重大安全事件上并不能令人放心。自動駕駛的事故問責問題就是一例。

值得注意的是,“冷撲大師”在今年1月人機大戰之前沒有研究過人類如何打德州撲克,也沒有和人類職業玩家有過交手。在投入實戰之前,它和自己對戰了幾百萬手牌,其中有不少是帶有特定目的的殘局,真正機器和機器之間的交手,大約是幾十萬手。

更有意思的是,“詐唬”(bluff)這種看似與心理有關的人類技能,“冷撲大師”通過算法也“自學成才”。詐唬是德撲的一種經典策略——當你手中的牌面不夠大,可以通過虛張聲勢加注嚇退對手,逼對手棄牌。而計算機會根據選手過去的表現來判斷對手牌面大的概率有多少,從而做出當下的最佳策略。

在桑德霍姆看來,“冷撲大師”的這套AI系統有十分廣闊應用空間:從戰略定價到金融領域、從談判到網絡安全、從政治競選到拍賣、從醫療資源規劃到軍事領域……現在唯一的問題是,運行“冷撲大師”,需要匹茲堡超算中心的Bridges超級計算機。不過桑德姆斯研究團隊樂觀表示,算法還可以被優化,再加上計算硬件的提升,可能5年之內就能一部手機搞定一切了。

猜你喜歡
深度人類游戲
人類能否一覺到未來?
深度理解一元一次方程
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
深度觀察
深度觀察
深度觀察
數獨游戲
瘋狂的游戲
飛碟探索(2016年11期)2016-11-14 19:34:47
爆笑游戲
主站蜘蛛池模板: 91青青在线视频| 日韩乱码免费一区二区三区| 一级高清毛片免费a级高清毛片| 国产第一页屁屁影院| 日本一区中文字幕最新在线| 色哟哟国产精品一区二区| 熟妇丰满人妻| 在线另类稀缺国产呦| 国产精品一区二区国产主播| 亚洲91精品视频| 亚洲色图另类| 久久这里只有精品国产99| 91蜜芽尤物福利在线观看| 五月天久久综合| 99re免费视频| 日韩欧美中文| 玖玖精品在线| 茄子视频毛片免费观看| 婷婷亚洲最大| 亚洲国产综合精品中文第一| 美女内射视频WWW网站午夜| 色综合成人| 免费在线观看av| 欧美另类第一页| 亚洲综合婷婷激情| 日韩精品亚洲精品第一页| 久久中文无码精品| 成人噜噜噜视频在线观看| 国产视频 第一页| 四虎免费视频网站| 亚洲手机在线| 不卡午夜视频| 国产美女在线免费观看| 中文字幕欧美日韩| 人妻出轨无码中文一区二区| 人妻精品久久久无码区色视| 91丝袜美腿高跟国产极品老师| 日本欧美一二三区色视频| 国产精品不卡片视频免费观看| 国产欧美性爱网| 夜色爽爽影院18禁妓女影院| 高清无码一本到东京热| 亚洲欧美天堂网| 亚洲热线99精品视频| 9久久伊人精品综合| 中文字幕亚洲另类天堂| 国产欧美日韩综合一区在线播放| 一本大道香蕉高清久久| 国产一区二区在线视频观看| 久996视频精品免费观看| 国产玖玖玖精品视频| 91人人妻人人做人人爽男同| 日韩福利视频导航| 亚洲精品欧美重口| 国产中文在线亚洲精品官网| 日本黄色不卡视频| 在线五月婷婷| 国产精品自拍合集| 无码啪啪精品天堂浪潮av| 免费看一级毛片波多结衣| 亚洲国产综合第一精品小说| 国产大片喷水在线在线视频| 狠狠干综合| 亚洲伊人天堂| 国产亚洲男人的天堂在线观看| 亚洲欧美日韩中文字幕一区二区三区| 天天干天天色综合网| 久久免费视频播放| 日韩人妻少妇一区二区| 中文字幕乱码二三区免费| 蜜芽国产尤物av尤物在线看| 伦精品一区二区三区视频| 亚洲乱强伦| 伊人久久影视| 91亚洲视频下载| 国产免费自拍视频| 毛片免费观看视频| 狠狠色丁香婷婷综合| 亚洲精品自产拍在线观看APP| 亚洲区第一页| 四虎永久在线精品国产免费 | 欧洲极品无码一区二区三区|