999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據庫自學習的中國象棋研究

2015-05-30 14:38:41劉霞張建剛邢勝
科技創新與應用 2015年32期
關鍵詞:數據庫

劉霞 張建剛 邢勝

摘 要:象棋軟件一般可以通過很多方法提高棋力,但最好的方法是優化數據結構、改進搜索方式,這兩種方法都有很高的博弈水平,但機器學習能力都較差。以前應用數據庫自學習的方法都存在很大的缺陷。文章通過將判斷失誤的關鍵著法和局面值存儲到數據庫中,從而使后面的象棋步驟當中相同局面時轉變策略,避免相同的失誤步驟,從而實現自學習能力。

關鍵詞:數據庫;博弈樹搜索;關鍵著法

引言

目前,象棋軟件大多數存在的問題是不具有自學習能力,以前主要應用提高數據結構和計算機運行速度的方式來改進象棋軟件的水平,而很少應用通過數據庫記錄計算機下棋過程中好的著法和局面值的方法,這種方法可以使計算機在以后相同局面時,轉變象棋軟件策略,不重復失敗的老路,實現自學習能力。

1 棋類游戲典型的自學習方法

目前,自學習能力的實現方法有很多種,最主要有兩種:一是應用加強的學習方法(包括三個方面:加強學習與神經網絡相結合、同數據庫結合以及瞬時差分TD算法);二是自適應遺傳算法,其中重點是加強學習的TD方法。

1.1 加強學習同神經網絡結合(RBP)

在計算機棋類軟件的發展過程中,機器自學習能力的發展有著成功的應用,比如Gerald Tesauro在1995年推出的西洋雙陸棋TD-Gammon。通過150萬盤比賽,最后取得世界冠軍的水平。國內也有這方面的相關研究,王一非,哈爾濱工程大學碩士,2007年在其畢業論文中詳細的說明并提出了應用RBP的缺點:神經網絡運算量太大,自學習過程時間長,收斂時間過慢。

1.2 加強學習同數據庫結合

長沙理工大學碩士付強2006年在其論文《基于激勵學習的中國象棋研究》中已經提出了將象棋軟件和數據庫結合的方法,記錄最好著法值,來提高自學習能力。經過1萬多盤比賽結果,已經下敗了傳統軟件。

1.3 瞬時差分TD 算法

早在1999年,ChrisSzeto就提出瞬時差分TD算法來優化棋類軟件。經過多次游戲實驗,將修正后的棋子子力值保存到數據庫中,比之前通過經驗與試算估計的方法更容易取得比賽的勝利,說明起到了優化作用。

2 基于數據庫自學習的原理及實現

我們對過去的方法進行改進。通過博弈樹搜索,利用數據庫記錄計算機不同的對手著法,只記錄計算機輸棋的情況,將搜索值賦給計算機存儲。當計算機在以后的比賽中遇到此局面時,做出戰略調整。從而實現象棋軟件的自學習功能。這種方法尤其在計算機輸棋時,就要向下多搜兩層,所以值會更精確,值會更小,因為博弈樹是最大最小搜索,具體解決方案如圖1所示。

對比原方法:此方案中三角代表原來的方法,整個圖代表應用數據庫后由原來第五層值變成了現在的第七層值,如此以來就多搜了兩層,所得值更小,更精確。

通過博弈樹的最大最小值搜索,所以當深色方框的值更小時,它必被上層取最小值的圓所選中,而又因為它的值小,在更上層取最大值時會被舍去,所以不會運行最左邊的方案,從而轉變策略,實現了象棋軟件的自學習能力。實驗中整盤棋會有很多種局面,如果按圖1方案,一開始就需要轉變策略,但實際上不必開局轉變。所以就需要判斷哪些是失敗的關鍵著法,需要對記錄著法分析局面值,有所選擇,將影響大的值保留下來,其他影響小的不做記錄,這樣不僅縮小了數據庫,而且讓策略的轉變發生在最合適時。通過實驗得出,分別對正值,負值,最接近0的值進行了實驗,正值是代表勝利,負值代表輸棋,0值基本代表平局。通過實驗分析,最后選取的關鍵著法值即為第一次出現劣勢且之后的棋無可挽回的下到輸的著法。

3 實驗結果及分析

黑‘×表示每一局面值,藍‘○表示不同著法的局面值

此方法證實了它的自學習能力,采用王小春的象棋軟件和應用數據庫象棋軟件對弈。數據庫象棋軟件又分為存儲全部不同著法和存儲關鍵著法。圖2所示的是數據庫軟件先行,同王小春的象棋軟件對弈輸棋的存儲值,黑點表示對弈31盤的評估值,藍圈表示存儲全部不同著法中16個不同值。存儲關鍵著法中存儲的是第四個籃圈值即第一次下降且以后沒有更高值的點。

第一局對弈,先行的數據庫象棋軟件輸給了王曉春的象棋軟件。數據庫象棋軟件將遇到的局面值存儲到數據庫中;第二局對弈,存儲關鍵著法通過記錄的關鍵著法獲勝,圖3線上的點顯示的是對弈贏棋的局面值;存儲全部不同著法一開始就改變策略,實施的著法是上一盤的對稱著法,所以又下輸了。第三局對弈,存儲全部不同著法也贏了王曉春的象棋軟件。經上述實驗表明在計算機輸棋局面下,通過數據庫搜索博弈樹,將值賦給此著法。同時只記錄關鍵著法,以減小數據庫規模,具有更好的自學習能力。

參考文獻

[1]Shi-Jim Yen, Jr-Chang Chen, Tai-Ning Yang, Shun-Chin Hsu, Computer Chinese Chess, ICGA Journal, March 2004.

[2]徐心和,王驕.中國象棋計算機博弈關鍵技術分析[J].小型微型計算機系統,2006,27(6):961-965.

[3]許舜欽.電腦西洋棋和電腦象棋的回顧與前瞻[J].電腦學刊,1990,2(2).

[4]付強,陳煥文.中國象棋人機對弈的自學習方法研究[J].計算機技術與發展,2007,17(12).

[5]付強,陳煥文.基于RL算法的自學習博弈程序設計及實現[J].長沙理工大學學報,2007.12(4):73-78.

猜你喜歡
數據庫
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
兩種新的非確定數據庫上的Top-K查詢
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
數據庫
財經(2015年3期)2015-06-09 17:41:31
數據庫
財經(2014年21期)2014-08-18 01:50:18
數據庫
財經(2014年6期)2014-03-12 08:28:19
數據庫
財經(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 欧美伦理一区| 欧美精品亚洲日韩a| 亚洲91精品视频| 精品国产中文一级毛片在线看 | 色综合天天娱乐综合网| 无码中文字幕乱码免费2| 国产手机在线小视频免费观看| 亚洲品质国产精品无码| 亚洲人成网7777777国产| 色综合网址| 国产无码高清视频不卡| 激情在线网| 精品国产污污免费网站| 久久国产亚洲偷自| 婷婷综合缴情亚洲五月伊| 亚洲精品在线91| 国产精品一老牛影视频| 久久无码av三级| 小说区 亚洲 自拍 另类| 精品乱码久久久久久久| 亚洲日韩高清无码| 国产高潮流白浆视频| 日日噜噜夜夜狠狠视频| 免费国产不卡午夜福在线观看| 国产不卡一级毛片视频| 四虎在线观看视频高清无码| 曰韩人妻一区二区三区| 午夜无码一区二区三区在线app| 欧美综合在线观看| 美女国产在线| 国产精品美女在线| AV在线麻免费观看网站| 亚洲视频在线观看免费视频| 日本精品一在线观看视频| 欧美成人午夜视频| 国产女人爽到高潮的免费视频| 制服丝袜国产精品| 欧洲欧美人成免费全部视频| 成人第一页| 国产91av在线| 亚洲色欲色欲www在线观看| 国产日韩AV高潮在线| 亚洲啪啪网| 日韩精品毛片人妻AV不卡| 国产激情无码一区二区APP| 蜜桃臀无码内射一区二区三区| 五月天香蕉视频国产亚| 中文字幕在线免费看| 伊人久久大线影院首页| 国产激情无码一区二区APP | 国产精品美人久久久久久AV| 韩国福利一区| 国产一级毛片在线| 国产尹人香蕉综合在线电影| 91美女视频在线| 国产成人调教在线视频| 91青青草视频| 国产一区二区三区夜色 | 国产黄网站在线观看| 国产地址二永久伊甸园| 99福利视频导航| 亚洲欧美综合精品久久成人网| 欧美日本视频在线观看| 不卡视频国产| 福利一区在线| 日韩欧美网址| 九色在线视频导航91| 亚洲人成日本在线观看| 欧美啪啪一区| 激情综合网址| 99精品国产电影| 一区二区理伦视频| 九色综合伊人久久富二代| A级毛片无码久久精品免费| 久久黄色视频影| 免费人欧美成又黄又爽的视频| 91精品国产一区| 成人免费视频一区二区三区| 亚洲成a人片77777在线播放| jijzzizz老师出水喷水喷出| 99热国产这里只有精品9九| 国产福利不卡视频|