999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

并行思想的六子棋博弈搜索算法設計

2021-06-29 06:56:40安徽財經大學計算機科學與技術系鄧銀瑩
電子世界 2021年10期
關鍵詞:深度計算機策略

安徽財經大學計算機科學與技術系 鄧銀瑩 常 郝

搜索算法是計算機博弈的核心問題,其好壞對整個系統(tǒng)產生直接影響。通過對計算機六子棋博弈中搜索算法的研究,將Alpha-Beta剪枝、深度優(yōu)先搜索、極大極小值、深度學習四種算法并行結合,使計算機在對抗過程中綜合選取最佳落子點,借此提高機器博弈水平,使計算機博弈更加靈活高效。

1 六子棋搜索策略發(fā)展現狀及研究意義

計算機博弈是人工智能領域一個重要且具有挑戰(zhàn)性的研究分支,包括五子棋、軍旗等棋牌游戲。六子棋以規(guī)則簡單、局面復雜的特點吸引玩家前來研究與挑戰(zhàn),其設計包含數據結構、搜索算法、估值函數、著法生成四部分。六子棋落子需綜合評估兩步棋的狀態(tài),而如何讓這兩步棋發(fā)揮最大作用,是研究的難點所在。

1.1 六子棋搜索策略發(fā)展現狀

2005年六子棋出現至今,雖與五子棋略有相似,但由于六子棋每輪每方可落兩子,最后的局面由兩子統(tǒng)一評定,所以它的計算復雜度相當于五子棋的兩倍,利用研究五子棋的方法無法完全解決六子棋博弈問題。因此許多研究者開始尋找其它策略,應對六子棋出現后的新挑戰(zhàn)。

目前已研究的六子棋搜索策略包括極大極小搜索、Alpha-Beta剪枝、深度優(yōu)先搜索、蒙特卡洛搜索、深度學習等。這些方法或多或少在提高程序搜索效率,提升博弈研究水平方面做出貢獻,也為后來者進一步研究與優(yōu)化提供理論支持與方向。

1.2 當前研究存在不足

目前六子棋的搜索算法多樣,但存在以下缺點:1)算法在計算機中串行執(zhí)行,無法充分利用CPU并行計算優(yōu)勢。2)部分算法因搜索時間長,無法在既定時間內完成最佳落子的查找與判定。3)部分算法雖耗時短,但因搜索不充分導致落子策略存在缺陷。

1.3 研究意義

對六子棋博弈搜索技術的研究,一方面是為找出更佳的搜索策略,能夠在更短的時間進行更深、更廣的搜索,從而提高六子棋博弈水平,更好地解決計算機博弈中的問題。另一方面通過學習并行計算相關知識,研究計算機博弈算法并行可行性,借此加深對機器博弈的理解與應用,推動未來人類智能領域發(fā)展。

2 搜索技術分析

搜索算法能從當前局面找出合適落子點進行棋局。當局面逐漸復雜時,簡單的搜索并不能有效找到最佳落子點,針對不同位置還應考慮落子后的發(fā)展情況。因此,為了更加有效地利用搜索算法,在提高落子質量的同時,對搜索深度與存儲空間進行合理分配,從而達到優(yōu)化程序的目的,下面介紹幾種博弈搜索算法。搜索算法優(yōu)缺點對比表1所示。

表1 搜索算法優(yōu)缺點對比

2.1 深度優(yōu)先搜索

深度優(yōu)先搜索與樹的先序遍歷類似,對每一個可能的分支進行深入查找。訪問后更改當前結點狀態(tài),保證每個結點只訪問一次。當某個分支訪問至葉子結點,則進行回溯,查找相鄰結點進行訪問。

2.2 極大極小值搜索

假設雙方每次落子為最佳走法,而落子后雙方都需通過估值函數評價各自棋局好壞。對于己方必是選取最優(yōu)落子點,同時認為對方選取的也是最優(yōu)落子,因此選擇估值最低的局面開展博弈樹。

2.3 Alpha-Beta剪枝搜索

Alpha-Beta剪枝以極大極小值搜索為基礎,通過排除搜索后的無用結點節(jié)省搜索空間,提高算法效率。對于極大值情況,保留最大分支;對于極小值情況,保留最小分支。

2.4 深度學習搜素

深度學習旨在建立一個模擬人腦的神經網絡,設定當前局面為輸入層,下一步落棋點為輸出層,在隱藏層中利用六子棋規(guī)則篩選落子點,給不同棋子位置設定不同概率,經過訓練得到最優(yōu)解。

3 算法設計

3.1 并行處理

并行計算將任務分為多個小對象,使計算機能同時處理多個程序,從而加快計算機整體運行速度,提高完成效率。其難點在于,找到程序中可以并行運算的部分。

圖1表示同時執(zhí)行四種搜索算法,綜合得到的落子并選取最佳落子點,使各算法得到充分利用,避免單個算法帶來的局限性。

圖1 并行算法流程圖

3.2 估值函數

博弈程序的落子點判斷,主要由搜索策略和估值函數配合完成。對于棋局的判斷,以基于“路”的搜索為基礎,在搜索中無需考慮棋形分布,只需查找某條路上是否存在六子,即可判斷勝負。每條路由某個點位以及與之相連的5個點組成,統(tǒng)計該條路上棋子個數,并用二進制將信息存儲。接著調用估值函數,給不同路賦予不同分值,最后綜合分值選出最優(yōu)落子策略。相比基于“棋形”的搜索,該方法節(jié)省大量匹配時間,便于對當前棋局的評估。連子估值如表2所示。

表2 連子估值表

估值函數的判定需參考固定子力值、棋子位置值、棋子靈活度值、威脅與保護值、動態(tài)調整值五要素。上表為最初參數設定,還需通過不斷測試找到更合適的權值,從而完善程序,提高棋力。

3.3 走法生成與選擇

走法生成是指將當前局面所有合理走法羅列出的模塊,也是用以告知計算機下一步走法的部分。通過并行計算得到每種搜索方式提供的最佳走法,再進行模擬比較,選擇分值最高的落子點作為之后的博弈策略。

圖2代表一副棋局,接下來由計算機執(zhí)行程序確定兩顆白子下落位置。表3列出計算機并行處理四種搜索算法得到的兩顆落子坐標,以及利用估值函數得到的棋子分值。由表可知,深度學習算法得到的落子分值最高,為最佳落子。

最佳落子的選擇利用貪心思想,選取分值最高者為最終結果,但可能存在一定誤差。因此還需考慮不同搜索算法所消耗時間、對之后棋局的影響等因素,綜合判斷后再做定奪。

圖2 某時刻棋局圖

表3 落子分值表

總結:隨著計算機博弈不斷發(fā)展,單一算法不足以適應復雜多變的棋局狀況。本文通過對計算機博弈中六子棋搜索技術的研究,結合并行算法,為計算機博弈搜索策略提供新思路與研究方向。

猜你喜歡
深度計算機策略
計算機操作系統(tǒng)
深度理解一元一次方程
例談未知角三角函數值的求解策略
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
我說你做講策略
深度觀察
深度觀察
深度觀察
高中數學復習的具體策略
數學大世界(2018年1期)2018-04-12 05:39:14
信息系統(tǒng)審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
主站蜘蛛池模板: 久综合日韩| 久久www视频| 91无码人妻精品一区二区蜜桃| 国产香蕉在线视频| 欧美国产视频| 久99久热只有精品国产15| 手机成人午夜在线视频| 国产www网站| 国产精品.com| 国产在线精彩视频二区| 久久这里只有精品8| 极品av一区二区| 国产精品久久久久久久久| 又爽又大又黄a级毛片在线视频 | 国产青青草视频| 中文字幕1区2区| 97视频精品全国在线观看| 亚洲欧洲AV一区二区三区| 日本高清在线看免费观看| 18黑白丝水手服自慰喷水网站| 欧美色视频日本| 综1合AV在线播放| 亚洲精品视频免费| 亚洲日本精品一区二区| 美女视频黄又黄又免费高清| 国产精品刺激对白在线| 日韩毛片免费| 欧美亚洲一二三区| 国产午夜精品一区二区三区软件| 亚洲中文字幕无码爆乳| 在线观看国产黄色| 国产微拍精品| 亚洲 日韩 激情 无码 中出| 日韩精品成人网页视频在线 | 精品一区二区三区水蜜桃| 毛片免费高清免费| 久久6免费视频| 小说 亚洲 无码 精品| 国产一区二区视频在线| 国产精品女主播| 日韩国产黄色网站| 亚洲国产综合自在线另类| 久久久久久久久久国产精品| 国产xx在线观看| 国产爽歪歪免费视频在线观看 | 亚洲综合国产一区二区三区| 91小视频版在线观看www| 91美女视频在线观看| 欧美一区二区三区国产精品| www.99在线观看| 一级成人a做片免费| www.亚洲色图.com| 夜精品a一区二区三区| 99在线视频免费| 人人艹人人爽| 国产乱子伦手机在线| 在线免费亚洲无码视频| 日韩精品无码免费专网站| 国模极品一区二区三区| 色综合a怡红院怡红院首页| 国产日产欧美精品| 九九九精品成人免费视频7| 国产后式a一视频| 亚洲一区二区日韩欧美gif| 依依成人精品无v国产| 日本道综合一本久久久88| 色丁丁毛片在线观看| 亚洲精品视频免费观看| 青草精品视频| 亚洲日本一本dvd高清| 亚洲欧美一区二区三区麻豆| 久久 午夜福利 张柏芝| 国产久操视频| 伊人久综合| 久久这里只有精品23| 五月丁香在线视频| 曰韩人妻一区二区三区| www亚洲精品| 久久精品无码中文字幕| 999福利激情视频| 一级成人a做片免费| 亚洲精品va|