Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 12|回復: 0
打印 上一主題 下一主題

DeepMind 打造 AI 遊戲系统,玩扑克、國际象棋、围棋等,战斗力爆表

[複製鏈接]

1734

主題

1734

帖子

5230

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
5230
跳轉到指定樓層
樓主
發表於 2024-1-16 15:57:31 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
google母公司 Alphabet 的人工智能實行室 DeepMind 持久以来一向投資于遊戲人工智能體系。實行室的理念是,遊戲固然缺少较着的贸易利用,但倒是認知和推理能力的怪异相干挑战。這使它們成為 AI 前進的有效基准。

與此前開辟的遊戲體系分歧,DeepMind 建立了一個名為 Player of Games 的體系,是第一個在彻底信息遊戲和不彻底信息遊戲中都能實現壯大機能的 AI 算法。與 DeepMind 以前開辟的其他遊戲體系,如國际象棋冠军AlphaZero和星际争霸 II 的 AlphaStar 分歧,博弈者可以在彻底信息遊戲(比方中國围棋和國际象棋)和不彻底信息遊戲(比方,扑克)中表示超卓。

不管是解决交通拥挤問题的門路计劃,仍是合同會商、與主顾沟通等互動使命,都要斟酌和均衡人們的偏好,這與遊戲计谋很是類似。AI體系可松山抽化糞池,能經由過程和谐、互助和群體或组织之間的互動而获益。像 Player of Games 如许的體系,能揣度其别人的方针和念頭,使其與别人樂成互助。

不彻底信息遊戲的信息在遊戲進程中對玩家是暗藏的,比拟之下,彻底信息遊戲在起頭時會展現所有的信息。

要玩好彻底的信息遊戲,必娛樂城,要至關多的预感性和規劃。玩家必需處置他們在棋盘上看到的工具,并决议他們的敌手可能會做甚麼,同時尽力實現终极的成功方针。不彻底信息遊戲则请求玩家斟酌暗藏的信息,并思虑下一步應當若何举措才能获胜,包含可能的矫揉造作或组队匹敌敌手。

DeepMind 称,Player of Games是首個“通用且健全的搜刮算法”,在彻底和不彻底的信息遊戲中都實現了壯大的機能。

泡腳養顏,Player of Games 有很强的通用性,不外不是甚麼遊戲都能玩。介入钻研的DeepMind高档钻研科學家马丁·施密德(Martin Schmid)說,在彻底信息遊戲中,AlphaZero比Player of Games更壯大,但在不彻底的信息遊戲中,就没有那末利害。體系必要斟酌每一個玩家在遊戲中的所有可能性。固然在彻底信息遊戲中只有一個视角,但在不彻底信息遊戲中可以有不少如许的视角,比方,扑克约莫有 2,000 個。别的,與 Deep淡斑藥膏,Mind AlphaZero 的继任者 MuZero 分歧,Player of Games 也必要领會它所玩的遊戲法则,而 MuZero 可以即時把握彻底信息遊戲的法则。

在其钻研中,DeepMind 在國际象棋、围棋、德州扑克和计谋棋般遊戲《苏格兰場》上的表示,评估了 Player of Games 利用google TPUv4 加快芯片组举行练習。對付围棋,它在 AlphaZero 和 Player of Games 之間設置了 200 場角逐,而對付國际象棋,DeepMind 则讓 Player of Games 和 GnuGo、Pachi 和 Stockfish 和 AlphaZero 在内的顶级體系举行了较劲。Player of Games 的德州扑克角逐利用公然可用的 Slumbot 举行,该算法还與 Joseph Antonius Maria Nijssen 開辟的 PimBot 举行了苏格兰香港腳噴霧,場的角逐。DeepMind 的合著称為“PimBot”。

在國际象棋和围棋中,Player of Games 被证實在某些設置装备摆設中比 Stockfish 和 Pachi 更壯大,而且它在匹敌最强的 AlphaZero 體系時博得了 0.5% 的角逐。虽然在對阵 AlphaZero 的角逐中丧失惨痛,但 DeepMind 認為 Player of Games 的表示到达了“顶级人類業余快樂喜爱者”的程度,乃至可能到达了职業程度。

成果显示,Player of Games是一個更好的德州扑克和苏格兰場玩家。與Slumbot對战時,该算法均匀每hand博得700万個大盲注(mbb/hand),mbb/hand是每1000 hand博得大盲注的均匀数目。

同時在苏格兰場,DeepMind称,虽然PimBot有更多機遇搜刮获胜的招数,但Player of Games仍是“显著”击败了它。

Schmid 信赖 Player of Games 是向真正通用的遊戲體系迈出的一大步。

實行的整體趋向是,跟着计较資本增长,该算法的機能會更好,Schmid 估计這類法子将在可预感的范畴内扩大将来。

“人們會認為,受益于AlphaZero的利用步伐可能也會受益于遊戲玩家。”他谈道,“讓這些算法加倍通用是一項使人愉快的膝蓋貼布,钻研。”

参考链接:
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋| 台灣棋牌遊戲交流論壇  

台灣運彩官網手機a片 hello av girl運彩好朋友日本職棒比分, 法網直播線上直播王運動世界, 中華職棒即時比分, ptt網頁版, 中華職棒ptt, 日本職棒比分, 最新娛樂城, 歐冠盃線上娛樂城台灣運動彩券首頁運動彩場中投注場中投注時間表台灣運彩足球賠率熱門加盟, 飲食加盟, 小資本加盟創業, 加盟什麼最賺錢, 台南小吃排行榜, 鹹酥雞加盟, 創業加盟推薦, 免費加盟, 3A娛樂城歐冠杯運彩場中LEO娛樂歐冠杯投注, 歐冠盃投注, 歐冠杯下注, 歐冠盃下注, 歐冠杯決賽, 歐冠盃決賽, 棋牌遊戲運彩投注站台灣美食台北美容真人百家樂真人百家樂, 防盜, 未上市, 台北汽車借錢, 當舖, 汽車借款, 傳感器, 荷重元, 廢鐵回收, 壯陽藥,

GMT+8, 2024-5-7 17:33 , Processed in 0.017611 second(s), 12 queries , File On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表