神仙打架?AlphaZero击败棋牌游戏引擎

小刘

【手机中国新闻】2017,谷歌母公司阿尔法集团旗下的英国人工智能公司DeepMind发布的一项研究——“通过自我模拟让通用强化学习算法掌握国际象棋和日本将棋”占据了各大媒体的头条。

神仙打架?AlphaZero击败棋牌游戏引擎
(图侵删)

这项研究描述了一个系统——AlphaZero,它可以教会自己如何玩国际象棋、将棋和围棋。在每种游戏中,AlphaZero都击败了世界冠军,展现出双人完美信息博弈游戏的最先进技巧。完美信息博弈游戏的意思是指,游戏中的任何决定都建立在玩家完全了解过去所有信息的基础之上。

AlphaZero

DeepMind今天宣布,经过数月的反复修订,其在AlphaZero上的工作已经被《科学》杂志所接受,并登上了封面。现在AlphaZero已经学会了三种不同的复杂棋类游戏,并且可能学会任何一种完美信息博弈的游戏,这“让我们对创建通用学习系统的使命充满信心”。

那么AlphaZero有多厉害呢?在国际象棋比赛中,AlphaZero与2016 TCEC冠军Stockfish对弈1000场,只输了6场。此外,它在国际象棋人类常见开局比赛中名列前茅。

人工智能

同时,在日本将棋的比赛中,AlphaZero在与2017年CSA世界冠军Elmo的对弈中,胜率为91.2%。而在对弈前辈AlphaGo Zero的围棋比赛中,它取得了61%的比赛的胜利。也就是说,无论是国际象棋、将棋还是围棋,AlphaZero都击败了当前最厉害的人工智能对手。

更令人吃惊的是,训练AlphaZero玩这些游戏所花费的时间:学会玩国际象棋用了9个小时,而学会玩日本将棋和围棋分别只用了12个小时和13天!当然,开发这样一个算法的目的可不仅仅是创造超人般的国际象棋程序。能够解决多个复杂问题的单一算法,是创建通用机器学习系统,解决实际问题的重要一步。科学家们的最终目标是利用从中学到的知识,开发出能够应对社会最严峻挑战的系统。

2021中国联通合作伙伴大会今日召开 重磅推出“联通云”

2024年上半年福建省银行机构办理跨境人民币业务6699.1亿元

一加6T迈凯伦版今日开抢 30W快充4599元

洪建春当选安徽黄山市人大常委会副主任

海信视像Q3财报发布:归母净利润同比大增47.08%

万千气象看上海|中国文化出海,米哈游们做对了什么|寻找中国经济新动能

埃及称不会接纳巴勒斯坦难民,世卫组织警告加沙局势正在失控

上海市贸促会会长:要让真正“走出去”的企业能够赚钱

国内首个开源人才评价机制发布 已有20所知名高校参与试点

上海发布暴雪红色预警?市气象局:只是演练,有备无患

全球凉热,年度天气摄影大赛发布入围作品

“逮捕尹锡悦”暂停执行!韩国今天发生了啥?

神仙打架?AlphaZero击败棋牌游戏引擎的相关内容

文章版权声明:除非注明,否则均为旋风网络原创文章,转载或复制请以超链接形式并注明出处。

取消
微信二维码
微信二维码
支付宝二维码