首页 文章资讯 围棋之后,谷歌AI再次在游戏领域击败人类

围棋之后,谷歌AI再次在游戏领域击败人类

发布者 : okay

2823

2018-07-06

谷歌旗下的DeepMind人工智能公司,从来没有停止过对AI的探索。


两年前,DeepMind通过创建一个击败世界冠军的Alpha Go而成为头条新闻。现在,Alphabet子公司的另一个项目已经开始学习如何在游戏领域与人类对抗。


上周,OpenAI的机器人正在玩Dota 2 ; 本周,它所尝试的游戏是多人视频游戏《雷神之锤Quake III》。


1531103055163238.jpg


《雷神之锤》的玩法简单:两队各个队员在给定的地图上竞争,目标是在保护己方旗帜的同时抓住对手队的旗帜。


为了获得战术优势,他们可以标记对手队员将他们送回复活点。五分钟后,拥有最多旗帜的队伍将赢得胜利。


1531103090686855.jpg


正如之前人工智能进行学习的例子,这个项目面临的挑战是培训能够在不完整信息的情况下导航复杂3D环境的AI机器人。


这完全不同于英雄联盟中人机对抗的简单机器人。


DeepMind的研究人员使用了一种AI培训方法,这种方法也已成为行内标准:强化学习,即通过大规模的试验对机器人进行培训。


1531103118257132.jpg


这种概念上简单的技术,却能使机器人逐渐学会并产生复杂的行为。


DeepMind的AI在训练了接近50万场比赛后,不仅学会了捕获旗帜的基本规则,还能跟队友达成良好协作,联合御敌。


1531103175348230.jpg


为此,研究人员举办了一场包括40名人类玩家的比赛,其中人类和AI在比赛中随机匹配——无论是作为对手还是作为队友。


结果是,AI机器人超过人类玩家的赢率。


机器人的团队最成功,获胜概率为74%。相比之下,普通人类玩家的概率为43%,高手人类玩家概率为52%。


1531103154809895.jpg


而在人类玩家的调查中,AI也被评为比人类本身更具协作性。


DeepMind在其博客上说:“我们认为这项工作突出了多智能体培训推动人工智能发展的潜力。”


相信将来这项技术会更加深入其他领域,为人类带来不可估量的价值。


分享

全部评论

    展开更多评论

    扩展迷QQ交流群

    错误提示保存失败
    成功提示保存成功
    close
    qr-code

    为打击盗链困扰,本站已启用公众号验证
    微信扫码关注上方公众号,回复“插件”二字获得验证码,验证码5分钟内全站有效。

    正在验证
    验证成功
    下载遇到问题?请添加QQ群:398095333
    close
    qr-code

    为打击盗链困扰,本站已启用公众号验证
    微信扫码关注上方公众号,回复“脚本”二字获得验证码,验证码5分钟内全站有效。

    正在验证
    验证成功