机器人在线 > 资讯 > 前沿科技 > 【人工智能】人工智能合作“交流”赢得纸牌游戏

【人工智能】人工智能合作“交流”赢得纸牌游戏

时间：2019-02-25 来源：机器人在线阅读：6991

为了教会人工智能(AI)进行交流，研究人员转向了纸牌游戏。虽然人工智能很久以前就在国际象棋、围棋、某些形式的扑克和许多电子游戏中击败了人类，但桥牌和哈纳比(Hanabi)等游戏提供了一些特殊的挑战。玩家必须在没有明确的信息共享方式的情况下进行合作(例如打出对方需要你打出的牌)。研究这两款游戏的研究人员最近开发了一种人工智能，这种智能发明了自己的隐式代码来协调他们的动作。

在训练过程中，AI玩家会因为自己提高了同伴对自己推断的准确性而得到奖励。

在经过150万手的练习之后，人工智能搭档已经形成了自己的惯例，人工智能已经开发了自己的约定，比如用招标的三套西装作为一种信号,表明六个西装可能是一个理想的合同。这篇论文的作者之一、伦敦大学学院(University College London)的计算机科学家王俊(Jun Wang)说，这些玩家还无法与人类相比，但他发现最初的结果“非常令人欣喜”。

最近，来自DeepMind技术公司和牛津大学的一个团队发表了一篇关于arXiv的论文，描述了一种用于两玩家版Hanabi的机器学习系统。他们的“贝叶斯行动解码器”(BAD)也使用神经网络，并让每个AI玩家尝试推断其伙伴的想法。为了避免无休止地重复思考你的伴侣在想什么，你在想什么，等等，这个系统在两个参与者之外创建了一组“公共信念”。

这些代表了所有公开的关于游戏状态和之前动作的信息，以及这些信息对所有对手的影响，而不需要实际查看它们。然后，“公共代理”使用神经网络将这些信念转换成指令，指导每个玩家应该做什么，以及他们的搭档手中的任何可能的牌的组合，然后，每个玩家根据公共代理的指导和自己观察来行动。

前沿科技

机器人在线版权与免责声明：

1.凡本网注明[来源：机器人在线]的所有文字、图片、音视和视频文件，版权均为机器人在线(www.imrobotic.com)独家所有。如需转载请与021-60717199联系。任何媒体、网站或个人转载使用时须注明来源"机器人在线"，违反者本网将追究其法律责任。

2.本网转载并注明其他来源的稿件，均来自互联网或业内投稿人士，版权属于原版权人。转载请保留稿件来源及作者，禁止擅自篡改，违者自负版权法律责任。

3.本网评论版块中各网友的评论只代表网友个人观点，不代表本站的观点或立场。