返回首页 hi, 欢迎来到机器人在线 请登录/ 免费注册 扫码关注

【人工智能】人工智能合作“交流”赢得纸牌游戏

时间:2019-02-25 来源:机器人在线 阅读:6991

为了教会人工智能(AI)进行交流,研究人员转向了纸牌游戏。虽然人工智能很久以前就在国际象棋、围棋、某些形式的扑克和许多电子游戏中击败了人类,但桥牌和哈纳比(Hanabi)等游戏提供了一些特殊的挑战。玩家必须在没有明确的信息共享方式的情况下进行合作(例如打出对方需要你打出的牌)。研究这两款游戏的研究人员最近开发了一种人工智能,这种智能发明了自己的隐式代码来协调他们的动作。



在训练过程中,AI玩家会因为自己提高了同伴对自己推断的准确性而得到奖励。


在经过150万手的练习之后,人工智能搭档已经形成了自己的惯例,人工智能已经开发了自己的约定,比如用招标的三套西装作为一种信号,表明六个西装可能是一个理想的合同。这篇论文的作者之一、伦敦大学学院(University College London)的计算机科学家王俊(Jun Wang)说,这些玩家还无法与人类相比,但他发现最初的结果“非常令人欣喜”。


最近,来自DeepMind技术公司和牛津大学的一个团队发表了一篇关于arXiv的论文,描述了一种用于两玩家版Hanabi的机器学习系统。他们的“贝叶斯行动解码器”(BAD)也使用神经网络,并让每个AI玩家尝试推断其伙伴的想法。为了避免无休止地重复思考你的伴侣在想什么,你在想什么,等等,这个系统在两个参与者之外创建了一组“公共信念”。


这些代表了所有公开的关于游戏状态和之前动作的信息,以及这些信息对所有对手的影响,而不需要实际查看它们。然后,“公共代理”使用神经网络将这些信念转换成指令,指导每个玩家应该做什么,以及他们的搭档手中的任何可能的牌的组合,然后,每个玩家根据公共代理的指导和自己观察来行动。

前沿科技

好的文章,需要您的鼓励

2

  • 最新资讯
  • 最新问答