【人工智能】人工智能合作“交流”赢得纸牌游戏
为了教会人工智能(AI)进行交流,研究人员转向了纸牌游戏。虽然人工智能很久以前就在国际象棋、围棋、某些形式的扑克和许多电子游戏中击败了人类,但桥牌和哈纳比(Hanabi)等游戏提供了一些特殊的挑战。玩家必须在没有明确的信息共享方式的情况下进行合作(例如打出对方需要你打出的牌)。研究这两款游戏的研究人员最近开发了一种人工智能,这种智能发明了自己的隐式代码来协调他们的动作。
在训练过程中,AI玩家会因为自己提高了同伴对自己推断的准确性而得到奖励。
在经过150万手的练习之后,人工智能搭档已经形成了自己的惯例,人工智能已经开发了自己的约定,比如用招标的三套西装作为一种信号,表明六个西装可能是一个理想的合同。这篇论文的作者之一、伦敦大学学院(University College London)的计算机科学家王俊(Jun Wang)说,这些玩家还无法与人类相比,但他发现最初的结果“非常令人欣喜”。
最近,来自DeepMind技术公司和牛津大学的一个团队发表了一篇关于arXiv的论文,描述了一种用于两玩家版Hanabi的机器学习系统。他们的“贝叶斯行动解码器”(BAD)也使用神经网络,并让每个AI玩家尝试推断其伙伴的想法。为了避免无休止地重复思考你的伴侣在想什么,你在想什么,等等,这个系统在两个参与者之外创建了一组“公共信念”。
这些代表了所有公开的关于游戏状态和之前动作的信息,以及这些信息对所有对手的影响,而不需要实际查看它们。然后,“公共代理”使用神经网络将这些信念转换成指令,指导每个玩家应该做什么,以及他们的搭档手中的任何可能的牌的组合,然后,每个玩家根据公共代理的指导和自己观察来行动。
好的文章,需要您的鼓励
2
- 最新资讯
- 最新问答
-
“机器人关节”被TA硬控了
关键字: 美的工业 rv减速机 2024-10-16 -
未来已至:Figure 02机器人引领AI硬件新时代
关键字: 人形机器人 2024-08-13 -
配天观点:具身智能商业化落地之路,道阻且长,但行则必至!
关键字: 配天 具身智能 2024-08-09 -
具身智能:人工智能新纪元,赋能未来科技新引擎
关键字: 具身智能 泰科机器人 2024-07-25 -
科技与艺术交融,BrainCo智能仿生手亮相北京中国国家博物馆丨设计智造与高质量发展特展
关键字: 强脑科技 智能仿生手 2024-07-22
-
激光焊接机器人的特点有哪些?
标签: 激光焊接机器人,焊接机器人,工业机器人 提问:小T 2025-04-15 11:02:00 -
工业机器人码垛原理是什么?
标签: 码垛机器人,工业机器人 提问:晓明 2025-03-24 12:00:00 -
什么是自动焊接和半自动焊接?
标签: 焊接,焊接机器人 提问:小君 2025-03-18 09:00:00 -
发那科机器人的信号种类?
标签: 发那科机器人,IO信号 提问:小马 2025-03-10 15:00:00 -
弧焊机器人有什么性能标准和要求?
标签: 弧焊机器人 提问:小常 2025-03-05 15:00:00
- 2024-08-09 15:55:07
- 2022-01-12 09:56:12
- 2019-12-20 17:31:37
- 2019-03-25 14:41:44
- 2019-07-05 13:37:10
- 2019-02-27 16:02:02
- 2024-10-16
- 2024-08-13
- 2024-08-09
- 2024-07-25
- 2024-07-22
- 2024-07-18
- 2024-07-18
- 2024-07-18
- 2024-01-29
- 2024-01-16