花火（纸牌游戏）

1 花火（纸牌游戏）

2 游戏规则

3 AI挑战

花火（纸牌游戏）

花火（来自日本的花火，烟花）是由法国游戏设计师AntoineBauza创造的合作性纸牌游戏，于2010年出版。玩家知道其他玩家的牌，但不知道自己的牌，并试图按照特定的顺序打出一系列的牌来引爆一个模拟的烟花表演。玩家可以向对方提供的信息类型是有限的，在游戏中可以提供的信息总量也是有限的。2013年，Hanabi赢得了SpieldesJahres奖，这是年度最佳棋盘游戏的行业奖项。

游戏规则

编辑

花牌包含五种花色的卡片（白、黄、绿、蓝、红）：三个1，2、3、4各两个，一个5。游戏开始时有8个可用的信息令牌和3个引信令牌。游戏开始时，玩家发了一张包含五张牌的手牌（4或5名玩家为四张）。如同"盲人摸象"，玩家可以看到对方的牌，但不能看到自己的牌。游戏围绕桌子进行；每回合，玩家必须采取以下行动之一。提供信息。玩家指出另一玩家手中的特定数字或特定花色的牌（例如。这张牌是你xxx的红牌，这两张牌是你xxx的3）。所提供的信息必须是完整和正确的。(在某些版本中，允许表示某位玩家有零的东西；其他版本明确禁止这种情况)。提供信息需要消耗一个信息令牌。丢弃一张牌。玩家从手牌中选择一张牌加入弃牌堆，然后抽一张牌来代替它。被丢弃的牌就会退出游戏，不能再进行游戏。丢弃一张牌可以补充一个信息令牌。出牌。玩家从手中选择一张牌，并试图将其加入已经打出的牌中。如果这张牌是尚未出过的花色中的1，或者是已经出过的花色中的下一个数字，则成功。否则会消耗一个导火索令牌，并丢弃被打错的牌。成功地打出任何花色的5，可以补充一个信息令牌。无论xxx是否成功，玩家都会抽到一张替换的牌。当所有的导火索令牌都用完了，导致游戏失败，或者所有的5都被成功打出，导致游戏胜利，游戏立即结束。否则，游戏继续进行，直到牌组用完，之后再进行一整轮。在游戏结束时，每种花色中最高的牌的价值被相加，产生一个总分，总分可能是25分。接待Hanabi获得了积极的评价。棋盘游戏探索》将该游戏评为四颗半星，赞扬其独特性、可及性和参与性。同样，《有主见的玩家》也赞扬了该游戏的参与性和上瘾性。它赢得了多个奖项，包括2013年SpieldesJahres奖和2013年FairplayÀlacarte奖得主。计算机HanabiHanabi是一种不完美信息的合作游戏。玩Hanabi的计算机程序可以进行自我游戏，也可以进行临时的团队游戏。在自我游戏中，该程序的多个实例在一个团队中相互游戏。因此，他们共享一个精心磨练的交流和游戏策略，当然，他们不允许与程序的其他实例非法分享关于每场游戏的任何信息。在临时团队游戏中，程序与其他任意的程序或人类玩家进行游戏。通过手工编码基于规则的策略，已经开发了各种计算机程序。xxx的程序，如WTFWThat，在与五个玩家的自我游戏中取得了近乎完美的结果，平均得分24.9分（满分25分）。

AI挑战

编辑

2019年，DeepMind提出将Hanabi作为一个理想的游戏，用它来建立合作游戏中人工智能研究的新基准。在自我游戏模式中，挑战是开发一个可以从头开始学习的程序，与自身的其他实例进行良好的游戏。截至2019年，这样的程序每场比赛只取得约15分，远不如手工编码的程序。然而，截至2020年，这一差距已明显缩小，简化行动解码器取得了24分左右的成绩。

特设团队游戏对人工智能来说是一个更大的挑战，因为Hanabi将对其他xxx的信念和意图的推理提升到了前台。在人类的水平上进行临时团队游戏，需要算法通过心智理论学习和发展与其他玩家的沟通惯例和策略。为自我游戏开发的计算机程序在与特设团队游戏时失败得很厉害，因为它们不知道如何学习适应其他玩家的游戏方式。Hu等人证明，学习对称不变的策略有助于人工智能代理避免学习无法解释的惯例，在与单独训练的人工智能代理（得分约为22分）和人类（得分约为16分，而基线自我游戏模型的得分约为20分）匹配时，他们的表现得到了改善。

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/174789/