花火(纸牌游戏)

编辑
本词条由“匿名用户” 建档。

花火(来自日本的花火,烟花)是由法国游戏设计师AntoineBauza创造的合作性纸牌游戏,于2010年出版。玩家知道其他玩家的牌,但不知道自己的牌,并试图按照特定的顺序打出一系列的牌来引爆一个模拟的烟花表演。玩家可以向对方提供的信息类型是有限的,在游戏中可以提供的信息总量也是有限的。2013年,Hanabi赢得了SpieldesJahres奖,这是年度最佳棋盘游戏的行业奖项。 花牌包含五种花色的...

花火(纸牌游戏)

编辑

花火(来自日本的花火,烟花)是由法国游戏设计师AntoineBauza创造的合作性纸牌游戏,于2010年出版玩家知道其他玩家的牌,但不知道自己的牌,并试图按照特定的顺序打出一系列的牌来引爆一个模拟的烟花表演。玩家可以向对方提供的信息类型是有限的,在游戏中可以提供的信息总量也是有限的。2013年,Hanabi赢得了SpieldesJahres奖,这是年度最佳棋盘游戏行业奖项。

游戏规则

编辑

花牌包含五种花色的卡片(白、黄、绿、蓝、红):三个1,2、3、4各两个,一个5。游戏开始时有8个可用的信息令牌和3个引信令牌。游戏开始时,玩家发了一张包含五张牌的手牌(4或5名玩家为四张)。如同"盲人摸象",玩家可以看到对方的牌,但不能看到自己的牌。游戏围绕桌子进行;每回合,玩家必须采取以下行动之一。提供信息。玩家指出另一玩家手中的特定数字或特定花色的牌(例如。这张牌是你xxx的红牌,这两张牌是你xxx的3)。所提供的信息必须是完整和正确的。(在某些版本中,允许表示某位玩家有零的东西;其他版本明确禁止这种情况)。提供信息需要消耗一个信息令牌。丢弃一张牌。玩家从手牌中选择一张牌加入弃牌堆,然后抽一张牌来代替它。被丢弃的牌就会退出游戏,不能再进行游戏。丢弃一张牌可以补充一个信息令牌。出牌。玩家从手中选择一张牌,并试图将其加入已经打出的牌中。如果这张牌是尚未出过的花色中的1,或者是已经出过的花色中的下一个数字,则成功。否则会消耗一个导火索令牌,并丢弃被打错的牌。成功地打出任何花色的5,可以补充一个信息令牌。无论xxx是否成功,玩家都会抽到一张替换的牌。当所有的导火索令牌都用完了,导致游戏失败,或者所有的5都被成功打出,导致游戏胜利,游戏立即结束。否则,游戏继续进行,直到牌组用完,之后再进行一整轮。在游戏结束时,每种花色中最高的牌的价值被相加,产生一个总分,总分可能是25分。接待Hanabi获得了积极的评价。棋盘游戏探索》将该游戏评为四颗半星,赞扬其独特性、可及性和参与性。同样,《有主见的玩家》也赞扬了该游戏的参与性和上瘾性。它赢得了多个奖项,包括2013年SpieldesJahres奖和2013年FairplayÀlacarte奖得主。计算机HanabiHanabi是一种不完美信息的合作游戏。玩Hanabi的计算机程序可以进行自我游戏,也可以进行临时的团队游戏。在自我游戏中,该程序的多个实例在一个团队中相互游戏。因此,他们共享一个精心磨练的交流和游戏策略,当然,他们不允许与程序的其他实例非法分享关于每场游戏的任何信息。在临时团队游戏中,程序与其他任意的程序或人类玩家进行游戏。通过手工编码基于规则的策略,已经开发了各种计算机程序。xxx的程序,如WTFWThat,在与五个玩家的自我游戏中取得了近乎完美的结果,平均得分24.9分(满分25分)。

AI挑战

编辑

2019年,DeepMind提出将Hanabi作为一个理想的游戏,用它来建立合作游戏中人工智能研究的新基准。在自我游戏模式中,挑战是开发一个可以从头开始学习的程序,与自身的其他实例进行良好的游戏。截至2019年,这样的程序每场比赛只取得约15分,远不如手工编码的程序。然而,截至2020年,这一差距已明显缩小,简化行动解码器取得了24分左右的成绩。

纸牌游戏

特设团队游戏对人工智能来说是一个更大的挑战,因为Hanabi将对其他xxx的信念和意图的推理提升到了前台。在人类的水平上进行临时团队游戏,需要算法通过心智理论学习和发展与其他玩家的沟通惯例和策略。为自我游戏开发的计算机程序在与特设团队游戏时失败得很厉害,因为它们不知道如何学习适应其他玩家的游戏方式。Hu等人证明,学习对称不变的策略有助于人工智能代理避免学习无法解释的惯例,在与单独训练的人工智能代理(得分约为22分)和人类(得分约为16分,而基线自我游戏模型的得分约为20分)匹配时,他们的表现得到了改善。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/174789/

(1)
词条目录
  1. 花火(纸牌游戏)
  2. 游戏规则
  3. AI挑战

轻触这里

关闭目录

目录