AI / LLMs 在设计游戏系统方面是独特的糟糕。这里有一个例子:

我要求 Gemini Pro 为“棋盘 - RPG”设计一个进度系统,考虑到它需要在 PvP 中工作,总结为 2 段。这种模糊的提示在设计测试中很常见,系统设计师在工作新项目或特性时需要解决的开放性问题。

它给了我这个。

棋盘 - RPG(由 Gemini Pro)

>在“棋盘 - RPG”中,进度以单个棋子发展和一个元技能树为中心,创造出独特、不对称的构建。玩家以基本棋子开始,通过生存比赛、捕获敌人和执行落下马来赚取经验值。升级后,棋子解锁分支类别的提升;例如,标准的卒可以分支成“盾牌骑士”来吸收一次捕获尝试,或者“盗贼”有一个更长的对角线背刺机制.

>胜利的比赛也赠送“大师点数”,用于解锁一个中心技能树上的总体玩家能力,赠送有限使用的战术咒语,如“强行行进”(额外移动)或“复活”,确保没有两个军队带来相同的装备到棋盘上.

虽然这些想法可能看起来很酷,但作为一个系统,它们失败了。它们会破坏和激怒对方,并且会浪费几个月的开发者时间。一些问题:

  1. 棋盘会变得无法解析,每个棋子升级后独立升级,同时保持整体自定义/身份的低复杂性成本。
  2. 相反,玩家被迫升级棋子,这会创造出在阶梯中更有保证的不平衡。
  3. 强烈的动机,如试图让棋子存活到赚取更多经验值。交易是一个平衡,但更好的是激励玩家玩好游戏。放弃第一轮可能是获得所有棋子“生存”奖励的最好方法。
  4. 技能树进度来自于什么地方,增加了复杂性。没有人会能够跟踪所有对手的选项,并且独特的选项会使您无法熟悉它们。
    5+. 有更多的。看看你自己是否能找出它们。

然而,如果允许将这些提议写成正式的设计文档,一位较弱的设计师,或者一位非设计师的领导者,可能会被欺骗。它确实会看起来像一个严格详细的进度系统。压缩想法到 2 段是有用的技巧来揭露它们的混乱。从人类设计师那里也要求类似的简要说明,保持高水平的描述,然后进入更深入的解释。如果所有这些都有意义,他们就可以开始设计。

我的方法

如果是我的话,我会寻找一种添加 RPG-like 类型的职业或角色进度的方式,带有大量潜在的深度,而不使 PvP 变得无法解析或不平衡的混乱。只有思考这个问题 5 分钟,我就觉得我的顶级设计与 Gemini Pro 的几分钟思考有可比性。

顶级想法:创建“将军”或“职业”类别,每个类别都有独特的棋子组合。通过玩游戏来升级将军,经验值基于总数的移动次数,时间花在其中会有一个小的奖励,然后一个乘数如果你赢得比赛。这会奖励玩家主要是因为花时间在游戏中,防止快速放弃以获取经验值,并且仍然创造出赢得比赛的动机。

当你升级时,你会解锁替代棋子来轻微地自定义这个将军的军队和升级现有的单位 - 给每个将军一些独特的棋子或组合。也许一个将军有四个骑士,而另一个将军有一个更强大的版本的国王,值得早期将其带入战斗而不是保护整个游戏。一些将军有弱棋子会获得一个被动或顶部栏。

设计解释

这个解决方案在清晰、不破坏性的方式中添加 RPG-身份 + 进度到棋盘。它更适合 PvP 平衡、匹配稳定性和进度深度。PvP 玩家将能够学习如何应对不同将军/职业和它们的标准设置的不同,而不是试图解析无限细粒度的棋子有自己的分支升级路径和进度状态组合以及大师点数技能树的顶部咒语的棋盘。

依靠身份想法,这也将强调 RPG 的 RP 部分:建造和进展角色。虽然你可以将每个棋子转变为一个独特的角色,但这会迅速变得混乱在计算密集的对局中。玩家通常会想将自己投入到“主角”中,并通过职业和升级选择来表达其独特身份的多种方式,这会比将同样的“Shieldbearer 或 Rogue”分支升级路径选择给 8 个不同的卒(即使这不是一个复杂性噩梦)更好地实现“棋盘 RPG”的暗示设计目标。

这个方法在另一个方面更强:有更多的进度深度。相比之下,每个将军/职业类别都有自己的升级。有更多的完成度深度,游戏想要激励玩家在整个棋盘上完成度,可能会创建特殊挑战来激励玩家使用多种不同的将军或改变哪些在当前特殊事件中更好。机会总是存在的,并且机会很好。

最后的话

节省几个月的坏系统设计实施是值得几个星期的系统设计师时间,但我真的不需要超过几分钟就能想出一些显著更好的设计。

AI 不能依赖于系统设计。您偶尔会获得一个可行的答案,当它复制某个高度特定的游戏的系统摘要时,但它总是会错过相关的上下文,并且它会失败每次它遇到一个需要一些上下文智能的新问题。

是的,我可以用高度具体的指令反复提示它,强迫它给出一个更窄的范围内的更好的答案。这不是问题。您也可以这样做,人类也会得到类似的改进结果。

是的,其他 LLMs 会给出不同的结果,Gemini Pro 也会给出不同的结果,尤其是如果您没有关闭它。

这是我在许多交互中观察到的一个例子,在许多模型上,这是有道理的。它不是科学证明。任何单个的提示和结果都无法做到这一点。这只是一个例子,之前我已经看到过多次这样的问题。

LLMs 将和再次组合和回溯常见模式而缺乏经验上下文,这意味着它们将始终是不可预测的,并且通常会在生产好的输出方面很糟糕。它往往会变得更糟糕,越深入任何特定的系统设计,添加复杂性在复杂性之上,并且错过特定的执行无法与之前的系统组件一起工作的方式。

这使得一个有趣的练习。它是练习拆解有缺陷的系统的好方法,而不损害真正的人的工作或创造一个要被击倒的 strawman。