我正在开发一个叫做 Spuria 的小型网络游戏,它是一个 OSINT 脑力游戏,玩家调查虚构案件,并回答核心问题:
谁?哪里?何时?
当前的想法很简单:
玩家收到证据样式的材料,图片,隐去的笔记,坐标,假的情报片段,元数据样式的提示,现场文件等,使用开源调查技术来连接点。
在生成性 AI 帮助方面,最重要的是 案件材料生产。
不是“AI 做整个游戏”,而是:
AI 草拟原始情报片段:我把它们转换成结构化的可解的谜题证据。
所有制作的案件都由我审查,以检查它们是否可玩,并且玩家是否需要使用一些 OSINT 技术。
例如,AI 有助于生成隐去的笔记,清单,文件,UI 复制,假的文本等。
但最难的部分是,OSINT谜题需要 公平。
一个线索看起来很酷,但仍然是坏游戏设计。
我经常遇到的最大问题是:
AI 创建氛围比逻辑快
它可以让某样东西看起来像分类,神秘的,或者“情报一样”,但这并不自动意味着玩家可以解决它。
生成的线索变得太模糊
一行可能听起来很有意义,但实际上并没有指向可验证的步骤。
案件需要一个真值表
我发现每个案件都需要手动控制结构:
- 正确的人/实体
- 正确的位置
- 正确的时间窗口
- 必须的线索
- 可选的线索
- 假的线索
- 每个错误答案为什么是错误的
调子很奇怪地难
AI 经常跳入好莱坞“分类机构”语言。我想游戏感觉像一个 OSINT谜题,而不是一个假的 CIA 爱好者小说。(不能否认,有时听起来像这样)
日常格式增加了压力
由于概念更接近于一个日常谜题,而不是一个巨大的 CTF,案件必须短,满意,并且逻辑紧密。
我的当前工作流程大致如下:
- 找到可以使用的东西(许可)
- 然后通过不同的含义运行它
- 它是否可以找到?
- 它是否可以引导到答案 X?
- 是否可以使用 OSINT?
- 用户是否可以快速找到它?(等等)
- 然后定义真实答案
- 手动创建真值表
- 生成多个证据片段
- 移除虚假模糊性
- 添加隐去/假的/不确定性
- 测试是否可解重写所有内容,以获得另一个缓存,因为它没有扎根
我很好奇这里的人们如何处理这个问题。
对于 AI 协助的叙事或谜题游戏:
如何验证生成的内容实际上是可玩的?
是否使用结构化 JSON 输出, lore圣经,自动化验证器,线索图,人类审查通过,还是其他东西?
特别感兴趣的是正在开发侦探游戏,谜题游戏,ARG,CTF 类似游戏,谜题格式的人。
在 spuria.app/demo - 真实的工作示例,如果您想看看验证问题在实践中的样子。但主要是为了讨论工作流程。
评论 (0)