我正在开发一款每日的OSINT谜题游戏，使用人工智能辅助案例材料，困扰我最大的问题是“公平线索”-墙外贴吧

我正在开发一个叫做 Spuria 的小型网络游戏，它是一个 OSINT 脑力游戏，玩家调查虚构案件，并回答核心问题：

谁？哪里？何时？

当前的想法很简单：

玩家收到证据样式的材料，图片，隐去的笔记，坐标，假的情报片段，元数据样式的提示，现场文件等，使用开源调查技术来连接点。

在生成性 AI 帮助方面，最重要的是 案件材料生产。

不是“AI 做整个游戏”，而是：

AI 草拟原始情报片段：我把它们转换成结构化的可解的谜题证据。

所有制作的案件都由我审查，以检查它们是否可玩，并且玩家是否需要使用一些 OSINT 技术。

例如，AI 有助于生成隐去的笔记，清单，文件，UI 复制，假的文本等。

但最难的部分是，OSINT谜题需要公平。

一个线索看起来很酷，但仍然是坏游戏设计。

我经常遇到的最大问题是：

AI 创建氛围比逻辑快
它可以让某样东西看起来像分类，神秘的，或者“情报一样”，但这并不自动意味着玩家可以解决它。

生成的线索变得太模糊
一行可能听起来很有意义，但实际上并没有指向可验证的步骤。

案件需要一个真值表
我发现每个案件都需要手动控制结构：

调子很奇怪地难
AI 经常跳入好莱坞“分类机构”语言。我想游戏感觉像一个 OSINT谜题，而不是一个假的 CIA 爱好者小说。（不能否认，有时听起来像这样）

日常格式增加了压力
由于概念更接近于一个日常谜题，而不是一个巨大的 CTF，案件必须短，满意，并且逻辑紧密。

我的当前工作流程大致如下：

我很好奇这里的人们如何处理这个问题。

对于 AI 协助的叙事或谜题游戏：

如何验证生成的内容实际上是可玩的？

是否使用结构化 JSON 输出， lore圣经，自动化验证器，线索图，人类审查通过，还是其他东西？

特别感兴趣的是正在开发侦探游戏，谜题游戏，ARG，CTF 类似游戏，谜题格式的人。

在 spuria.app/demo - 真实的工作示例，如果您想看看验证问题在实践中的样子。但主要是为了讨论工作流程。

我正在开发一款每日的OSINT谜题游戏，使用人工智能辅助案例材料，困扰我最大的问题是“公平线索”