大家好。
我正在制作《在训练中》(UNDER TRAINING),这是一个关于大型语言模型在训练过程中可能感受到的体验的短小浏览器游戏。

我们现在每天都在与语言模型交谈或使用它们在工作流程中。 我想问一个稍微不同的问题:如果你能进入其中一个语言模型的内部世界,会是什么感觉? 被碎片、指令、奖励、用户压力和所有这些小的力量塑造,会是什么样的体验?

在这个游戏中,你不是在与AI玩耍,也不是在与AI竞争,你是在成为AI。

这个原型基于语言模型训练过程的三个阶段(预训练、微调、beta测试)。 每个级别都引入了新的规则和完全不同的游戏玩法。

这是一个工作的垂直切片,我第一次开发的游戏。 一次运行大约需要10-15分钟,它完全免费,适合在桌面上玩。 我建议在没有任何提示的情况下玩一次,然后,如果你喜欢它,重新运行并尝试不同的答案和路径,因为你的选择会导致不同的最终形状。

一个小免责声明:我不是ML或AI工程师,也不是游戏开发者。 我在开发过程中使用了不同的模型(主要是GPT 5.5和Opus 4.6/4.7),以咨询概念、机制和措辞,因此它们不会漂浮到一些象征性的诗歌中。但我仍然希望它们简单和有趣,所以一些ML-ish想法和概念可能会被简化、压缩或变得象征性(倾向于一些物理现实的关联)而不是技术上准确。 但这也是我感兴趣的:使用游戏和艺术来接近困难的技术思想,通过使它们触感、奇怪和从另一个角度理解来使它们更容易理解。

这个游戏是用Decker开发的,这是一个小型HyperCard-like引擎,它使用一个简单但罕见的语言叫做Lil。 这给了项目一个独特的单调界面风格,但也给了设计师很多限制。 我用Codex和Hermes Agent来完成所有编码,很有趣的是,模型对Lil和Decker有很浅的了解,常常试图发明新的脚本基于其他引擎,所以我必须保持主技术文档并指向代理当做一些事情变得稍微复杂时。

所有的图像都是用GPT Image 2生成的。 音频是用Suno和Minimax Audio生成的(它实际上是一个很有趣的音频模型)。

这个版本是一个垂直切片,但我希望继续开发它。 我已经有了至少三个更多阶段和一个更大的结构,围绕训练、部署、评估和模型在压力下表现的行为。

我非常渴望听到您的反馈!