看到那篇点-and-click 文章获得大量关注后,我一直在思考这个问题。概念在纸上看起来是可行的,对吧?背景、道具、道具,所有这些都可以通过生成来实现。但是,当你实际上尝试让一个角色在 30 场景中保持一致时,就会变得混乱。风格漂移、光照不一致、每隔一屏幕的脸部几何学都有所不同。问题在于,你要处理的清洁工作取决于你实际使用的工具和工作流程。参考条件、LoRAs、填充、姿势控制等功能,已经变得比一年前更好地保持了身份和风格的完整性。但是,“更好”并不意味着“解决了”。一些工具给你更强的一致性控制,而其他工具则没有,所以关于 AI 可以或不能做的事情的 blanket 声明会迅速过时。实际上有效的工作流程似乎仍然是混合式,而不是纯粹的 AI 输出。生成一堆候选项,选择最好的,放大,涂抹那些奇怪的部分,标准化调色板。一些团队也倚重迭代填充而不是简单地放大,这可以节省几轮手动校正。无论哪种方式,成本和时间节省都是真实的,但实际效果并没有那么夸张。值得注意的是,如果你正在建立商业产品,那么 IP 和训练数据的问题并没有解决。风格相似度的声称和资产所有权依赖于你的司法管辖区,所以这仍然是一个风险层。 “完美”可能不是一个正确的目标。“适合单人开发者无艺术预算”的目标可能更实际一些,而对于这个目标,AI 艺术确实可以帮助你实现。更困难的问题是,是否可以通过使用 AI 艺术来处理冒险游戏的一致性和艺术指导,才能让游戏的感觉保持一致。有没有人在这里使用主要 AI 艺术的东西,或者已经完成或接近完成了冒险游戏,哪里是你的流水线实际上打破了?