自从早期参与Midjournery,之后我一直尝试大量工具和流程。从ComfyUI管道到尝试不同模型,我看到了很多变化。尤其是在最近的日子里,它们的更新节奏让我很惊讶。
其中一个让我印象很深的事情是新模型像Gemini(我现在个人比较喜欢,虽然ChatGPT最近也得到很大的提升)的实现了一致性提高。
经过这段时间的使用经验,我决定将所有内容综合到一个小游戏项目中。
结果是,使用生成模型来制作的大多数视觉资产的2D游戏演示。根据我的经验,AI在2D方面表现出了很好的效果,它很快、灵活且有趣。这让我们能够快速迭代并看到结果。
尽管如此,这并不是简单的“点一下并得到游戏”。 背后仍需要:
游戏设计、迭代和融合需要付出努力
生成的图片需要合集和导向
声音是我们自己制作的
代码近乎完全由我们自己完成。我使用了一些AI来加速一下编码过程,不过这并不是“灵感编码”。
我们这两个人花了大约3个月的时间,终于把https://edicenook.itch.io/office-leveling 这个可玩的Demo发布出来,你可以在那里尝试它。
如果你喜欢它,你也可以在Steam上添加到你的心仪项目中:https://store.steampowered.com/app/4434520/Office_Leveling/
并不是所有的环节都顺利进行的。例如,得到一个合适的Logo仍然是一道难解之题。像Gemini或ChatGPT这样模型倾向于好好响应指令,但结果常常感觉枯燥,缺乏独特性。另一方面,Midjourney就像一匹野马,充满了创造性但很难控制。在一些情况下,最初看起来很棒的结果可能一细看就会发现有很多不一致和错误的地方,这使得它难以在一个精心打造的产品中真正使用。
ComfyUI对过程有着的控制权,我非常感谢。但是,至今,我还没有找到使得其质量或风格令人信服的模型。
也许我对Logo就要求过高了,但是毫无疑问,当前工具在Logo方面仍在苦苦挣扎。
我很想听到你的反馈。
评论 (0)