我正在开发一个用于帮助创建和编码游戏的AI工具的框架,目前我还在思考如何评估它的质量。

首先,我尝试着开发一个第一人称射击游戏(FPS)。

这个工具并不会生成艺术作品,只会提供占位符,并且你仍然需要提供指示和知道自己要做什么。

你个人认为什么样的测试可以用来衡量这种AI工具的质量呢?

哪些功能会让你印象深刻,哪些结果会让你认为这个框架是有用的?