我在游戏开发中遇到的一个小工作流程问题:

空白语音。

不是最终的语音演出。更像:

  • 测试对话节奏
  • 判断一句台词是否不太自然
  • 通过耳朵检查任务/NPC对话
  • 在内部构建中减少沉默
  • 在雇用演员前尝试不同的角色方向
  • 粗略地制作剪辑或教程旁白

大多数AI语音工具似乎都是围绕最终的完美输出,但我想知道在游戏开发中是否更有用的场景是在早期过程中:快速可抛弃的语音,而不是在写作和迭代中。

我特别感兴趣的是定制语音的方法。

例如: “老迈疲惫的商人,温暖但怀疑的语气” “平静的教程旁白,清晰中立的语气” “年轻飞行员,快速传递,紧张的能量”

然后生成从这个方向出的粗略读,然后在项目进展到可以使用真实语音演出时再进行替换。

我正在开发一个本地mac语音合成应用,所以我可能会有偏见,但我想从实际的游戏开发者那里问:

这个功能在你们的工作流程中是否有用,还是在最终生产之前,空白语音都是多余的噪音?

App:https://murmurtts.com/