这是我们的在游戏中的AI酒馆持有者Cindrel。

https://reddit.com/link/1s19jwm/video/6q8h6mybpqqg1/player

他是非常早上。
还有大量工作在等着他,包括场景的全面重制、动画润色、所有…… 但我们已经让他实现了可以立即对话和回应。我们之前一直在使用语音合成工厂,Instant-Response,但我们想开始实验用虚拟主持人的语音。

我们的配音演员有着浓密的苏格兰口音,尤其是在格拉斯哥,甚至在模型中也在努力保留这个口音。

目前,他的口音完全不同,但是在逐渐增长(排除他偶尔说的一些杂言)。

_______________________________________

你是否有使用XTTS,如何优化它的经验。当前,他的速度非常慢,并且他的口音听起来如同他想吃掉我。

期待有人的建议,对于口音的实现。可能的方法是针对他本身进行模型训练(他的骨架模型目前很基本),但我想要避免使用API来确保他可以本地化并且紧凑化。任何的建议非常感谢。

注意:当我告诉他我将要杀死一条龙时,他竟然完全不再回应。Cindrel很明显不喜欢这个想法,lmao。