大家好,我们目前正在开发一款专门为实时对话在特定背景下的语言工具,它使用人工智能技术。我们的最大挑战在于评分机制,即使用户输入的内容在语法和拼写检查上完美通过,但可能包含本应在特定背景下不使用的短语。如果人工智能确认这样的句子是“正确”的,用户可能会养成不当的对话习惯。反之,如果人工智能标记它们为“错误的”,这会打断人们所期望的有趣、个性化的对话体验。在我们的当前流程中,我们使用PyTorch来构建我们的训练系统,并使用Tripo AI来创建场景和AI角色。你们中是否有人使用一种两套系统,一套用于模拟对话流程,一套用于评估?你们中是否有人使用轻量级模型?你们如何在不使有趣的对话变成枯燥的语法测验的情况下提供对短语的建设性反馈?我们非常期待你们如何处理这些系统调整规则的问题。