我是一个独立开发者。今年一月,我推出了MixDoctor(一款用于iOS和macOS的AI混音分析软件)。虽然它在用户反馈中表现得还不错,但我逐渐发现了一些问题:这个应用程序在惩罚专业混音的歌曲。
一位金属乐队的制作人上传了一首歌曲,歌曲的音压值(LUFS)为-7,使用了严重的压缩,动态范围非常窄。应用程序告诉他这是一个问题。但是,实际上金属音乐的混音就是这样……应用程序的评分系统完全不知道它正在分析的是什么类型的音乐。
修复这个问题需要从头开始。所以,我重建了整个引擎,根据9个不同的音乐类型(每种类型都有来自实际混音研究的阈值值,来源于iZotope、Dynamic Range Database和伊恩·谢伯德(Ian Shepherd)的工作)。这比我预期的要花更多的时间,而且还打破了几个功能。
这就是教训:域内的准确性比一般的准确性更重要。一个对你的用例有信心但却错误的工具,反而比没有工具要糟糕。
接下来的事情还在思考中。哪些功能能让你相信AI分析工具在你的工作流程中有用?
评论 (0)