我制作了一个板子旋转器应用程序,让你能够让这些板子快速旋转。很有意思的是,这里的声音并不是事先录制的。你所听到的是基于物理原理实时生成的。

我是如何做到这一点的呢?我取了音频频谱图,清理了一下一个音频频谱图的图像,来源于实际录音的板子滑动和旋转声音。但当我展示给Gemini(你可以使用任何LLM)分析音频时,我需要帮助它一下子指出使用噪音而不是特定的周频。这种方式基本上是让它构建了一种板子滑动或旋转声音的模型效果,而且还不错。

的确,图形界面并不是很棒,但声音效果还是可以的。我的观点是,这是一个非常有趣的方式,使用LLM来产生声音应用程序。原因是,你可以让声音变得更加动态和逼真,而不是使用固定预录音。可能我会想将声音添加一些变化,使它们不再相同。但这正是一个优点:你可以添加尽可能多的声音变化,通过这种方式你还是比预录音的声音得到一个更加动态和逼真的效果。

我很好奇的是,看看是否有更好的方法来实现这种功能,我以前工作过音效设计,所以这个方法对我来说是很直观的。但是也可能有更好的方法。如果你有更好的方法,请告诉我。