当前位置:首页 > 档案资料

如何制作声音的克隆人:关于 AI 与音乐(五)

如何制作声音的克隆人:关于 AI 与音乐(五)

迷因创作者、何制诈骗集团、作声音乐制作人⋯⋯大家準备好了吗? 

探讨更深层的音的于AI音问题,诸如 AI 準备如何摧毁或重建产业,克隆或是人关法律层面之前,先来看看这是何制怎么做的。主流是作声一款名为 SO-VITS-SVC 的开源软件,利用深度学习将「餵」给它的音的于AI音声音档案建立模型,再以此转化那些你想模仿的克隆音档,音乐制作上,人关如果有用过例如 Drumagog 这类换鼓软件,何制其实是作声颇为相似的概念。

先利用 iZotope RX、音的于AI音免费的克隆 Ultimate Vocal Remover,又或是人关之前提过可线上处理的 LALAL.AI,先将想建立模型的人声从音乐中分离出,转成 44.1kHz 的採样频率,再分别剪成5~15秒的小片段,由于 SO-VITS-SVC 是在本地电脑上运行,加上一个不能太糟的 GPU 工作一阵子之后,你就能得到一个能让它唱出任何旋律的「角色」。

这类 AI 模型「像不像」的关键除了演算法之外,最重要关键来源是否乾净清晰,能合法地获得原始单轨大概是最佳解,取样的多样性例如较为宽广的音域也会很有帮助。

▲ UVR5 很好用,且免费。

Discord 也行?

觉得上述方式太麻烦的话,更简单的是像 Uberduck 或 Voicemod 这类服务,大抵上都是透过月费订阅的方式,可以享有文字转成语音、制作声音模型这类的功能,有的甚至有已经建好的名人模型,例如可以用 Snoop Dogg 的声音说个「我很嗨」之类。

另一个有趣的是名为 AI World 的 Discord 伺服器,你可以把它想成声音版本的 Midjourney,透过与伺服器中的机器人运作完成你希望制作的 AI 语音。

一旦得到需要的语音轨道之后,接下来就跟日常的音乐制作一样,丢进你的 DAW,将整个音乐做良好的平衡,利用一些混音技巧让表情更为生动等等。老实说近日海量的 AI 歌曲,制作精良的还是相对少数,如果少了文字以及画面引导,你是否还是认为这真是某个歌手,唱着不属于他的作品?

▲ 你可以在 AI World 里头交流 model,并且看到现在已有许多非英语系的内容。

会出事吗?还是接下来会出什么事

制作了(AI)Drake 与 The Weekend 合唱歌曲〈Heart on My Sleeve〉的 @ghostwriter977,算是这波 AI 歌曲的高潮先锋,但他的 TikTok 几乎已清空,各串流平台也下架了(下架前播放量超百万次)。握有大量版权的唱片公司对媒体平台的影响力仍相当巨大,但也有像 Grimes 这样在早先宣布:以分润50%的方式欢迎大家使用她的声音。

艺人将自己当成 API,大部分时候,大家都可以自由接上只要别忘了版税,似乎是个不错的想法,只是实际层面如何执行,又或是 Google 可不管你上架的小程式有多丑,但作为艺术创作者能忍受的范围通常不太大。一如所有新科技带来的混沌,接下来我们终究会找到出口。

▲ 陈珊妮制作陈珊妮的 AI 模型,可能是某种长生不老的概念(?) 

撰文:Jungle

重返青春热血的社团时光,5月23日乐手巢杂誌 Vol.17 正式出刊:https://ysolife.com/yso-mag-vol-17/

几个值得尝试的 AI 音乐工具:关于 AI 与音乐(四)

分享到:

京ICP备2024074891号-59