当前位置:首页 > 粉丝聚集地

接下来值得关注的 AI 音乐工具:关于 AI 与音乐(六)

声音合成

接下来值得关注的 AI 音乐工具:关于 AI 与音乐(六)

很意外这可能是接下具关最令人兴奋的部分,尤其对于音乐工作者来说。关注

能够创造出自己独有的音于AI音声响应该是梦寐以求的事,早在2017年由 Google AI 底下的乐工乐 Magenta 便有一个名为 NSynth 的计画,试着使用深度神经网络的接下具关方式来合成声音,网页上可以听到一些例如贝斯加长笛的关注声音,如果你是音于AI音 Ableton 的使用者,也有 Max Device 可试用。乐工乐其实这样的接下具关声音并不至于无法想像,甚至很容易悦耳,关注挑战可能在于创造出音色后弹奏出属于它的音于AI音表情。

▲ NSynth 在 Ableton 中运作的乐工乐状况。

行至今日,接下具关Qosmo Neutone 在这类型的关注声音合成器中,是音于AI音最值得被关注的一个。VST3/AU 的格式可在大部分的 DAW 中运行,它们所建立的社群也有许多人在其中分享自己的建模(SDK)。

人声合成


之前曾花过一整个篇幅来介绍如何「复制」人声,而如果想要更自由的创作,Dreamtonics Synthesizer V 应该是不错的选择。使用上如同一般的 DAW 介面,只要输入音符跟文字,就可以用已建立好的模型帮你「唱」出来,目前只支援英、日、中三国语言,不过却能找到有才的网友利用罗马拼音唱出惟妙惟肖的台语。

想像你自此得到数个随时可录 demo 的歌手,而且不再有音準问题。

取样与建模

我们身处于一个对于各式音乐、人声取样仍有非常复杂版权及法律规范的时代,未来 AI 创作出的内容是否需在规范内也多有讨论,但少数能肯定的是「声音处理」成了无涉版权,又商机无限的地方。Neural DSP Quad Cortex 这类的产品可以让你先送出讯号(capture out)到任一机器,也许是六零年代的 Fender 音箱,又或是一颗稀有的 pedal,再回送到 Quad Cortex 本身后即完成取样,这让音乐家们对于音色的创造跟掌控又更进了一步。

而如果这样的技术已经能够「下放」到一般人可负担的机器时,厂家从之前传统的 DSP 模拟需要「猜测」各种模拟组件的效果及其相互依赖性,直到如今使用 AI 的更便宜、更快,意味着这些低成本、高质量模拟模型的激增,许多珍禽异兽经典铭机将不再遥不可及。

可以自动化的部分

之前曾多次提及 iZotope 或 sonible 这些发展 AI 混音及母带后期处理工具的公司,多年来产品有着听感上显着的进步。此类声音处理建模的想法部分是基于例如:重金属音乐中的电吉他总是在某个频率段有着巨大能量,又或是爵士音乐中大鼓所占据频率段的位置。随着运算能力增强以及模型数量增大,一如修图软件,终将能够做得比一般人更快更好。

很遗憾地说,除了创作者本身,听众并不在乎创作的细节甚至过程,今日线上的母带后期处理服务,大部分结果无法分辨是由 AI 或是人所为。

MIDI 还有搞头吗?


比起试图在 MIDI 技术上革新(MIDI 2.0)而又无人闻问,透过 MIDI 来拆解学习并创作音乐的 AI 工具似乎比较能让这个已经四十年的科技有个较为光明的未来。无论是能在 DAW 中使用的 Mixed In Key Captain,还是网页形式的 AIVA,都能以此创造出乐句,并输出 MIDI 档案以供修改。

与目前被广泛应用在 AI 创作上的图像以及文本不同,音乐是一个有「时间轴」的艺术形式,即使目前工具已经能产出某种乐风的起承转合,这反而是最为需要人为介入的一个环节,毕竟与音讯相比,MIDI 所能承载的资讯量还是过低,容易听起来笨拙。

如果你研究过因 ChatGPT 而大热的公司 OpenAI,会发现它也曾有过以此为概念的专案 MuseNet,但似乎无意商品化。

撰文:Jungle

重返青春热血的社团时光,5月23日乐手巢杂誌 Vol.17 正式出刊:https://ysolife.com/yso-mag-vol-17/

如何制作声音的克隆人:关于 AI 与音乐(五)

分享到:

京ICP备2024074891号-59