伦敦 伦敦00:00:00 纽约 纽约00:00:00 东京 东京00:00:00 北京 北京00:00:00

400-668-6666

分层编码

当前位置:主页 > 分层编码 >
分层编码

AI玩起音乐来“天赋”惊人新版加州旅馆听过没?还是熟悉的老鹰乐

  AI把一首歌重新唱一遍,会是什么感觉?还是那个歌手,还是那个歌词,却是全新的旋律,全新的风格。

  上面的歌曲你也听过了,它是Open AI 最新研究出的神经网络:Jukebox。

  Jukebox使用了一种称为VQ-VAE的量化方法,将音频压缩到离散空间。

  所谓的分层方法,就是分为三层将44kHz原始音频压缩为8x,32x和128x。

  压缩:每层都独立地进行编码。底层编码进行重构,而顶层编码只保留了基本的音乐信息。

  生产:也是分层进行,一系列的transformers会从上到下生成代码,最后,下层的解码器将它们转换为原始音频。

  目前这个神经网络也有局限,产生不了常见大型音乐结构,例如和声和重复。科学家还在进一步努力中。


点击次数:  更新时间:2020-10-01 06:40   【打印此页】  【关闭
http://gentecilla.com/fencengbianma/77/