免费 AI 清唱提取器 — 从任意歌曲获取干净人声
从任意曲目中提取制作人级别的清唱。录音室级三模型 ensemble 去除伴奏,为你提供无损 WAV 或 FLAC 的干净人声 stem —— 非常适合采样、混音、叠加或扒谱。
如何提取清唱 — 4 步
- 上传歌曲或粘贴 YouTube / SoundCloud / TikTok 链接。
- 选择 WAV 或 FLAC。混音和采样工作必须用无损 —— MP3 会压缩高频人声细节。
- 点击分离。Studio 流程运行三个基于 transformer 的分离模型,并对它们的掩码取平均。
- 下载
vocals.wav—— 隔离出的清唱,已响度归一化,可直接用于你的 DAW。
什么造就出色的 AI 清唱提取器?
出色的清唱有三大特性:低乐器渗漏(听不到鼓或吉他从中透出)、保留高频细节(气声、辅音、人声周围的空气感 —— 这些让人声显得真实)以及自然的动态(歌手变响或变轻时没有泵感或怪异失真)。
旧的人声隔离器用相位抵消的伎俩,会破坏这三者。像 BS-Roformer 这样的现代 AI 模型从数百万样本中学习人声特征,在频谱图空间中生成干净的掩码。我们的 ensemble 结合三款顶尖模型,以弥补各自的盲点。
制作人和 DJ 用 AI 清唱做什么
🔁 混音与混搭
把清唱铺到新的节拍上。经典的混音工作流 —— 但有了 AI,你不再需要官方 A 面 stem。
🎚️ 采样
切片、变调、伸缩并重排人声乐句,做成新歌。源清唱越干净,切片听起来越好。
🥁 DJ 现场演出
在 Serato Stems、Rekordbox、Virtual DJ 或 Engine DJ 中,把一首歌的清唱触发到另一首的伴奏上。
📝 歌词扒谱
隔离人声让人工或 AI 扒谱准确得多 —— 没有伴奏遮盖辅音。
🎵 人声训练数据
构建语音克隆数据集(RVC、Bark、XTTS)的制作人用 AI 提取的清唱作为训练素材。
🎧 精听
没有乐队干扰时,音乐学生研究旋律、咬字、颤音和歌词处理会容易得多。
为什么我们的清唱比其他免费工具更干净
- 三模型 ensemble 对比单一模型。Spleeter、vocalremover.org 和大多数免费工具用单一模型。每个模型都有弱点 —— 一个漏出镲片,另一个糊掉齿音。对三个独立模型取平均能抹平各自的盲点。
- 最新一代 transformer。BS-Roformer(2024)和 Mel-Band Roformer(2024)是业界顶尖,MDX23C 是多届 MDX 挑战赛冠军。多数免费工具用的是 Spleeter(2019),整整老了 5 年。
- 响度归一化输出。EBU R128 归一化让不同清唱的感知响度一致 —— 无需在 DAW 里重新调增益。
- 无损 WAV/FLAC。许多免费工具只提供 MP3,而 MP3 会扼杀你做干净采样所需的瞬态细节。
常见问题
清唱到底有多干净?
在现代流行或嘻哈的录音室母带上,人声 stem 里几乎听不到伴奏。在带侧链人声的重度母带 EDM 曲目上,你可能听到轻微的泵感。在有渗漏的现场录音上,预期会有更多残留。
可以商业采样吗?
AI 提取是一项技术服务。人声表演的底层权利仍归原艺人/厂牌所有。商业采样时,你需要像处理任何其他采样一样清理版权。
和声怎么处理?
和声(和音、即兴段、叠音)通常也会被拉进人声 stem,因为模型把它们标记为“人声”。部分厚重的合唱层可能保留在伴奏侧。
人声通常是单声道,为什么清唱是立体声?
现代人声经过立体声效果(混响、加倍插件、和声器)处理,把它们铺展到整个立体声声场。我们的模型保留这种立体声像,而不是塌缩为单声道。
可以获得干声清唱(无混响)吗?
提取会保留原混音中烘焙进去的任何混响。要进一步把清唱变干,下载后用去混响插件处理。
免费额度:每天几首清唱?
免费每天 1 首,Patreon Pro 每天 20 首。