AIVoiceSeparator
🌐 English

如何去除人声——免费处理 YouTube 视频(2026)

你不需要音频工程学位,也不需要付费插件。借助现代 AI,你只要粘贴一个 YouTube 链接,几分钟内就能免费得到干净分离的人声音轨和伴奏。下面是完整步骤,以及那些没人会告诉你的限制和小细节。

过去要去除一首歌里的人声,意味着在 Audacity 里折腾相位抵消的小技巧,结果往往是一团空洞、发飘的杂音。到了 2026 年,深度学习模型能真正胜任这件事:它们真的“理解”什么是人声,并把人声从混音中提取出来,同时保留鼓、贝斯、吉他和合成器。最终你得到的是两个可用的文件——一个纯人声音轨和一个伴奏——而不是一个被严重损伤的折中产物。

本教程介绍最快的免费方法:把 YouTube 链接直接粘贴进我们的 YouTube 人声去除器。无需第三方 MP3 转换器,无需安装,无需注册。

想用一首真实的歌跟着操作?

🔗 打开 YouTube 人声去除器

免费每天 1 首 · 无需注册 · Patreon Pro = 每天 20 首

四步法(粘贴链接,下载音轨)

  1. 复制 YouTube 链接。在浏览器或 YouTube App 中打开视频,从地址栏复制链接,或点击分享 → 复制链接。标准的 youtube.com/watch?v=… 链接、短链 youtu.be/…、YouTube Music 和 Shorts 都支持。
  2. 打开 AIVoiceSeparator,切换到粘贴 YouTube / SoundCloud / TikTok 链接的标签页。你不必先下载 MP3——服务器会用 yt-dlp 替你抓取音频。
  3. 粘贴链接并点击“分离音频”。你的任务会进入队列,GPU 会对整首曲目运行三模型 AI 集成。你会看到实时进度条;可以让标签页开着,也可以稍后再回来。
  4. 预览并下载。处理完成后(一首普通歌曲约六分钟),可在浏览器里播放两个音轨,然后下载分离出的 vocals.wavinstrumental.wav。也可以选择 MP3 320 kbps 或无损 FLAC。

整个流程就是这样。如果你更想上传已有的文件,同一页面也支持拖放音频——链接方式只是替你省了一步。有两个小习惯能让结果更好:当一首歌有多个版本时,选音质最高的那一版;优先用官方发行版,而不是手机录的现场片段。来源越干净、越响亮,AI 可利用的信息就越多,分离效果也就越逼真。

你也不用一直盯着任务。一旦排队,处理就在服务器上进行,所以你可以关闭标签页、换歌,或者十分钟后再回来——结果会一直等着你(直到 24 小时自动删除窗口为止)。如果你在一次会话里处理了好几首,记住免费版每天重置为一首歌。

哪些能行——以及需要了解的限制

⏱️ 15 分钟上限

来源视频必须不超过 15 分钟。这几乎涵盖所有歌曲(包括加长混音版),但排除完整的 DJ set 和播客。

📦 100 MB 文件上限

音频下载后必须小于 100 MB。高码率来源在较长曲目上可能触及这个上限——若如此,请裁剪或选更短的视频。

🌐 仅限公开视频

私享、会员专属、年龄限制和地区屏蔽的视频常常拒绝下载。公开链接才是可靠的路径。

🆓 每天 1 首免费

匿名用户每 24 小时可享受一次完整音质的分离。Patreon Pro 将其提升到每天 20 首并在队列中优先。

🔒 24 小时自动删除

下载的音频和你分离出的音轨都会在一天后自动删除。你的音频绝不会被用于训练 AI 模型。

🎚️ 无损输出

如果你要在 DAW 里继续编辑音轨,请选 WAV 或 FLAC——它们保留完整保真度。MP3 320 适合随意聆听。

音质预期:好的分离听起来是什么样

2026 年的 AI 分离确实令人惊艳,但它不是魔法。这里给你一个诚实的画面,说明你会得到什么。

对于混音良好的录音室作品——主唱清晰、制作现代——伴奏会听起来干净饱满,人声音轨会清晰,只有极轻微的瑕疵。这是最理想的情况,而大多数歌曲都属于此类。我们的流水线运行加权三模型集成(BS-Roformer、Mel-Band Roformer 和 MDX23C InstVoc),实测 SDR 为 12.97 dB,明显比老式单模型工具更干净。如果你想了解为什么集成胜过任何单一模型,请看我们关于 BS-Roformer vs Demucs 的解析。

更具挑战的情况:

如果你的目标专门是无人声的伴奏,伴奏提取器正是为此调校的,而卡拉OK制作器还会在上面叠加同步歌词。

关于法律方面的简短说明

为自己的私人用途分离一首曲目——跟唱、练乐器、研究编曲或转写歌词——在大多数地方通常被视为合理的个人使用。完全不同的情况是发布、分发或商业化你并不拥有版权的歌曲的音轨。把提取出的清唱上传到流媒体平台、出售翻混,或对翻唱进行变现,都可能侵犯版权。

简而言之:你需要对所处理的任何内容拥有相应权利负责。我们不托管也不分享你的输出,所有内容在 24 小时后删除,但这并不授予你对底层录音的任何许可。拿不准时,就保持私人用途,或使用你自己创作或已获授权的素材。具体请见我们的使用条款DMCA 政策

常见问题排查

问题可能原因与解决方法
“下载失败”错误视频是私享、年龄限制或地区锁定的。试试同一首歌的公开版本,或自行下载音频后上传文件。
任务因时长被拒来源超过 15 分钟。请使用更短的版本或片段。
“文件过大”下载的音频超过 100 MB。请选更短或码率更低的来源视频。
已达每日上限免费版每 24 小时一首歌。等待重置,或加入 Patreon Pro 享每天 20 首。
伴奏里残留人声“幽灵”通常是混响尾音。没有能完美去除的开关,但更干净、混响更少的来源会有很大帮助。
输出听起来单薄或浑浊来源码率太低。垃圾进、垃圾出——请从可获得的最高音质版本开始。
队列感觉很慢单块 GPU 一次只处理一个任务。繁忙时段 Pro 会员会排在免费任务之前。

额外福利:同时获取歌词和调性/速度

在点击分离之前,你可以打开“生成歌词”。我们会在分离出的人声音轨上运行 Whisper,并回传三个文件:SRT(用于视频字幕)、LRC(用于按时间滚动歌词的卡拉OK播放器)和纯文本 TXT 转录。每个任务还会报告检测到的 BPM 和音乐调性,如果你打算翻混、做 DJ 或在伴奏上叠加翻唱,这非常有用。想了解把一首曲目变成可跟唱版本的完整流程,请看如何把任意歌曲做成卡拉OK版本

常见问题

这真的免费吗?

是的——每天一首歌,享受完整 Studio 音质,无水印、无需注册。Patreon Pro 将上限提升到每天 20 首并增加优先排队。

我需要先下载 YouTube 音频吗?

不需要。粘贴链接,我们的服务器会替你下载音频。你也可以上传文件,如果你更喜欢的话。

最大长度和大小是多少?

每个来源 15 分钟,下载后 100 MB。大多数歌曲都能轻松满足。

除了 YouTube 还支持哪些链接?

SoundCloud、TikTok、Bandcamp 和 Vimeo 也都支持。我们专门的 TikTok 人声去除器页面介绍了那个流程。

伴奏会完全干净吗?

对大多数录音室作品而言,是的——干净又饱满。强混响或现场录音可能残留淡淡的人声痕迹。预期请见上面的音质章节。

你们会保留我的文件吗?

不会。输入和输出都在 24 小时后删除,你的音频绝不会被用于训练模型。

这合法吗?

个人用途通常是合法的。再分发或商业使用他人的录音则不可以。你需要自行对权利负责——请见我们的条款

准备好分离你的第一首曲目了吗?

🎙️ 打开 AIVoiceSeparator

免费、无需注册、无水印——每 24 小时 1 首歌

继续阅读