最佳人声去除工具横评：我用同一首歌实测了 7 款

我做了一个人声去除工具。在写下第一行推理代码之前，我花了一个周末，把同一首歌丢给所有我能用信用卡买得起的工具——以及几款不需要付费的。

结果和那些 SEO 文章承诺的完全不一样。

这就是我当初希望能读到的那篇对比。七款工具，一首曲子，一副耳机，一个写满吐槽的笔记本。

测试设置

参考曲目只有一首：inaya_official 在 Pixabay 上的 "Sunlight"——免版税，主唱干净地浮在温暖的 pad 之上，配有鼓、贝斯，桥段还有一段钢琴 fill。

我选它是因为桥段里的钢琴是所有分离器最难处理的元素。如果一款工具自称"音轨分离器"，却把钢琴糊进 "other" 里，我要亲耳听见。

每款工具拿到的输入完全一样：3 分 14 秒、44.1 kHz / 16 bit 的 WAV 文件。我用 Sony MDR-7506 监听，遇到只输出 MP3 的工具就 mono 求和处理。

我没手下留情。

我实际试过的工具

1. LALAL.AI——最精致的那一个

上传、付款、下载。它的 UI 在这份清单里最干净，按音轨分离的标签页设计也确实用心。

但有两件事让我不爽。

免费额度是"有生之年共 10 分钟"——不是每月 10 分钟，也不是每首歌 10 分钟，是一次。一旦用完就只能买积分包。

而且它默认的 2 轨输出（人声 vs 伴奏）听起来人声有种奇怪的空洞感。切到他们的 "Phoenix" 模型大部分问题就消失了，但你得知道该这么干。

**适合：**喜欢干净控制台、不在乎价格的人。 **不适合：**任何想在掏钱前测试不止一首歌的人。

2. Moises——主打工作流的那个

Moises 想当你的练习工作室，不只是一个分离器。它有和弦识别、变调、变速、歌词同步。

如果你是想跟着歌练习，这很棒。如果你只想拆出音轨然后走人，这就是阻力。

免费版每月限 5 次分离，每次 2 轨。要想拿到 4 轨就得上 Premium，按年订阅每月 $3.99。年中取消，剩余的月份照样扣。

Premium 上的 5 轨输出（人声/鼓/贝斯/钢琴/other）很干净。问题是，你得在没听过自己歌曲分离效果之前，先决定喜不喜欢 Moises 到愿意订阅。

3. vocalremover.org / Splitter AI——SERP 冠军

在 Google 搜 "vocal remover" 排第一的品牌。所以我抱了挺高的期望。

上传秒到，处理飞快，输出嘛——还行。就是还行。

它的子产品 Splitter AI 提供最多 5 轨分离，免费，首次使用不用注册。这是它的杀手锏。音质上明显是 Spleeter 一脉的模型：贝斯有漏音，鼓听起来有点糊，人声轨干净到能凑合家庭 KTV，但还不到能发表 remix 的水平。

**实话：**如果你今晚要给家庭聚会切一段卡拉 OK 伴奏，就用它。别再往下读了，去用就行。免费、能用、不用登录。

但凡是要拿去舞台循环或丢进 DAW 的素材，继续往下看。

4. Voice.ai——自封"最佳"的那个

它的落地页原话是 "The Best AI Stem Splitter on the Market"。

它不是。

人声分离勉强可以接受。鼓声软塌塌还在抽吸。"other" 轨把钢琴整个吞了——正是我盯着的那种失败模式。

更让我意外的是工作流。要下载结果，我得装他们的桌面 app。一款定位是 web 工具的分离器要我装本地软件，这一条就直接劝退。

装完 8 分钟，我把它卸了。

5. Fadr——制作人的选择

Fadr 是这份清单里唯一明确把制作人和 DJ 摆在第一位、普通用户摆在第二位的工具。16 种音轨类型、人声/贝斯/鼓的 MIDI 导出、DAW 插件、专门的 /dj 页面。

免费额度足够你认真评估。我测试曲目上的 5 轨输出是我听到的第二好——仅次于下面那两款 htdemucs 级别的结果。钢琴留在钢琴轨。贝斯留在贝斯轨。

付费版 "Plus" 年费 $50。如果你每周都用，这个价不亏。

**没想到的一点：**16 轨模式大多是在同一份底层分离结果上做创意切片——电吉他 vs 木吉他 vs 主音吉他这种。用来采样有用，但不是真正意义上的 16 路物理分离。

6. UVR (Ultimate Vocal Remover)——开源那一款

免费。本地。开源。不上传、不担心隐私、不用月付。

r/musicproduction 大多数帖子推的就是这个。也确实该推——如果你能装好 Python、把对的模型文件丢进对的文件夹、并且在 macOS 上能熬过一场 CUDA / MPS 安装大战，你能榨出来的音质跟任何商业产品打平。

但这个"如果"是真的"如果"。

我在一台全新 M2 MacBook Air 上花了大约 50 分钟才让 UVR 跑起来。一个 Windows 上的朋友花了两个小时外加一次 Stack Overflow 弯路。我们俩底层都用同一个 Demucs htdemucs_ft 模型，分离结果都很漂亮。

**用 UVR 如果：**你要批量处理几十首歌、在意隐私、不想按分钟付费、能耐着性子读安装文档。

**别用 UVR 如果：**你要 60 秒内拿到音轨，从没气急败坏地敲过 pip install。

7. AI Stem Splitter（我自己的——aistemsplitter.org）

开诚布公：这是我做的。你可以跳过这一节——但既然你是为对比来的，我会诚实地讲它是什么、不是什么。

它跑的是和 UVR 一样的 htdemucs 模型家族。模型来自 Meta AI，赢过 Sony Music Demixing Challenge，是所有正经开源工具都会去拿的那一款。我没造出"更好的模型"，我做的是一个无摩擦地跑这个模型的方式。

输出六轨：人声、鼓、贝斯、吉他、钢琴、other。纯浏览器。WAV 下载。

在测试曲目上，它把钢琴留在钢琴轨。副歌部分的人声轨没有可闻的鼓声漏音。一首常规长度的歌曲处理在 60 秒内 完成（Pixabay 那首测试曲 41 秒回来）。

它不适合的场景：

暂时不支持 YouTube/SoundCloud URL 导入。你得自己带文件。
没有 API。如果你要用 Python 脚本化处理，用 UVR。
没有 DAW 插件。如果你想在 Logic 里不离开 Logic 就拿到去人声的轨，Fadr 能做，我们做不到。

怎么用——逐步操作

你想要操作指南。这是从"我有一首歌"到"我有六条音轨"的完整路径。

**第 1 步。**打开 aistemsplitter.org。用 Google 登录。你会拿到 10 分钟免费处理额度——不要信用卡，也没有后台默默倒计时的试用期。

**第 2 步。**把音频文件拖到上传区。支持：MP3、WAV、FLAC、M4A。单文件最多约 100 MB 或 20 分钟。

**第 3 步。**选择音轨模式。4 轨（人声 / 鼓 / 贝斯 / other）更快，和大多数其它工具给你的一致。6 轨（多加吉他和钢琴）是你在意上面那个钢琴问题时该选的。

**第 4 步。**点开始。进度条是真实推进的，不是 0-100 的伪动画。一首 3-4 分钟的歌在我们的基础设施上不到一分钟出结果。

**第 5 步。**完成后每条音轨都有自己的播放器和下载按钮。你可以独奏、静音、A/B 对照原曲，或者把六条 WAV 打包成 zip 下载。

这时候你独奏人声应该听到完全孤立的人声，独奏除人声外的所有轨应该完全听不到人声。如果不是这样，发邮件到支持邮箱——这是我们最在意的失败模式。

第 6 步（可选）。免费额度用完了？积分包是 $5 换 50 分钟（$0.10 / 分钟），积分永不过期。没有订阅。如果你一年只处理一首歌，这 $5 你只用掉了 4 美分。

横评表

这是我开始时希望手边就有的表。

工具	免费输出	付费起步	音轨数	格式	速度	诚实评价
LALAL.AI	终身共 10 分钟	积分包约 $15 起	最多 10	WAV / MP3	~1 分钟	UI 干净，免费额度难受
Moises	每月 5 首，2 轨	按年订阅每月 $3.99	付费版 5 轨	MP3（免费）、WAV（付费）	~1-2 分钟	真打算订阅就香
vocalremover.org	免费、免注册、5 轨	会员套餐	最多 5	MP3 / WAV	<1 分钟	卡拉 OK 的最佳免费选项
Voice.ai	装 app 后免费	n/a	2-4	需装 app	不定	营销大于现实
Fadr	慷慨的免费额度	$50/年	16（创意切片）	WAV	~1 分钟	制作人的最佳选择
UVR（本地）	永久免费	免费	看模型（常 6 轨）	WAV	看你 GPU	装得起就音质最好
AI Stem Splitter	注册即送 10 分钟	$5 / 50 分钟，永不过期	6（htdemucs）	WAV	<1 分钟	不想折腾安装、又要 htdemucs 的偶尔用户首选

我会怎么跟朋友说

今晚切一首 KTV 伴奏、之后不会再用：vocalremover.org。读到这里就行了。

会装 Python、要处理一大批：UVR。免费 + 本地，无敌。

你是住在 DAW 里的制作人：Fadr 加它的插件。

你想要六轨、想在一分钟内拿到、想要 WAV、不想再订阅任何东西：AI Stem Splitter 就是我为这个场景做的。

我学到的几件事

三件，写下来怕忘：

**大多数工具在拼音轨数量。**营销文案里的"16 轨"很卖座。但一个好的 4 轨分离和一个烂的 16 轨分离之间的音质差距是巨大的。音轨数不等于音质。

**免费额度才是产品。**我试过的每一个付费方案都在卖一种我付钱之前听不到的音质。我信任的工具是那些让我在注册前就能用自己的歌试出结果的。这是我自家网站上有意做的选择，也是我会让横评里每一款竞品都改的一件事。

**有速度没音质比慢且干净更糟。**一个 30 秒分离完、但人声轨还带鼓漏音的工具是不能用的。一个 90 秒分离完、但干干净净的工具是金子。盯住被拿来跑分的是什么。

笔记本就这些。

你能把一首歌丢进网页、拿回六条干净音轨——而且比你打开 DAW 的时间还短——这一天已经到了。只是对每一款工具来说，到的不一样齐。