
我把同一首 Pixabay 曲目分别丢给 LALAL.AI、Moises、vocalremover.org、Voice.ai、Fadr、UVR 和我自己做的 AI Stem Splitter。这是一份戴着耳机听出来的诚实对比,外加一份获取干净六轨输出的逐步操作指南。
我做了一个人声去除工具。在写下第一行推理代码之前,我花了一个周末,把同一首歌丢给所有我能用信用卡买得起的工具——以及几款不需要付费的。
结果和那些 SEO 文章承诺的完全不一样。
这就是我当初希望能读到的那篇对比。七款工具,一首曲子,一副耳机,一个写满吐槽的笔记本。
参考曲目只有一首:inaya_official 在 Pixabay 上的 "Sunlight"——免版税,主唱干净地浮在温暖的 pad 之上,配有鼓、贝斯,桥段还有一段钢琴 fill。
我选它是因为桥段里的钢琴是所有分离器最难处理的元素。如果一款工具自称"音轨分离器",却把钢琴糊进 "other" 里,我要亲耳听见。
每款工具拿到的输入完全一样:3 分 14 秒、44.1 kHz / 16 bit 的 WAV 文件。我用 Sony MDR-7506 监听,遇到只输出 MP3 的工具就 mono 求和处理。
我没手下留情。
上传、付款、下载。它的 UI 在这份清单里最干净,按音轨分离的标签页设计也确实用心。
但有两件事让我不爽。
免费额度是"有生之年共 10 分钟"——不是每月 10 分钟,也不是每首歌 10 分钟,是一次。一旦用完就只能买积分包。
而且它默认的 2 轨输出(人声 vs 伴奏)听起来人声有种奇怪的空洞感。切到他们的 "Phoenix" 模型大部分问题就消失了,但你得知道该这么干。
**适合:**喜欢干净控制台、不在乎价格的人。 **不适合:**任何想在掏钱前测试不止一首歌的人。
Moises 想当你的练习工作室,不只是一个分离器。它有和弦识别、变调、变速、歌词同步。
如果你是想跟着歌练习,这很棒。如果你只想拆出音轨然后走人,这就是阻力。
免费版每月限 5 次分离,每次 2 轨。要想拿到 4 轨就得上 Premium,按年订阅每月 $3.99。年中取消,剩余的月份照样扣。
Premium 上的 5 轨输出(人声/鼓/贝斯/钢琴/other)很干净。问题是,你得在没听过自己歌曲分离效果之前,先决定喜不喜欢 Moises 到愿意订阅。
在 Google 搜 "vocal remover" 排第一的品牌。所以我抱了挺高的期望。
上传秒到,处理飞快,输出嘛——还行。就是还行。
它的子产品 Splitter AI 提供最多 5 轨分离,免费,首次使用不用注册。这是它的杀手锏。音质上明显是 Spleeter 一脉的模型:贝斯有漏音,鼓听起来有点糊,人声轨干净到能凑合家庭 KTV,但还不到能发表 remix 的水平。
**实话:**如果你今晚要给家庭聚会切一段卡拉 OK 伴奏,就用它。别再往下读了,去用就行。免费、能用、不用登录。
但凡是要拿去舞台循环或丢进 DAW 的素材,继续往下看。
它的落地页原话是 "The Best AI Stem Splitter on the Market"。
它不是。
人声分离勉强可以接受。鼓声软塌塌还在抽吸。"other" 轨把钢琴整个吞了——正是我盯着的那种失败模式。
更让我意外的是工作流。要下载结果,我得装他们的桌面 app。一款定位是 web 工具的分离器要我装本地软件,这一条就直接劝退。
装完 8 分钟,我把它卸了。
Fadr 是这份清单里唯一明确把制作人和 DJ 摆在第一位、普通用户摆在第二位的工具。16 种音轨类型、人声/贝斯/鼓的 MIDI 导出、DAW 插件、专门的 /dj 页面。
免费额度足够你认真评估。我测试曲目上的 5 轨输出是我听到的第二好——仅次于下面那两款 htdemucs 级别的结果。钢琴留在钢琴轨。贝斯留在贝斯轨。
付费版 "Plus" 年费 $50。如果你每周都用,这个价不亏。
**没想到的一点:**16 轨模式大多是在同一份底层分离结果上做创意切片——电吉他 vs 木吉他 vs 主音吉他这种。用来采样有用,但不是真正意义上的 16 路物理分离。
免费。本地。开源。不上传、不担心隐私、不用月付。
r/musicproduction 大多数帖子推的就是这个。也确实该推——如果你能装好 Python、把对的模型文件丢进对的文件夹、并且在 macOS 上能熬过一场 CUDA / MPS 安装大战,你能榨出来的音质跟任何商业产品打平。
但这个"如果"是真的"如果"。
我在一台全新 M2 MacBook Air 上花了大约 50 分钟才让 UVR 跑起来。一个 Windows 上的朋友花了两个小时外加一次 Stack Overflow 弯路。我们俩底层都用同一个 Demucs htdemucs_ft 模型,分离结果都很漂亮。
**用 UVR 如果:**你要批量处理几十首歌、在意隐私、不想按分钟付费、能耐着性子读安装文档。
**别用 UVR 如果:**你要 60 秒内拿到音轨,从没气急败坏地敲过 pip install。
开诚布公:这是我做的。你可以跳过这一节——但既然你是为对比来的,我会诚实地讲它是什么、不是什么。
它跑的是和 UVR 一样的 htdemucs 模型家族。模型来自 Meta AI,赢过 Sony Music Demixing Challenge,是所有正经开源工具都会去拿的那一款。我没造出"更好的模型",我做的是一个无摩擦地跑这个模型的方式。
输出六轨:人声、鼓、贝斯、吉他、钢琴、other。纯浏览器。WAV 下载。
在测试曲目上,它把钢琴留在钢琴轨。副歌部分的人声轨没有可闻的鼓声漏音。一首常规长度的歌曲处理在 60 秒内 完成(Pixabay 那首测试曲 41 秒回来)。
它不适合的场景:
你想要操作指南。这是从"我有一首歌"到"我有六条音轨"的完整路径。
**第 1 步。**打开 aistemsplitter.org。用 Google 登录。你会拿到 10 分钟免费处理额度——不要信用卡,也没有后台默默倒计时的试用期。
**第 2 步。**把音频文件拖到上传区。支持:MP3、WAV、FLAC、M4A。单文件最多约 100 MB 或 20 分钟。
**第 3 步。**选择音轨模式。4 轨(人声 / 鼓 / 贝斯 / other)更快,和大多数其它工具给你的一致。6 轨(多加吉他和钢琴)是你在意上面那个钢琴问题时该选的。
**第 4 步。**点开始。进度条是真实推进的,不是 0-100 的伪动画。一首 3-4 分钟的歌在我们的基础设施上不到一分钟出结果。
**第 5 步。**完成后每条音轨都有自己的播放器和下载按钮。你可以独奏、静音、A/B 对照原曲,或者把六条 WAV 打包成 zip 下载。
这时候你独奏人声应该听到完全孤立的人声,独奏除人声外的所有轨应该完全听不到人声。如果不是这样,发邮件到支持邮箱——这是我们最在意的失败模式。
第 6 步(可选)。免费额度用完了?积分包是 $5 换 50 分钟($0.10 / 分钟),积分永不过期。没有订阅。如果你一年只处理一首歌,这 $5 你只用掉了 4 美分。
这是我开始时希望手边就有的表。
| 工具 | 免费输出 | 付费起步 | 音轨数 | 格式 | 速度 | 诚实评价 |
|---|---|---|---|---|---|---|
| LALAL.AI | 终身共 10 分钟 | 积分包约 $15 起 | 最多 10 | WAV / MP3 | ~1 分钟 | UI 干净,免费额度难受 |
| Moises | 每月 5 首,2 轨 | 按年订阅每月 $3.99 | 付费版 5 轨 | MP3(免费)、WAV(付费) | ~1-2 分钟 | 真打算订阅就香 |
| vocalremover.org | 免费、免注册、5 轨 | 会员套餐 | 最多 5 | MP3 / WAV | <1 分钟 | 卡拉 OK 的最佳免费选项 |
| Voice.ai | 装 app 后免费 | n/a | 2-4 | 需装 app | 不定 | 营销大于现实 |
| Fadr | 慷慨的免费额度 | $50/年 | 16(创意切片) | WAV | ~1 分钟 | 制作人的最佳选择 |
| UVR(本地) | 永久免费 | 免费 | 看模型(常 6 轨) | WAV | 看你 GPU | 装得起就音质最好 |
| AI Stem Splitter | 注册即送 10 分钟 | $5 / 50 分钟,永不过期 | 6(htdemucs) | WAV | <1 分钟 | 不想折腾安装、又要 htdemucs 的偶尔用户首选 |
今晚切一首 KTV 伴奏、之后不会再用:vocalremover.org。读到这里就行了。
会装 Python、要处理一大批:UVR。免费 + 本地,无敌。
你是住在 DAW 里的制作人:Fadr 加它的插件。
你想要六轨、想在一分钟内拿到、想要 WAV、不想再订阅任何东西:AI Stem Splitter 就是我为这个场景做的。
三件,写下来怕忘:
**大多数工具在拼音轨数量。**营销文案里的"16 轨"很卖座。但一个好的 4 轨分离和一个烂的 16 轨分离之间的音质差距是巨大的。音轨数不等于音质。
**免费额度才是产品。**我试过的每一个付费方案都在卖一种我付钱之前听不到的音质。我信任的工具是那些让我在注册前就能用自己的歌试出结果的。这是我自家网站上有意做的选择,也是我会让横评里每一款竞品都改的一件事。
**有速度没音质比慢且干净更糟。**一个 30 秒分离完、但人声轨还带鼓漏音的工具是不能用的。一个 90 秒分离完、但干干净净的工具是金子。盯住被拿来跑分的是什么。
笔记本就这些。
你能把一首歌丢进网页、拿回六条干净音轨——而且比你打开 DAW 的时间还短——这一天已经到了。只是对每一款工具来说,到的不一样齐。
