For spoken voice in noisy recordings

Voice Isolator:从嘈杂录音中提取 spoken voice

如果采访、通话、课程、播客片段、现场录音或语音备忘里的 speech 听不清,上传音频,把 spoken voice 提取成更干净的 MP3。

Voice isolator 会从录音的背景噪声里分离人类 speech。spoken voice 场景适合采访、通话、课程、播客、现场录音或语音备忘。歌曲和音乐人声请改用 vocal remover 或 stem splitter。

歌曲和音乐人声请使用 Vocal Remover / Stem Splitter

仅音频文件最长 10 分钟每 1 秒源音频 1 credit

仅支持音频上传。符合条件的账号有 10 分钟免费额度。provider 处理失败会退回 credits。

提取 spoken voice
音质

登录后处理音频

你可以先选择文件并在页面内预览,但 Voice Isolator 任务需要登录后才会开始,因为它会使用付费 GPU 处理。

Before

原始嘈杂录音

原始嘈杂录音

After

提取后的 spoken voice

提取后的 spoken voice
登录并提取 spoken voice
真实 Replicate 测试

直接听嘈杂原音和提取后人声

这 4 段短音频都来自真实 noisy speech 数据集,并已用 Replicate 上的 playmore/speech-enhancer 处理。可以逐段播放 before / after 判断效果。

公交噪声语音片段在人声提取前后的波形对比。
SNR 提升: +15.0 dB

公交噪声语音清理

低信噪比公交噪声片段,类似交通低频噪声压在人声下面的场景。

嘈杂原音
提取后人声
Edinburgh noisy speech · bus 2.5 dB
咖啡馆噪声语音片段在人声提取前后的波形对比。
SNR 提升: +7.3 dB

咖啡馆人声清理

咖啡馆背景噪声样本,用来测试降低环境声后 spoken voice 是否仍然清楚。

嘈杂原音
提取后人声
Edinburgh noisy speech · cafe 7.5 dB
办公室噪声语音片段在人声提取前后的波形对比。
SNR 提升: +18.3 dB

办公室噪声清理

较难的办公室噪声录音,需要保留句子主体,同时压低房间底噪。

嘈杂原音
提取后人声
Edinburgh noisy speech · office 2.5 dB
公共广场噪声语音片段在人声提取前后的波形对比。
SNR 提升: +14.0 dB

公共广场录音清理

更长的公共广场噪声片段,背景很重,但主体是单个人声。

嘈杂原音
提取后人声
Edinburgh noisy speech · public square 2.5 dB

音频来源:Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0。增强结果由 Replicate playmore/speech-enhancer 生成。

01

这个 voice isolator 用于 spoken voice,不用于歌曲

Voice isolator 搜索里混着两类需求:speech cleanup 和音乐人声分离。本页面面向嘈杂录音里的 spoken voice。如果你的来源是歌曲、卡拉 OK、acapella 或音乐人声,请改用 Vocal Remover。

02

上传嘈杂音频,流程保持简单

从音频文件开始:MP3、WAV、FLAC、M4A、AAC、OGG 或 WEBM。Voice Isolator v1 支持最大 50 MB、最长 600 秒。直接 MP4 上传、URL 抓取和实时麦克风降噪不在此流程内。

03

对比 before 和 after 的 voice isolation

Speech cleanup 必须听得到。先用 before player 播放原始嘈杂录音,再和处理后的 isolated spoken voice 对比。这个并排检查可以帮助你判断清晰度、artifacts,以及是否可以下载使用。

04

下载一个 isolated spoken-voice MP3

结果是一个 spoken voice MP3,不是 stem package、mixer session 或 ZIP 文件。你可以用于复听、编辑、转写准备、播客清理,或分享更清楚的语音版本。

05

GPU 处理开始前先看清 credits

你可以在页面上选择并预览文件,但真正产生费用的任务会在登录后启动。Voice Isolator 按每 1 秒源音频 1 credit 计费。provider 提交、provider 处理或输出 finalization 失败都会退回 credits。

06

清楚的 v1 边界避免选错工具

Voice Isolator 不是通话、OBS、Discord、Zoom 或 Teams 的实时降噪。它也不是 diarization、目标说话人提取、forensic restoration 或重叠说话人分离。视频请先提取音频,再上传支持的音频文件。

07

由 speech enhancement model 驱动

这个流程和音乐 stem splitter 分开。它把上传的音频发送到 Replicate playmore/speech-enhancer,并使用 mossformer2_se_48k model,然后把返回的音频 finalized 为可下载的 isolated-voice MP3。

FAQ

Voice Isolator 常见问题

Voice Isolator 适合什么场景?+

Voice Isolator 用于从采访、通话、课程、播客、语音备忘和现场录音等嘈杂录音中提取 spoken voice。它是 speech cleanup,不是音乐 stem separation。

它能从歌曲里去除人声吗?+

不能。本页面用于嘈杂录音里的 spoken voice。歌曲、音乐人声、卡拉 OK、acapella、remix 或 stem 工作流请使用 Vocal Remover 或 Stem Splitter。

可以上传哪些文件?+

V1 只接受音频文件:MP3、WAV、FLAC、M4A、AAC、OGG 和 WEBM。文件必须不超过 50 MB,时长不超过 600 秒。

可以上传视频或粘贴 URL 吗?+

v1 不支持。Voice Isolator 不支持直接 MP4/video 上传,也不支持 URL 抓取。如果来源是视频,请先提取音频,再上传支持的音频文件。

credits 怎么计算?+

Voice Isolator 沿用音频处理规则:1 credit 等于源音频 1 秒。90 秒录音会使用 90 credits。

处理失败会怎样?+

provider 提交失败、provider 处理失败和输出 finalization 失败都会把任务标记为 failed,并退回这段录音使用的 credits。你可以用同一个文件或更干净的导出重试。

它能分离多个重叠说话人吗?+

不能。V1 用于增强嘈杂音频里的 spoken voice,不做 diarization、目标说话人提取、forensic restoration,也不分离同一录音中互相覆盖的多个人声。

清理嘈杂录音里的 spoken voice

上传音频,对比 before/after,然后下载 isolated MP3。

提取 spoken voice
LogoAI Stem Splitter

使用这个模板,更快上线你的下一个 AI 产品。

GitHubDiscordEmail
产品
  • 功能
  • 价格
  • 常见问题
免费工具
  • 调性识别
  • Nightcore Maker
  • Pitch Changer · 音调调整
  • Slowed Reverb Maker · 慢速混响生成器
  • TikTok Voice 生成器
AI 工具
  • AI Vocal Removal
  • AI Acapella Extractor
  • YouTube 与 SoundCloud 人声移除器
  • Karaoke Maker
  • AI Drum Remover
  • Voice Isolator
替代方案
  • Lalal.ai 替代品
  • Splitter.ai alternative
资源
  • 博客
  • API
开发者
  • API 参考
  • SDK
  • 获取 API key
集成
  • n8n 集成
信任背书
  • Stripe Climate
  • Product Hunt
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
BadgeBadge
BadgeBadge
BadgeBadge
BadgeBadge
© 2026 AI Stem Splitter All Rights Reserved.
LogoAI Stem Splitter
首页价格
API 参考

REST 端点、认证、回调、OpenAPI 3.1 规范。

SDK

七个第一方 SDK(Node、Python、Java、Go、PHP、Swift、Lua)。

获取 API key

在 Settings → Developer 中创建 key。

调性识别

识别速度与音乐调性 — 无需注册

Nightcore Maker

Nightcore, daycore, or sped-up versions from a YouTube link or upload.

Pitch Changer · 音调调整

上下调整音调,不改变速度。

Slowed Reverb Maker · 慢速混响生成器

为 TikTok、Reels 和慢速播放列表制作慢速+混响 edit。

TikTok Voice 生成器

免费生成短视频 AI 旁白。

AI Vocal Removal

Remove vocals for karaoke tracks, quick acapellas, and six-stem previews from files or supported links

AI Acapella Extractor

为 remix、mashup 或 DJ 剪辑从任何歌曲中提取一段干净的 acapella。

YouTube 与 SoundCloud 人声移除器

粘贴 YouTube 或 SoundCloud 链接,拆分出人声、鼓、贝斯、钢琴、吉他和其他分轨

Karaoke Maker

Remove vocals from a song to make a clean instrumental backing track for sing-alongs, rehearsals, and karaoke nights

AI Drum Remover

上传一首歌,下载一段无鼓伴奏 —— 人声、贝斯和除了鼓以外的全部音乐。

Voice Isolator

从嘈杂采访、通话、现场录音和语音备忘中提取 spoken voice。

博客
任务中心