For spoken voice in noisy recordings

Voice Isolator:從嘈雜錄音中提取 spoken voice

如果採訪、通話、課程、Podcast 片段、現場錄音或語音備忘裡的 speech 聽不清,請上傳音訊,把 spoken voice 提取成更乾淨的 MP3。

Voice isolator 會從錄音的背景噪音中分離人類 speech。spoken voice 場景適合採訪、通話、課程、Podcast、現場錄音或語音備忘。歌曲和音樂人聲請改用 vocal remover 或 stem splitter。

歌曲和音樂人聲請使用 Vocal Remover / Stem Splitter

僅音訊檔案最長 10 分鐘每 1 秒來源音訊 1 credit

僅支援音訊上傳。符合條件的帳號有 10 分鐘免費額度。provider 處理失敗會退回 credits。

提取 spoken voice
音質

登入後處理音訊

你可以先選擇檔案並在頁面內預覽,但 Voice Isolator 任務需要登入後才會開始,因為它會使用付費 GPU 處理。

Before

原始嘈雜錄音

原始嘈雜錄音

After

提取後的 spoken voice

提取後的 spoken voice
登入並提取 spoken voice
真實 Replicate 測試

直接聽嘈雜原音與提取後人聲

這 4 段短音訊都來自真實 noisy speech 資料集,並已用 Replicate 上的 playmore/speech-enhancer 處理。可以逐段播放 before / after 判斷效果。

公車噪聲語音片段在人聲提取前後的波形對比。
SNR 提升: +15.0 dB

公車噪聲語音清理

低信噪比公車噪聲片段,類似交通低頻噪聲壓在人聲下方的場景。

嘈雜原音
提取後人聲
Edinburgh noisy speech · bus 2.5 dB
咖啡館噪聲語音片段在人聲提取前後的波形對比。
SNR 提升: +7.3 dB

咖啡館人聲清理

咖啡館背景噪聲樣本,用來測試降低環境聲後 spoken voice 是否仍然清楚。

嘈雜原音
提取後人聲
Edinburgh noisy speech · cafe 7.5 dB
辦公室噪聲語音片段在人聲提取前後的波形對比。
SNR 提升: +18.3 dB

辦公室噪聲清理

較難的辦公室噪聲錄音,需要保留句子主體,同時壓低房間底噪。

嘈雜原音
提取後人聲
Edinburgh noisy speech · office 2.5 dB
公共廣場噪聲語音片段在人聲提取前後的波形對比。
SNR 提升: +14.0 dB

公共廣場錄音清理

較長的公共廣場噪聲片段,背景很重,但主體是單一人聲。

嘈雜原音
提取後人聲
Edinburgh noisy speech · public square 2.5 dB

音訊來源:Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0。增強結果由 Replicate playmore/speech-enhancer 產生。

01

這個 voice isolator 用於 spoken voice,不用於歌曲

Voice isolator 搜尋裡混著兩類需求:speech cleanup 和音樂人聲分離。本頁面面向嘈雜錄音裡的 spoken voice。如果你的來源是歌曲、卡拉 OK、acapella 或音樂人聲,請改用 Vocal Remover。

02

上傳嘈雜音訊,流程保持簡單

從音訊檔案開始:MP3、WAV、FLAC、M4A、AAC、OGG 或 WEBM。Voice Isolator v1 支援最大 50 MB、最長 600 秒。直接 MP4 上傳、URL 抓取和即時麥克風降噪不在此流程內。

03

對比 before 和 after 的 voice isolation

Speech cleanup 必須聽得到。先用 before player 播放原始嘈雜錄音,再和處理後的 isolated spoken voice 對比。這個並排檢查可以幫助你判斷清晰度、artifacts,以及是否可以下載使用。

04

下載一個 isolated spoken-voice MP3

結果是一個 spoken voice MP3,不是 stem package、mixer session 或 ZIP 檔案。你可以用於複聽、編輯、轉寫準備、Podcast 清理,或分享更清楚的語音版本。

05

GPU 處理開始前先看清 credits

你可以在頁面上選擇並預覽檔案,但真正產生費用的任務會在登入後啟動。Voice Isolator 按每 1 秒來源音訊 1 credit 計費。provider 提交、provider 處理或輸出 finalization 失敗都會退回 credits。

06

清楚的 v1 邊界避免選錯工具

Voice Isolator 不是通話、OBS、Discord、Zoom 或 Teams 的即時降噪。它也不是 diarization、目標說話人提取、forensic restoration 或重疊說話人分離。影片請先提取音訊,再上傳支援的音訊檔案。

07

由 speech enhancement model 驅動

這個流程和音樂 stem splitter 分開。它把上傳的音訊傳送到 Replicate playmore/speech-enhancer,並使用 mossformer2_se_48k model,然後把返回的音訊 finalized 為可下載的 isolated-voice MP3。

FAQ

Voice Isolator 常見問題

Voice Isolator 適合什麼場景?+

Voice Isolator 用於從採訪、通話、課程、Podcast、語音備忘和現場錄音等嘈雜錄音中提取 spoken voice。它是 speech cleanup,不是音樂 stem separation。

它能從歌曲裡去除人聲嗎?+

不能。本頁面用於嘈雜錄音裡的 spoken voice。歌曲、音樂人聲、卡拉 OK、acapella、remix 或 stem 工作流請使用 Vocal Remover 或 Stem Splitter。

可以上傳哪些檔案?+

V1 只接受音訊檔案:MP3、WAV、FLAC、M4A、AAC、OGG 和 WEBM。檔案必須不超過 50 MB,時長不超過 600 秒。

可以上傳影片或貼上 URL 嗎?+

v1 不支援。Voice Isolator 不支援直接 MP4/video 上傳,也不支援 URL 抓取。如果來源是影片,請先提取音訊,再上傳支援的音訊檔案。

credits 怎麼計算?+

Voice Isolator 沿用音訊處理規則:1 credit 等於來源音訊 1 秒。90 秒錄音會使用 90 credits。

處理失敗會怎樣?+

provider 提交失敗、provider 處理失敗和輸出 finalization 失敗都會把任務標記為 failed,並退回這段錄音使用的 credits。你可以用同一個檔案或更乾淨的匯出重試。

它能分離多個重疊說話人嗎?+

不能。V1 用於增強嘈雜音訊裡的 spoken voice,不做 diarization、目標說話人提取、forensic restoration,也不分離同一錄音中互相覆蓋的多個人聲。

清理嘈雜錄音裡的 spoken voice

上傳音訊,對比 before/after,然後下載 isolated MP3。

提取 spoken voice
LogoAI Stem Splitter

使用這個模板,更快上線你的下一個 AI 產品。

GitHubDiscordEmail
產品
  • 功能
  • 價格
  • 常見問題
免費工具
  • 調性識別
  • Nightcore Maker
  • Pitch Changer 變調工具
  • Slowed Reverb 製作器
  • TikTok Voice 生成器
AI 工具
  • AI Vocal Removal
  • Acapella 人聲提取器
  • YouTube 與 SoundCloud 人聲移除器
  • Karaoke Maker
  • AI 鼓聲去除器
  • Voice Isolator
替代方案
  • Lalal.ai 替代方案
  • Splitter.ai alternative
資源
  • 博客
  • API
開發者
  • API 參考文件
  • SDKs
  • 取得 API 金鑰
整合
  • n8n 整合
信任背書
  • Stripe Climate
  • Product Hunt
法律
  • Cookie政策
  • 隱私政策
  • 服務條款
BadgeBadge
BadgeBadge
BadgeBadge
BadgeBadge
© 2026 AI Stem Splitter All Rights Reserved.
LogoAI Stem Splitter
首頁價格
API 參考文件

REST endpoints、驗證、callbacks、OpenAPI 3.1 規格。

SDKs

7 個第一方 SDK(Node、Python、Java、Go、PHP、Swift、Lua)。

取得 API 金鑰

在 Settings → Developer 中產生金鑰。

調性識別

識別速度與音樂調性 — 無需註冊

Nightcore Maker

Nightcore, daycore, or sped-up versions from a YouTube link or upload.

Pitch Changer 變調工具

上下調整音高,不影響速度。

Slowed Reverb 製作器

為 TikTok、Reels 和 slowed 播放清單製作慢速 + 殘響版本。

TikTok Voice 生成器

免費生成短影音 AI 旁白。

AI Vocal Removal

Remove vocals for karaoke tracks, quick acapellas, and six-stem previews from files or supported links

Acapella 人聲提取器

從任何一首歌拉出乾淨的 acapella,做 remix、mashup 或 DJ 剪輯都能用。

YouTube 與 SoundCloud 人聲移除器

貼上 YouTube 或 SoundCloud 連結,拆分出人聲、鼓、貝斯、鋼琴、吉他和其他分軌

Karaoke Maker

Remove vocals from a song to make a clean instrumental backing track for sing-alongs, rehearsals, and karaoke nights

AI 鼓聲去除器

上傳一首歌,下載一條無鼓音軌——人聲、貝斯,以及除了鼓以外的所有聲部。

Voice Isolator

從嘈雜訪談、通話、現場錄音和語音備忘中提取 spoken voice。

博客
任務中心