
バス騒音の音声クリーンアップ
交通音のような低域ノイズが話し声の下にある、低SNRのバス環境クリップです。
インタビュー、通話、講義、ポッドキャスト、フィールド録音、ボイスメモで話し声が聞き取りにくいですか?音声をアップロードして、話し声をよりクリアな MP3 として抽出します。
Voice isolator は音声録音の背景ノイズから人の話し声を分離します。話し声にはインタビュー、通話、講義、ポッドキャスト、フィールド録音、ボイスメモで使います。曲や音楽ボーカルには Vocal Remover または Stem Splitter を使ってください。
曲や音楽ボーカルには Vocal Remover / Stem Splitter
音声ファイルのみアップロード可能。対象アカウントは 10 分無料。プロバイダー処理が失敗した場合は credits を返却します。
音声処理にはログインが必要です
ここでファイルを選んでプレビューできますが、Voice Isolator のジョブは有料 GPU 処理を使うためログイン後に開始します。
元のノイズの多い録音
抽出された話し声
4つの短い noisy speech クリップを Replicate の playmore/speech-enhancer で処理しました。before / after を再生してクリーンアップ結果を確認できます。

交通音のような低域ノイズが話し声の下にある、低SNRのバス環境クリップです。

広い環境音を下げた後も話し声の明瞭さが残るかを確認するカフェ背景音サンプルです。

文の内容を残しながら室内ノイズを抑える必要がある、難しめのオフィス録音です。

背景音が強い長めの公共広場クリップで、主対象は単一の話し声です。
音声出典: Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0。処理後音声は Replicate playmore/speech-enhancer で生成しました。
Voice isolator の検索には、話し声のクリーンアップと音楽ボーカル除去の 2 つの目的が混在します。このページはノイズの多い録音の話し声向けです。曲、カラオケ、アカペラ、音楽ボーカルには Vocal Remover を使ってください。
MP3、WAV、FLAC、M4A、AAC、OGG、WEBM の音声ファイルから始めます。Voice Isolator v1 は最大 50 MB、600 秒まで対応。MP4 直接アップロード、URL 取得、ライブマイク処理は対象外です。
スピーチのクリーンアップは聴いて確認する必要があります。Before プレーヤーで元のノイズ録音を聴き、処理後の抽出された話し声と比較します。聞き取りやすさ、アーティファクト、ダウンロード可否を判断できます。
結果は話し声の MP3 1 つで、stem パッケージ、mixer session、ZIP ではありません。レビュー、編集、文字起こし準備、ポッドキャストのクリーンアップ、より明瞭な音声共有に使えます。
ページ上でファイル選択とプレビューはできますが、課金対象ジョブはログイン後に開始します。Voice Isolator はソース 1 秒ごとに 1 credit を使用。プロバイダー送信、処理、出力 finalization の失敗時は返却されます。
Voice Isolator は通話、OBS、Discord、Zoom、Teams のリアルタイムノイズ除去ではありません。diarization、対象話者抽出、forensic restoration、重なった話者の分離にも対応しません。動画は先に音声を抽出してアップロードしてください。
このフローは音楽 stem splitter とは別です。アップロード音声を Replicate playmore/speech-enhancer の mossformer2_se_48k model に送り、返された音声をダウンロード用の isolated-voice MP3 として finalization します。
Voice Isolator はインタビュー、通話、講義、ポッドキャスト、ボイスメモ、フィールド録音などのノイズの多い録音から話し声を抽出します。音楽 stem separation ではなく speech cleanup です。
いいえ。このページはノイズの多い録音の話し声向けです。曲、音楽ボーカル、カラオケ、アカペラ、リミックス、stem ワークフローには Vocal Remover または Stem Splitter を使ってください。
V1 は音声ファイルのみ対応します: MP3、WAV、FLAC、M4A、AAC、OGG、WEBM。ファイルは 50 MB 以下、600 秒以下である必要があります。
v1 ではできません。Voice Isolator は MP4/video の直接アップロードや URL 取得に対応しません。動画が元の場合は先に音声を抽出し、対応音声ファイルをアップロードしてください。
Voice Isolator は他の音声処理と同じルールを使います: ソース音声 1 秒 = 1 credit。90 秒の録音は 90 credits を使います。
プロバイダー送信、プロバイダー処理、出力 finalization の失敗はジョブを failed にし、その録音で使った credits を返却します。同じ音声またはよりクリーンな書き出しで再試行できます。
いいえ。V1 はノイズの多い音声の話し声を改善するもので、diarization、対象話者抽出、forensic restoration、同じ録音で重なって話す複数人の分離には対応しません。
音声をアップロードし、前後を比較して、抽出された MP3 をダウンロードします。