ノイズの多い録音の話し声向け

ノイズの多い録音から話し声を取り出す Voice Isolator

インタビュー、通話、講義、ポッドキャスト、フィールド録音、ボイスメモで話し声が聞き取りにくいですか？音声をアップロードして、話し声をよりクリアな MP3 として抽出します。

Voice isolator は音声録音の背景ノイズから人の話し声を分離します。話し声にはインタビュー、通話、講義、ポッドキャスト、フィールド録音、ボイスメモで使います。曲や音楽ボーカルには Vocal Remover または Stem Splitter を使ってください。

曲や音楽ボーカルには Vocal Remover / Stem Splitter

音声ファイルのみ最大 10 分ソース 1 秒ごとに 1 credit

音声ファイルのみアップロード可能。対象アカウントは 3 分無料。プロバイダー処理が失敗した場合は credits を返却します。

話し声を抽出

品質

音声処理にはログインが必要です

ここでファイルを選んでプレビューできますが、Voice Isolator のジョブは有料 GPU 処理を使うためログイン後に開始します。

Before

元のノイズの多い録音

After

抽出された話し声

ログインして話し声を抽出

実際の Replicate テスト

ノイズ入り音声と分離後の声を聴き比べる

4つの短い noisy speech クリップを Replicate の playmore/speech-enhancer で処理しました。before / after を再生してクリーンアップ結果を確認できます。

SNR 改善: +15.0 dB

バス騒音の音声クリーンアップ

交通音のような低域ノイズが話し声の下にある、低SNRのバス環境クリップです。

ノイズ入り原音

分離後の声

Edinburgh noisy speech · bus 2.5 dB

SNR 改善: +7.3 dB

カフェ雑音のクリーンアップ

広い環境音を下げた後も話し声の明瞭さが残るかを確認するカフェ背景音サンプルです。

ノイズ入り原音

分離後の声

Edinburgh noisy speech · cafe 7.5 dB

SNR 改善: +18.3 dB

オフィスノイズのクリーンアップ

文の内容を残しながら室内ノイズを抑える必要がある、難しめのオフィス録音です。

ノイズ入り原音

分離後の声

Edinburgh noisy speech · office 2.5 dB

SNR 改善: +14.0 dB

広場録音のクリーンアップ

背景音が強い長めの公共広場クリップで、主対象は単一の話し声です。

ノイズ入り原音

分離後の声

Edinburgh noisy speech · public square 2.5 dB

音声出典: Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0。処理後音声は Replicate playmore/speech-enhancer で生成しました。

この voice isolator は話し声向けで、曲向けではありません

Voice isolator の検索には、話し声のクリーンアップと音楽ボーカル除去の 2 つの目的が混在します。このページはノイズの多い録音の話し声向けです。曲、カラオケ、アカペラ、音楽ボーカルには Vocal Remover を使ってください。

ノイズの多い音声をアップロードし、流れをシンプルに

MP3、WAV、FLAC、M4A、AAC、OGG、WEBM の音声ファイルから始めます。Voice Isolator v1 は最大 50 MB、600 秒まで対応。MP4 直接アップロード、URL 取得、ライブマイク処理は対象外です。

Voice isolation の前後を比較

スピーチのクリーンアップは聴いて確認する必要があります。Before プレーヤーで元のノイズ録音を聴き、処理後の抽出された話し声と比較します。聞き取りやすさ、アーティファクト、ダウンロード可否を判断できます。

抽出された話し声の MP3 を 1 つダウンロード

結果は話し声の MP3 1 つで、stem パッケージ、mixer session、ZIP ではありません。レビュー、編集、文字起こし準備、ポッドキャストのクリーンアップ、より明瞭な音声共有に使えます。

GPU 処理前に credits を確認

ページ上でファイル選択とプレビューはできますが、課金対象ジョブはログイン後に開始します。Voice Isolator はソース 1 秒ごとに 1 credit を使用。プロバイダー送信、処理、出力 finalization の失敗時は返却されます。

明確な v1 制限でツール選びを間違えない

Voice Isolator は通話、OBS、Discord、Zoom、Teams のリアルタイムノイズ除去ではありません。diarization、対象話者抽出、forensic restoration、重なった話者の分離にも対応しません。動画は先に音声を抽出してアップロードしてください。

Speech enhancement model で処理

このフローは音楽 stem splitter とは別です。アップロード音声を Replicate playmore/speech-enhancer の mossformer2_se_48k model に送り、返された音声をダウンロード用の isolated-voice MP3 として finalization します。

FAQ

Voice Isolator FAQ

Voice Isolator は何に使いますか？+

Voice Isolator はインタビュー、通話、講義、ポッドキャスト、ボイスメモ、フィールド録音などのノイズの多い録音から話し声を抽出します。音楽 stem separation ではなく speech cleanup です。

曲からボーカルを消せますか？+

いいえ。このページはノイズの多い録音の話し声向けです。曲、音楽ボーカル、カラオケ、アカペラ、リミックス、stem ワークフローには Vocal Remover または Stem Splitter を使ってください。

どのファイルをアップロードできますか？+

V1 は音声ファイルのみ対応します: MP3、WAV、FLAC、M4A、AAC、OGG、WEBM。ファイルは 50 MB 以下、600 秒以下である必要があります。

動画をアップロードしたり URL を貼れますか？+

v1 ではできません。Voice Isolator は MP4/video の直接アップロードや URL 取得に対応しません。動画が元の場合は先に音声を抽出し、対応音声ファイルをアップロードしてください。

credits はどう計算されますか？+

Voice Isolator は他の音声処理と同じルールを使います: ソース音声 1 秒 = 1 credit。90 秒の録音は 90 credits を使います。

処理が失敗したらどうなりますか？+

プロバイダー送信、プロバイダー処理、出力 finalization の失敗はジョブを failed にし、その録音で使った credits を返却します。同じ音声またはよりクリーンな書き出しで再試行できます。

複数の重なった話者を分離できますか？+

いいえ。V1 はノイズの多い音声の話し声を改善するもので、diarization、対象話者抽出、forensic restoration、同じ録音で重なって話す複数人の分離には対応しません。

ノイズの多い録音の話し声をクリーンに

音声をアップロードし、前後を比較して、抽出された MP3 をダウンロードします。

話し声を抽出

シンプルな従量課金

最初の3分は無料50分が$6.99150分が$15.00

すべてのプランを見る →

ノイズの多い録音から話し声を取り出す Voice Isolator

この voice isolator は話し声向けで、曲向けではありません

明確な v1 制限でツール選びを間違えない