
Sprache mit Buslärm bereinigen
Ein Bus-Clip mit niedrigem SNR, bei dem verkehrsähnliches Rumpeln unter dem gesprochenen Satz liegt.
Hast du ein Interview, einen Anruf, eine Vorlesung, einen Podcast-Clip, eine Field Recording oder eine Sprachnotiz, in der Sprache schwer hörbar ist? Lade das Audio hoch und isoliere die gesprochene Stimme als sauberere MP3.
Ein Voice Isolator trennt menschliche Sprache vom Hintergrundrauschen einer Audioaufnahme. Für gesprochene Stimme nutze ihn bei Interviews, Anrufen, Vorlesungen, Podcasts, Field Recordings oder Sprachnotizen. Für Songs und Musik-Vocals nutze stattdessen Vocal Remover oder Stem Splitter.
Für Songs und Musik-Vocals nutze Vocal Remover / Stem Splitter
Nur Audio-Upload. 10 kostenlose Minuten für berechtigte Konten. Credits werden erstattet, wenn die Provider-Verarbeitung fehlschlägt.
Zum Verarbeiten anmelden
Du kannst eine Datei auswählen und hier vorhören, aber der Voice-Isolator-Job startet erst nach der Anmeldung, weil dafür bezahlte GPU-Verarbeitung genutzt wird.
Originale verrauschte Aufnahme
Isolierte gesprochene Stimme
Vier kurze noisy-speech-Clips wurden mit playmore/speech-enhancer auf Replicate verarbeitet. Spiele jedes Before/After-Paar ab, um die Bereinigung zu beurteilen.

Ein Bus-Clip mit niedrigem SNR, bei dem verkehrsähnliches Rumpeln unter dem gesprochenen Satz liegt.

Ein Café-Hintergrundsample, das zeigt, ob Sprache nach dem Reduzieren breiter Umgebungsgeräusche verständlich bleibt.

Eine schwierige Office-Aufnahme, bei der der Satz erhalten bleiben und Raumtextur entfernt werden muss.

Ein längerer Clip von einem öffentlichen Platz mit starkem Hintergrundgeräusch um eine einzelne Stimme.
Audioquelle: Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0. Die verbesserten Outputs wurden mit Replicate playmore/speech-enhancer erzeugt.
Voice-Isolator-Suchen mischen zwei Aufgaben: Sprachbereinigung und Musik-Vocal-Entfernung. Diese Seite ist für gesprochene Stimme in verrauschten Aufnahmen. Wenn deine Quelle ein Song, Karaoke-Track, Acapella-Wunsch oder Musik-Vocal ist, nutze Vocal Remover.
Beginne mit einer Audiodatei: MP3, WAV, FLAC, M4A, AAC, OGG oder WEBM. Voice Isolator v1 akzeptiert Dateien bis 50 MB und 600 Sekunden. Direkter MP4-Upload, URL-Abruf und Live-Mikrofonbereinigung gehören nicht zu diesem Workflow.
Sprachbereinigung muss hörbar sein. Nutze den Vorher-Player für die originale verrauschte Aufnahme und vergleiche sie nach der Verarbeitung mit der isolierten Stimme. Der Vergleich hilft, Verständlichkeit, Artefakte und Download-Reife zu beurteilen.
Das Ergebnis ist eine MP3 für die gesprochene Stimme, kein Stem-Paket, keine Mixer-Session und keine ZIP-Datei. Nutze sie für Review, Editing, Transkriptionsvorbereitung, Podcast-Cleanup oder eine klarere Version einer Sprachaufnahme.
Du kannst auf der Seite eine Datei wählen und vorhören, aber der kostenpflichtige Job startet nach der Anmeldung. Voice Isolator nutzt 1 Credit pro Quellsekunde. Provider-Submission, Provider-Fehler und Ausgabe-Finalisierung erstatten Credits.
Voice Isolator ist keine Echtzeit-Entrauschung für Anrufe, OBS, Discord, Zoom oder Teams. Es ist keine Diarisierung, Zielsprecher-Extraktion, Forensik-Restauration oder Trennung überlappender Sprecher. Bei Video zuerst Audio extrahieren und hochladen.
Dieser Flow ist vom Musik-Stem-Splitter getrennt. Er sendet das hochgeladene Audio an Replicate playmore/speech-enhancer mit dem Modell mossformer2_se_48k und finalisiert die Rückgabe als isolierte Voice-MP3 zum Download.
Voice Isolator extrahiert gesprochene Stimme aus verrauschten Aufnahmen wie Interviews, Anrufen, Vorlesungen, Podcasts, Sprachnotizen und Field Audio. Es ist Sprachbereinigung, keine Musik-Stem-Separation.
Nein. Diese Seite ist für gesprochene Stimme in verrauschten Aufnahmen. Für Songs, Musik-Vocals, Karaoke, Acapella, Remix oder Stem-Workflows nutze Vocal Remover oder Stem Splitter.
V1 akzeptiert nur Audiodateien: MP3, WAV, FLAC, M4A, AAC, OGG und WEBM. Dateien dürfen maximal 50 MB groß und 600 Sekunden lang sein.
Nicht in v1. Voice Isolator unterstützt keinen direkten MP4-/Video-Upload und keinen URL-Abruf. Wenn deine Quelle Video ist, extrahiere zuerst Audio und lade eine unterstützte Audiodatei hoch.
Voice Isolator nutzt dieselbe Audioregel wie andere Verarbeitungsflows: 1 Credit entspricht 1 Sekunde Quellaudio. Eine 90-Sekunden-Aufnahme nutzt 90 Credits.
Provider-Submission, Provider-Fehler und Ausgabe-Finalisierung markieren den Job als fehlgeschlagen und erstatten die Credits für diese Aufnahme. Du kannst mit derselben oder einer saubereren Audiodatei erneut versuchen.
Nein. V1 verbessert gesprochene Stimme in verrauschtem Audio, ist aber keine Diarisierung, Zielsprecher-Extraktion, Forensik-Restauration oder Trennung mehrerer gleichzeitig sprechender Personen in einer Aufnahme.
Audio hochladen, Vorher und Nachher vergleichen und die isolierte MP3 herunterladen.