Für gesprochene Stimmen in verrauschten Aufnahmen

Voice Isolator für gesprochene Stimmen in verrauschten Aufnahmen

Hast du ein Interview, einen Anruf, eine Vorlesung, einen Podcast-Clip, eine Field Recording oder eine Sprachnotiz, in der Sprache schwer hörbar ist? Lade das Audio hoch und isoliere die gesprochene Stimme als sauberere MP3.

Ein Voice Isolator trennt menschliche Sprache vom Hintergrundrauschen einer Audioaufnahme. Für gesprochene Stimme nutze ihn bei Interviews, Anrufen, Vorlesungen, Podcasts, Field Recordings oder Sprachnotizen. Für Songs und Musik-Vocals nutze stattdessen Vocal Remover oder Stem Splitter.

Für Songs und Musik-Vocals nutze Vocal Remover / Stem Splitter

Nur AudiodateienBis zu 10 Minuten1 Credit pro Quellsekunde

Nur Audio-Upload. 3 kostenlose Minuten für berechtigte Konten. Credits werden erstattet, wenn die Provider-Verarbeitung fehlschlägt.

Gesprochene Stimme isolieren

Qualität

Zum Verarbeiten anmelden

Du kannst eine Datei auswählen und hier vorhören, aber der Voice-Isolator-Job startet erst nach der Anmeldung, weil dafür bezahlte GPU-Verarbeitung genutzt wird.

Vorher

Originale verrauschte Aufnahme

Nachher

Isolierte gesprochene Stimme

Anmelden und Stimme isolieren

Echte Replicate-Tests

Noisy Source und isolierte Stimme anhören

Vier kurze noisy-speech-Clips wurden mit playmore/speech-enhancer auf Replicate verarbeitet. Spiele jedes Before/After-Paar ab, um die Bereinigung zu beurteilen.

Wellenformvergleich eines Sprachclips mit Buslärm vor und nach der Voice-Isolation.

SNR-Zuwachs: +15.0 dB

Sprache mit Buslärm bereinigen

Ein Bus-Clip mit niedrigem SNR, bei dem verkehrsähnliches Rumpeln unter dem gesprochenen Satz liegt.

Noisy Source

Isolierte Stimme

Edinburgh noisy speech · bus 2.5 dB

Wellenformvergleich eines Sprachclips mit Café-Geräuschen vor und nach der Voice-Isolation.

SNR-Zuwachs: +7.3 dB

Café-Geräusche bereinigen

Ein Café-Hintergrundsample, das zeigt, ob Sprache nach dem Reduzieren breiter Umgebungsgeräusche verständlich bleibt.

Noisy Source

Isolierte Stimme

Edinburgh noisy speech · cafe 7.5 dB

Wellenformvergleich eines Sprachclips mit Office-Rauschen vor und nach der Voice-Isolation.

SNR-Zuwachs: +18.3 dB

Office-Rauschen bereinigen

Eine schwierige Office-Aufnahme, bei der der Satz erhalten bleiben und Raumtextur entfernt werden muss.

Noisy Source

Isolierte Stimme

Edinburgh noisy speech · office 2.5 dB

Wellenformvergleich eines Sprachclips vom öffentlichen Platz vor und nach der Voice-Isolation.

SNR-Zuwachs: +14.0 dB

Public-Square-Aufnahme bereinigen

Ein längerer Clip von einem öffentlichen Platz mit starkem Hintergrundgeräusch um eine einzelne Stimme.

Noisy Source

Isolierte Stimme

Edinburgh noisy speech · public square 2.5 dB

Audioquelle: Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0. Die verbesserten Outputs wurden mit Replicate playmore/speech-enhancer erzeugt.

Dieser Voice Isolator ist für Sprache, nicht für Songs

Voice-Isolator-Suchen mischen zwei Aufgaben: Sprachbereinigung und Musik-Vocal-Entfernung. Diese Seite ist für gesprochene Stimme in verrauschten Aufnahmen. Wenn deine Quelle ein Song, Karaoke-Track, Acapella-Wunsch oder Musik-Vocal ist, nutze Vocal Remover.

Verrauschtes Audio hochladen und den Workflow einfach halten

Beginne mit einer Audiodatei: MP3, WAV, FLAC, M4A, AAC, OGG oder WEBM. Voice Isolator v1 akzeptiert Dateien bis 50 MB und 600 Sekunden. Direkter MP4-Upload, URL-Abruf und Live-Mikrofonbereinigung gehören nicht zu diesem Workflow.

Vorher und Nachher der Voice Isolation vergleichen

Sprachbereinigung muss hörbar sein. Nutze den Vorher-Player für die originale verrauschte Aufnahme und vergleiche sie nach der Verarbeitung mit der isolierten Stimme. Der Vergleich hilft, Verständlichkeit, Artefakte und Download-Reife zu beurteilen.

Eine isolierte Spoken-Voice-MP3 herunterladen

Das Ergebnis ist eine MP3 für die gesprochene Stimme, kein Stem-Paket, keine Mixer-Session und keine ZIP-Datei. Nutze sie für Review, Editing, Transkriptionsvorbereitung, Podcast-Cleanup oder eine klarere Version einer Sprachaufnahme.

Credits kennen, bevor die GPU-Verarbeitung startet

Du kannst auf der Seite eine Datei wählen und vorhören, aber der kostenpflichtige Job startet nach der Anmeldung. Voice Isolator nutzt 1 Credit pro Quellsekunde. Provider-Submission, Provider-Fehler und Ausgabe-Finalisierung erstatten Credits.

Klare v1-Grenzen verhindern den falschen Tool-Start

Voice Isolator ist keine Echtzeit-Entrauschung für Anrufe, OBS, Discord, Zoom oder Teams. Es ist keine Diarisierung, Zielsprecher-Extraktion, Forensik-Restauration oder Trennung überlappender Sprecher. Bei Video zuerst Audio extrahieren und hochladen.

Angetrieben von einem Speech-Enhancement-Modell

Dieser Flow ist vom Musik-Stem-Splitter getrennt. Er sendet das hochgeladene Audio an Replicate playmore/speech-enhancer mit dem Modell mossformer2_se_48k und finalisiert die Rückgabe als isolierte Voice-MP3 zum Download.

FAQ

Voice Isolator FAQ

Wofür ist Voice Isolator gedacht?+

Voice Isolator extrahiert gesprochene Stimme aus verrauschten Aufnahmen wie Interviews, Anrufen, Vorlesungen, Podcasts, Sprachnotizen und Field Audio. Es ist Sprachbereinigung, keine Musik-Stem-Separation.

Kann es Vocals aus Songs entfernen?+

Nein. Diese Seite ist für gesprochene Stimme in verrauschten Aufnahmen. Für Songs, Musik-Vocals, Karaoke, Acapella, Remix oder Stem-Workflows nutze Vocal Remover oder Stem Splitter.

Welche Dateien kann ich hochladen?+

V1 akzeptiert nur Audiodateien: MP3, WAV, FLAC, M4A, AAC, OGG und WEBM. Dateien dürfen maximal 50 MB groß und 600 Sekunden lang sein.

Kann ich ein Video hochladen oder eine URL einfügen?+

Nicht in v1. Voice Isolator unterstützt keinen direkten MP4-/Video-Upload und keinen URL-Abruf. Wenn deine Quelle Video ist, extrahiere zuerst Audio und lade eine unterstützte Audiodatei hoch.

Wie werden Credits berechnet?+

Voice Isolator nutzt dieselbe Audioregel wie andere Verarbeitungsflows: 1 Credit entspricht 1 Sekunde Quellaudio. Eine 90-Sekunden-Aufnahme nutzt 90 Credits.

Was passiert, wenn die Verarbeitung fehlschlägt?+

Provider-Submission, Provider-Fehler und Ausgabe-Finalisierung markieren den Job als fehlgeschlagen und erstatten die Credits für diese Aufnahme. Du kannst mit derselben oder einer saubereren Audiodatei erneut versuchen.

Kann es mehrere überlappende Sprecher trennen?+

Nein. V1 verbessert gesprochene Stimme in verrauschtem Audio, ist aber keine Diarisierung, Zielsprecher-Extraktion, Forensik-Restauration oder Trennung mehrerer gleichzeitig sprechender Personen in einer Aufnahme.

Bereinige die gesprochene Stimme in deiner verrauschten Aufnahme

Audio hochladen, Vorher und Nachher vergleichen und die isolierte MP3 herunterladen.

Gesprochene Stimme isolieren

Einfaches Pay-as-you-go-Preismodell

Die ersten 3 Minuten kostenlos50 Minuten für $6.99150 Minuten für $15.00

Alle Tarife ansehen →

Voice Isolator für gesprochene Stimmen in verrauschten Aufnahmen