So erstellen Sie Backing Tracks zum Üben mit AI Stem Splitter

Die Übungsroutine der meisten Musiker hat eine offensichtliche Lücke: Es gibt keine Band.

Sie können eine Stunde lang zum Metronom durch einen Song spielen, aber Sie werden den Refrain erst dann sauber treffen, wenn Sie gegen echte Drums, echten Bass und echte Vocals spielen. Die klassische Antwort war, einzelne Backing Tracks bei iTunes zu kaufen — ein paar hundert Songs, je 1,99 $, meist schlechte Mixe von Songs, die Sie gar nicht spielen wollen.

Die KI-gestützte Source Separation hat diesen Markt erledigt. Sie können jetzt jeden Song, den Sie besitzen (oder jeden YouTube-Link), nehmen und Ihr Instrument in wenigen Minuten entfernen. Das Ergebnis ist ein Backing Track, der exakt zur Originalaufnahme passt, weil er die Originalaufnahme minus Sie ist.

Dieser Beitrag führt Sie durch den praktischen Workflow für die vier häufigsten Fälle — Gesang, Gitarre, Bass, Schlagzeug — plus die Songs, bei denen der Trick nicht funktioniert, und was zu tun ist, wenn Sie sie verlangsamen müssen.

Was Sie am Ende haben

Eine einzelne Audiodatei pro Song, die die komplette Originalaufnahme minus Ihr Instrument enthält. Laden Sie sie auf Spotify auf Ihrem Handy, in Anytune, in einen portablen Looper oder in eine beliebige DAW. Spielen Sie mit.

Für Sänger ist das die Karaoke-Instrumentalversion. Für Gitarristen die komplette Band ohne Gitarre. Für Schlagzeuger der Song mit einem Loch, wo Ihr Kit hingehört. Gleiche Idee, andere entfernte Stems.

Wählen Sie zuerst das richtige Modell

Das ist die eine Entscheidung, die die meisten Leute falsch treffen, und sie kostet Sie ein komplettes Re-Rendering.

Ihr Instrument	Dieses Modell verwenden	Warum
Gesang (Singen)	4-Stem (Standard)	Vocals trennen sich im 4-Stem-Modell am saubersten
Bass	4-Stem (Standard)	Bass hat seinen eigenen dedizierten Stem
Schlagzeug	4-Stem (Standard)	Drums haben ihren eigenen dedizierten Stem
Gitarre	6-Stem	Ohne 6-Stem wird die Gitarre mit Synths und Streichern in „other“ geworfen
Klavier	6-Stem	Gleicher Grund — Piano braucht seinen eigenen dedizierten Stem
Sax, Geige, Blechbläser	4-Stem (und akzeptieren)	Kein dedizierter Stem vorhanden; sie landen in „other“

Das 6-Stem-Modell ist der Fehler, den wir am häufigsten sehen. Gitarristen wählen aus Gewohnheit 4-Stem und wundern sich dann, warum ihr „instrumentaler“ Backing Track immer noch durchblutende Gitarre enthält. Das ist kein Modellfehler — im 4-Stem-Modell gibt es einfach keinen dedizierten Gitarren-Stem. Wählen Sie 6-Stem, wenn Sie Gitarre oder Klavier spielen. Ansonsten wählen Sie 4-Stem; es ist schneller und pro Stem etwas sauberer.

Die Kosten sind in beiden Fällen gleich, optimieren Sie also nicht darauf. (Wir haben die Kosten-pro-Call-Mathematik hier aufgeschrieben.)

Workflow: Gesangsübung

Das ist der einfachste Fall, weil „alles außer Vocals“ ein Klick ist.

Wählen Sie einen Song. Alles mit sauberer Produktion. Vermeiden Sie Liveaufnahmen (alles blutet durch) und Songs, bei denen der Leadgesang gedoppelt, stark Auto-Tuned oder unter Hall begraben ist.
Überspringen Sie den Stem Splitter, verwenden Sie stattdessen den Karaoke Maker. Es ist eine Ein-Klick-Variante „Gib mir die Instrumentalversion“ genau dieses Workflows.
Warten Sie etwa 60 Sekunden. Ein 3-minütiger Song wird in dieser Zeit Ende-zu-Ende verarbeitet.
Laden Sie die Instrumentaldatei herunter. Das sind Drums + Bass + other, bereits zusammengemischt. Auf das Handy laden. Fertig.

Der eine Trick: Wenn der Song markante Backing Vocals hat, die Sie auch entfernen möchten (Beatles-artige gestapelte Harmonien), lässt der Karaoke Maker diese drin. Es gibt im öffentlichen Internet kein Modell, das Lead Vocals sauber von Backing Vocals trennt — sie teilen sich zu viel Frequenzinhalt. Wählen Sie eine andere Aufnahme oder akzeptieren Sie die Backing Vocals in Ihrer Instrumentalversion.

Workflow: Gitarrenübung

Hier wird die 6-Stem-Entscheidung wichtig.

Wählen Sie den Song. Songs mit einer klar aufgenommenen Gitarre funktionieren am besten — saubere Sounds, gut getrennte Kanäle. Songs mit fünf geschichteten Gitarrenspuren (die meisten Metal-Songs, viel moderner Pop) sind für jedes Modell ein harter Fall.
Öffnen Sie AI Stem Splitter und wählen Sie 6-Stem. Datei hochladen oder YouTube-URL einfügen.
Warten Sie 2–3 Minuten auf die Verarbeitung.
Laden Sie alle Stems außer Gitarre herunter. Sie erhalten sechs Dateien: Vocals, Drums, Bass, Gitarre, Piano, other. Fünf behalten, Gitarre überspringen.
Mischen Sie sie wieder zu einer Datei zusammen. Ziehen Sie die fünf Stems in Audacity (kostenlos) oder eine beliebige DAW. Stellen Sie alle Spuren auf 0 dB. Als MP3 exportieren.

Das Ergebnis ist die komplette Band minus Gitarre. Loopen Sie den Solo-Abschnitt in einem beliebigen Audioplayer, der A-B repeat unterstützt, und üben Sie das Lick fünfzig Mal.

Die Timing-Falle: Es ist verlockend, auch die Drums für einen „saubereren“ Übungsmix stummzuschalten. Tun Sie es nicht. Die meisten Musiker verlieren ohne die Drums als Referenz das Timing, und der ganze Sinn, mit der Aufnahme mitzuspielen, ist zu lernen, wie der Part im Groove sitzt.

Workflow: Bassübung

Fast identisch mit Gitarre, aber 4-Stem verwenden.

Laden Sie den Song in AI Stem Splitter hoch, wählen Sie 4-Stem.
Warten Sie etwa 60 Sekunden.
Laden Sie Vocals + Drums + other herunter. Den Bass-Stem überspringen.
Mischen Sie sie in Audacity wieder zusammen. Exportieren.

Bass-spezifische Falle: Songs mit Synth-Bass oder schwerem Sub-Bass werden oft unsauber zwischen dem „Bass“-Stem und „other“ aufgeteilt. Wenn Ihre Basslinie aus der Bass-Datei verschwindet und schwach in „other“ auftaucht, hat der Originalmix den Bass über einen Synth geroutet oder starkes Sidechaining verwendet. Auf Modell-Ebene gibt es keine Lösung — wählen Sie einen anderen Song oder schichten Sie die beiden Stems wieder zusammen und akzeptieren Sie, dass der „Backing“-Track einen Geister-Bass enthält.

Workflow: Schlagzeugübung

Gleicher Ablauf, anderer Stem zum Weglassen.

In AI Stem Splitter hochladen, 4-Stem wählen.
Laden Sie Vocals + Bass + other herunter. Den Drums-Stem überspringen.
Wieder zu einer Datei zusammenmischen.

Drum-spezifische Falle: Im „Vocals“-Stem werden schwache Becken-Hash-Reste durchbluten (Becken teilen viel Hochfrequenzinhalt mit zischelnden Vocals), und der „other“-Stem hat manchmal Geister-Snare-Artefakte. Zum Üben spielt das keine Rolle — Sie spielen sowieso laut genug, dass niemand das Durchbluten hört. Beim Aufnehmen Ihres Kits über den Backing Track sollten Sie alles außer dem Drum-Slot bei ca. 80 Hz hochpass-filtern, dann verschwindet das Durchbluten.

Songs, die funktionieren, Songs, die nicht funktionieren

Das ist die Hälfte der Gleichung, über die niemand spricht. Ein perfektes Modell kann kein Audio trennen, das nicht mit Blick auf Trennung aufgenommen wurde.

Funktioniert gut:

Classic Rock (Beatles nach '66, CCR, Tom Petty, Springsteen)
Country, fast immer — der Gesang steht immer vorne und mittig
Akustische Singer-Songwriter
Moderner Pop mit sauberer Produktion (das meiste nach 2010)
Jazz-Standards mit kleinen Ensembles

Funktioniert schlecht:

Heavy Shoegaze und Lo-Fi (absichtlich verwaschene Produktion)
Stark Auto-Tunede Vocals, gedoppelt mit effektierten Harmonien
Liveaufnahmen (alles blutet in alles)
Songs mit starker Parallel-/Bus-Kompression
Mono-Mixe vor 1965
Heavy Metal mit geschichteten Gitarrenwänden

Der Ohrhörer-Test: Wenn Sie jedes Instrument auf billigen Ohrhörern klar hören und benennen können, kann das Modell sie wahrscheinlich trennen. Wenn der Mix auf billigen Ohrhörern wie eine Wall of Sound klingt, gibt Ihnen das Modell eine Wall of Stems.

Verlangsamen oder die Tonart ändern

Ein Backing Track im Originaltempo ist selten nützlich, solange Sie noch lernen. Zwei Wege, damit umzugehen.

Nach der Trennung verlangsamen. Lassen Sie den Song normal durch den Stem Splitter laufen, mischen Sie Ihren Backing Track und laden Sie ihn dann in den Slowed + Reverb Maker. Funktioniert gut bei Tempo-Reduktionen bis etwa 15 %. Darüber hinaus hören Sie Time-Stretch-Artefakte auf den Becken.

Vor der Trennung verlangsamen. Kontraintuitiv, aber das liefert oft bessere Stem-Qualität. Das Modell verarbeitet dasselbe Audio bei einer niedrigeren Sample-Dichte pro Sekunde, was ihm bei kniffligen Transienten mehr Material zum Arbeiten gibt. Probieren Sie das bei Songs, bei denen die Standardtrennung matschig herauskommt.

Für Tonartwechsel verwenden Sie den Pitch Changer auf Ihrem fertigen Backing Track. Vermeiden Sie es, die Tonart vor der Trennung zu ändern — die Pitch-Shift-Artefakte verwirren das Modell und Sie bekommen schlechtere Stems.

Drei Fallstricke, die Sie kennen sollten

1. Normalisieren Sie nicht jeden Stem vor dem Mischen. Die Stem-Trennung bewahrt bereits die relativen Lautstärken aus dem Originalmix. Wenn Sie jeden Stem vor dem Kombinieren auf 0 dB normalisieren, bekommen Sie einen Backing Track, in dem der Bass plötzlich das Lauteste ist — völlig falsch gegenüber der Originalaufnahme. Importieren Sie die rohen Stems, stellen Sie alle Spuren auf 0 dB Gain, exportieren Sie.

2. Machen Sie sich nicht die Mühe mit Stems für einen einmaligen Durchlauf. Stem-Trennung macht Sinn für Songs, die Sie 50-mal üben werden. Für einen Song, den Sie zweimal durchspielen, spielen Sie einfach mit der Originalaufnahme in einer Lautstärke mit, die Sie sich selbst hören lässt. Die Mathematik von „5 Minuten Verarbeitung + 30 Sekunden Mischen“ zahlt sich nur über viele Übungssessions aus.

3. Vertrauen Sie der ersten Trennung nicht, wenn das Quellaudio schlecht klingt. Bitrate spielt eine Rolle. Ein 128-kbps-YouTube-Rip wird merklich schlechter getrennt als ein 320-kbps-MP3 oder eine verlustfreie Datei. Wenn das Ergebnis komisch klingt, prüfen Sie zuerst die Quelle — es gibt eine reale Obergrenze für die Qualität, die Sie aus einer Quelle mit niedriger Bitrate ziehen können.

Wie das in der Praxis aussieht

Ein typischer Workflow nimmt etwa drei Minuten aktive Zeit in Anspruch:

30 Sekunden, um den Song hochzuladen und das Modell zu wählen
1–3 Minuten Verarbeitung (Sie tun nichts)
30 Sekunden zum Herunterladen und Kombinieren in Audacity

Gesamt: unter 5 Minuten von „Ich will diesen Song üben“ bis „der Backing Track ist auf meinem Handy“.

Wenn Sie nur Vocals entfernen müssen, überspringt der Karaoke Maker den manuellen Misch-Schritt komplett. Für alles andere ist ein Drag-and-Drop in Audacity die ganze Arbeit.

Das Fazit: Das Modell ist der einfache Teil. Das richtige Modell für Ihr Instrument zu wählen und einen Song zu wählen, der mit sauberer Trennung aufgenommen wurde, sind die beiden Entscheidungen, die bestimmen, ob Sie die nächste Stunde mit Üben oder mit Fehlerbehebung verbringen.

Wenn Sie es an einem Song ausprobieren möchten, ohne eine lokale Toolchain einzurichten, ist AI Stem Splitter für die ersten paar Minuten Audio kostenlos.

Die Übungsroutine der meisten Musiker hat eine offensichtliche Lücke: Es gibt keine Band.

Was Sie am Ende haben

Wählen Sie zuerst das richtige Modell

Das ist die eine Entscheidung, die die meisten Leute falsch treffen, und sie kostet Sie ein komplettes Re-Rendering.

Ihr Instrument	Dieses Modell verwenden	Warum
Gesang (Singen)	4-Stem (Standard)	Vocals trennen sich im 4-Stem-Modell am saubersten
Bass	4-Stem (Standard)	Bass hat seinen eigenen dedizierten Stem
Schlagzeug	4-Stem (Standard)	Drums haben ihren eigenen dedizierten Stem
Gitarre	6-Stem	Ohne 6-Stem wird die Gitarre mit Synths und Streichern in „other“ geworfen
Klavier	6-Stem	Gleicher Grund — Piano braucht seinen eigenen dedizierten Stem
Sax, Geige, Blechbläser	4-Stem (und akzeptieren)	Kein dedizierter Stem vorhanden; sie landen in „other“

Die Kosten sind in beiden Fällen gleich, optimieren Sie also nicht darauf. (Wir haben die Kosten-pro-Call-Mathematik hier aufgeschrieben.)

Workflow: Gesangsübung

Das ist der einfachste Fall, weil „alles außer Vocals“ ein Klick ist.

Wählen Sie einen Song. Alles mit sauberer Produktion. Vermeiden Sie Liveaufnahmen (alles blutet durch) und Songs, bei denen der Leadgesang gedoppelt, stark Auto-Tuned oder unter Hall begraben ist.
Überspringen Sie den Stem Splitter, verwenden Sie stattdessen den Karaoke Maker. Es ist eine Ein-Klick-Variante „Gib mir die Instrumentalversion“ genau dieses Workflows.
Warten Sie etwa 60 Sekunden. Ein 3-minütiger Song wird in dieser Zeit Ende-zu-Ende verarbeitet.
Laden Sie die Instrumentaldatei herunter. Das sind Drums + Bass + other, bereits zusammengemischt. Auf das Handy laden. Fertig.

Workflow: Gitarrenübung

Hier wird die 6-Stem-Entscheidung wichtig.

Wählen Sie den Song. Songs mit einer klar aufgenommenen Gitarre funktionieren am besten — saubere Sounds, gut getrennte Kanäle. Songs mit fünf geschichteten Gitarrenspuren (die meisten Metal-Songs, viel moderner Pop) sind für jedes Modell ein harter Fall.
Öffnen Sie AI Stem Splitter und wählen Sie 6-Stem. Datei hochladen oder YouTube-URL einfügen.
Warten Sie 2–3 Minuten auf die Verarbeitung.
Laden Sie alle Stems außer Gitarre herunter. Sie erhalten sechs Dateien: Vocals, Drums, Bass, Gitarre, Piano, other. Fünf behalten, Gitarre überspringen.
Mischen Sie sie wieder zu einer Datei zusammen. Ziehen Sie die fünf Stems in Audacity (kostenlos) oder eine beliebige DAW. Stellen Sie alle Spuren auf 0 dB. Als MP3 exportieren.

Das Ergebnis ist die komplette Band minus Gitarre. Loopen Sie den Solo-Abschnitt in einem beliebigen Audioplayer, der A-B repeat unterstützt, und üben Sie das Lick fünfzig Mal.

Workflow: Bassübung

Fast identisch mit Gitarre, aber 4-Stem verwenden.

Laden Sie den Song in AI Stem Splitter hoch, wählen Sie 4-Stem.
Warten Sie etwa 60 Sekunden.
Laden Sie Vocals + Drums + other herunter. Den Bass-Stem überspringen.
Mischen Sie sie in Audacity wieder zusammen. Exportieren.

Workflow: Schlagzeugübung

Gleicher Ablauf, anderer Stem zum Weglassen.

In AI Stem Splitter hochladen, 4-Stem wählen.
Laden Sie Vocals + Bass + other herunter. Den Drums-Stem überspringen.
Wieder zu einer Datei zusammenmischen.

Songs, die funktionieren, Songs, die nicht funktionieren

Das ist die Hälfte der Gleichung, über die niemand spricht. Ein perfektes Modell kann kein Audio trennen, das nicht mit Blick auf Trennung aufgenommen wurde.

Funktioniert gut:

Classic Rock (Beatles nach '66, CCR, Tom Petty, Springsteen)
Country, fast immer — der Gesang steht immer vorne und mittig
Akustische Singer-Songwriter
Moderner Pop mit sauberer Produktion (das meiste nach 2010)
Jazz-Standards mit kleinen Ensembles

Funktioniert schlecht:

Heavy Shoegaze und Lo-Fi (absichtlich verwaschene Produktion)
Stark Auto-Tunede Vocals, gedoppelt mit effektierten Harmonien
Liveaufnahmen (alles blutet in alles)
Songs mit starker Parallel-/Bus-Kompression
Mono-Mixe vor 1965
Heavy Metal mit geschichteten Gitarrenwänden

Verlangsamen oder die Tonart ändern

Ein Backing Track im Originaltempo ist selten nützlich, solange Sie noch lernen. Zwei Wege, damit umzugehen.

Drei Fallstricke, die Sie kennen sollten

Wie das in der Praxis aussieht

Ein typischer Workflow nimmt etwa drei Minuten aktive Zeit in Anspruch:

30 Sekunden, um den Song hochzuladen und das Modell zu wählen
1–3 Minuten Verarbeitung (Sie tun nichts)
30 Sekunden zum Herunterladen und Kombinieren in Audacity

Gesamt: unter 5 Minuten von „Ich will diesen Song üben“ bis „der Backing Track ist auf meinem Handy“.

Wenn Sie nur Vocals entfernen müssen, überspringt der Karaoke Maker den manuellen Misch-Schritt komplett. Für alles andere ist ein Drag-and-Drop in Audacity die ganze Arbeit.

Wenn Sie es an einem Song ausprobieren möchten, ohne eine lokale Toolchain einzurichten, ist AI Stem Splitter für die ersten paar Minuten Audio kostenlos.

Was Sie am Ende haben

Wählen Sie zuerst das richtige Modell

Workflow: Gesangsübung

Workflow: Gitarrenübung

Workflow: Bassübung

Workflow: Schlagzeugübung

Songs, die funktionieren, Songs, die nicht funktionieren

Verlangsamen oder die Tonart ändern

Drei Fallstricke, die Sie kennen sollten

Wie das in der Praxis aussieht

Autor

Kategorien

Weitere Beiträge

Die besten Vocal Remover im Vergleich: 7 Tools an demselben Song getestet

How to Remove Vocals from Any Song: A Beginner's Step-by-Step Guide (2026)

htdemucs vs. BS-RoFormer vs. Spleeter: Audio-Quellentrennung im Benchmark 2026

So erstellen Sie Backing Tracks zum Üben mit AI Stem Splitter

Was Sie am Ende haben

Wählen Sie zuerst das richtige Modell

Workflow: Gesangsübung

Workflow: Gitarrenübung

Workflow: Bassübung

Workflow: Schlagzeugübung

Songs, die funktionieren, Songs, die nicht funktionieren

Verlangsamen oder die Tonart ändern

Drei Fallstricke, die Sie kennen sollten

Wie das in der Praxis aussieht

Autor

Kategorien

Weitere Beiträge

Die besten Vocal Remover im Vergleich: 7 Tools an demselben Song getestet

How to Remove Vocals from Any Song: A Beginner's Step-by-Step Guide (2026)

htdemucs vs. BS-RoFormer vs. Spleeter: Audio-Quellentrennung im Benchmark 2026