Comparatif des meilleurs suppresseurs de voix : j'en ai testé 7 sur la même chanson

J'ai construit un suppresseur de voix. Avant d'écrire la moindre ligne de code d'inférence, j'ai passé un week-end à faire tourner la même chanson à travers tous les outils pour lesquels j'ai pu trouver une carte bancaire — et quelques autres pour lesquels je n'en avais pas besoin.

Les résultats n'étaient pas ceux que les articles SEO promettaient.

Voici la comparaison que j'aurais voulu avoir au départ. Sept outils, un morceau, un casque, et un carnet plein de récriminations.

Le protocole de test

Un morceau de référence : « Sunlight » d'inaya_official sur Pixabay — libre de droits, avec une voix lead propre par-dessus des nappes chaudes, de la batterie, de la basse, et un fill de piano sur le pont.

Je l'ai choisi parce que le piano du pont est ce qu'il y a de plus dur à gérer pour n'importe quel séparateur. Si un outil se présente comme un « stem splitter » mais étale le piano dans la piste « other », je veux l'entendre.

Chaque outil a reçu la même entrée : un WAV de 3:14 en 44,1 kHz / 16 bits. J'ai écouté sur un Sony MDR-7506, sommé en mono là où l'outil ne proposait que du MP3.

Je n'ai pas été tendre.

Ce que j'ai réellement essayé

1. LALAL.AI — le poli

Upload, paiement, téléchargement. Leur interface est la plus propre de cette liste, et leur onglet d'isolation par stem est vraiment bien pensé.

Mais deux choses m'ont piégé.

La version gratuite vous donne 10 minutes une seule fois, à vie — ni 10 minutes par mois, ni 10 minutes par chanson. Une seule fois. À l'instant où vous les atteignez, vous passez sur un pack de crédits.

Et leur sortie 2-stems par défaut (voix vs instrumental) sonnait étrangement creuse sur le stem voix. Passer sur leur modèle « Phoenix » a corrigé l'essentiel, mais encore fallait-il savoir le faire.

Bon pour : ceux qui veulent un tableau de bord propre et qui se moquent du prix. Mauvais pour : quiconque teste plus d'une chanson avant de s'engager.

2. Moises — celui pour le workflow

Moises veut être votre studio de répétition, pas seulement un séparateur. Il y a un détecteur d'accords, un pitch shifter, un curseur de tempo, des overlays de paroles.

Pour répéter sur une chanson, c'est génial. Pour extraire des stems et passer à autre chose, c'est de la friction.

Le plan gratuit vous limite à 5 séparations par mois, 2 stems chacune. Pour obtenir 4 stems, il faut passer au plan Premium à 3,99 $/mois facturé à l'année. Annulez en cours d'année et vous continuez à payer.

La sortie 5-stems (voix/batterie/basse/piano/other) sur Premium est propre. Le hic, c'est qu'il faut aimer Moises suffisamment pour s'abonner avant de pouvoir l'entendre sur votre propre chanson.

3. vocalremover.org / Splitter AI — le vainqueur du SERP

La marque qui se classe n°1 pour « vocal remover » sur Google. J'avais donc de grands espoirs.

L'upload était instantané, le traitement rapide, le résultat — correct. Juste correct.

Leur sous-produit Splitter AI vous donne jusqu'à une séparation en 5 stems, gratuite, sans inscription pour le premier essai. C'est la fonctionnalité phare. Côté qualité, c'est clairement un modèle de la lignée Spleeter : du bleed sur la basse, une batterie qui sonne un peu écrasée, un stem voix assez propre pour une soirée karaoké mais pas pour un remix que vous publieriez.

Avis honnête : si vous découpez ce soir une piste karaoké pour une fête de famille, c'est l'outil. Arrêtez de lire et allez l'utiliser. C'est gratuit, ça marche, vous n'avez pas besoin de vous connecter.

Pour tout ce que vous boucleriez sur scène ou dans un DAW, continuez votre route.

4. Voice.ai — la promesse du « meilleur »

Leur page d'accueil dit littéralement « The Best AI Stem Splitter on the Market » (le meilleur séparateur de stems IA du marché).

C'est faux.

L'isolation de la voix était acceptable. La batterie était molle et pompée. Le stem « other » a avalé le piano entier — exactement le mode d'échec que je guettais.

Ce qui m'a surpris encore plus, c'est le workflow. Pour télécharger le résultat, j'ai dû installer leur application de bureau. Sur un séparateur positionné comme un outil web, c'était rédhibitoire.

Je l'ai désinstallée 8 minutes après l'installation.

5. Fadr — le choix du producteur

Fadr est le seul outil de cette liste à se positionner d'abord pour les producteurs et les DJ, et seulement ensuite pour les utilisateurs occasionnels. 16 types de stems, export MIDI pour voix/basse/batterie, un plugin DAW, une page /dj.

La version gratuite est suffisamment généreuse pour évaluer réellement. La sortie 5-stems sur mon morceau test était la deuxième meilleure que j'aie entendue, derrière les résultats de la classe htdemucs ci-dessous. Le piano est resté dans le stem piano. La basse est restée dans le stem basse.

La version payante est à 50 $/an pour le plan « Plus ». C'est un bon rapport qualité-prix si vous l'utilisez chaque semaine.

Bémol auquel je ne m'attendais pas : le mode 16-stems est surtout un découpage créatif de la même séparation sous-jacente — guitare électrique vs guitare acoustique vs guitare lead, ce genre de chose. Utile pour le sampling, pas une vraie séparation physique en 16.

6. UVR (Ultimate Vocal Remover) — l'open source

Gratuit. Local. Open source. Pas d'upload, pas de souci de confidentialité, pas d'abonnement mensuel.

C'est celui que la plupart des threads r/musicproduction recommandent. Et à juste titre — si vous savez installer Python, déposer les bons fichiers de modèle dans le bon dossier, et survivre à une bagarre d'installation CUDA / MPS sur macOS, la qualité que vous en tirez est au niveau de n'importe quel produit commercial.

Mais c'est un vrai « si ».

J'ai fait tourner UVR en environ 50 minutes sur un MacBook Air M2 vierge. Un ami sous Windows a mis deux heures et un détour par Stack Overflow. Nous avons tous les deux utilisé le même modèle Demucs htdemucs_ft sous le capot, et nous avons tous les deux obtenu des stems superbes.

Utilisez UVR si : vous traitez des dizaines de morceaux, vous tenez à la confidentialité, vous ne voulez pas payer à la minute, et vous êtes prêt à lire de la documentation d'installation.

Passez votre chemin si : vous voulez des stems en 60 secondes et vous n'avez jamais écrit pip install avec colère.

7. AI Stem Splitter (le mien — aistemsplitter.org)

Divulgation complète : je l'ai construit. Sautez cette section si vous voulez — mais vous êtes venu chercher une comparaison et je vais être honnête sur ce que c'est et ce que ce n'est pas.

Il fait tourner la même famille de modèles htdemucs qu'UVR. Le modèle vient de Meta AI, il a remporté la Sony Music Demixing Challenge, et c'est ce vers quoi se tourne chaque outil open source sérieux. Je n'ai pas construit un « meilleur modèle ». J'ai construit une façon sans friction de faire tourner ce modèle.

Six stems en sortie : voix, batterie, basse, guitare, piano, other. Dans le navigateur uniquement. Téléchargement en WAV.

Sur le morceau test, il a gardé le piano dans le stem piano. La voix n'avait pas de bleed audible de batterie sur le refrain. Le traitement s'est terminé en moins de 60 secondes sur une chanson de durée typique (le morceau test Pixabay est revenu en 41 secondes).

Là où ce n'est pas le bon choix :

Pas encore d'import depuis une URL YouTube/SoundCloud. Vous apportez le fichier.
Pas d'API. Si vous avez besoin de scripter depuis Python, utilisez UVR.
Pas de plugin DAW. Si vous voulez une piste sans voix à l'intérieur de Logic sans quitter Logic, Fadr le fait et pas nous.

Comment l'utiliser réellement — étape par étape

Vous avez demandé le guide d'utilisation. Voici le chemin complet, de « j'ai une chanson » à « j'ai six stems ».

Étape 1. Rendez-vous sur aistemsplitter.org. Connectez-vous avec Google. Vous obtenez 10 minutes gratuites de traitement — sans carte bancaire, sans minuteur d'essai qui tourne en arrière-plan.

Étape 2. Glissez votre fichier audio sur l'uploader. Formats supportés : MP3, WAV, FLAC, M4A. Jusqu'à environ 100 Mo ou à peu près 20 minutes par fichier.

Étape 3. Choisissez un mode de stems. 4-stems (voix / batterie / basse / other) est plus rapide et correspond à ce que la plupart des autres outils proposent. 6-stems (ajoute guitare et piano) est celui à utiliser si la question du piano évoquée plus haut vous importe.

Étape 4. Lancez le traitement. La barre de progression avance en temps réel, pas en animation factice de 0 à 100. Une chanson typique de 3-4 minutes est traitée en moins d'une minute sur notre infrastructure.

Étape 5. Quand c'est terminé, chaque stem dispose de son propre lecteur et de son propre bouton de téléchargement. Vous pouvez le mettre en solo, le mute, faire un A/B avec l'original, ou télécharger les six en WAV dans un zip.

À ce stade, vous devriez entendre la voix complètement isolée quand vous la mettez en solo, et vous ne devriez plus entendre de voix du tout quand vous mettez en solo tout sauf la voix. Si ce n'est pas le cas, écrivez-moi sur l'e-mail support — c'est le mode d'échec qui nous tient le plus à cœur.

Étape 6 (optionnelle). Plus de crédits gratuits ? Le pack de crédits est à 5 $ pour 50 minutes (0,10 $ la minute) et les crédits n'expirent jamais. Pas d'abonnement. Si vous traitez une seule chanson cette année, vous avez utilisé 4 centimes de ces 5 $.

Le tableau comparatif

Voici le tableau que j'aurais voulu avoir au départ.

Outil	Sortie gratuite	Plancher payant	Stems	Format	Vitesse	Verdict honnête
LALAL.AI	10 min à vie	Packs de crédits à partir d'environ 15 $	jusqu'à 10	WAV / MP3	~1 min	UI propre, gratuité douloureuse
Moises	5 pistes/mois, 2-stems	3,99 $/mois facturé à l'année	5 sur payant	MP3 (gratuit), WAV (payant)	~1-2 min	Super si vous comptez réellement vous abonner
vocalremover.org	Gratuit, sans inscription, 5-stems	Palier d'abonnement	jusqu'à 5	MP3 / WAV	<1 min	Meilleure option gratuite pour le karaoké
Voice.ai	Gratuit avec installation d'app	n/a	2-4	App requise	variable	Marketing > réalité
Fadr	Version gratuite généreuse	50 $/an	16 (découpage créatif)	WAV	~1 min	Idéal pour les producteurs
UVR (local)	Gratuit à vie	Gratuit	Dépend du modèle (souvent 6)	WAV	Votre GPU	Meilleure qualité si vous savez l'installer
AI Stem Splitter	10 min à l'inscription	5 $ / 50 min, n'expirent jamais	6 (htdemucs)	WAV	<1 min	Le meilleur compromis pour les utilisateurs occasionnels qui veulent htdemucs sans l'installation

Ce que je dirais à un ami

Si vous découpez ce soir une piste karaoké et que vous ne le referez jamais : vocalremover.org. Arrêtez de lire.

Si vous savez installer Python et que vous en faites beaucoup : UVR. Rien ne bat gratuit et local.

Si vous êtes producteur et que vous vivez dans un DAW : Fadr avec le plugin.

Si vous voulez six stems, vous les voulez en moins d'une minute, vous les voulez en WAV, et vous ne voulez vous abonner à rien : AI Stem Splitter est ce que j'ai construit pour ce cas précis.

Ce que j'ai appris

Trois choses, écrites avant de les oublier :

La plupart des outils font la course au nombre de stems. L'argument marketing des « 16 stems » fait vendre. La vraie différence de qualité entre une bonne séparation en 4-stems et une mauvaise séparation en 16-stems est énorme. Le nombre de stems n'est pas la qualité.

La version gratuite, c'est le produit. Chaque plan payant que j'ai essayé vendait une qualité que je ne pouvais pas entendre avant d'avoir payé. Les outils auxquels je fais confiance sont ceux qui me laissent entendre la sortie sur ma propre chanson avant toute inscription. C'est un choix délibéré que j'ai fait sur mon propre site, et c'est la seule chose que je changerais chez chaque concurrent de cette liste.

La vitesse sans la qualité est pire que la lenteur et la propreté. Une séparation en 30 secondes qui laisse du bleed de batterie sur le stem voix est inutilisable. Une séparation en 90 secondes qui n'en laisse pas vaut de l'or. Surveillez ce qui est mesuré.

Voilà tout le carnet.

Le jour où l'on peut déposer une chanson sur une page web et récupérer six stems propres, plus vite qu'il n'en aurait fallu pour ouvrir votre DAW, est arrivé. Il n'est juste pas arrivé de la même manière pour chaque outil.

Les résultats n'étaient pas ceux que les articles SEO promettaient.

Voici la comparaison que j'aurais voulu avoir au départ. Sept outils, un morceau, un casque, et un carnet plein de récriminations.

Le protocole de test

Chaque outil a reçu la même entrée : un WAV de 3:14 en 44,1 kHz / 16 bits. J'ai écouté sur un Sony MDR-7506, sommé en mono là où l'outil ne proposait que du MP3.

Je n'ai pas été tendre.