
Я прогнал один и тот же трек с Pixabay через LALAL.AI, Moises, vocalremover.org, Voice.ai, Fadr, UVR и собственный AI Stem Splitter. Это честное сравнение в наушниках плюс пошаговый гайд, как получить чистые шесть стэмов на выходе.
Я сделал инструмент для удаления вокала. Прежде чем выкатить хотя бы одну строчку инференса в продакшен, я провёл выходные, прогоняя одну и ту же песню через каждый сервис, на который смог найти кредитку — и через пару тех, где она была не нужна.
Результаты оказались совсем не такими, как обещают SEO-статьи.
Это то сравнение, которое мне самому пригодилось бы в начале пути. Семь инструментов, один трек, наушники и блокнот, полный претензий.
Один референсный трек: «Sunlight» от inaya_official на Pixabay — royalty-free, с чистым ведущим вокалом поверх тёплых падов, ударных, баса и фортепианной партии на бридже.
Я выбрал именно его, потому что фортепиано на бридже — самое сложное, с чем приходится работать любому разделителю. Если сервис называет себя «stem splitter», но размазывает фортепиано в «other», я хочу это услышать.
Каждый инструмент получил один и тот же вход: WAV длиной 3:14, 44,1 кГц / 16 бит. Слушал я в Sony MDR-7506, сводил в моно там, где сервис давал только MP3.
Я не церемонился.
Загрузил, заплатил, скачал. UI у них — самый чистый в этом списке, а вкладка с изоляцией отдельных стэмов действительно хорошо продумана.
Но две вещи меня зацепили.
Бесплатный тариф даёт Вам 10 минут один раз и навсегда — не 10 минут в месяц, не 10 минут на песню. Один раз. Как только Вы их выработали — Вас уже ждут платные пакеты кредитов.
И их дефолтный 2-стэмовый вывод (вокал и инструментал) звучал на вокальном стэме как-то странно полым. Переключение на их модель «Phoenix» это в основном лечило, но об этом надо знать.
Подходит: тем, кому нужен опрятный дашборд и кого не волнует цена. Не подходит: тем, кто хочет потестировать больше одной песни перед покупкой.
Moises хочет быть Вашей репетиционной студией, а не просто разделителем. Там есть детектор аккордов, шифтер высоты, ползунок темпа, оверлеи с текстом.
Для игры под трек — отлично. Чтобы извлечь стэмы и уйти — лишнее трение.
Бесплатный план ограничивает Вас 5 разделениями в месяц по 2 стэма. Чтобы получить 4 стэма, нужен план Premium за $3,99/мес при годовой оплате. Отменили посреди года — продолжаете платить.
5-стэмовый вывод (вокал/ударные/бас/фортепиано/other) на Premium — чистый. Загвоздка в том, что Moises должен Вам понравиться достаточно, чтобы оформить подписку ещё до того, как Вы услышите результат на своей песне.
Бренд, который занимает №1 в Google по запросу «vocal remover». Так что я возлагал большие надежды.
Загрузка мгновенная, обработка быстрая, результат — нормально. Просто нормально.
Их под-продукт Splitter AI даёт до 5-стэмового разделения, бесплатно, без регистрации на первом запуске. Это — киллер-фича. По качеству это явно модель из линейки Spleeter: подтекание на басу, ударные звучат слегка размазано, вокальный стэм — достаточно чистый для караоке-вечера, но не для ремикса, который Вы выпустите.
Честно: если Вам сегодня вечером нужно нарезать караоке-минусовку для семейного праздника — это тот самый инструмент. Перестаньте читать и идите его использовать. Бесплатно, работает, логин не нужен.
Для всего, что Вы будете крутить на сцене или в DAW, — читайте дальше.
На их лендинге буквально написано «The Best AI Stem Splitter on the Market».
Это не так.
Изоляция вокала была приемлемой. Ударные — мягкие и «качающиеся». Стэм «other» проглотил фортепиано целиком — ровно тот режим отказа, за которым я следил.
Ещё больше меня удивил воркфлоу. Чтобы скачать результат, мне пришлось установить их десктоп-приложение. Для разделителя, который позиционируется как веб-инструмент, это была сделка-разрушитель.
Я удалил его через 8 минут после установки.
Fadr — единственный инструмент в этом списке, который маркетируется в первую очередь на продюсеров и диджеев, а на обычных пользователей — во вторую. 16 типов стэмов, MIDI-экспорт для вокала/баса/ударных, DAW-плагин, отдельная /dj страница.
Бесплатный тариф достаточно щедрый, чтобы реально что-то оценить. 5-стэмовый вывод на моём тестовом треке оказался вторым по качеству — сразу после результатов класса htdemucs ниже. Фортепиано осталось в фортепианном стэме. Бас — в басовом.
Платный тариф — $50/год за «Plus». Хорошая цена, если Вы используете его еженедельно.
Оговорка, которой я не ожидал: режим 16 стэмов — это в основном креативная нарезка одного и того же базового разделения: гитара-электро vs гитара-акустика vs гитара-соло, в таком духе. Полезно для сэмплинга, но это не настоящее физическое разделение на 16 источников.
Бесплатно. Локально. Open source. Никаких загрузок, никакого беспокойства о приватности, никаких месячных платежей.
Именно его чаще всего рекомендуют в тредах r/musicproduction. И справедливо: если Вы можете установить Python, кинуть нужные файлы моделей в нужную папку и пережить сражение с установкой CUDA / MPS на macOS — качество, которое Вы получите на выходе, не уступит ничему коммерческому.
Но это очень большое «если».
Я запустил UVR примерно за 50 минут на новеньком M2 MacBook Air. Друг на Windows потратил два часа и пару заходов на Stack Overflow. Мы оба использовали под капотом одну и ту же модель Demucs htdemucs_ft, и у нас обоих получились прекрасные стэмы.
Используйте UVR, если: Вы обрабатываете десятки треков, заботитесь о приватности, не хотите платить поминутно и готовы читать документацию по установке.
Пропустите UVR, если: Вам нужны стэмы за 60 секунд и Вы никогда не печатали pip install со злости.
Честное предупреждение: я сделал его сам. Можете пропустить эту секцию — но Вы пришли сюда за сравнением, и я буду честен в том, что это такое, а что нет.
Он использует то же семейство моделей htdemucs, что и UVR. Модель — от Meta AI, она выиграла Sony Music Demixing Challenge, и именно к ней обращается каждый серьёзный open-source инструмент. Я не делал «модель получше». Я сделал способ запускать эту модель без трения.
На выходе шесть стэмов: вокал, ударные, бас, гитара, фортепиано, other. Только в браузере. Скачивание в WAV.
На тестовом треке он удержал фортепиано в фортепианном стэме. На вокале на припеве не было слышного подтекания ударных. Обработка завершилась менее чем за 60 секунд на типичной длине песни (тестовый трек с Pixabay вернулся за 41 секунду).
Где он не подходит:
Вы просили операционный гайд. Вот полный путь от «у меня есть песня» до «у меня есть шесть стэмов».
Шаг 1. Идите на aistemsplitter.org. Войдите через Google. Вы получаете 10 бесплатных минут обработки — без кредитной карты, без таймера триала, тикающего где-то в фоне.
Шаг 2. Перетащите аудиофайл в загрузчик. Поддерживается: MP3, WAV, FLAC, M4A. До ~100 МБ или примерно 20 минут на файл.
Шаг 3. Выберите режим стэмов. 4 стэма (вокал / ударные / бас / other) — быстрее и совпадает с тем, что дают большинство других инструментов. 6 стэмов (добавляются гитара и фортепиано) — это режим, если Вам важен тот самый вопрос про фортепиано, который я упомянул выше.
Шаг 4. Нажмите старт. Прогресс-бар движется в реальном времени, а не фейковой анимацией 0–100. Типичная песня 3–4 минуты обрабатывается у нас меньше чем за минуту.
Шаг 5. По готовности у каждого стэма свой плеер и своя кнопка скачивания. Можно играть в соло, мьютить, A/B сравнить с оригиналом или скачать все шесть в WAV одним zip-архивом.
На этом этапе Вы должны услышать вокал полностью изолированным, когда играете его в соло, и вообще не слышать вокала, когда играете в соло всё остальное. Если это не так — напишите мне на саппорт, это тот режим отказа, который нам важнее всего.
Шаг 6 (опционально). Кончились бесплатные кредиты? Пакет — $5 за 50 минут ($0,10 за минуту), и эти кредиты никогда не сгорают. Никакой подписки. Если Вы обработаете одну песню за год — Вы потратили 4 цента из этих $5.
Вот та таблица, которую мне хотелось иметь в начале.
| Инструмент | Бесплатно | Минимум платно | Стэмы | Формат | Скорость | Честный вердикт |
|---|---|---|---|---|---|---|
| LALAL.AI | 10 мин на всю жизнь | Пакеты кредитов от ~$15 | до 10 | WAV / MP3 | ~1 мин | Чистый UI, болезненный free tier |
| Moises | 5 треков/мес, 2 стэма | $3,99/мес при годовой оплате | 5 на платном | MP3 (free), WAV (paid) | ~1–2 мин | Хорош, если реально будете подписываться |
| vocalremover.org | Бесплатно, без регистрации, 5 стэмов | Тариф с подпиской | до 5 | MP3 / WAV | <1 мин | Лучший бесплатный вариант для караоке |
| Voice.ai | Бесплатно с установкой приложения | n/a | 2–4 | Нужно приложение | как повезёт | Маркетинг > реальность |
| Fadr | Щедрый free tier | $50/год | 16 (креативный сплит) | WAV | ~1 мин | Лучший для продюсеров |
| UVR (локально) | Бесплатно навсегда | Бесплатно | Зависит от модели (часто 6) | WAV | Ваш GPU | Лучшее качество, если осилите установку |
| AI Stem Splitter | 10 мин после входа | $5 / 50 мин, не сгорают | 6 (htdemucs) | WAV | <1 мин | Лучший вариант для нечастых пользователей, которым нужен htdemucs без установки |
Если Вы режете одну караоке-минусовку сегодня вечером и больше никогда этим заниматься не собираетесь: vocalremover.org. Перестаньте читать.
Если можете установить Python и делаете это часто: UVR. Бесплатное и локальное — непобиваемо.
Если Вы продюсер и живёте в DAW: Fadr плюс плагин.
Если нужны шесть стэмов, нужны меньше чем за минуту, нужен WAV и Вы не хотите ни на что подписываться: AI Stem Splitter — то, что я сделал ровно под этот кейс.
Три вещи, которые я записываю, пока не забыл:
Большинство инструментов гонится за числом стэмов. Маркетинговая формулировка «16 стэмов» продаётся. Реальная разница в качестве между хорошим 4-стэмовым разделением и плохим 16-стэмовым — огромна. Число стэмов — это не качество.
Бесплатный тариф и есть продукт. Каждый платный план, который я пробовал, продавал качество, которое я не мог услышать, пока не заплатил. Инструменты, которым я доверяю, — это те, что позволяют услышать результат на своей собственной песне до любой регистрации. Это осознанный выбор, который я сделал на своём сайте, и единственное, что я бы изменил у каждого конкурента в этом списке.
Скорость без качества — хуже, чем медленно, но чисто. Разделение за 30 секунд, оставляющее подтекание ударных на вокальном стэме, использовать нельзя. Разделение за 90 секунд, которое этого не делает, — золото. Следите, что именно бенчмаркают.
Вот и весь блокнот.
День, когда Вы можете бросить песню на веб-страницу и получить шесть чистых стэмов назад быстрее, чем успели бы открыть свой DAW, наступил. Просто наступил он не одинаково для всех инструментов.


Step-by-step guide to removing vocals from any song with AI. No software to install, no signup for your first try. Get a clean instrumental in under 90 seconds.


Практический воркфлоу для создания минусовок «всё, кроме вашего инструмента» — выбор модели (4 стема vs 6 стемов), пошаговые инструкции для вокала, гитары, баса и ударных, песни, которые плохо разделяются, и как их замедлить.


Практическое сравнение трёх ведущих открытых моделей разделения источников звука — SDR, стоимость инференса, реальная задержка и сценарии, в которых каждая из них действительно оправдана в продакшене.
