
如何使用 AI Stem Splitter 製作練習用的伴奏帶
一套實用的工作流程,教你做出「除了你的樂器之外什麼都有」的伴奏帶——涵蓋模型選擇(4 軌 vs 6 軌)、人聲/吉他/貝斯/鼓的個別步驟、哪些歌曲分軌效果不佳,以及如何放慢速度練習。
大多數樂手的練習日常都有一個明顯的缺口:沒有樂團。
你可以對著節拍器把一首歌跑一個小時,但要等到實際對著真正的鼓、真正的貝斯、真正的人聲一起彈,才學得會怎麼把副歌穩穩送進去。以前的解法是去 iTunes 一首一首買伴奏帶——幾百首,每首 1.99 美元,大多還是你根本不想彈的歌、被混得很糟的版本。
AI 音軌分離直接幹掉了這個市場。現在你可以拿任何一首你擁有的歌(或任何一條 YouTube 連結),在幾分鐘內把你自己那項樂器抽掉。做出來的伴奏帶會完全貼合原始錄音,因為它就是原始錄音減去你而已。
這篇文章會帶你走過四種常見情境的實作流程——人聲、吉他、貝斯、鼓——再加上這招行不通的那些歌、以及需要放慢速度時該怎麼處理。
你最後會得到什麼
每首歌一個音訊檔,裡面是完整的原版錄音減掉你的樂器。把它丟進手機的 Spotify、Anytune、隨身 looper,或任何 DAW,然後跟著彈。
對主唱來說,那就是卡拉 OK 的伴奏。對吉他手來說,是少了吉他的整個樂團。對鼓手來說,是中間挖了一個鼓位空缺的歌。同一套邏輯,差別只在抽掉哪一軌。
先挑對模型
這是大多數人會搞錯的關鍵決策,搞錯就得整首重跑一次。
| 你的樂器 | 用這個模型 | 為什麼 |
|---|---|---|
| 人聲(唱歌) | 4 軌(預設) | 4 軌模型的人聲分得最乾淨 |
| 貝斯 | 4 軌(預設) | 貝斯有自己的獨立音軌 |
| 鼓 | 4 軌(預設) | 鼓有自己的獨立音軌 |
| 吉他 | 6 軌 | 不用 6 軌的話,吉他會被丟進「other」裡跟合成器、弦樂混在一起 |
| 鋼琴 | 6 軌 | 同樣的原因——鋼琴需要自己的獨立音軌 |
| 薩克斯風、小提琴、銅管 | 4 軌(接受現實) | 沒有專屬音軌,這些樂器只能待在「other」裡 |
6 軌模型是我們最常看到大家踩的坑。 吉他手習慣性選 4 軌,然後納悶為什麼自己做出來的「伴奏帶」還是有吉他聲漏出來。這不是模型的 bug——4 軌模型裡根本就沒有專屬吉他軌。如果你彈吉他或鋼琴就選 6 軌,其他情況選 4 軌;4 軌比較快,每一軌的分離也稍微乾淨一點。
兩種模型成本相同,所以不用為了省錢去糾結這個。(每次呼叫的成本算式我們在這裡寫過。)
工作流程:練唱
這是最簡單的情境,因為「除了人聲之外的全部」只要點一下就好。
- 挑一首歌。 任何製作乾淨的歌都行。避開現場錄音(什麼聲音都會互相干擾),以及主唱被疊軌、過度 auto-tune、或埋在 reverb 底下的歌。
- 跳過音軌分離器,改用 karaoke maker。 這就是同一個流程的一鍵「給我伴奏版」捷徑。
- 等大約 60 秒。 一首 3 分鐘的歌大概就是這個處理時間。
- 下載伴奏檔。 那是已經幫你混好的鼓 + 貝斯 + other。丟到手機,搞定。
唯一的小陷阱: 如果歌曲裡有你也想去掉的明顯和聲(Beatles 那種疊起來的和聲),karaoke maker 會保留那些和聲。網路上沒有任何公開模型可以乾淨地把主唱和和聲分開——它們共享太多頻率內容。換一個錄音,不然就接受你的伴奏帶裡會有和聲存在。
工作流程:練吉他
這裡 6 軌的決策就很重要了。
- 挑歌。 那種只有一把明顯錄出來的吉他的歌最理想——音色乾淨、聲道分離好。有五層吉他疊軌的歌(大部分金屬、很多現代流行)對任何模型來說都是硬骨頭。
- 打開 AI Stem Splitter 選 6 軌。 上傳檔案或貼一條 YouTube 連結。
- 等 2 到 3 分鐘 處理。
- 下載除了吉他以外的所有音軌。 你會拿到六個檔案:人聲、鼓、貝斯、吉他、鋼琴、other。留五個,跳過吉他。
- 把它們混回一個檔案。 把那五軌拖進 Audacity(免費)或任何 DAW。所有軌都設成 0 dB。匯出成 MP3。
成品就是少了吉他的整個樂團。在任何支援 A-B repeat 的播放器裡 loop 住 solo 段落,把那個 lick 練個五十次。
節奏陷阱: 你可能會手癢想把鼓也靜音,做出「更乾淨」的練習混音。別這樣。大多數樂手沒有鼓當參考就會抓不到節奏,而跟著原始錄音彈的整個重點,就是要學會你的聲部要怎麼坐進那個 groove 裡。
工作流程:練貝斯
幾乎跟吉他一模一樣,只是用 4 軌。
- 把歌上傳到 AI Stem Splitter,選 4 軌。
- 等大約 60 秒。
- 下載人聲 + 鼓 + other。 跳過貝斯軌。
- 在 Audacity 裡把它們混回去。匯出。
貝斯專屬的坑: 有合成貝斯或重 sub-bass 的歌,常常會在「bass」軌和「other」軌之間被切得很怪。如果你的 bassline 從 bass 檔裡消失了,卻在 other 裡淡淡地出現,那是因為原始混音把貝斯接上了合成器或用了重 sidechain。這在模型層級沒辦法修——換首歌,或者把兩軌疊回去,接受你的「伴奏」帶裡會有 ghost bass。
工作流程:練鼓
同樣的流程,換一個音軌丟掉。
- 上傳到 AI Stem Splitter,選 4 軌。
- 下載人聲 + 貝斯 + other。 跳過鼓軌。
- 混回一個檔案。
鼓專屬的坑: 「人聲」軌會有微弱的鈸聲漏出來(鈸跟齒音人聲共用很多高頻內容),而「other」軌偶爾會有 ghost-snare 的雜訊殘留。練習用的話無所謂——你打得夠大聲,沒人聽得到那點漏音。如果你要把鼓錄進伴奏帶裡,把鼓位以外的所有軌道都用 ~80 Hz 高通濾掉,漏音就會消失。
哪些歌行得通、哪些行不通
這是大家都不講的另一半。再完美的模型,也分不了當初錄音時就沒打算分軌的音訊。
效果好:
- 經典搖滾(66 年後的 Beatles、CCR、Tom Petty、Springsteen)
- 鄉村音樂幾乎全部都行——人聲永遠在最前面
- 木吉他創作型歌手
- 製作乾淨的現代流行(2010 年後的大多數作品)
- 小編制爵士標準曲
效果差:
- 重 shoegaze 與 lo-fi(刻意做模糊的製作風格)
- 重度 auto-tune 加上加了效果的和聲疊唱
- 現場錄音(每樣聲音都會互相干擾)
- 用了重 parallel/bus 壓縮的歌
- 1965 年以前的單聲道混音
- 有吉他牆疊軌的重金屬
耳機測試: 如果你用便宜耳機就能清楚聽出每樣樂器在哪、叫得出名字,模型大概也分得開。如果在便宜耳機裡聽起來就是一面 wall of sound,模型也只會給你一面 wall of stems。
放慢速度或變調
原速的伴奏帶在你還在學的時候通常不太實用。兩種處理方式。
分軌之後再放慢。 正常跑一次音軌分離,把你的伴奏帶混好,然後丟進 slowed + reverb maker。在 15% 以內的減速都還能用。超過這個範圍就會開始聽到鈸上的 time-stretch 雜訊。
分軌之前先放慢。 反直覺地,這常常會讓分軌品質更好。模型在同一段音訊上用更低的每秒取樣密度去處理,遇到棘手的瞬態時就有更多東西可以分析。如果某首歌預設分出來很糊,試試這招。
要變調的話,把 pitch changer 用在你最終的伴奏帶上。不要在分軌之前變調——pitch-shift 的雜訊會干擾模型,最後拿到更糟的音軌。
三個值得知道的雷
1. 不要在混音之前正規化每個音軌。 音軌分離本來就已經保留了原始混音的相對音量。如果你在合起來之前把每一軌都 normalize 到 0 dB,做出來的伴奏帶會突然變成貝斯最大聲——對著原版錄音完全不對。匯入原始的音軌,所有軌道增益都設 0 dB,匯出。
2. 一次性使用的話不必特別分軌。 音軌分離適合那些你會練 50 次的歌。一首你只會彈過兩次的歌,直接跟著原版彈、把音量調到你聽得見自己的程度就好。「5 分鐘處理 + 30 秒混音」的時間成本只有在多次練習中才划算。
3. 如果來源音訊本身聽起來就爛,不要相信第一次的分軌結果。 位元率有差。一段 128 kbps 的 YouTube rip 分出來會明顯比 320 kbps MP3 或無損檔案差。如果結果聽起來怪怪的,先檢查來源——你能從低位元率來源裡榨出的品質有實實在在的上限。
實際操作起來大概長這樣
一個典型的工作流程主動花的時間大概三分鐘:
- 30 秒上傳歌曲、選模型
- 1 到 3 分鐘處理(這段你什麼都不用做)
- 30 秒下載並在 Audacity 裡合併
總計:從「我想練這首歌」到「伴奏帶已經在手機上」不到 5 分鐘。
如果你只需要把人聲拿掉,karaoke maker 完全省掉手動混音那一步。除此之外,把檔案一拖一放進 Audacity 就是整個工作了。
重點整理: 模型本身才是最簡單的部分。為你的樂器挑對模型,以及挑一首當初錄音時就有乾淨分離的歌,這兩個決策才是決定接下來一小時你是在練琴還是在排錯的關鍵。
如果你想在不架設本地工具鏈的情況下試試看,AI Stem Splitter 對最前面幾分鐘的音訊是免費的。
作者

分類
更多文章

htdemucs vs BS-RoFormer vs Spleeter:2026 音源分離基準測試
從 SDR 分數、推論成本到實際延遲,比較 htdemucs、BS-RoFormer 與 Spleeter 三大開源音源分離模型——基於 aistemsplitter.org 的生產部署實測資料。


How to Remove Vocals from Any Song: A Beginner's Step-by-Step Guide (2026)
Step-by-step guide to removing vocals from any song with AI. No software to install, no signup for your first try. Get a clean instrumental in under 90 seconds.


最佳人聲移除器工具比較:我用同一首歌實測了 7 款
我把同一首 Pixabay 曲目丟進 LALAL.AI、Moises、vocalremover.org、Voice.ai、Fadr、UVR,以及我自己的 AI Stem Splitter。這是戴耳機實測後誠實的比較,外加一份取得乾淨六軌輸出的逐步操作指南。
