Stable·v0.1

原生貼合你技術棧的 SDK 與整合。

同一個 AI Stem Splitter API,覆蓋 7 個第一方 SDK 和 4 個無程式碼整合——從 npm install @aistemsplitter/sdk 到單一 n8n node——背後有 OpenAPI 3.1 規格,以及永不到期的分鐘包。

取得 API 金鑰閱讀 API 文件
POST /v1/audio/splits
$ curl -X POST https://api.aistemsplitter.org/v1/audio/splits \
 -H "Authorization: Bearer $AISTEMSPLITTER_API_KEY" \
 -d '{"input": { "type": "direct_url", "url": "…" }, "stemModel": "6s" }'
HTTP/1.1 200 OKsucceeded
語言
7
整合
4
渠道
13
Spec
OpenAPI 3.1
/ 第一方 SDK

選擇符合你技術棧的 SDK

Node.js
Node.js / TypeScript
@aistemsplitter/sdk · npm + JSR
$npm install @aistemsplitter/sdk
Quickstart
v0.1.0
Python
Python
aistemsplitter · PyPI
$pip install aistemsplitter
Quickstart
v0.1.0
Java
Java / Kotlin
org.aistemsplitter:aistemsplitter-java · Maven Central
$implementation "org.aistemsplitter:aistemsplitter-java:0.1.0"
在 GitHub 閱讀
v0.1.0
Go
Go
github.com/aistemsplitter/aistemsplitter-go · Go module
$go get github.com/aistemsplitter/aistemsplitter-go
在 GitHub 閱讀
v0.1.0
PHP
PHP
aistemsplitter/aistemsplitter · Packagist
$composer require aistemsplitter/aistemsplitter
在 GitHub 閱讀
v0.1.0
Swift
Swift
aistemsplitter-swift · SPM + CocoaPods
$pod "aistemsplitter-swift"
在 GitHub 閱讀
v0.1.0
Lua
Lua
aistemsplitter · LuaRocks
$luarocks install aistemsplitter
在 GitHub 閱讀
v0.1.0
/ 通用 quick start

提交任務、輪詢一次、拿到 6 條 stem

12 行程式碼就能證明介面範圍。提交一次分離,取得 job id,輪詢一次,收到人聲、鼓、貝斯、吉他、鋼琴和 other——每個 SDK 都跑同一套 htdemucs_ft 分離流程。依輸入音訊分鐘數從永不到期的分鐘包扣費(依購買量不同,每分鐘 $0.08–$0.14)。

# 1) Submit a split job
curl -X POST https://api.aistemsplitter.org/v1/audio/splits \
  -H "Authorization: Bearer $AISTEMSPLITTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "input": { "type": "direct_url", "url": "https://example.com/song.mp3" },
    "stemModel": "htdemucs_ft"
  }'
# → { "id": "split_01J…", "status": "queued" }

# 2) Poll for completion
curl https://api.aistemsplitter.org/v1/audio/splits/split_01J… \
  -H "Authorization: Bearer $AISTEMSPLITTER_API_KEY"
# → { "status": "succeeded", "stems": { "vocals": "...", ...x6 } }
/ 無程式碼與自動化

同一個 API,也給團隊其他人一條無程式碼路徑

工程師很少是唯一使用者。把同一個 AI Stem Splitter API 放進 n8n、GitHub Actions、container 或 Pipedream workflow,讓營運、內容和 CI 都跑在同一個 vendor 上。

⬢
教學

n8n community node

從任何地方觸發,輸出 6 條 stem。可自架,也可使用 n8n Cloud。

開啟教學
▶
marketplace

GitHub Action

在 CI/CD 中做 stem 分離,並自動附加到 release。

在 Marketplace 查看
🐳
ghcr.io

Docker / CLI image

一行 container 命令,適合批次工作和本機 pipeline。

在 GHCR 查看
P
workspace

Pipedream actions

可直接放進 Pipedream workflow 的 steps。

在 Pipedream 查看
/ 常見問題

開發者安裝前常問的問題

  • Which SDK should I install — Node, Python, or curl?

    Pick the language your service already runs on. Node and Python ship typed clients with one-call helpers (waitForSplit, verify_signature) and full method autocomplete; curl works on the same REST endpoints if you're prototyping or scripting from a shell. The hosted API is identical across all 13 distribution channels — same job ids, same webhooks, same per-minute billing.

  • Do credits expire if I don't use them?

    No. Credit packs never expire — purchase $6.99 / 50 minutes, $15 / 150 minutes, or $39.99 / 500 minutes and the balance stays on your account until you spend it. There is no monthly subscription, no rollover cap, and no auto-renewal. The first 3 minutes are free with no card required, charged at $0.08–$0.14 per minute depending on pack size.

  • Which model do you use, and can I name it in the request?

    The default is htdemucs_ft (Demucs fine-tuned, 4-stem: vocals, drums, bass, other) — the same model variant the open-source community benchmarks at ~8.7 dB SDR. You can switch to htdemucs_6s for guitar and piano stems by passing model='htdemucs_6s' on submit. Models are named explicitly in every SDK so output quality is comparable to local Demucs runs.

  • Can I self-host the SDK or the inference?

    The SDK clients are MIT-licensed and ship to npm, JSR, PyPI, Maven Central, Packagist, LuaRocks, SPM, and CocoaPods — fork or vendor them as you like. Inference itself runs on our managed GPUs against the hosted API at api.aistemsplitter.com — there is no on-prem inference image in v1, but the GHCR Docker image wraps the SDK for self-hosted orchestration.

  • What's the rate limit, and how do I handle large files?

    Concurrent jobs and per-minute request caps live on /developers/api with the current numbers (they age, so they aren't pinned here). For large uploads, call presignUpload (Node) / presign_upload (Python) to get a direct-to-storage URL — the SDK handles retries with exponential backoff out of the box. Files up to 50 MB upload directly; larger files use multipart presigned URLs.

  • How do I receive the result without polling forever?

    Pass webhook_url on createSplit. When the job finishes, the API POSTs an HMAC-SHA256-signed event to your URL with the stem download links inline. Verify the signature with one SDK call (verifyWebhook in Node, verify_signature in Python). The Webhooks section in each per-language quickstart shows runnable Express, Hono, FastAPI, and Flask handlers.

  • 我該安裝哪個 SDK——Node、Python 還是 curl?

    選擇你的服務已經在用的語言。Node 和 Python 提供型別化 client,帶有一次呼叫的 helper(waitForSplit、verify_signature)和完整 method autocomplete;如果你只是從 shell 做原型或寫腳本,curl 也使用同一套 REST endpoints。託管 API 在全部 13 個分發渠道中都一致——同樣的 job ids、同樣的 webhooks、同樣的按分鐘計費。

  • 分鐘額度不用會過期嗎?

    不會。分鐘包永不到期——購買 $6.99 / 50 分鐘、$15 / 150 分鐘或 $39.99 / 500 分鐘後,餘額會留在你的帳戶直到用完。沒有月訂閱、沒有 rollover 上限,也不會自動續費。前 3 分鐘免費且不需信用卡,依方案大小不同,每分鐘 $0.08–$0.14。

  • 你們使用哪個模型?我可以在 request 裡指定嗎?

    預設是 htdemucs_ft(Demucs fine-tuned,4-stem:vocals、drums、bass、other)——這是開源社群 benchmark 約 8.7 dB SDR 的同一個模型變體。提交時傳入 model='htdemucs_6s',即可切換到支援 guitar 和 piano stems 的模型。每個 SDK 都明確命名模型,所以輸出品質可和本機 Demucs 執行結果比較。

  • 我可以 self-host SDK 或推論服務嗎?

    SDK clients 採 MIT 授權,並發布到 npm、JSR、PyPI、Maven Central、Packagist、LuaRocks、SPM 和 CocoaPods——你可以依需要 fork 或 vendor。推論本身跑在我們管理的 GPU 上,透過 api.aistemsplitter.com 的 hosted API 呼叫——v1 沒有 on-prem 推論 image,但 GHCR Docker image 會包住 SDK,供 self-hosted orchestration 使用。

  • 速率限制是多少?大檔案要怎麼處理?

    並行任務數和每分鐘 request 上限以 /developers/api 的目前數值為準(這些數字會變,所以這裡不固定寫死)。上傳大檔案時,呼叫 presignUpload(Node)/ presign_upload(Python)取得 direct-to-storage URL——SDK 內建 exponential backoff retry。50 MB 以內檔案可直接上傳;更大的檔案使用 multipart presigned URLs。

  • 要怎麼不用一直輪詢也能收到結果?

    在 createSplit 傳入 webhook_url。任務完成後,API 會向你的 URL POST 一個 HMAC-SHA256 簽名事件,並在 payload 內直接帶上 stem 下載連結。用一次 SDK 呼叫驗證簽名(Node 裡 verifyWebhook,Python 裡 verify_signature)。每個語言 quickstart 的 Webhooks 區塊都提供可執行的 Express、Hono、FastAPI 和 Flask handlers。

今天就開始用 stem 分離構建。

建立一把金鑰,貼進 Quick Start,1 分鐘內就能拿回分離好的 stem。前 3 分鐘免費贈送——之後使用永不到期的分鐘包,依購買量不同,每分鐘 $0.08–$0.14。

取得 API 金鑰聯絡團隊
LogoAI Stem Splitter

使用這個模板,更快上線你的下一個 AI 產品。

GitHubDiscordEmail
產品
  • 功能
  • 價格
  • 常見問題
免費工具
  • 調性識別
  • Nightcore Maker
  • Pitch Changer 變調工具
  • Slowed Reverb 製作器
  • TikTok Voice 生成器
AI 工具
  • AI Vocal Removal
  • Acapella 人聲提取器
  • 吉他移除器
  • YouTube 與 SoundCloud 人聲移除器
  • Karaoke Maker
  • AI 鼓聲去除器
  • Voice Isolator
替代方案
  • Lalal.ai 替代方案
  • Splitter.ai alternative
  • VocalRemover 替代方案
資源
  • 博客
  • API
開發者
  • API 參考文件
  • SDKs
  • 取得 API 金鑰
整合
  • n8n 整合
信任背書
  • Stripe Climate
  • Product Hunt
法律
  • Cookie政策
  • 隱私政策
  • 服務條款
BadgeBadge
BadgeBadge
BadgeBadge
BadgeBadge
© 2026 AI Stem Splitter All Rights Reserved.
LogoAI Stem Splitter
首頁價格
API 參考文件

REST endpoints、驗證、callbacks、OpenAPI 3.1 規格。

SDKs

7 個第一方 SDK(Node、Python、Java、Go、PHP、Swift、Lua)。

取得 API 金鑰

在 Settings → Developer 中產生金鑰。

調性識別

識別速度與音樂調性 — 無需註冊

Nightcore Maker

Nightcore, daycore, or sped-up versions from a YouTube link or upload.

Pitch Changer 變調工具

上下調整音高,不影響速度。

Slowed Reverb 製作器

為 TikTok、Reels 和 slowed 播放清單製作慢速 + 殘響版本。

TikTok Voice 生成器

免費生成短影音 AI 旁白。

AI Vocal Removal

Remove vocals for karaoke tracks, quick acapellas, and six-stem previews from files or supported links

Acapella 人聲提取器

從任何一首歌拉出乾淨的 acapella,做 remix、mashup 或 DJ 剪輯都能用。

吉他移除器

把吉他抽掉,跟真實的樂團一起練 — 人聲、鼓和貝斯都還在。

YouTube 與 SoundCloud 人聲移除器

貼上 YouTube 或 SoundCloud 連結,拆分出人聲、鼓、貝斯、鋼琴、吉他和其他分軌

Karaoke Maker

Remove vocals from a song to make a clean instrumental backing track for sing-alongs, rehearsals, and karaoke nights

AI 鼓聲去除器

上傳一首歌,下載一條無鼓音軌——人聲、貝斯,以及除了鼓以外的所有聲部。

Voice Isolator

從嘈雜訪談、通話、現場錄音和語音備忘中提取 spoken voice。

博客
任務中心