
버스 소음 음성 정리
교통 저음이 말소리 아래에 깔린 낮은 SNR의 버스 환경 클립입니다.
인터뷰, 통화, 강의, 팟캐스트 클립, 현장 녹음, 음성 메모에서 말소리가 잘 들리지 않나요? 오디오를 업로드하고 spoken voice를 더 깨끗한 MP3로 분리하세요.
Voice isolator는 오디오 녹음의 배경 소음에서 사람의 speech를 분리합니다. spoken voice에는 인터뷰, 통화, 강의, 팟캐스트, 현장 녹음, 음성 메모에 사용하세요. 노래와 음악 보컬에는 Vocal Remover 또는 Stem Splitter를 사용하세요.
노래와 음악 보컬에는 Vocal Remover / Stem Splitter
오디오 파일만 업로드할 수 있습니다. 대상 계정은 10분 무료입니다. provider 처리 실패 시 credits가 환불됩니다.
오디오 처리를 위해 로그인
여기에서 파일을 선택하고 미리 들을 수 있지만, Voice Isolator 작업은 유료 GPU 처리를 사용하므로 로그인 후 시작됩니다.
원본 시끄러운 녹음
분리된 spoken voice
4개의 짧은 noisy speech 클립을 Replicate의 playmore/speech-enhancer로 처리했습니다. before / after를 재생해 정리된 정도를 확인할 수 있습니다.

교통 저음이 말소리 아래에 깔린 낮은 SNR의 버스 환경 클립입니다.

넓은 주변 소음을 낮춘 뒤에도 말소리가 또렷하게 남는지 확인하는 카페 배경 샘플입니다.

문장의 핵심을 유지하면서 실내 소음을 줄여야 하는 까다로운 사무실 녹음입니다.

배경 소음이 강한 긴 공공 광장 클립이며, 중심 대상은 한 사람의 말소리입니다.
오디오 출처: Cassia Valentini-Botinhao, Noisy speech database for training speech enhancement algorithms and TTS models, University of Edinburgh DataShare, CC BY 4.0. 향상된 출력은 Replicate playmore/speech-enhancer로 생성했습니다.
Voice isolator 검색에는 speech cleanup과 음악 보컬 제거라는 두 작업이 섞여 있습니다. 이 페이지는 시끄러운 녹음 속 spoken voice용입니다. 소스가 노래, karaoke track, acapella 요청 또는 음악 보컬이라면 Vocal Remover를 사용하세요.
MP3, WAV, FLAC, M4A, AAC, OGG 또는 WEBM 오디오 파일로 시작하세요. Voice Isolator v1은 최대 50 MB, 600초 파일을 지원합니다. 직접 MP4 업로드, URL 가져오기, 실시간 마이크 cleanup은 이 workflow에 포함되지 않습니다.
Speech cleanup은 직접 들어봐야 합니다. Before 플레이어로 원본 시끄러운 녹음을 듣고, 처리 후 분리된 spoken voice와 비교하세요. 이 비교는 명료도, artifacts, 다운로드 가능성을 판단하는 데 도움이 됩니다.
결과는 spoken voice용 MP3 하나이며, stem package, mixer session 또는 ZIP 파일이 아닙니다. 검토, 편집, transcription 준비, podcast cleanup 또는 더 명확한 음성 버전 공유에 사용할 수 있습니다.
페이지에서 파일을 선택하고 미리 들을 수 있지만, 비용이 발생하는 작업은 로그인 후 시작됩니다. Voice Isolator는 소스 1초당 1 credit을 사용합니다. provider 제출, provider 실패, 출력 finalization 실패 시 credits가 환불됩니다.
Voice Isolator는 통화, OBS, Discord, Zoom 또는 Teams용 real-time denoise가 아닙니다. diarization, target-speaker extraction, forensic restoration 또는 overlapping speaker separation도 아닙니다. 비디오는 먼저 오디오를 추출한 뒤 업로드하세요.
이 flow는 음악 stem splitter와 분리되어 있습니다. 업로드된 오디오를 Replicate playmore/speech-enhancer의 mossformer2_se_48k model로 보내고, 반환된 오디오를 다운로드용 isolated-voice MP3로 finalization합니다.
Voice Isolator는 인터뷰, 통화, 강의, 팟캐스트, 음성 메모, 현장 녹음 같은 시끄러운 녹음에서 spoken voice를 추출합니다. 음악 stem separation이 아니라 speech cleanup입니다.
아니요. 이 페이지는 시끄러운 녹음 속 spoken voice용입니다. 노래, 음악 보컬, karaoke, acapella, remix 또는 stem workflow에는 Vocal Remover 또는 Stem Splitter를 사용하세요.
V1은 오디오 파일만 허용합니다: MP3, WAV, FLAC, M4A, AAC, OGG, WEBM. 파일은 50 MB 이하, 600초 이하여야 합니다.
v1에서는 안 됩니다. Voice Isolator는 직접 MP4/video 업로드나 URL 가져오기를 지원하지 않습니다. 소스가 비디오라면 먼저 오디오를 추출한 뒤 지원되는 오디오 파일을 업로드하세요.
Voice Isolator는 다른 오디오 처리 flow와 같은 규칙을 사용합니다: 소스 오디오 1초는 1 credit입니다. 90초 녹음은 90 credits를 사용합니다.
provider 제출 실패, provider 실패, 출력 finalization 실패는 작업을 failed로 표시하고 해당 녹음에 사용된 credits를 환불합니다. 같은 파일이나 더 깨끗한 오디오 export로 다시 시도할 수 있습니다.
아니요. V1은 시끄러운 오디오 속 spoken voice를 향상하는 기능이며 diarization, target-speaker extraction, forensic restoration 또는 같은 녹음에서 겹쳐 말하는 여러 사람 분리는 지원하지 않습니다.
오디오를 업로드하고 before/after를 비교한 뒤 분리된 MP3를 다운로드하세요.