보컬 / 반주 AI 분리
최고 수준 모델 — BS-Roformer + 앙상블 · 빠름 · 무료로 시작
사용 방법
- 업로드 — MP3 / WAV / M4A 파일을 드래그 — 최대 100 MB, 최대 15분
- AI 처리 대기 — Studio 파이프라인(BS-Roformer + Mel-Roformer + MDX23C 앙상블)은 약 5~6분 소요
- 다운로드 — vocals.wav(보컬) + instrumental.wav(반주/노래방)를 각각 받습니다
무료 하루 1곡 · Patreon 가입 시 → Pro 하루 20곡 · 오디오는 태국에 머무름 · 로컬 GPU
자주 묻는 질문
AIVoiceSeparator는 정말 무료인가요?
네. 비회원도 하루 1곡을 전체 스튜디오 품질(3개 모델 AI 앙상블 + 라우드니스 정규화)로 처리할 수 있습니다. Patreon Pro에 가입하면 하루 20곡까지 늘어납니다.
LALAL.AI나 vocalremover.org와 비교하면 어떤가요?
3개 모델 앙상블(BS-Roformer + Mel-Roformer + MDX23C)이 SDR 12.97 dB를 기록해 오픈소스 Demucs 기준보다 약 3 dB 우수합니다. 결과물은 EBU-R128 라우드니스 정규화를 거쳐 어떤 믹스에도 자연스럽게 어울립니다. 오디오는 태국에 있는 전용 GPU에서 처리되며, 외부 클라우드로 전송되지 않습니다.
업로드한 노래를 저장하나요?
모든 작업(입력 + 결과물)은 24시간 후 자동으로 삭제됩니다. 사용자의 오디오를 AI 모델 학습에 사용하지 않으며, 사용자 간에 결과물을 공유하지 않습니다. 접근은 추측 불가능한 job_id로만 제한됩니다.
어떤 오디오 형식을 지원하나요?
입력: MP3, WAV, M4A, FLAC, OGG, WebM, Opus · 최대 100 MB · 최대 15분 · 출력: MP3 320 kbps(기본값), WAV, 또는 FLAC(무손실).
YouTube 링크에서 바로 보컬을 분리할 수 있나요?
네. YouTube, SoundCloud, TikTok, Bandcamp, Vimeo URL을 붙여넣으면 서버가 오디오를 자동으로 다운로드합니다. 처리하는 콘텐츠에 대한 권리는 사용자 본인이 책임져야 합니다.
노래에서 가사 / 자막을 받을 수 있나요?
네. 처리 전에 '가사 생성' 옵션을 켜세요. 분리된 보컬 stem에 Whisper를 실행해 SRT(자막), LRC(노래방), TXT(텍스트) 파일을 제공합니다. 약 30초가 추가됩니다.