ボーカル / 伴奏 AIで分離
SOTAモデル — BS-Roformer + アンサンブル · 高速 · 無料で始められる
使い方
- アップロード — MP3 / WAV / M4A をドラッグ — 最大100 MB、最長15分
- AIの処理を待つ — Studioパイプライン(BS-Roformer + Mel-Roformer + MDX23C アンサンブル)で約5〜6分
- ダウンロード — vocals.wav(ボーカル)+ instrumental.wav(カラオケ)を別々に取得
無料 1曲/日 · Patreon 参加で → Pro 20曲/日 · 音声はタイ国内に留まる · ローカルGPU
よくある質問
AIVoiceSeparator は本当に無料ですか?
はい。登録なしのユーザーでも、フルのスタジオ品質(3モデルAIアンサンブル + loudnorm)で1日1曲ご利用いただけます。Patreon Pro なら上限が1日20曲に増えます。
LALAL.AI や vocalremover.org と比べてどうですか?
当サービスの3モデルアンサンブル(BS-Roformer + Mel-Roformer + MDX23C)は SDR 12.97 dB を記録し、オープンソースの Demucs ベースラインより約3 dB 高精度です。出力は EBU-R128 でラウドネスを正規化しているため、どんなミックスにも自然になじみます。音声はタイにある専用GPUで処理され、第三者のクラウドには一切送信されません。
アップロードした曲は保存されますか?
すべてのジョブ(入力と出力)は24時間後に自動的に削除されます。お客様の音声をAIモデルの学習に使うことはなく、ユーザー間で結果を共有することもありません(不透明な job_id でアクセス制御しています)。
対応している音声フォーマットは?
入力:MP3、WAV、M4A、FLAC、OGG、WebM、Opus · 最大 100 MB · 最長 15 分。出力:MP3 320 kbps(デフォルト)、WAV、または FLAC(ロスレス)。
YouTube のリンクから直接分離できますか?
はい。YouTube、SoundCloud、TikTok、Bandcamp、Vimeo の URL を貼り付ければ、サーバーが音声をダウンロードします。処理するコンテンツの権利はご自身で確認のうえご利用ください。
曲の歌詞 / 字幕を取得できますか?
はい。処理前に「歌詞を生成」をオンにしてください。分離したボーカルに Whisper を実行し、SRT(字幕)、LRC(カラオケ)、TXT(プレーン)ファイルを返します。処理時間は約30秒増えます。