AIVoiceSeparator
🌐 English

ボーカル / 伴奏 AIで分離

SOTAモデル — BS-Roformer + アンサンブル · 高速 · 無料で始められる

SDR 12.97 dB · Demucsより約3 dB高精度 🔒 クラウド非経由 · GPUはタイ国内 🎯 高域の保持は vocalremover.org と同等
🎚️ Studio品質
3モデルアンサンブル(BS-Roformer + Mel-Roformer + MDX23C)+ EBU-R128 loudnorm — 1曲あたり約5〜6分
⚡ Standard

使い方

  1. アップロードMP3 / WAV / M4A をドラッグ — 最大100 MB、最長15分
  2. AIの処理を待つStudioパイプライン(BS-Roformer + Mel-Roformer + MDX23C アンサンブル)で約5〜6分
  3. ダウンロードvocals.wav(ボーカル)+ instrumental.wav(カラオケ)を別々に取得

無料 1曲/日 · Patreon 参加で → Pro 20曲/日 · 音声はタイ国内に留まる · ローカルGPU

よくある質問

AIVoiceSeparator は本当に無料ですか?

はい。登録なしのユーザーでも、フルのスタジオ品質(3モデルAIアンサンブル + loudnorm)で1日1曲ご利用いただけます。Patreon Pro なら上限が1日20曲に増えます。

LALAL.AI や vocalremover.org と比べてどうですか?

当サービスの3モデルアンサンブル(BS-Roformer + Mel-Roformer + MDX23C)は SDR 12.97 dB を記録し、オープンソースの Demucs ベースラインより約3 dB 高精度です。出力は EBU-R128 でラウドネスを正規化しているため、どんなミックスにも自然になじみます。音声はタイにある専用GPUで処理され、第三者のクラウドには一切送信されません。

アップロードした曲は保存されますか?

すべてのジョブ(入力と出力)は24時間後に自動的に削除されます。お客様の音声をAIモデルの学習に使うことはなく、ユーザー間で結果を共有することもありません(不透明な job_id でアクセス制御しています)。

対応している音声フォーマットは?

入力:MP3、WAV、M4A、FLAC、OGG、WebM、Opus · 最大 100 MB · 最長 15 分。出力:MP3 320 kbps(デフォルト)、WAV、または FLAC(ロスレス)。

YouTube のリンクから直接分離できますか?

はい。YouTube、SoundCloud、TikTok、Bandcamp、Vimeo の URL を貼り付ければ、サーバーが音声をダウンロードします。処理するコンテンツの権利はご自身で確認のうえご利用ください。

曲の歌詞 / 字幕を取得できますか?

はい。処理前に「歌詞を生成」をオンにしてください。分離したボーカルに Whisper を実行し、SRT(字幕)、LRC(カラオケ)、TXT(プレーン)ファイルを返します。処理時間は約30秒増えます。