แยกเสียงร้อง / ดนตรี ด้วย AI
โมเดล SOTA — BS-Roformer + ensemble · เร็ว · ฟรีเริ่มต้น
วิธีใช้งาน
- อัพโหลด — ลากไฟล์เพลง MP3 / WAV / M4A ขนาดไม่เกิน 100 MB ยาวไม่เกิน 15 นาที
- รอ AI ทำงาน — Studio pipeline (BS-Roformer + Mel-Roformer + MDX23C ensemble) ใช้เวลา ~5-6 นาที
- ดาวน์โหลด — ได้ vocals.wav (เสียงร้อง) + instrumental.wav (karaoke) แยกกัน
ฟรี 1 เพลง/วัน · สมัคร Patreon → Pro 20 เพลง/วัน · ไม่ส่งไฟล์ออกนอกประเทศ · GPU ทำงานในไทย
คำถามที่พบบ่อย
AIVoiceSeparator ใช้ฟรีจริงเหรอ?
ใช่ ผู้ใช้ทั่วไปได้ 1 เพลง/วัน คุณภาพ Studio เต็มรูปแบบ (3-model AI ensemble + loudnorm) ผู้สมัคร Patreon Pro ได้ 20 เพลง/วัน
คุณภาพเทียบกับ LALAL.AI หรือ vocalremover.org อย่างไร?
ensemble 3 โมเดล (BS-Roformer + Mel-Roformer + MDX23C) วัดได้ SDR 12.97 dB ดีกว่า Demucs baseline ประมาณ 3 dB ผลลัพธ์ทำ loudness normalization แบบ EBU-R128 ให้ stems ทั้งสองอยู่ในระดับธรรมชาติ ประมวลผลบน GPU ส่วนตัวในไทย ไม่ส่งไฟล์ออก cloud ของบุคคลที่สาม
เก็บเพลงที่อัพโหลดไว้นานเท่าไหร่?
ทุก job (input + ผลลัพธ์) จะถูกลบอัตโนมัติหลัง 24 ชั่วโมง ไม่ใช้ไฟล์ของคุณไป train AI model ใดๆ และไม่แชร์ผลลัพธ์ของผู้ใช้คนหนึ่งให้ผู้ใช้คนอื่น (เข้าถึงผ่าน job_id เท่านั้น)
รองรับไฟล์รูปแบบไหนบ้าง?
Input: MP3, WAV, M4A, FLAC, OGG, WebM, Opus · สูงสุด 100 MB · ยาวสูงสุด 15 นาที · Output: MP3 320 kbps (ค่าเริ่มต้น), WAV, หรือ FLAC (lossless)
แยกเสียงจากลิงก์ YouTube ได้เลยมั้ย?
ได้ วางลิงก์ YouTube, SoundCloud, TikTok, Bandcamp หรือ Vimeo แล้วเซิร์ฟเวอร์จะดาวน์โหลดเสียงให้อัตโนมัติ คุณต้องรับผิดชอบสิทธิ์ของเนื้อหาที่ใช้เอง
ถอดเนื้อเพลง / ทำซับไตเติ้ลได้มั้ย?
ได้ เปิดปุ่ม 'ถอดเนื้อร้องเป็นซับไตเติ้ล' ก่อนกดเริ่ม ระบบจะรัน Whisper บน vocal stem แล้วคืนไฟล์ SRT (ซับ), LRC (คาราโอเกะ), TXT (ข้อความ) เพิ่มเวลาประมาณ 30 วินาที