วิธีทำคาราโอเกะจากเพลงใด ๆ
คุณไม่ต้องซื้อแผ่นคาราโอเกะหรือรอให้ใครอัปโหลดเพลงโปรดของคุณ ด้วยการลบเสียงร้องด้วย AI และการถอดเนื้อร้องอัตโนมัติ คุณสามารถเปลี่ยนเพลงเกือบทุกเพลงให้เป็นคาราโอเกะที่ขัดเกลาแล้วพร้อมเนื้อร้องซิงค์เวลาได้ในประมาณสิบนาที ฟรี ๆ
"การทำแทร็กคาราโอเกะ" จริง ๆ แล้วหมายถึงอะไร
คาราโอเกะจริง ๆ คือสองสิ่งที่ทำงานร่วมกัน ได้แก่ ดนตรีบรรเลง (เพลงที่ลบเสียงร้องนำออก) และชุด เนื้อร้องซิงค์เวลา ที่เลื่อนตามจังหวะเพื่อให้คุณรู้ว่าต้องเข้าตอนไหน ระบบคาราโอเกะรุ่นเก่าจัดส่งสิ่งเหล่านี้ในรูปแบบ MIDI หรือ CDG ที่เป็นกรรมสิทธิ์ ทุกวันนี้คุณสร้างสิ่งเดียวกันได้จากการบันทึกใด ๆ ที่คุณมีสิทธิ์ใช้ เพราะสองปัญหาที่เคยยาก คือการแยกเสียงออกจากดนตรี และการจัดเนื้อร้องให้ตรงจังหวะ ตอนนี้ AI แก้ได้แล้ว
ตัวสร้างคาราโอเกะ AI บน AIVoiceSeparator จัดการทั้งสองอย่างในรอบเดียว มันรันชุดโมเดลสามโมเดลเพื่อดึงเสียงร้องออก และสามารถรัน Whisper บนสเต็มเสียงร้องที่แยกออกมาเพื่อสร้างไฟล์ .lrc พร้อมไทม์สแตมป์ที่พร้อมใช้กับคาราโอเกะ ส่วนที่เหลือของคู่มือนี้จะพาผ่านขั้นตอนการทำงานทั้งหมด รวมถึงวิธีปรับคีย์ผลลัพธ์ให้เข้ากับช่วงเสียงของคุณเอง และเครื่องเล่นไหนที่อ่านไฟล์เนื้อร้องคาราโอเกะได้จริง
ทำแทร็กคาราโอเกะจากเพลงใด ๆ
🎤 เปิดตัวสร้างคาราโอเกะฟรี 1 เพลง/วัน · ไม่ต้องสมัคร · Patreon Pro = 20 เพลง/วัน
ขั้นที่ 1 — เพิ่มเพลงของคุณ (อัปโหลดหรือวาง URL)
เปิดแอป AIVoiceSeparatorแล้วเลือกวิธีเพิ่มเพลงของคุณ คุณจะลากไฟล์เสียงเข้ามา (MP3, WAV, FLAC, M4A และอื่น ๆ ขนาดไม่เกิน 100 MB / 15 นาที) หรือสลับไปแท็บ URL แล้ววางลิงก์ก็ได้ การรองรับ URL ครอบคลุม YouTube, YouTube Music, SoundCloud และ TikTok ซึ่งสะดวกหากเพลงที่คุณต้องการอยู่ฝั่งตัวลบเสียงร้อง YouTubeแทนที่จะเป็นไฟล์ในเครื่องคุณ เซิร์ฟเวอร์จะดาวน์โหลดเสียงด้วย yt-dlp ดังนั้นคุณไม่ต้องไปงม MP3 จากเว็บแปลงที่ไม่น่าไว้ใจก่อน
เพื่อผลลัพธ์คาราโอเกะที่สะอาดที่สุด เริ่มจากแหล่งที่มาคุณภาพสูงสุดที่คุณหาได้ สตรีม 320 kbps หรือไฟล์ lossless ให้รายละเอียดแก่โมเดลแยกเสียงมากกว่าไฟล์ rip 96 kbps แบบบาง ๆ และความแตกต่างนั้นฟังออกได้ในดนตรีบรรเลงสุดท้าย
ขั้นที่ 2 — เปิด "สร้างเนื้อร้อง" ก่อนประมวลผล
นี่คือขั้นตอนที่คนส่วนใหญ่ข้ามแล้วมาเสียดายทีหลัง ก่อนกดปุ่มแยกเสียง ให้เปิดสวิตช์ สร้างเนื้อร้อง เมื่อเปิดอยู่ บริการจะรัน Whisper ซึ่งเป็นโมเดลรู้จำเสียงพูดแบบโอเพนซอร์ส บน สเต็มเสียงร้องที่แยกออกมา ไม่ใช่มิกซ์เต็ม การถอดความบนเสียงร้องที่สะอาด (แทนที่จะเป็นเพลงต้นฉบับ) คือเคล็ดลับที่ทำให้การจับเวลาแม่นยำ เพราะไม่มีเสียงดนตรีให้โมเดลเข้าใจผิดว่าเป็นคำพูด
คุณจะได้รับสามไฟล์กลับมา:
- SRT — รูปแบบซับไตเทิลวิดีโอมาตรฐาน พร้อมไทม์สแตมป์เริ่ม/จบ เหมาะกับการใส่เนื้อร้องลงบนวิดีโอ
- LRC — รูปแบบคาราโอเกะ แต่ละบรรทัดติดไทม์สแตมป์
[mm:ss.xx]เพื่อให้เครื่องเล่นเลื่อนและไฮไลต์เนื้อร้องให้ตรงกับดนตรี - TXT — ข้อความล้วน ไม่มีจับเวลา มีประโยชน์สำหรับพิมพ์เนื้อเพลงหรือตรวจทาน
Whisper รองรับภาษาหลากหลาย จึงใช้ได้กับภาษาไทย ญี่ปุ่น เกาหลี จีน สเปน และอีกหลายสิบภาษา ดูเรื่องคาราโอเกะหลายภาษาด้านล่างเพิ่มเติม
ขั้นที่ 3 — แยกเพลง
กดแยกเสียงแล้วปล่อยให้ AI ทำงาน โหมด Studio ของ AIVoiceSeparator รันชุดโมเดลแบบถ่วงน้ำหนักสามโมเดล ได้แก่ BS-Roformer, Mel-Band Roformer และ MDX23C แทนที่จะเป็นเครือข่ายเดียว การรวมชุดโมเดลช่วยลบสิ่งแปลกปลอมที่โมเดลใดโมเดลหนึ่งจะทิ้งไว้ และผลลัพธ์วัดได้ราว 12.97 dB SDR ซึ่งสูงกว่าเส้นฐาน Demucs รุ่นเก่าอย่างมีนัยสำคัญ เพลงห้านาทีทั่วไปเสร็จในประมาณหกนาทีบน GPU หากอยากรู้ว่าการแยกนั้นทำงานเบื้องหลังอย่างไร ดูบทความอธิบายของเราเรื่องการแยกเสียงด้วย AI ทำงานอย่างไร
ขณะที่งานรันอยู่ บริการยังตรวจหา BPM และคีย์ดนตรี ของเพลงด้วย ทั้งสองมีประโยชน์จริงสำหรับคาราโอเกะ เพราะบอกจังหวะที่คุณจะร้องตาม และคีย์นั้นอยู่ในช่วงเสียงที่คุณร้องสบายไหม
ขั้นที่ 4 — ดาวน์โหลดดนตรีบรรเลง (และ LRC)
เมื่องานเสร็จ ฟังตัวอย่างสเต็มในเบราว์เซอร์ แล้วดาวน์โหลดสิ่งที่คุณต้องการ:
- ดนตรีบรรเลง — นี่คือแทร็กประกอบคาราโอเกะของคุณ เอาเป็น WAV หรือ FLAC แบบ lossless หากวางแผนจะปรับคีย์หรือรีมิกซ์ทีหลัง หรือ MP3 320 kbps หากแค่อยากร้องตาม
- ไฟล์ .lrc — เนื้อร้องซิงค์เวลาของคุณ
- สเต็มเสียงร้อง (ถ้าต้องการ) — มีประโยชน์เป็นแทร็กอ้างอิงนำทางขณะหัดทำนอง
หากเป้าหมายของคุณคือแทร็กประกอบล้วน ๆ ไม่สนใจเนื้อร้อง ตัวดึงดนตรีบรรเลงโดยเฉพาะทำการแยกแบบเดียวกันด้วยขั้นตอนที่ปรับมาเพื่อเอาต์พุตเดียวนั้น
ขั้นที่ 5 — ปรับคีย์ดนตรีบรรเลงให้เข้าช่วงเสียงคุณ (ถ้าต้องการ)
คีย์ต้นฉบับคือคีย์ที่ศิลปินบันทึกไว้ ซึ่งไม่ใช่ที่ที่เสียงคุณอยู่เสมอ ถ้าท่อนคอรัสสูงเกินเอื้อม ให้ลดทั้งดนตรีบรรเลงลงสองสามครึ่งเสียง ถ้ามันต่ำเกินไปและฟังขุ่น ก็ดันขึ้น สองหรือสามครึ่งเสียงไปทางใดทางหนึ่งมักพอที่จะย้ายเพลงเข้าสู่ช่วงที่สบายโดยไม่ฟังเหมือนถูกปรับแต่งจนชัด
เครื่องเล่นคาราโอเกะสมัยใหม่ส่วนใหญ่ (KaraFun, Walaoke) มีปุ่มควบคุมคีย์ในตัว คุณจึงเปลี่ยนคีย์ได้ทันทีโดยไม่ต้องเรนเดอร์ใหม่ หากคุณอยากฝังคีย์ใหม่ลงในไฟล์ โปรแกรมแก้ไขเสียงใด ๆ (Audacity ฟรี) สามารถปรับคีย์โดยรักษา tempo ไว้ได้ เพราะคุณดาวน์โหลด WAV แบบ lossless ในขั้นก่อนหน้า คุณจึงปรับคีย์ได้โดยไม่ซ้อนสิ่งแปลกปลอมจากการบีบอัดอย่างที่จะเกิดเมื่อเข้ารหัส MP3 ซ้ำไปซ้ำมา
ขั้นที่ 6 — เล่นในแอปคาราโอเกะ
ไฟล์ LRC จะทำหน้าที่ของมันได้ก็ต่อเมื่อเครื่องเล่นของคุณรู้วิธีอ่าน ธรรมเนียมที่เครื่องเล่นเกือบทุกตัวยึดตามนั้นง่ายมาก คือ ตั้งชื่อไฟล์เนื้อร้องให้เหมือนกับไฟล์เสียงและเก็บไว้ในโฟลเดอร์เดียวกัน song.mp3 อยู่ข้าง ๆ song.lrc นี่คือตัวเลือกที่พบบ่อย:
🎬 VLC
ตัวยืนพื้นฟรีและข้ามแพลตฟอร์ม ด้วยไฟล์ LRC ชื่อเดียวกัน (และเปิดส่วนขยายเนื้อร้อง) VLC จะเลื่อนเนื้อร้องซิงค์เวลาทับดนตรีบรรเลงของคุณ ใช้ได้บน Windows, macOS, Linux, Android และ iOS
🎹 KaraFun
เครื่องเล่นคาราโอเกะที่สร้างมาเฉพาะ มีปุ่มควบคุมคีย์และ tempo แบบทันที พร้อมจอแสดงเนื้อร้องแบบไฮไลต์ขนาดใหญ่ เหมาะกับคืนคาราโอเกะในห้องนั่งเล่น
🎤 Walaoke
เครื่องเล่นคาราโอเกะ Windows น้ำหนักเบาที่นิยมสำหรับใช้ที่บ้าน โหลดดนตรีบรรเลงพร้อม LRC ที่ตรงกัน แล้วแสดงเนื้อร้องเลื่อนและไฮไลต์สี
🎵 MiniLyrics
ปลั๊กอินเนื้อร้องที่เชื่อมกับเครื่องเล่นอย่าง foobar2000 และอ่านการจับเวลา LRC แสดงเนื้อร้องซิงค์เวลาขณะเพลงเล่น
หากคุณแค่อยากให้เนื้อร้องเบิร์นลงบนวิดีโอสำหรับจอคาราโอเกะ ใช้ไฟล์ SRT แทน แล้วเพิ่มเป็นแทร็กซับไตเทิลในเครื่องเล่นหรือโปรแกรมตัดต่อวิดีโอใด ๆ
เคล็ดลับเพื่อผลคาราโอเกะที่สะอาด
- เริ่มจากการบันทึกในสตูดิโอที่สะอาด เวอร์ชันแสดงสด คัฟเวอร์อะคูสติกที่มีเสียงผู้ชม และแทร็กที่มาสเตอร์มาดังจัด แยกให้สะอาดได้ยากกว่า มิกซ์สตูดิโอมาตรฐานให้ดนตรีบรรเลงที่สะอาดที่สุด
- ระวังเสียงประสาน การลบเสียงร้องจะจัดการกับเสียงร้องทั้งหมด ดังนั้นชั้นฮาร์โมนีหนาแน่นและคอรัสร้องหมู่บางครั้งทิ้งร่องรอยจาง ๆ หรือกลับกัน ดึงฮาร์โมนีที่คุณอยากเก็บออกไป ไม่มีคำตอบที่สมบูรณ์แบบ ฟังแล้วเลือกผลลัพธ์ที่คุณชอบกว่า
- ตรวจทาน LRC Whisper เก่งแต่ไม่ไร้ที่ติกับคำสแลง ชื่อเฉพาะ และแร็ปเร็ว ๆ เปิด TXT หรือ LRC ในโปรแกรมแก้ไขข้อความใด ๆ แล้วแก้ไม่กี่คำที่มันพลาด
- เก็บไว้ที่ lossless จนถึงตอนจบ ปรับคีย์และแก้ไขบน WAV/FLAC ก่อน แล้วค่อยส่งออกเป็น MP3 เป็นขั้นตอนสุดท้าย
- ตั้งชื่อไฟล์เนื้อร้องให้ตรงกับเสียง สาเหตุที่พบบ่อยที่สุดที่เนื้อร้อง "ไม่ขึ้น" คือชื่อไฟล์ไม่ตรงกัน
คาราโอเกะหลายภาษา (ไทย ญี่ปุ่น เกาหลี และอื่น ๆ)
ข้อได้เปรียบที่ใหญ่ที่สุดอย่างหนึ่งของการสร้างคาราโอเกะจาก AI แทนการพึ่งแคตตาล็อกคาราโอเกะ คือการครอบคลุมภาษา ห้องสมุดคาราโอเกะเชิงพาณิชย์มีเพลงภาษาอังกฤษและตลาดใหญ่ไม่กี่แห่งเยอะ แต่บางมากในที่อื่น ๆ เพราะเนื้อร้องที่นี่มาจาก Whisper ขั้นตอนการทำงานจึงรองรับภาษาไทย ญี่ปุ่น เกาหลี จีนกลาง กวางตุ้ง สเปน อินโดนีเซีย เวียดนาม และอีกหลายสิบภาษา รวมถึงเพลงที่ไม่มีบริการคาราโอเกะใดเคยผลิต
ขั้นตอนลบเสียงร้องไม่ขึ้นกับภาษา โมเดลแยกเสียงไม่สนใจว่าร้องอะไร สนใจแค่ว่ามันเป็นเสียงมนุษย์ในมิกซ์ ดังนั้นเพลงลูกทุ่งไทยหรือซิงเกิล J-pop จะแยกได้ดีเท่ากับเพลงฮิตในชาร์ตภาษาอังกฤษ สำหรับอักษรที่ไม่ใช่ละติน ตรวจทานการถอดความให้ดี เพราะคำที่หายากและการสะกดแบบสไตล์เฉพาะคือจุดที่การถอดความอัตโนมัติมักจะพลาดที่สุด
หมายเหตุด้านกฎหมายสั้น ๆ
การทำคาราโอเกะเพื่อฝึกซ้อมเองหรืองานสังสรรค์ส่วนตัวโดยทั่วไปถือเป็นการใช้ส่วนตัว การขายแทร็กคาราโอเกะที่คุณสร้างจากการบันทึกของผู้อื่น การอัปโหลดสู่สาธารณะ หรือการแสดงเชิงพาณิชย์ เกี่ยวข้องกับการขออนุญาตจากเจ้าของสิทธิ์และเป็นคนละเรื่อง คุณต้องรับผิดชอบในการมีสิทธิ์ใช้สิ่งที่คุณประมวลผลเอง ดูเงื่อนไขการใช้งานของเราสำหรับภาพรวมทั้งหมด ในด้านความเป็นส่วนตัว: ทุกงาน ทั้งไฟล์ที่คุณอัปโหลดและสเต็มที่เราสร้าง จะถูกลบโดยอัตโนมัติหลัง 24 ชั่วโมง และเสียงของคุณจะไม่ถูกนำไปฝึกโมเดล AI
คำถามที่พบบ่อย
การทำแทร็กคาราโอเกะฟรีจริงไหม?
จริง ผู้ใช้ที่ไม่ระบุตัวตนได้ 1 เพลงต่อวันที่คุณภาพ Studio เต็มรูปแบบ รวมการสร้างเนื้อร้อง Patreon Pro เพิ่มเป็น 20 เพลงต่อวันพร้อมคิวลำดับความสำคัญ
ไฟล์ LRC คืออะไรกันแน่?
เป็นไฟล์เนื้อร้องข้อความล้วนที่แต่ละบรรทัดนำหน้าด้วยไทม์สแตมป์อย่าง [01:14.30] เครื่องเล่นคาราโอเกะอ่านไทม์สแตมป์เหล่านั้นเพื่อเลื่อนและไฮไลต์เนื้อร้องให้ตรงกับดนตรี
ฉันเปลี่ยนคีย์ให้เข้ากับเสียงได้ไหม?
ได้ ดาวน์โหลดดนตรีบรรเลงแบบ lossless แล้วใช้ปุ่มควบคุมคีย์ในตัวของเครื่องเล่นคาราโอเกะ หรือปรับคีย์ในโปรแกรมแก้ไขฟรีอย่าง Audacity สองถึงสามครึ่งเสียงมักจะพอ
ดนตรีบรรเลงจะมีเสียงร้องตกค้างไหม?
ชุดโมเดลสามโมเดลลบเสียงร้องนำได้สะอาดในเพลงสตูดิโอส่วนใหญ่ ชั้นเสียงประสานหนาแน่นและการบันทึกสดอาจทิ้งร่องรอยจาง ๆ ผลลัพธ์แตกต่างกันตามเพลง
ใช้กับเพลงที่ไม่ใช่ภาษาอังกฤษได้ไหม?
ได้ การลบเสียงร้องไม่ขึ้นกับภาษา และ Whisper ถอดความภาษาไทย ญี่ปุ่น เกาหลี จีน สเปน และอีกหลายภาษาสำหรับไฟล์เนื้อร้อง
คุณเก็บไฟล์ของฉันนานแค่ไหน?
ทุกงานจะถูกลบหลัง 24 ชั่วโมง เราไม่เคยนำเสียงของคุณไปฝึก AI
เครื่องมือและบทความที่เกี่ยวข้อง
พร้อมร้องหรือยัง? สร้างแทร็กคาราโอเกะของคุณตอนนี้
🎤 เปิดตัวสร้างคาราโอเกะฟรี ไม่ต้องสมัคร ไม่มีลายน้ำ — 1 เพลงทุก 24 ชั่วโมง