Cómo Quitar la Voz de un Vídeo de YouTube (Gratis, 2026)
No necesitas una carrera en ingeniería de audio ni un plugin de pago. Con la IA moderna puedes pegar un enlace de YouTube y obtener una pista vocal limpia y separada, además del instrumental, en unos pocos minutos, y gratis. Aquí tienes exactamente cómo hacerlo, junto con los límites y las particularidades que nadie te cuenta.
Antes, quitar la voz de una canción significaba pelearse con trucos de cancelación de fase en Audacity que dejaban un resultado hueco y con un eco extraño. En 2026, los modelos de aprendizaje profundo lo hacen correctamente: entienden de verdad qué es una voz y la extraen de la mezcla, dejando intactos la batería, el bajo, las guitarras y los sintetizadores. El resultado son dos archivos utilizables — una pista solo de voz y un instrumental — en lugar de un único compromiso degradado.
Esta guía recorre el método gratuito más rápido: pegar una URL de YouTube directamente en nuestro eliminador de voz para YouTube. Sin conversores MP3 de terceros, sin instalaciones, sin registro.
¿Quieres seguir el proceso con una canción real?
🔗 Abrir el eliminador de voz para YouTubeGratis 1 canción/día · sin registro · Patreon Pro = 20 canciones/día
El método en 4 pasos (pega un enlace, descarga las pistas)
- Copia la URL de YouTube. Abre el vídeo en tu navegador o en la app de YouTube y copia el enlace de la barra de direcciones, o toca Compartir → Copiar enlace. Funcionan los enlaces estándar
youtube.com/watch?v=…, los enlaces cortosyoutu.be/…, YouTube Music y los Shorts. - Abre AIVoiceSeparator y cambia a la pestaña Pega un enlace de YouTube / SoundCloud / TikTok. No tienes que descargar un MP3 primero: el servidor obtiene el audio por ti con yt-dlp.
- Pega el enlace y haz clic en "Separar audio". Tu trabajo entra en la cola y la GPU ejecuta un ensamble de IA de tres modelos sobre toda la pista. Verás una barra de progreso en vivo; puedes dejar la pestaña abierta o volver más tarde.
- Escucha y descarga. Cuando termine (unos seis minutos para una canción típica), reproduce ambas pistas en el navegador y descarga la
vocals.wavaislada y elinstrumental.wav. También puedes elegir MP3 320 kbps o FLAC sin pérdida.
Ese es todo el flujo. Si prefieres subir un archivo que ya tienes, la misma página acepta arrastrar y soltar audio — la opción del enlace solo te ahorra un paso. Un par de pequeños hábitos mejoran el resultado: elige la versión de la canción con mejor calidad cuando existan varias, y prefiere el lanzamiento oficial antes que un clip en directo grabado con el teléfono. Cuanto más limpia y fuerte sea la fuente, más material tendrá la IA con el que trabajar, y más convincente será la separación.
Tampoco tienes que estar pendiente del trabajo. Una vez en la cola, el procesamiento ocurre en el servidor, así que puedes cerrar la pestaña, cambiar de canción o volver en diez minutos: el resultado te espera (hasta la ventana de borrado automático de 24 horas). Si procesas varias pistas en una sesión, recuerda que el plan gratuito se reinicia con una canción al día.
Qué funciona — y los límites que conviene conocer
⏱️ Límite de 15 minutos
Los vídeos de origen deben durar 15 minutos o menos. Eso cubre prácticamente cualquier canción, incluidas las versiones extendidas; descarta sesiones de DJ completas y pódcasts.
📦 Límite de 100 MB
Una vez descargado, el audio debe pesar menos de 100 MB. Las fuentes de alto bitrate pueden alcanzar este límite en pistas largas — recórtalas o elige un vídeo más corto si es necesario.
🌐 Solo vídeos públicos
Los vídeos privados, exclusivos para miembros, con restricción de edad y bloqueados por región a menudo se niegan a descargarse. Los enlaces públicos son el camino fiable.
🆓 1 canción gratis/día
Los usuarios anónimos obtienen una separación de calidad completa cada 24 horas. Patreon Pro la eleva a 20 al día con prioridad en la cola.
🔒 Borrado en 24 h
Tanto el audio descargado como tus pistas separadas se eliminan automáticamente al cabo de un día. Tu audio nunca se usa para entrenar modelos de IA.
🎚️ Salida sin pérdida
Elige WAV o FLAC si vas a seguir editando las pistas en un DAW — conservan toda la fidelidad. MP3 320 está bien para escucha casual.
Expectativas de calidad: cómo suena una buena separación
La separación con IA en 2026 es realmente impresionante, pero no es magia. Aquí tienes una imagen honesta de lo que obtendrás.
En una grabación de estudio bien mezclada — voz principal clara, producción moderna — el instrumental sonará limpio y completo, y la pista vocal será nítida con apenas leves artefactos. Este es el mejor de los casos, y es el de la mayoría de las canciones. Nuestro proceso ejecuta un ensamble ponderado de tres modelos (BS-Roformer, Mel-Band Roformer y MDX23C InstVoc) medido en un SDR de 12,97 dB, claramente más limpio que las herramientas antiguas de un solo modelo. Si quieres entender por qué un ensamble supera a cualquier modelo individual, consulta nuestra explicación sobre BS-Roformer vs Demucs.
Dónde se vuelve más difícil:
- Mucha reverberación o delay en la voz. La "cola" de una voz con reverb se mezcla con el instrumental, así que puede quedar un poco de eco vocal en la pista de fondo.
- Coros y armonías densos. Las armonías apiladas ocupan el mismo rango de frecuencias que la voz principal y pueden seguir parcialmente a la pista vocal — normalmente algo bueno para el karaoke, ocasionalmente no.
- Fuentes de baja fidelidad o muy comprimidas. Un rip de YouTube turbio con bajo bitrate le da menos material a la IA. Elige la versión de mejor calidad de una canción cuando puedas escoger.
- Grabaciones en directo. El ruido del público y la reverberación de la sala no son "instrumentos", así que se reparten de forma impredecible entre ambas pistas.
Si tu objetivo es específicamente una pista de fondo sin voz, el extractor de instrumentales está optimizado para exactamente eso, y el creador de karaoke añade encima la letra sincronizada.
Una nota rápida sobre el aspecto legal
Separar una pista para tu propio uso privado — cantar, practicar un instrumento, estudiar un arreglo o transcribir la letra — suele considerarse un uso personal razonable en la mayoría de los lugares. Algo distinto es publicar, distribuir o comercializar pistas de una canción cuyos derechos no posees. Subir una acapela extraída a un servicio de streaming, vender un remix o monetizar un cover puede infringir derechos de autor.
En resumen: eres responsable de tener los derechos de lo que proceses. No alojamos ni compartimos tus resultados, y todo se elimina tras 24 horas, pero eso no te concede una licencia sobre la grabación original. En caso de duda, mantenlo en el ámbito personal, o trabaja con material que hayas creado o licenciado. Consulta nuestras condiciones de uso y la política DMCA para más detalles.
Solución de problemas comunes
| Problema | Causa probable y solución |
|---|---|
| Error "Failed to download" | El vídeo es privado, tiene restricción de edad o está bloqueado por región. Prueba con una versión pública de la misma canción, o descarga el audio tú mismo y sube el archivo. |
| Trabajo rechazado por duración | La fuente supera los 15 minutos. Usa una versión más corta de la pista o un fragmento. |
| "File too large" | El audio descargado supera los 100 MB. Elige un vídeo de origen más corto o de menor bitrate. |
| Has alcanzado tu límite diario | El plan gratuito es una canción cada 24 horas. Espera al reinicio o únete a Patreon Pro para 20/día. |
| Un "fantasma" vocal queda en el instrumental | Normalmente son colas de reverb. No hay un interruptor para eliminarlo a la perfección, pero una fuente más limpia y con menos reverberación ayuda mucho. |
| El resultado suena fino o turbio | La fuente tenía bajo bitrate. Si entra basura, sale basura — parte de la versión de mejor calidad disponible. |
| La cola parece lenta | Una única GPU procesa un trabajo a la vez. Los miembros Pro tienen prioridad sobre los trabajos gratuitos en los momentos de mayor demanda. |
Extra: obtén también la letra y el tono/tempo
Antes de pulsar separar, puedes activar "Generar letra". Ejecutamos Whisper sobre la pista vocal aislada y te devolvemos tres archivos: un SRT (para subtítulos de vídeo), un LRC (para reproductores de karaoke que desplazan la letra a tiempo) y una transcripción TXT en texto plano. Cada trabajo informa además del BPM y el tono musical detectados, muy útil si vas a remezclar, pinchar o construir un cover sobre el instrumental. Para una guía completa de cómo convertir una pista en un tema para cantar, lee cómo hacer una versión karaoke de cualquier canción.
Preguntas frecuentes
¿De verdad es gratis?
Sí — una canción al día con la calidad Studio completa, sin marca de agua y sin registro. Patreon Pro eleva el límite a 20 canciones diarias y añade cola prioritaria.
¿Tengo que descargar primero el audio de YouTube?
No. Pega el enlace y nuestro servidor descarga el audio por ti. También puedes subir un archivo si lo prefieres.
¿Cuál es la duración y el tamaño máximos?
15 minutos por fuente y 100 MB tras la descarga. La mayoría de las canciones encajan sin problema.
¿Qué enlaces funcionan además de YouTube?
También se admiten SoundCloud, TikTok, Bandcamp y Vimeo. Nuestra página dedicada de eliminador de voz para TikTok cubre ese flujo.
¿El instrumental quedará completamente limpio?
En la mayoría de las pistas de estudio, sí — limpio y completo. La reverberación intensa o las grabaciones en directo pueden dejar leves restos de voz. Consulta la sección de calidad de arriba para saber qué esperar.
¿Guardáis mis archivos?
No. Las entradas y salidas se eliminan tras 24 horas, y tu audio nunca se usa para entrenar modelos.
¿Es legal?
Para uso personal, en general sí. La redistribución o el uso comercial de la grabación de otra persona, no. Eres responsable de los derechos — consulta nuestras condiciones.
¿Listo para separar tu primera pista?
🎙️ Abrir AIVoiceSeparatorGratis, sin registro, sin marca de agua — 1 canción cada 24 horas