¿Es gratis quitar la voz de un vídeo de YouTube?

Sí. Los usuarios gratuitos pueden procesar una canción al día con la calidad Studio completa. Patreon Pro eleva el límite a 2 canciones diarias con cola prioritaria.

¿Cuál es la duración máxima del vídeo de YouTube?

15 minutos por fuente, con un límite de 100 MB en el audio descargado. La mayoría de las canciones completas están muy por debajo de ambos límites.

¿Por qué falló mi enlace de YouTube?

Los vídeos privados, con restricción de edad, exclusivos para miembros o bloqueados por región pueden fallar al descargarse. Usa un enlace público, o descarga el audio tú mismo y sube el archivo.

¿Es legal quitar la voz de un vídeo de YouTube?

Tú eres responsable de tener los derechos. El uso personal, como practicar o cantar karaoke en casa, suele estar bien; redistribuir o usar comercialmente la pista de otra persona, no.

Cómo Quitar la Voz de un Vídeo de YouTube (Gratis, 2026)

No necesitas una carrera en ingeniería de audio ni un plugin de pago. Con la IA moderna puedes pegar un enlace de YouTube y obtener una pista vocal limpia y separada, además del instrumental, en unos pocos minutos, y gratis. Aquí tienes exactamente cómo hacerlo, junto con los límites y las particularidades que nadie te cuenta.

Antes, quitar la voz de una canción significaba pelearse con trucos de cancelación de fase en Audacity que dejaban un resultado hueco y con un eco extraño. En 2026, los modelos de aprendizaje profundo lo hacen correctamente: entienden de verdad qué es una voz y la extraen de la mezcla, dejando intactos la batería, el bajo, las guitarras y los sintetizadores. El resultado son dos archivos utilizables — una pista solo de voz y un instrumental — en lugar de un único compromiso degradado.

Esta guía recorre el método gratuito más rápido: pegar una URL de YouTube directamente en nuestro eliminador de voz para YouTube. Sin conversores MP3 de terceros, sin instalaciones, sin registro.

¿Quieres seguir el proceso con una canción real?

🔗 Abrir el eliminador de voz para YouTube

Gratis 3 canciones/mes · sin registro · Patreon Pro = 2 canciones/día

El método en 4 pasos (pega un enlace, descarga las pistas)

Copia la URL de YouTube. Abre el vídeo en tu navegador o en la app de YouTube y copia el enlace de la barra de direcciones, o toca Compartir → Copiar enlace. Funcionan los enlaces estándar youtube.com/watch?v=…, los enlaces cortos youtu.be/…, YouTube Music y los Shorts.
Abre AIVoiceSeparator y cambia a la pestaña Pega un enlace de YouTube / SoundCloud / TikTok. No tienes que descargar un MP3 primero: el servidor obtiene el audio por ti con yt-dlp.
Pega el enlace y haz clic en "Separar audio". Tu trabajo entra en la cola y la GPU ejecuta un ensamble de IA de tres modelos sobre toda la pista. Verás una barra de progreso en vivo; puedes dejar la pestaña abierta o volver más tarde.
Escucha y descarga. Cuando termine (unos seis minutos para una canción típica), reproduce ambas pistas en el navegador y descarga la vocals.wav aislada y el instrumental.wav. También puedes elegir MP3 320 kbps o FLAC sin pérdida.

Ese es todo el flujo. Si prefieres subir un archivo que ya tienes, la misma página acepta arrastrar y soltar audio — la opción del enlace solo te ahorra un paso. Un par de pequeños hábitos mejoran el resultado: elige la versión de la canción con mejor calidad cuando existan varias, y prefiere el lanzamiento oficial antes que un clip en directo grabado con el teléfono. Cuanto más limpia y fuerte sea la fuente, más material tendrá la IA con el que trabajar, y más convincente será la separación.

Tampoco tienes que estar pendiente del trabajo. Una vez en la cola, el procesamiento ocurre en el servidor, así que puedes cerrar la pestaña, cambiar de canción o volver en diez minutos: el resultado te espera (hasta la ventana de borrado automático de 24 horas). Si procesas varias pistas en una sesión, recuerda que el plan gratuito se reinicia con una canción al día.

Qué funciona — y los límites que conviene conocer

⏱️ Límite de 15 minutos

Los vídeos de origen deben durar 15 minutos o menos. Eso cubre prácticamente cualquier canción, incluidas las versiones extendidas; descarta sesiones de DJ completas y pódcasts.

📦 Límite de 100 MB

Una vez descargado, el audio debe pesar menos de 100 MB. Las fuentes de alto bitrate pueden alcanzar este límite en pistas largas — recórtalas o elige un vídeo más corto si es necesario.

🌐 Solo vídeos públicos

Los vídeos privados, exclusivos para miembros, con restricción de edad y bloqueados por región a menudo se niegan a descargarse. Los enlaces públicos son el camino fiable.

🆓 1 canción gratis/día

Los usuarios anónimos obtienen una separación de calidad completa cada 24 horas. Patreon Pro la eleva a 2 al día con prioridad en la cola.

🔒 Borrado en 24 h

Tanto el audio descargado como tus pistas separadas se eliminan automáticamente al cabo de un día. Tu audio nunca se usa para entrenar modelos de IA.

🎚️ Salida sin pérdida

Elige WAV o FLAC si vas a seguir editando las pistas en un DAW — conservan toda la fidelidad. MP3 320 está bien para escucha casual.

Expectativas de calidad: cómo suena una buena separación

La separación con IA en 2026 es realmente impresionante, pero no es magia. Aquí tienes una imagen honesta de lo que obtendrás.

En una grabación de estudio bien mezclada — voz principal clara, producción moderna — el instrumental sonará limpio y completo, y la pista vocal será nítida con apenas leves artefactos. Este es el mejor de los casos, y es el de la mayoría de las canciones. Nuestro proceso ejecuta un ensamble ponderado de tres modelos (BS-Roformer, Mel-Band Roformer y MDX23C InstVoc) medido en un SDR de 12,97 dB, claramente más limpio que las herramientas antiguas de un solo modelo. Si quieres entender por qué un ensamble supera a cualquier modelo individual, consulta nuestra explicación sobre BS-Roformer vs Demucs.

Dónde se vuelve más difícil:

Mucha reverberación o delay en la voz. La "cola" de una voz con reverb se mezcla con el instrumental, así que puede quedar un poco de eco vocal en la pista de fondo.
Coros y armonías densos. Las armonías apiladas ocupan el mismo rango de frecuencias que la voz principal y pueden seguir parcialmente a la pista vocal — normalmente algo bueno para el karaoke, ocasionalmente no.
Fuentes de baja fidelidad o muy comprimidas. Un rip de YouTube turbio con bajo bitrate le da menos material a la IA. Elige la versión de mejor calidad de una canción cuando puedas escoger.
Grabaciones en directo. El ruido del público y la reverberación de la sala no son "instrumentos", así que se reparten de forma impredecible entre ambas pistas.

Si tu objetivo es específicamente una pista de fondo sin voz, el extractor de instrumentales está optimizado para exactamente eso, y el creador de karaoke añade encima la letra sincronizada.

Una nota rápida sobre el aspecto legal

Separar una pista para tu propio uso privado — cantar, practicar un instrumento, estudiar un arreglo o transcribir la letra — suele considerarse un uso personal razonable en la mayoría de los lugares. Algo distinto es publicar, distribuir o comercializar pistas de una canción cuyos derechos no posees. Subir una acapela extraída a un servicio de streaming, vender un remix o monetizar un cover puede infringir derechos de autor.

En resumen: eres responsable de tener los derechos de lo que proceses. No alojamos ni compartimos tus resultados, y todo se elimina tras 24 horas, pero eso no te concede una licencia sobre la grabación original. En caso de duda, mantenlo en el ámbito personal, o trabaja con material que hayas creado o licenciado. Consulta nuestras condiciones de uso y la política DMCA para más detalles.

Solución de problemas comunes

Problema	Causa probable y solución
Error "Failed to download"	El vídeo es privado, tiene restricción de edad o está bloqueado por región. Prueba con una versión pública de la misma canción, o descarga el audio tú mismo y sube el archivo.
Trabajo rechazado por duración	La fuente supera los 15 minutos. Usa una versión más corta de la pista o un fragmento.
"File too large"	El audio descargado supera los 100 MB. Elige un vídeo de origen más corto o de menor bitrate.
Has alcanzado tu límite diario	El plan gratuito es una canción cada 24 horas. Espera al reinicio o únete a Patreon Pro para 2/día.
Un "fantasma" vocal queda en el instrumental	Normalmente son colas de reverb. No hay un interruptor para eliminarlo a la perfección, pero una fuente más limpia y con menos reverberación ayuda mucho.
El resultado suena fino o turbio	La fuente tenía bajo bitrate. Si entra basura, sale basura — parte de la versión de mejor calidad disponible.
La cola parece lenta	Una única GPU procesa un trabajo a la vez. Los miembros Pro tienen prioridad sobre los trabajos gratuitos en los momentos de mayor demanda.

Extra: obtén también la letra y el tono/tempo

Antes de pulsar separar, puedes activar "Generar letra". Ejecutamos Whisper sobre la pista vocal aislada y te devolvemos tres archivos: un SRT (para subtítulos de vídeo), un LRC (para reproductores de karaoke que desplazan la letra a tiempo) y una transcripción TXT en texto plano. Cada trabajo informa además del BPM y el tono musical detectados, muy útil si vas a remezclar, pinchar o construir un cover sobre el instrumental. Para una guía completa de cómo convertir una pista en un tema para cantar, lee cómo hacer una versión karaoke de cualquier canción.

Preguntas frecuentes

¿De verdad es gratis?

Sí — una canción al día con la calidad Studio completa, sin marca de agua y sin registro. Patreon Pro eleva el límite a 2 canciones diarias y añade cola prioritaria.

¿Tengo que descargar primero el audio de YouTube?

No. Pega el enlace y nuestro servidor descarga el audio por ti. También puedes subir un archivo si lo prefieres.

¿Cuál es la duración y el tamaño máximos?

15 minutos por fuente y 100 MB tras la descarga. La mayoría de las canciones encajan sin problema.

¿Qué enlaces funcionan además de YouTube?

También se admiten SoundCloud, TikTok, Bandcamp y Vimeo. Nuestra página dedicada de eliminador de voz para TikTok cubre ese flujo.

¿El instrumental quedará completamente limpio?

En la mayoría de las pistas de estudio, sí — limpio y completo. La reverberación intensa o las grabaciones en directo pueden dejar leves restos de voz. Consulta la sección de calidad de arriba para saber qué esperar.

¿Guardáis mis archivos?

No. Las entradas y salidas se eliminan tras 24 horas, y tu audio nunca se usa para entrenar modelos.

¿Es legal?

Para uso personal, en general sí. La redistribución o el uso comercial de la grabación de otra persona, no. Eres responsable de los derechos — consulta nuestras condiciones.

¿Listo para separar tu primera pista?

🎙️ Abrir AIVoiceSeparator

Gratis, sin registro, sin marca de agua — 1 canción cada 24 horas