Logotipo horizontal de Diego C Martín colores invertidos, blanco y naranja para findo negro

Repliqué mi voz usando la IA de ElevenLabs y la precisión es desconcertante

Categorías:  Autor: Diego C Martin 
img-1

1. ElevenLabs ha lanzado una página de síntesis de voz rediseñada con voces sintéticas con sonido natural y capacidades de clonación de voz.
2. El motor de voz de OpenAI, retrasado por motivos de seguridad, puede desafiar la plataforma de ElevenLabs en el futuro.
3. ElevenLabs ofrece opciones de clonación de voz rápidas y sencillas, incluida la clonación de voz instantánea y la clonación profesional, con posibles riesgos y restricciones de privacidad.

ElevenLabs ha renovado su página de síntesis de voz para que a los usuarios les resulte más fácil crear voces de IA y utilizarlas para la conversión de texto a voz. La plataforma ofrece voces sintéticas y clones de voces con sonido natural, con un nuevo diseño que simplifica el proceso de creación al comenzar solo con un cuadro de texto y agregar controles a medida que los usuarios interactúan con la herramienta. La plataforma también ofrece opciones de clonación de voz instantánea y clonación profesional; esta última requiere verificación del equipo y hasta seis horas para recibir el clon final. Los usuarios pueden obtener una clonación notablemente precisa de su voz utilizando aproximadamente tres minutos de audio de muestra para una clonación instantánea, que está disponible en aproximadamente 20 minutos.

La clonación de voz se puede utilizar para diversos fines, incluida la creación de dramas de radio con un actor y la mejora de la calidad del audio. La tecnología tiene el potencial de resucitar a artistas que murieron hace mucho tiempo, lo que genera preocupaciones en organizaciones como SAG-AFTRA sobre sus implicaciones. Si bien el discurso generado por IA puede parecer muy realista, existen restricciones dentro del sistema de ElevenLabs, como la detección de clips generados por IA y la prevención de la creación de clones de funcionarios o candidatos electos.

OpenAI ha retrasado el lanzamiento de su motor de voz debido a preocupaciones de seguridad, optando por discutir primero el despliegue responsable de voces sintéticas y su impacto en la sociedad. Con los avances en la tecnología de conversión de texto a voz, existen preocupaciones sobre el riesgo de fraude de identidad y la necesidad de protección contra el uso indebido de la tecnología de clonación de voz. A pesar del progreso en los proyectos de conversión de texto a voz de código abierto, ElevenLabs continúa innovando en el campo con su interfaz fácil de usar y capacidades avanzadas de clonación de voz.

Enlace fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Artículos de la misma categoría

crossmenu
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram