top of page

Así es Voice Engine, la nueva IA de OpenAI que clona tu voz con solo escucharte una vez

Voice Engine permite clonar cualquier voz y utilizarla en varios idiomas con acento natural, aunque su uso está muy restringido.



Así es Voice Engine, la nueva IA de OpenAI ‐ X LEVEL MEDIA

OpenAI es una de las empresas más punteras de inteligencia artificial, y además de ChatGPT y su prometedora tecnología de Sora, también tiene Voice Engine, una IA que permite clonarte la voz con solo escucharte una vez y en apenas 15 segundos.


De momento es una preview, pero la tecnología es bastante prometedora. Voice Engine utiliza entrada de texto y una única muestra de audio de 15 segundos para generar habla con sonido natural que se parece mucho al hablante original.


La clave principal está en esa única muestra de 15 segundos que puede crear, según OpenAI, voces emotivas y realistas.


OpenAI desarrolló Voice Engine a finales de 2022 y se ha utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como ChatGPT Voice y Read Aloud, pero es ahora cuando salen a relucir los primeros y prometedores datos de lo que es capaz la tecnología de la compañía.


La tecnología tiene un gran campo de usos posibles, aunque la compañía la está probando a una escala bastante reducida, al menos de momento. OpenAI cita situaciones en las que Voice Engine puede suponer un enorme salto.


Por ejemplo, la compañía pone como ejemplo la traducción de contenido como vídeos y podcasts, para que los creadores y las empresas puedan llegar a más personas en todo el mundo, con fluidez y con sus propias voces.


Los errores de ChatGPT son moneda corriente.

Según OpenAI, cuando se utiliza para traducir, Voice Engine conserva el acento nativo del hablante original: por ejemplo, generar inglés con una muestra de audio de un hablante francés produciría habla con acento francés.


El acceso a Voice Engie está muy restringido

Lógicamente, aunque como muestran sus ejemplos, Voice Engine funciona bastante bien, hay una razón por la que la compañía lo está probando, de momento, en una escala muy reducida. OpenAI reconoce que, generar voces se asemeje a las voces de las personas reales, conlleva serios riesgos. Sobre todo en un año electoral como en el que están inmersos en EE.UU.



A día de hoy, el reducido grupo que está probando (y usando comercialmente) Voice Engine han aceptado una serie de medidas para evitar los problemas derivados de esta tecnología. OpenAI prohíbe explícitamente la suplantación de otro individuo u organización sin consentimiento o derecho legal.


Además, su uso requiere el consentimiento explícito e informado del hablante original y no permiten a los desarrolladores que creen herramientas para que los usuarios individuales creen sus propias voces, así que olvídate de probarlo. Al menos a día de hoy.

Comments


bottom of page