Las herramientas de Inteligencia Artificial (IA) son uno de los últimos avances en la tecnología. Cada vez más compañías desarrollan este tipo de modelos para crear nuevas funciones para sus productos. En esta ocasión, Microsoft anunció que su nuevo modelo IA puede imitar cualquier voz con gran realismo.

VALL-E de Microsoft puede imitar cualquier voz

La popularidad de los modelos IA aumento en los últimos meses. Incluso, algunas redes sociales comenzaron a usar esta tecnología, de hecho, TikTok ofrece un generador IA de texto a imagen, así como múltiples filtros IA que generan retratos.

Las grandes compañías de tecnología también tienen múltiples proyectos de IA. Microsoft se encuentra trabajando en una herramienta IA de texto a voz llamada VALL-E que tiene la capacidad de imitar la voz humana. La imitación destaca por su realismo, pues no solo imita el timbre de la voz, sino que también imita el tono emocional y la acústica.

VALL-E IA de Microsoft

Los expertos entrenaron a la herramienta con más de 60.000 horas de audios en ingles pertenecientes a más de 7.000 personas. Estas muestras se encontraban en la biblioteca LibriLight de Meta. VALL-E necesita de un audio de 3 segundos para poder imitar la voz, si bien los resultados son mixtos, algunos de ellos resultan sorprendentes.

La compañía aún necesita mejorar algunos aspectos de la herramienta relacionados con la prosodia, el estilo de habla y la similitud de altavoces. Sin embargo, la capacidad que tiene esta IA de Microsoft de imitar la voz humana con absoluto realismo tiene a todos los investigadores entusiasmados con el proyecto.

Microsoft ya reveló que VALL-E no será una función de código abierto, pues ello conllevaría muchos riesgos, incluidas las falsas declaraciones. Se cree que la función se usará en aplicaciones de texto a voz personalizadas o de gama alta. Por ahora solo nos queda esperar y ver como evoluciona este proyecto.

Vía Engadget.