La IA que predice el rostro de una persona solo por escuchar su voz

El portal ‘Speech2Face’ nos muestra cómo es posible que la inteligencia artificial (IA) pueda recrear rostros humanos solo con escuchar el sonido de sus voces.

Speech2Face recrea rostros virtuales con el sonido de las voces humanas - Blog Hola Telcel

¿Cuántas veces hemos imaginado el rostro de una persona tan solo con escuchar su voz? Muchas veces. Y es una práctica muy común, por ejemplo, cuando escuchamos a los locutores de radio. Pero ¿qué pasa cuando dicha práctica roza los niveles de la tecnología? Pues desemboca en la creación de una IA (inteligencia artificial) capaz de predecir y reconocer el rostro de una persona solo con escuchar su voz.

Lee: Así puedes escuchar tu voz como si estuvieras en Marte

La IA que sabe cómo es el rostro de una persona solo por escuchar su voz 

Resulta que un grupo de investigadores del Instituto de Tecnología de Massachusetts (MIT, por sus siglas en inglés) inició un proyecto cuyo objetivo es crear un algoritmo capaz de emular los rasgos físicos de un ser humano únicamente cuando habla.

El resultado fue Speech2Face, una página web dotada de IA que sirve para recrear un rostro humano de la vida real con tan solo reproducir algunos segundos de un audio con su voz. Básicamente, este sistema se basa en una especie de red neuronal capaz de reconocer ciertos rasgos físicos de las personas. Dichos rasgos pueden ser el origen étnico, la edad y el género.

Asimismo, hacen énfasis en que la correlación de voces y rostros se basa en un sinfín de personas que aparecen en videos de YouTube.

Speech2Face, a IA detectar la edad, el género o la raza de una persona únicamente con su voz - Blog Hola Telcel

“Diseñamos y entrenamos una red neuronal profunda para realizar esta tarea utilizando millones de videos naturales de personas hablando desde Internet/Youtube. Durante el entrenamiento, nuestro modelo aprende correlaciones audiovisuales de voz y rostro que le permiten producir imágenes que capturan varios atributos físicos de los hablantes, como la edad, el género y el origen étnico”, explican los responsables

Los resultados son una gama de rostros virtuales muy similares a personas reales. Es decir, la IA no replica exactamente el rostro de una persona humana. Más bien lo que hace es crear una imagen virtual muy parecida que recupera los aspectos/rasgos físicos que estén correlacionados con el habla de una persona humana.

Si esta nota te ha parecido interesante, no dudes en compartirla en todas tus redes sociales, porque recuerda que puedes aprovechar que con tu Plan Telcel Max Sin Límite tienes redes sociales ilimitadas como WhatsApp, Facebook, Twitter, Instagram y Snapchat y la conectividad de #TelcelLaMejorRed con la mayor Cobertura y Velocidad.

Lee: Cómo saber cuántas veces han visto tus estados de WhatsApp

No dejes de leer HolaTelcel para conocer lo último en innovaciones tecnológicas.

Ahora ve: 

Continua leyendo:

Tecate Pa’l Norte 2026 anuncia una nueva edición llena de talento.- Blog Hola Telcel
Tecate Pa’l Norte 2026 regresa con una edición inolvidable en Monterrey
Bases de la Dinámica: “Participa para ganar un pase al Maratón Powerade Monterrey 2025”
Telcel y Motorola te invitan a ser parte del Gran Premio de Ciudad de México 2025.- Blog Hola Telcel
Telcel y Motorola te llevan al Gran Premio de la Ciudad de México 2025 Presentado por Heineken™