Microsoft crea inteligencia artificial que puede generar videos de personas a partir de una única foto

Microsoft ha logrado un avance revolucionario en el campo de la inteligencia artificial al desarrollar una tecnología capaz de generar videos realistas de personas basándose en una única fotografía. Esta innovadora creación demuestra el potencial ilimitado de la IA en la generación de contenido visual, superando las barreras tradicionales de la producción audiovisual. La capacidad de esta inteligencia artificial para crear imágenes en movimiento a partir de una sola imagen estática abre un sinfín de posibilidades en diversos sectores, desde el entretenimiento hasta la seguridad. Sin duda, este hito marca un antes y un después en el mundo de la tecnología y la creatividad visual.

Index

Microsoft presenta VASA: IA que convierte fotos en videos realistas

Microsoft Research Asia, una división de la compañía fundada por Bill Gates, ha presentado VASA-1, un modelo de inteligencia artificial que puede crear un video animado sincronizado de una persona hablando o cantando a partir de una sola foto y una pista de audio existente.

VASA de Microsoft: Crea avatares virtuales a partir de una sola imagen

VASA de Microsoft: Crea avatares virtuales a partir de una sola imagen

El marco VASA (abreviatura de Visual Affective Skills Animator) utiliza el aprendizaje automático para analizar una imagen estática junto con un clip de audio de voz. Luego puede generar un vídeo realista con expresiones faciales precisas, movimientos de cabeza y sincronización de labios con el audio.

Nueva tecnología de Microsoft permite animar fotos estáticas con audio

Microsoft afirma que el modelo supera significativamente a los métodos anteriores de animación de voz en términos de realismo, expresividad y eficiencia. Es una mejora con respecto a los modelos de animación de una sola imagen anteriores.

Vídeo que muestra cómo funciona VASA-1, la inteligencia artificial que a partir de una foto crea un vídeo

Los investigadores de Microsoft entrenaron VASA-1 en el conjunto de datos VoxCeleb2 creado en 2018 por tres investigadores de la Universidad de Oxford. Ese conjunto de datos contiene más de un millón de declaraciones de 6.112 celebridades, según el sitio web VoxCeleb2, extraído de vídeos subidos a YouTube.

Un catedrático español cree que la IA sustituirá a los profesionales médicos: Duerme bien y no se coge bajas, es el esclavo perfecto

Los esfuerzos de investigación de IA para animar una sola foto de una persona o personaje se remontan al menos a algunos años, pero más recientemente, los investigadores han estado trabajando para sincronizar automáticamente un vídeo generado con una pista de audio.

Para mostrar el modelo, Microsoft creó una página de investigación VASA-1 que presenta muchos vídeos de muestra de la herramienta en acción, incluidas personas cantando y hablando en sincronización con pistas de audio pregrabadas.

Si bien los investigadores de Microsoft promocionan posibles aplicaciones positivas, como mejorar la equidad educativa, mejorar la accesibilidad y brindar compañía terapéutica, la tecnología también podría usarse indebidamente.

Lucía García

Hola, soy Lucía, un apasionado escritor y experto en actualidad nacional e internacional en el periódico independiente El Noticiero. Mi dedicación por la objetividad y la rigurosidad en mis artículos me permite ofrecer a nuestros lectores las últimas novedades de manera imparcial y detallada. Mi compromiso es informar con veracidad y transparencia, para que nuestros lectores estén siempre bien informados. ¡Descubre conmigo las historias más relevantes del momento en El Noticiero!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir