Microsoft ha logrado un avance revolucionario en el campo de la inteligencia artificial al desarrollar una tecnología capaz de generar videos realistas de personas basándose en una única fotografía. Esta innovadora creación demuestra el potencial ilimitado de la IA en la generación de contenido visual, superando las barreras tradicionales de la producción audiovisual. La capacidad de esta inteligencia artificial para crear imágenes en movimiento a partir de una sola imagen estática abre un sinfín de posibilidades en diversos sectores, desde el entretenimiento hasta la seguridad. Sin duda, este hito marca un antes y un después en el mundo de la tecnología y la creatividad visual.
- Microsoft presenta VASA: IA que convierte fotos en videos realistas
- VASA de Microsoft: Crea avatares virtuales a partir de una sola imagen
- Nueva tecnología de Microsoft permite animar fotos estáticas con audio
- Vídeo que muestra cómo funciona VASA-1, la inteligencia artificial que a partir de una foto crea un vídeo
- Un catedrático español cree que la IA sustituirá a los profesionales médicos: Duerme bien y no se coge bajas, es el esclavo perfecto
Microsoft presenta VASA: IA que convierte fotos en videos realistas
Microsoft Research Asia, una división de la compañía fundada por Bill Gates, ha presentado VASA-1, un modelo de inteligencia artificial que puede crear un video animado sincronizado de una persona hablando o cantando a partir de una sola foto y una pista de audio existente.
VASA de Microsoft: Crea avatares virtuales a partir de una sola imagen
El marco VASA (abreviatura de Visual Affective Skills Animator) utiliza el aprendizaje automático para analizar una imagen estática junto con un clip de audio de voz. Luego puede generar un vídeo realista con expresiones faciales precisas, movimientos de cabeza y sincronización de labios con el audio.
Nueva tecnología de Microsoft permite animar fotos estáticas con audio
Microsoft afirma que el modelo supera significativamente a los métodos anteriores de animación de voz en términos de realismo, expresividad y eficiencia. Es una mejora con respecto a los modelos de animación de una sola imagen anteriores.
Vídeo que muestra cómo funciona VASA-1, la inteligencia artificial que a partir de una foto crea un vídeo
Los investigadores de Microsoft entrenaron VASA-1 en el conjunto de datos VoxCeleb2 creado en 2018 por tres investigadores de la Universidad de Oxford. Ese conjunto de datos contiene más de un millón de declaraciones de 6.112 celebridades, según el sitio web VoxCeleb2, extraído de vídeos subidos a YouTube.
Un catedrático español cree que la IA sustituirá a los profesionales médicos: Duerme bien y no se coge bajas, es el esclavo perfecto
Los esfuerzos de investigación de IA para animar una sola foto de una persona o personaje se remontan al menos a algunos años, pero más recientemente, los investigadores han estado trabajando para sincronizar automáticamente un vídeo generado con una pista de audio.
Para mostrar el modelo, Microsoft creó una página de investigación VASA-1 que presenta muchos vídeos de muestra de la herramienta en acción, incluidas personas cantando y hablando en sincronización con pistas de audio pregrabadas.
Si bien los investigadores de Microsoft promocionan posibles aplicaciones positivas, como mejorar la equidad educativa, mejorar la accesibilidad y brindar compañía terapéutica, la tecnología también podría usarse indebidamente.
Deja una respuesta