A principios de este año, las redes sociales fueron atrapadas brevemente por Deep Nostalgia de MyHeritage para dar vida a fotos antiguas. La compañía cuya tecnología de inteligencia artificial impulsa a Deep Nostalgia, D-ID, está llevando esa tecnología un paso más allá. Ahora está convirtiendo las fotos fijas tipo retrato, en videos «deepfake» que se mueven y dicen lo que el usuario quiere.

Por impresionantemente realistas que fueran los resultados de Deep Nostalgia de MyHeritage, la función tenía sus limitaciones. Después de subida una foto fija de una persona, era analizada la orientación de la cabeza en la toma para determinar en qué dirección miraban sus ojos. Luego era seleccionado un video coincidente de una pequeña colección de ‘videos de conductores’. Esto para usarlo como una referencia para crear los movimientos generados por la IA. Los usuarios no tenían control sobre los movimientos en el video generado y el sujeto no hizo ningún intento de hablar.
Ahora D-ID reveló una versión más avanzada de Deep Nostalgia llamada Speaking Portraits que puede hacer que las fotos fijas parezcan moverse y hablar. Todo a partir de un video original, solo un clip de audio o incluso un archivo de texto con un guión preescrito.
Estarán disponibles dos sabores de Speaking Portrait
Single Portrait puede convertir una fotografía fija en una cabeza parlante, pero los movimientos se limitarán solo a la cabeza; cualquier otra cosa en una foto sin recortar, incluido el cuerpo de una persona y lo que sea que haya en el fondo, permanecerá estático, arruinando potencialmente la credibilidad del efecto.
La otra versión más avanzada de Speaking Portrait es Trained Character y, en lugar de una foto fija, requiere un video de 10 minutos de la persona animada con ellos realizando un conjunto específico de movimientos y diciendo ciertas cosas, según lo definido por un conjunto de directrices que ha creado D-ID.
Los resultados, como se ve en esta muestra anterior de un presentador de noticias que presenta una historia, son mucho más realistas y creíbles que lo que produce el Retrato único, que todavía tiene los signos reveladores de una falsificación profunda o «deepfake», incluidos bordes borrosos y deformaciones inusuales cuando la cara se mueve. Trained Character también tiene la flexibilidad adicional de intercambiar lo que está en el fondo y el potencial de animar el cuerpo de la persona, incluidos los brazos y las manos.
Origen: Gizmodo
[+] Videos de nuestro canal de YouTube