Esta tecnología provocó una revolución en la manipulación visual que puede traer beneficios, pero altos costos en seguridad
Ciudad de México (N22/ Redacción). – En 2018 las Deepfakes cambiaron el modo de entender la Inteligencia Artificial con una serie de montajes donde unió el discurso de algún personaje con el rostro de otro, como fue un discurso de Jennifer Lawrence con el rostro de Steve Buscemi.
El video fue subido por @Villain_Guy en Reddit y tras una serie de montajes hechos por otros usuarios, la red social lo prohibió. Sin embargo, esta técnica llegó para quedarse. Deepfakes consiste en sintetizar la imagen humana superponiendo imágenes creadas por ordenador. Se utiliza tecnología de inteligencia artificial y aplicada a vídeos ya existentes. El resultado final es un video completamente falso, pero en muchos casos, convincente como para pensar que es real.
De acuerdo con Fast Company, algunas compañías se encuentran trabajando en modelos para generar Deepfakes, «sacar provecho de tecnología similar, aprovechando el aprendizaje automático para hacer cosas sin precedentes en los medios de comunicación, desde voces falsas hasta avatares falsos y fotografías muy detalladas» y comercializarlos.
Topaz Labs es una de ellas, y se dedica a construir herramientas de edición de imágenes independientes. Tras una serie de investigaciones, ahora puede extraer imágenes nítidas de un video o agregar un brillo a una imagen en movimiento. «Topaz está tratando de controlar el uso de su software al promocionar su tecnología a los fotógrafos y aconsejar a otras personas, como las autoridades, sobre sus limitaciones.»
Modulate apuesta por las voces, permite convertir una voz en la de cualquier otra persona. En su sitio, presenta una demostración convincente, aunque un poco confusa, de Barack Obama quien presenta el software.
El software de Modulate funciona entrenando un modelo varias muestras de una misma voz. El objetivo de la compañía no es alterar voces de figuras públicas, solo que en ellas encuentran la materia prima ya que han grabado horas y horas de audio, lo que hace que los objetivos sean más fáciles de personificar. Su ida es ofrecer su tecnología a redes sociales y compañías de juegos, permitiéndole tener un avatar de audio genial en estas plataformas, pero en ningún otro lugar fuera de ellas, para evitar mal uso de las voces incorporó una huella digital de audio en el interior de todas sus grabaciones.
Meo hace lo propio, pero con los cuerpos. Lo que hace es tomar un video en 2D de la cara de alguien y convertirlo en un avatar en 3D. Puede funcionar en un juego, una red social o una aplicación de belleza. «Al capturar cientos de miles, incluso millones de fotos tuyas, Meo puede hacer que parezca que eres tú quien está asaltando el castillo de tu amigo, o puede ayudarte a ver cómo se vería el nuevo delineador en tu rostro».
Los creadores también advierten que pueden existir prácticas abusivas con este modelo, pero expertos sugieren que los investigadores mantengan sus hallazgos patentados y limitando las vías de explotación.