Un equipo de la Universidade de Vigo desarrolla los algoritmos para entrenar a la IA
29 jul 2021 . Actualizado a las 05:00 h.Cualquier archivo multimedia, por inocente que parezca, puede contener datos de alto riesgo que comprometan nuestra seguridad. Para luchar contra esta técnica, popular entre organizaciones terroristas o de crimen organizado, la Unión Europea financia un proyecto coordinado por la Real Academia Militar de Bruselas para crear una inteligencia artificial (IA) capaz de detectar la información oculta en imágenes, vídeos, audios o archivos de texto que circulan en cualquier tipo de entorno digital.
En la investigación, financiada con casi siete millones de euros por los fondos Horizon 2020, participan 22 socios. Entre ellos, un experimentado equipo de la Escola de Enxeñaría de Telecomunicación de la Universidade de Vigo capitaneado por el catedrático Fernando Pérez. La base de la investigación es la esteganografía, la técnica de enviar mensajes ocultos en otros contenidos, sobre todo, fotografías. «Se incrusta dentro de las imágenes, no en los metadatos, sino modificando los píxeles de una manera que para el ojo es invisible. Solo puedes leer el mensaje si sabes cómo se ha insertado», explica Pérez.
La misión del equipo vigués, especializado en el análisis forense de contenidos multimedia, consiste en entrenar a la IA para reducir al mínimo el margen de error. En otras palabras, desarrollan la parte previa al estegoanálisis, enseñándole que ciertos procesos por los que pasa una imagen —cámara con la que fue realizada, utilización de filtros, haber sido comprimida o pasado por redes sociales, entre otros— son comunes y no significan motivo de alerta.
Sin embargo, «para que funcione bien tienes que darle una cantidad ingente de ejemplos», explica el catedrático, pero «no es fácil encontrar imágenes que lleven mensajes ocultos porque es un método minoritario y las fuerzas de seguridad no suelen compartir las que poseen». Frente a esta problemática, otra aportación clave de Fernando y sus compañeros a la investigación es su capacidad para generar estos archivos. «Tenemos un algoritmo capaz de hacer esteganografía. Le pasamos millones de imágenes y le ordenamos que esconda mensajes aleatorios. Luego, le damos a la inteligencia artificial tanto las fotos originales como las modificadas para que aprenda a interceptar los datos ocultos».
Al final, Pérez reconoce que «es un juego de gato y ratón, uno desarrolla un método de detección y el otro desarrolla un sistema que no sea rastreable», lo que dificulta un resultado cien por cien efectivo. Aún así, el uso de IA ofrece ventajas, como su «memoria brutal y la facultad de funcionar en un mundo donde las excepciones son la regla».
La información que manejan los equipos involucrados en el proyecto es estrictamente confidencial. El propio Fernando indica que hablar sobre su labor requiere «muchísima seguridad, no podemos decir ni qué algoritmos descubrimos ni cuáles usamos, pues cualquiera que quiera saltarse nuestras protecciones o detectores tendría información suficiente para poder hacerlo». Pese a ello, puede adelantar que «solo en este tiempo que llevamos —la investigación arrancó el pasado mes de mayo— hemos averiguado que los criminales utilizan técnicas que no nos imaginábamos».
De momento, tienen 36 meses de trabajo por delante para crear la estructura y las herramientas de una IA que siempre seguirá mejorando gracias a su capacidad de aprendizaje infinito, una característica lejos del alcance de cualquier humano.