Los ordenadores han creado su primera vacuna contra la gripe. Ocurrió hace unos días, gracias a técnicas de IA y al procesamiento masivo de información. El oro que viene está democratizado y al alcance de la mano, pero para ponerlo en valor es preciso contar con una nueva generación de profesionales altamente cualificados
21 feb 2020 . Actualizado a las 13:11 h.Cuando hablamos de materias primas, somos conscientes de su importancia en la economía y progreso de un país, pero cuando pensamos en ellas, pensamos en los países productores de metales, combustibles, cereales… Los datos son la materia prima de la nueva era de la información. La irrupción del Internet de las cosas, la mejora y abaratamiento de la sensórica, las comunicaciones o el uso de dispositivos conectados nos permiten tener acceso a grandes cantidades de datos. En este entorno, cada vez más digitalizado, cada día se generan miles de millones de datos en forma de textos, imágenes o números. Pero esta materia prima carece de valor si no somos capaces de explotarla. Su análisis nos permite descubrir patrones ocultos en ella y así derivar información y conocimiento útiles.

La Ciencia e Ingeniería de Datos está detrás de grandes proyectos de investigación actuales. Ya existen ejemplos fascinantes de uso de estas técnicas que han producido resultados en muchos campos de conocimiento, algunos de cuyos exponentes pueden ser los Proyectos Europeos Genoma Humano y Cerebro Humano o el Proyecto Gaia de la Agencia Espacial Europea. Hace unos días nos desayunábamos con que, usando técnicas de inteligencia artificial, se había desarrollado la primera vacuna generada por computador para la gripe gracias al análisis de un volumen importante de datos que permitió entender mejor el cambio estacional de las cepas, un trabajo que, de otro modo, sería inabordable para los científicos y que ha permitido obtener una vacuna efectiva. Esta tecnología nos permitirá también en el futuro hacer frente a grandes retos de la Humanidad. La medicina personalizada, la lucha contra el cambio climático, la personalización de la educación, la mejora de la seguridad del transporte, una gestión más sostenible de nuestras ciudades y recursos o la lucha contra el crimen son solo algunos ejemplos.
Empleo potencial
No solo los grandes desafíos científicos necesitan de esta disciplina en un mundo en el que la generación de datos es cada vez mayor. Diversos informes internacionales sitúan el perfil de Científico e Ingeniero de datos como el mejor trabajo en cuanto al entorno, nivel de estrés, potencial de progresión y salario de quienes lo desarrollan. También LinkedIn lo ha situado en el 2019 como el trabajo más prometedor. La consultora Gartner realizó un estudio en el que advierte que la demanda de estos servicios se incrementa de forma tal que se prevén sean necesarios alrededor de cinco millones de puestos de trabajo en el mundo. Un resultado equiparable para España arroja el informe elaborado por la EAE Business School. Los perfiles necesarios en las pequeñas y medianas empresas, la mayoría con las que contamos en España, necesitan profesionales que puedan recoger y almacenar datos, garantizar su seguridad y tratarlos adecuadamente para inferir la información y el conocimiento necesarios que permitan a las empresas generar nuevos productos o mejores estrategias que las hagan más competitivas. Y no solo para las empresas. Las Administraciones Públicas generan también inmensas cantidades de datos, que pueden servir para agilizar los servicios públicos y mejorar la calidad de vida de los ciudadanos. Y esto es así para cualquier sector productivo o servicio social de un país en el que podamos pensar.
Este amplio ciclo de vida de los datos engloba dos grandes áreas de conocimiento en gran parte relacionadas con la Informática y las Matemáticas. Por un lado, la Ciencia de Datos, ya que trabajar con los datos implica limpiarlos, transformarlos, analizarlos y visualizarlos mediante la programación de algoritmos y el uso de técnicas estadísticas, aprendizaje automático e inteligencia artificial. Por otra parte, la Ingeniería de Datos, ya que para manipularlos es necesario guardarlos en bases de datos adecuadas, ser capaces de manejar arquitecturas de computación masiva para obtener procesos computacionalmente muy eficientes y, finalmente, construir sistemas que se pongan en producción. Además de estas habilidades técnicas, los científicos e ingenieros de datos deberán trabajar siempre con profesionales de otras disciplinas, en diferentes entornos de trabajo, por lo que deberán contar con otras habilidades como curiosidad intelectual, una buena capacidad de comunicación y comprensión del negocio, y también de trabajo en equipo. Por último, no debemos perder de vista la ética, fundamental cuando se trabaja con datos personales o sensibles.
Pero la Ciencia e Ingeniería de Datos no solo es una buena opción profesional a nivel individual. Los datos son un activo estratégico y, a priori, también una materia prima democratizada. Todos los países tendrán acceso a ella pero el éxito dependerá de su capacidad para explotarla, es decir, de la capacidad de sus recursos tecnológicos y humanos. La formación es, por tanto, una pieza clave y el Sistema Universitario Español, consciente de la importancia de la adaptación a este nuevo escenario, ha reaccionado rápido ofertando nuevos títulos de Ciencia e Ingeniería de Datos en algunas de sus universidades que toman ventaja de los conocimientos adquiridos por su personal docente e investigador en lo que, hasta hace bien poco, fueron disciplinas relegadas al ámbito de la I+D.