Skip Navigation LinksIFCA > IFCA | Instituto de Física de Cantabria > News > SIESTA analizará datos sensibles en entornos de computación seguros

SIESTA analizará datos sensibles en entornos de computación seguros

​​

El IFCA (CSIC-UC) coordinará este proyecto de investigación europeo en el que trabajarán 17 instituciones hasta 2026



En Santander, a 29 de enero de 2024


La nube europea de ciencia abierta (EOSC) ya es una realidad, desde su presentación en 2018 por parte de la Comisión Europea, como una herramienta que ofrece un entorno de computación y datos sin fronteras dentro del continente europeo, disponible para todo el mundo, sin barreras de acceso y gratuita. Sin embargo, en esos entornos, billones de datos son utilizados, reutilizados, procesados o almacenados cada segundo, y todas esas transacciones deben cumplir con una serie de principios, lo que se conoce en la materia como principios FAIR, que sean datos fiables, accesibles, interoperables y reproducibles. 


De esa premisa nace SIESTA (Secure Interactive Environments for Sensitive Data Analytics), un proyecto de investigación financiado por el programa Horizonte Europa (Comisión Europea) y coordinado por el Instituto de Física de Cantabria (IFCA), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad de Cantabria (UC), junto a un consorcio formado por 17 instituciones: el CSIC, la Universidad de Cantabria (UC), el Instituto de Física Interdisciplinar y Sistemas Complejos (IFISC), el Instituto Nacional de Estadística (INE), la Academia Eslovaca de Ciencias (Eslovaquia), la Universidad de León, Javier de la Cueva y Asociados, el Institut national de la santé et de la recherche médicale (INSERM), el Centre National de la Recherche Scientifique (CNRS), la Universidad de Radbou (Países Bajos), la Fundación ISI, Interway, Thinlinc, AlgoWatt, el Donders Institute, el Centro de Ciencias Humanas y Sociales (CCHS, CSIC), y el Instituto de Economía, Geografía y Demografía (IEGD, CSIC). 


“SIESTA es un proyecto de investigación que trata de desarrollar una plataforma de computación que sea fiable para poder analizar datos sensibles que no se pueden compartir públicamente, incluso con gente en la que confíes, sin tomar unas ciertas medidas de seguridad, como por ejemplo datos médicos, estadísticos o datos de empresas”, explica el investigador del IFCA y coordinador del proyecto, Álvaro López.  


La Escuela de Ingenierías de la Universidad de León (uno de los socios del proyecto) ha sido escenario, durante los días 25 y 26 de enero, de la presentación del proyecto europeo, donde se han reunido 45 personas, en un formato híbrido, entre lo presencial y lo online, en representación de los socios participantes de la iniciativa. Muchas de los socios se han visto por primera vez y, a partir de este momento, trabajarán en equipo en SIESTA hasta el horizonte del proyecto, en 2026. 



Foto de familia al cierre del congreso. / IFCA Comunicación


Claves de SIESTA: acceso seguro a datos sensibles y en abierto


La materia prima del proyecto son los datos, y la idea es que la comunidad científica pueda compartir, almacenar y reutilizar datos de investigación, de forma abierta y en un entorno computacional seguro, sin fisuras. Y aquí es donde entran en juego los principios FAIR. En el campo de la ciencia y la investigación por ejemplo, estas reglas indican que existe un marco fiable, donde el acceso y la reutilización de esos datos científicos es adecuada y cumple con los estándares exigibles. Además, la aplicación de estos principios FAIR es una de las razones de ser de la Nube Europea de la Ciencia Abierta. 


Campos tan diversos como la teledetección, el cambio climático, ingeniería, logística, la imagen médica o la biodiversidad, que implican trabajar con grandes cantidades de datos, ya hacen uso de la nube y aplican estos parámetros FAIR. Sin embargo, existe aún un reto: poder acceder a datos sensibles o confidenciales preservando al mismo tiempo la privacidad y la facilidad de uso para el personal investigador. Actualmente existen alternativas para abordar este desafío, como las salas o cápsulas seguras, o los refugios de datos, pero plantean inconvenientes para el desarrollo de la investigación reproducible (investigación que pueda ser reutilizada por la comunidad científica), y no suelen ser soluciones muy intuitivas. 


Durante el congreso hubo tiempo para debatir sobre los datos privados, como por ejemplo, en los casos de estudios demográficos, y las problemáticas que plantean a la hora de trabajar con datos personales. Se habló sobre la importancia de tratar estos datos de forma independiente, por ejemplo, en el caso de los datos médicos, que son manejados de forma distinta en cada país europeo. 


“Con SIESTA lo que podemos conseguir es que investigadores que no tengan acceso a datos pero que sean relevantes para su investigación, puedan acceder a ellos”, explica el investigador del IFCA. “Por ejemplo, que un investigador en inteligencia artificial pueda acceder a datos de resonancias magnéticas para entrenar un algoritmo mejor, o que agencias estadísticas como el INE, puedan analizar datos en común que, por motivos de legislación o administrativos, no se puedan analizar en conjunto y tener así estadísticas mejores y más completas”, recalca López


El proyecto se nutrirá de 5 millones de euros, puestos a disposición, tanto de la Unión Europea como de la asociación EOSC, y el equipo investigador parte de un programa de acciones dividido en 20 paquetes de trabajo (datos sensibles FAIR, privacidad en datos y herramientas de anonimización, integración de la EOSC, imagen médica, epidemiología, energía, demografía, o los casos de uso), siguiendo la misión que marca la Agenda Estratégica de Investigación e Innovación: que las prácticas de ciencia abierta se conviertan en la nueva normalidad, ofreciendo herramientas y servicios que permitan a la comunidad investigadora encontrar, acceder, reutilizar y combinar resultados científicos, haciendo uso de infraestructuras federadas y accesibles. Además, se pretende que los resultados obtenidos, se envíen a los responsables políticos, mediante un policy brief, para servir como hoja de ruta en la toma de decisiones que afecten a la seguridad y privacidad de los datos ciudadanos.  


Algunos de los objetivos que se han marcado estos días en la presentación han pasado por el deseo de que SIESTA sea “una comunidad, que ofrece herramientas, servicios al personal investigador, dentro de la nube de ciencia abierta, y mostrando los beneficios que tiene para la sociedad, la ciencia y la investigación”. Y demostrar la importancia de procesar datos sensibles siguiendo los principios FAIR, ofrecer herramientas de anonimización, y buscar sinergias con otros proyectos de la infraestructura EOSC (conocida como INFRAEOSC), como por ejemplo, EOSC-ENTRUST (Elixir) o TITAN (Universidad de Murcia). 



Rebeca García / IFCA Comunicación 


  • Centro Mixto perteneciente al Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad de Cantabria (UC)

    Instituto de Física de Cantabria
    Edificio Juan Jordá
    Avenida de los Castros, s/n
    E-39005 Santander
    Cantabria, España

  • © IFCA- Instituto de Física de Cantabria