Skip Navigation LinksIFCA > IFCA | Instituto de Física de Cantabria > News > Jaime Céspedes y Judith Sáinz-Pardo presentan Frouros y pyCANON en Alemania

Jaime Céspedes y Judith Sáinz-Pardo presentan Frouros y pyCANON en Alemania

 Jaime Céspedes y Judith Sáinz-Pardo junto a los pósteres que presentan hoy en Alemania


El equipo investigador del grupo de Computación Avanzada del IFCA presentará dos librerías recientemente creadas: Frouros y pyCANON en IDESSAI 2022


2 de septiembre de 2022


La escuela de verano sobre Inteligencia Artificial, es decir, la IDESSAI 2022, contará con la participación este viernes de los investigadores predoctorales en el Grupo de Computación Avanzada del Instituto de Física de Cantabria (IFCA, CSIC-UC), Judith Sáinz-Pardo y Jaime Céspedes Sisniega. 


El equipo investigador está hoy en Alemania (Saarbrücken) para presentar dos librerías recientemente creadas por Céspedes, Frouros, una librería de Python (un lenguaje de programación de alto nivel), que detecta problemas de aprendizaje automático o machine learning, y pyCAN​ON, una librería de Python que mide el nivel de privacidad de datos que maneje el usuario mediante técnicas de anonimización, desarrollada por Sáinz-Pardo.


pyCANON: Equilibrio entre privacidad e información 


Las tecnologías que manejan gran cantidad de datos han experimentado un rápido crecimiento en los últimos años, gracias sobre todo a la sencilla disponibilidad de grandes volúmenes de datos que son procesados (big data). La inteligencia artificial, el machine learning (aprendizaje automático) y el deep learning (aprendizaje profundo) permiten una amplia gama de aplicaciones, como la visión artificial, el procesamiento del lenguaje natural o el reconocimiento del habla. Pero para producir estos sistemas, se necesitan grandes cantidades de datos para crear modelos con un buen nivel de precisión. 


Los problemas surgen cuando se busca mantener el equilibrio entre la privacidad y la preservación de la mayor cantidad de información posible. Un estudio realizado sobre el censo de Estados Unidos reveló que en el 81% de los casos, tres datos personales como el código postal, el género y la fecha de nacimiento, son suficientes para identificar a alguien en una base de datos, y permitiría extraer cierta información sensible, como su clase salarial o nivel de estudios. Y esto no es todo, el dilema de la preservación de la privacidad se ve más agravado cuando se manejan bases de datos que contienen datos clínicos de pacientes, ¿cómo es posible preservar la privacidad de los pacientes manteniendo la mayor cantidad de información posible de cara a desarrollar modelos de Machine Learning?


Por ello, desde el IFCA se estudian técnicas que permitan trabajar con datos que den garantía de seguridad para desarrollar técnicas de privacidad y operar con datos de forma segura. Una de ellas es la librería pyCANON, creada por la investigadora Sáinz-Pardo, que trabaja con técnicas de anonimización, y está diseñada para que cualquier usuario pueda utilizarla sin necesidad de amplios conocimientos. 


La idea principal de la librería es proporcionar al equipo investigador, y en general a cualquiera que quiera publicar un conjunto de datos en acceso abierto o compartirlo con otros, un conocimiento previo del nivel de anonimización de sus datos. Le ofrecerá información sobre los posibles riesgos a los que se expondría esta información, y su resistencia a diferentes ataques. 


Frouros: Vigilante de la degradación de los datos


El aprendizaje automático o machine learning detecta patrones en conjuntos de datos, con el objetivo de realizar una predicción a futuro. Por lo general, los modelos de machine learning tienden a sufrir cierta degradación, en términos de rendimiento, con el paso del tiempo.


Se degradan porque los conceptos aprendidos durante la fase de entrenamiento de estos datos normalmente no permanecen estáticos y van variando, por eso se debe reentrenar el modelo. La función de la librería Frouros creada por el investigador Céspedes es implementar métodos que detecten esa degradación que sufren los datos. 


IDESSAI 2022 tiene lugar desde el 29 de agosto al 2 de septiembre en Saarbrücken, Alemania, está organizado por los institutos de Inteligencia Artificial alemán y francés, el DFKI y el Inria y se centra en dos temas de vanguardia, la Inteligencia Artificial de confianza y la sostenible, además buscar abordar los últimos avances y en futuro de esta materia. 




  • Centro Mixto perteneciente al Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad de Cantabria (UC)

    Instituto de Física de Cantabria
    Edificio Juan Jordá
    Avenida de los Castros, s/n
    E-39005 Santander
    Cantabria, España

  • © IFCA- Instituto de Física de Cantabria