Protección de datos y anonimización en entornos de servicios financieros y jurídico legales

El reglamento RGPD obliga a organizaciones, empresas e instituciones a proteger los datos de los ciudadanos para que no sean utilizados por terceras partes, además de minimizarlos en su transmisión. En base a esa obligación, INEA (Innovation and Networks Executive Agency) ha concedido al consorcio dirigido por Pangeanic casi un millón de euros, destinado al desarrollo de un kit de herramientas de anonimización multilingüe basado en el procesamiento inteligente de textos médico-sanitarios; de ciencias de la vida, así como jurídicos, para las administraciones públicas europeas. Lo que nos preguntamos es… ¿hasta qué punto estamos preparados en el sector financiero y jurídico-legal español para el cumplimiento del RGPD, cuando se manejan datos personales de nuestros clientes a gran escala?

La protección de datos personales no sólo trata de evitar que otras personas no autorizadas conozcan datos privados de un individuo, si no que va más allá. Se trata de un derecho fundamental de las personas, que busca proteger su intimidad y su privacidad frente a las vulneraciones de tales derechos que puedan proceder de la recogida y almacenamiento de sus datos personales por empresas o Administraciones Públicas.

Se considera un dato de carácter personal cualquier información numérica, alfabética, gráfica, fotográfica, acústica o de cualquier otro tipo, concerniente a personas físicas identificadas o identificables. Es decir: toda la información que aporte datos sobre una persona física concreta o bien que, a través de dicha información, se pueda llegar a identificar. Hablamos de nóminas, direcciones, teléfonos, email, fotos, revisiones médicas, nombres y apellidos, creencias religiosas, tendencias políticas, cuentas bancarias y algunos casos profesiones o relaciones familiares, etc. Sin embargo, datos como el CIF de una persona jurídica, no se consideran de carácter personal.

Hay datos que, por ser especialmente sensibles, afectan a la intimidad de las personas. La Ley considera especialmente protegidos los relativos a la ideología, afiliación sindical, religión, creencias, origen racial, salud y vida sexual. Este tipo de datos requieren la aplicación de medidas de seguridad especiales por parte de las empresas y administraciones.Ejemplo de software de anonimización de textos con la técnica de bloque cerrado

Ejemplo de software de anonimización de textos con la técnica de bloque cerrado

A fin de poder dotar de mayor seguridad a cualquier empresa que maneje habitualmente datos personales de clientes a gran escala, mediante las nuevas técnicas Big Data, es cuando entra en juego la anonimización de los mismos, que en este contexto adquiere un valor incalculable.

Aquí debemos diferenciar entre el concepto de anonimización absoluta, el cual es muy difícil de conseguir, puesto que mediante el cruce de información siempre queda el riesgo de poder “casar” el dato en cuestión con la persona a la que hace alusión, y el término más práctico “desidentificación”. Teniendo en cuenta que la anonimización nunca será absoluta, hay que conseguir al menos que la reidentificación que pudiese darse debido a ese cruce de información o “trazabilidad al sujeto", conlleve un esfuerzo tan elevado que no sea algo asumible ni factible para quien intente recuperarla. Y en ello estamos trabajando actualmente desde nuestra división tecnológica, PangeaMT.

El proyecto MAPA (Multilingual Anonymisation toolkit for Public Administrations) utiliza herramientas de procesamiento de lenguaje natural de última generación: reconocimiento de entidades que alimentan redes neuronales y codificaciones bilingües para desarrollar una solución de código abierto centrado en los ámbitos médico y jurídico, implantándolo en varias administraciones públicas de la Unión Europea: España, Francia, Letonia y Malta.

“El objetivo de MAPA es proporcionar un servicio privado de anonimización de datos para que estos se puedan compartir entre organizaciones, al tiempo que se protegen datos privados o confidenciales. Los casos de implementación se centrarán en la desidentificación, la ofuscación o el pseudoanonimato de la información que identifica a las personas. Para demostrar que no importa a qué idioma se enfrente la Administración Pública u otros usuarios, existe una solución gracias a la inteligencia artificial (IA). MAPA permitirá que las AA.PP. cumplan con la RGPD con un alto grado de precisión y protejan los datos privados de una persona mientras mantienen la utilidad del Big Data.”

MAPA satisfará los requisitos del RGPD a escala, aunque ningún software puede garantizar el 100% de precisión, sí conseguirá que el intercambio de documentos sea mucho más eficaz, rápido y dinámico y asegurará el cumplimiento tando del RGPD como de la Ley ¿Se han planteado las empresas de estos sectores tales como entidades financieras, corredurías de seguros, asesorías y firmas jurídicas cómo facilitaría la implementación de estas herramientas de anonimización el cumplimiento del RGPD?

Desde esta experiencia, en Pangeanic estamos trabajando para hacer de la anonimización una herramienta que se implemente no sólo en el sector público, sino también en el ámbito empresarial privado, acercándola a sectores como el financiero y el legal, donde se maneja habitualmente una ingente cantidad de datos personales de clientes haciendo de la anonimización una realidad, y partiendo de necesidades, creamos realidades para estos sectores básicos en la economía nacional.