Trabajar con datos agregados: ¿qué hay que tener en cuenta?

El análisis de datos es una práctica eficaz en la investigación, en la predicción de comportamientos y tendencias y, en consecuencia, en la toma de decisiones en cualquier sector: el empresarial, el comercial, el científico, el educativo, el gubernamental, etc.

Al llevar a cabo esta práctica estadística y estratégica debe extraerse información realmente relevante. Esta solo la pueden proporcionar los datos agregados, una especie de promedio que se obtiene de los datos individuales.

Pero ¿qué pasa cuando estos datos agregados provienen de datos personales? Esto es, datos específicos que son identificadores de los individuos, datos muy sensibles. Más concretamente, ¿qué debe tenerse en cuenta?

 

 

Definición de datos agregados

 

Para entender mejor las aplicaciones y riesgos de los datos agregados es importante conocer su definición, cómo se forman y su relación con los datos individuales y los datos anónimos o anonimizados.

Los datos agregados son un conjunto de información recopilada con base al promedio o resumen de un grupo de datos individuales. Su fin es el de efectuar comparaciones, estudiar y pronosticar tendencias y obtener información de importancia global.

Estos datos grupales pueden contener o no números y, al mismo tiempo, conllevar el tratamiento de datos personales.

Normalmente, cuando se necesita utilizar datos agregados, estos pasan primeramente por un proceso de anonimización, un método en el que se elimina la información que puede servir como identificador del individuo.



 

 

Datos agregados y datos desagregados

De acuerdo con todo lo expresado, la agregación de datos implica resumir y compilar un grupo de datos individuales. Pero también existe una práctica muy necesaria, la desagregación.

Los datos desagregados provienen de la disgregación o separación de las unidades de información que componen los datos agregados. Por lo tanto, estos datos desagregados pueden definirse como los componentes que estructuran la información agregada.

Los datos agregados son fundamentales para conocer y compilar información importante, mostrar tendencias y predecir comportamientos. Por su parte, los desagregados son indispensables para mostrar ciertos patrones subyacentes.

Los datos desagregados muestran tendencias que no se observan a simple vista en los agregados, pero si estos se desglosan, se revelan. 

Por ejemplo, en un país X, el promedio agregado de individuos hombres entre 30 y 50 años que padecen de estrés grave es del 35 %. Pero al desagregar esta información se revela que solo el 5 % de los hombres que viven alejados de la ciudad sufren de estrés.

Como se ve en la definición de datos agregados, estos suelen limitarse a proporcionar patrones o comportamientos generales a gran escala. Pero se hace necesario desglosarlos, es decir, desagregarlos, para estudiar factores o detectar problemas o características más específicas.

 

 

Usos y aplicaciones de los datos agregados

 

Los datos agregados proporcionan información valiosa. Y, normalmente, se utilizan para establecer la base de toma de decisiones importantes para una empresa, una institución, una determinada población… Por ejemplo:

  • Los analistas financieros utilizan los datos agregados para conocer la tasa de inflación general.
  • Las entidades bancarias recopilan los datos de clientes, los someten a la anonimización y los utilizan para estimaciones económicas o conocer las tendencias de un determinado sector de usuarios.
  • Los gobiernos pueden emplear estos datos para conocer los resultados o la efectividad de alguna medida implantada en el país o ciudad. Los ayuda a afianzar o a planificar nuevas estrategias.
  • Los planteles educativos utilizan los datos agregados para determinar el rendimiento escolar.



 

 

Riesgos de los datos agregados

 

Como ya se ha explicado, cuando los datos agregados provienen de datos personales, debe cuidarse el uso y divulgación de los mismos por protección a la privacidad de los individuos. Por esto, es una práctica que los datos personales se anonimicen para, después, ser agregados.

No obstante, existen datos que, por su naturaleza o formato, no se dejan anonimizar; o si se tornan anónimos, pueden reidentificar al individuo titular de los mismos al aplicarse técnicas de comparación. Un ejemplo de estos son los datos de vídeos o de voz y los datos de sensores.

Aunado a esto, los datos agregados pueden contener ciertos datos muy específicos del individuo que, si se desea, pueden arrojar hábitos y preferencias privadas, cuyo titular no ha compartido conscientemente.

Muchas veces, si no se toman las medidas tecnológicas adecuadas para la protección, los algoritmos de inteligencia artificial, al procesar dichos datos, pueden descubrir relaciones y tendencias que pueden socavar el derecho a la privacidad.

Por esta razón, es de suma importancia que toda empresa, organización, asociación o institución gubernamental cuente con una compañía de datos agregados de confianza que le suministre la tecnología eficaz para garantizar la protección y buen uso de los mismos.

Solo una compañía de datos agregados con experiencia en el tratamiento de información mediante tecnología avanzada puede ofrecer una alta calidad en el proceso de agregación de datos para estudios, planificaciones, desarrollos y otras actividades.

 

Para garantizar la integridad, privacidad, confiabilidad y anonimización de los datos en el marco del procesamiento de contenidos y las traducciones, contacta con nosotros. En Pangeanic, te ofrecemos soluciones tecnológicas avanzadas que cumplen con la protección de datos y el RGPD.

 

cta