No todos los datos son útiles: qué son los Dark Data

De todos los datos que guardan las empresas, el 80% son inútiles, un gasto que además frena la innovación. Detallamos qué es el Dark Data y algunas buenas prácticas para evitarlo

Jueves, 23 Julio, 2020

Dark data

Los datos son el nuevo petróleo”. Que levante la mano quien no haya oído (casi hasta la extenuación) esta frase.

No vamos a discutir ahora por qué los datos se han convertido en algo tan importante, pero sí que vamos a hablar de algo que no siempre se tiene en cuenta: no todo lo que reluce es oro y en toda base de datos, en todo repositorio de información, se almacena material que no tiene ya ningún interés.

Es lo que se conoce como Dark Data. Según la definición de la consultora Gartner, los datos oscuros son los activos de información que las organizaciones recopilan, procesan y almacenan durante sus actividades comerciales, pero que generalmente no se usan para otros fines (por ejemplo, análisis, relaciones comerciales y monetización directa).

¿Por qué se guardan estos datos?

Los datos oscuros se generan casi en cualquier tipo de documento, aplicación, transacción y/u operación. Algunos ejemplos típicos son información de clientes o ex empleados, archivos de registro, datos de encuestas, estados financieros, notas, presentaciones, correos electrónicos, archivos adjuntos de correo electrónico, bases de datos inactivas, versiones antiguas de documentos, transcripciones de centros de llamadas, revisiones de clientes, etc.

Es cierto que las organizaciones a menudo conservan todos estos datos oscuros solo para cumplir con algunas obligaciones legales (como, por ejemplo, la de guardar las facturas), pero también que este almacenamiento y la protección de datos generalmente suponen más gastos (y a veces un mayor riesgo) que el valor que puede aportar mantener esta información en nuestros repositorios.

Se calcula que en 2025 se crearán 463 exabytes de datos cada día en todo el mundo. Muchas empresas se afanan por guardar y recopilar mucha información de sus usuarios, sin a veces plantearse para qué quieren realmente todos estos datos. Sí, el objetivo es analizarlos convenientemente para desarrollar una estrategia comercial y adaptar mejor sus productos y marketing para satisfacer las necesidades de sus clientes. Pero, ¿se hace?

Además, este afán por guardar tanta información conlleva que se almacenen datos sin interés ni valor. De hecho, el 55% de los datos que recopilan las organizaciones se puede englobar en este fenómeno de los datos sucios, según un informe de la empresa de análisis de big data Splunk.

Qué problemas acarrea el dark data

El gran problema de estos datos oscuros no es que sean algo que guardemos de manera inútil, sino que pueden acarrear otras complicaciones.

Por ejemplo, el tener que destinar más recursos para poder guardar toda esta información. Además, y en función de cómo y dónde la guardamos, este volumen puede afectar al rendimiento de otros equipos y, por tanto, que necesitemos más potencia en nuestros dispositivos informáticos.

Además, si entre estos datos que conservamos y que no son útiles hay información personal, debemos tener en cuenta que deberíamos vigilarlos y controlarlos, puesto que los derechos de protección personal también son aplicables a estos archivos. Cabe recordar que, cuanto más sensible sea la información, más políticas de seguridad deberemos tener en cuenta.

Y esto, de nuevo, nos puede llevar a tener que aplicar medidas de seguridad más complejas y más costosas. Por no hablar de que, en caso de sufrir una vioalción de datos, nuestra reputación como empresa se puede ver aún más perjudicada si el alcance del ataque tiene que ver con datos de información personal.

Por último, y no por ello menos importante, esta información también nos exige dedicarle su tiempo. Debemos ser conscientes de que casi todos los datos tienen una fecha de caducidad y vencimiento. De nada nos vale seguir guardando un resguardo de haber pagado nuestros impuestos si han pasado más de diez años. Los datos que no se utilizan de manera oportuna se volverán rápidamente inútiles.

Cómo evitar generar datos sucios

Es cierto que a nivel personal a veces nos cuesta deshacernos de determinadas fotos aunque apenas tengan valor alguno para nosotros. Pero a nivel profesional, laboral y empresarial debemos evitar caer en este síndrome de Diógenes digital e intentar almacenar y guardar la menor información inútil posible.

Por eso, la primera medida es empezar hoy mismo a atajar el problema, tomando las medidas que sean necesarias: desde trasladarlos de lugar donde se almacenan, protegerlos o eliminarlos.

Para evitar que se sigan produciendo más datos inútiles, las empresas pueden automatizar determinadas operaciones, con herramientas que permiten seleccionar los datos valiosos. También es útil hacer un seguimiento del uso de datos. Aquí el reto es identificar tablas y bases de datos no utilizadas para trasladarlas a sistemas (como la nube) que sean más económicas. Esta simple operación liberará determinados recursos de almacenamiento de datos, mejorará el rendimiento de otras operaciones y nos permite ahorrarnos inversiones en hardware.

Pero, además, es fundamental que todas las personas implicadas tengan la formación y los conocimientos necesarios para evitar generar y guardar estos datos sucios. Estas políticas de datos deben ser conocidas por todos los empleados para evitar que se guarden (incluso por duplicado) datos en ordenadores, portátiles, móviles, en local y en la nube, amén de en dispositivos de memoria extraíbles.

 

Escrito en ISDI para leer y compartir

Más sobre Blog