Predatory data: ¿estas decidiendo o te están “dirigiendo”?

Lo he mencionado en múltiples ocasiones: los datos son la materia prima de los negocios y al interpretarlos el resultado es tener información. Por decenas de años el problema era no tener esos datos y hoy el problema es que hay una abundancia de datos y, en ciertos casos los datos existentes provocan decidir mal.

En otras palabras, la preocupación es si se están tomando decisiones basadas en esos datos o los datos fueron diseñados para influir en las decisiones.

¿Qué son los datos predatorios?

En palabras sencillas los datos predatorios (del inglés “predatory data”) son datos que influyen en las decisiones a favor de un tercero, explotando sesgos humanos o debilidades en la operación. Aportan en principio la objetividad que se busca, pero a la vez condicionan las conclusiones. En otras palabras, son datos útiles, pero a la vez dirigen las decisiones.

Esto nos hace tener que pensar no solo en la validez de un dato sino en la intención o el efecto que puede generar.

Origen de los datos predatorios

Este tipo de datos son una consecuencia de distintas tecnologías y herramientas donde empezó una tendencia de tener datos para entender para pasar a tener datos para influir.

Hay 3 motores principales de este tipo de datos:

  1. La economía de la atención: Donde se entiende que quien controle el dato controla la decisión. (Aquí más información)
  2. La monetización del comportamiento: Para lo cual se han creado plataformas que “optimizan” lo que se muestra. (Aquí más información)
  3. IA y automatización: Con resultados de amplificar los datos sin necesariamente validarlos.

En otras palabras, los datos han dejado de ser evidencia y se han empezado a convertir en un instrumento.

Tipos de datos predatorios

En esencia hay 5 principales que suceden frecuentemente:

  1. Datos selectivos: Son parciales, lo que se ve no es el todo, y por lo tanto se muestran los datos que aportan un sesgo a una determinada narrativa.
  2. Datos con sesgos: Son diseñados con base en métricas o muestras que conducen a conclusiones planeadas, se ven aparentemente muy racionales, pero en realidad son inducidas.
  3. Datos fuera de contexto: Pudieron ser en un momento datos correctos, pero se emplean en el momento equivocado o sin un marco de referencia, provocando interpretaciones erróneas.
  4. Datos derivados: Provienen de modelos de terceros o datos que se procesaron por algoritmos que no son propios y por lo tanto no se controlan, teniendo decisiones basadas en la lógica de una entidad ajena al negocio.
  5. Datos auto reforzados: Sucede cuando los sistemas “aprenden” de sus propios resultados, que no necesariamente fueron precisos o correctos y como conclusión se va amplificando el error.

Segmentos empresariales donde pueden suceder

Solo a manera de ejemplo, los datos predatorios pueden suceder de las siguientes formas en los distintos segmentos empresariales:

  • Comercio y/o autoservicio: Tableros de control que favorecen promociones que incrementan ventas pero no cuidan el margen, provocando pérdidas inclusive
  • Financiero: Modelos de riesgos que excluyen segmentos rentables en la actualidad por basarse en sesgos del pasado o históricos.
  • Marketing digital: Se “premian” los clics o el “egagement” pero no suceden ventas reales como consecuencia, por más clics que se hagan.
  • Salud: Conjuntos de datos que no representan poblaciones de cierto tipo y como consecuencia aportan diagnósticos imprecisos.
  • Manufactura: Se tienen indicadores de “eficiencia” que en la realidad no muestran cuellos de botella que si están sucediendo.
  • Sector público: Políticas basadas en estadísticas en lugar de evaluar la relevancia o realidad de la política.

Por hablar de algunas representaciones en las que se dan los datos predatorios.

Impacto de datos predatorios en los negocios

Hay 4 ejes donde este tipo de datos puede tener un impacto relevante:

  1. Estratégico: Las decisiones pueden estar integradas a intereses externos, perdiendo la independencia operativa y comprometiendo la soberanía en la toma de decisiones.
  2. Financiero: Impactan provocando inversiones malas, con métricas no relevantes y en el mediano plazo erosionan la rentabilidad.
  3. Operativo: Toda la empresa se enfoca en cumplir KPIs equivocados y además se automatizan errores.
  4. Reputacional: Se toman decisiones injustas o no consistentes con los valores de la empresa, provocando la pérdida de la confianza interna y externa

Como conclusión, una empresa no quiebra por la falta de datos hoy en día. Quiebra por tomar decisiones basadas en datos equivocados.

Detectando datos predatorios

Dentro de las señales de alerta se pueden ver ciertos patrones:

  • Todo en la información parece “mejorar” pero el negocio no mejora.
  • Todo depende de una sola fuente o proveedor
  • Nadie sabe cómo se generaron los datos
  • Los datos no reflejan la realidad operativa

Por lo que sugiero hacerse algunas preguntas:

  • ¿Quién gana si tomo esta decisión?
  • ¿Qué información no se está contemplando o no se está viendo?
  • ¿Se pueden auditar los datos?
  • ¿Qué pasaría si este dato estuviera sesgado?

Evitando datos predatorios

Hay 3 niveles organizacionales donde esto debe de suceder para evitar caer en datos predatorios:

  1. Alta dirección: Aquí es donde se establecen las responsabilidades sobre los datos, separando quien produce los datos, quien los analiza y quien los decide.
  2. Estratégico: En este nivel se debe de no delegar las decisiones críticas a modelos o aplicaciones de terceros que no se pueden auditar manteniendo siempre la capacidad interna de la interpretación. No se puede gobernar lo que no se puede auditar.
  3. Operación: Se debe de validar con varias fuentes de información, cuestionando las métricas “estándar” y siempre incorporando el contexto o la coyuntura del negocio. No creas nada por el simple hecho que te digan que es verdad.

Antes el reto era acceder a la información, hoy el reto es proteger la calidad de la decisión.

Conclusión

Más que tener los datos suficientes, se debe de pensar en quién o qué diseña los datos que influyen las decisiones. En especial poder darse cuenta si realmente se está decidiendo o algo nos está “dirigiendo” a una decisión sin darnos cuenta.


Deja un comentario