Eleva tus habilidades de liderazgo y negocios

Súmate a más de 52,000 líderes en 90 empresas mejorando habilidades de estrategia, gestión y negocios.


Las decisiones basadas en datos comienzan con estas 4 preguntas

Para obtener respuestas útiles de los datos, no podemos tomarlas como valor nominal. Tenemos que aprender a hacer preguntas reflexivas. En particular, necesitamos saber cómo se obtuvo, qué modelos se usaron para analizarlo y qué se omitió. Sobre todo, tenemos que ir más allá del uso de datos simplemente para optimizar las operaciones y aprovecharlos para imaginar nuevas posibilidades. Los datos que son de mala calidad o que se utilizan en un contexto incorrecto pueden ser peores que ningún dato en absoluto. Tenga en cuenta que a veces, los datos que no tiene pueden afectar su toma de decisiones tanto como los datos que sí tiene. También tenemos que estar constantemente haciendo preguntas difíciles de nuestros modelos. ¿Son adecuados para el propósito para el que los estamos usando? ¿Están teniendo en cuenta los factores correctos? ¿La salida refleja realmente lo que está pasando en el mundo real?
Las decisiones basadas en datos comienzan con estas 4 preguntas
Las decisiones basadas en datos comienzan con estas 4 preguntas
Las decisiones basadas en datos comienzan con estas 4 preguntas
Jorg Greuel/Getty Images

Los datos se han convertido en un elemento central de cómo gestionamos nuestros negocios hoy en día. De hecho, la firma internacional de inteligencia de mercado internacional International Data Corporation (IDC) proyecta el gasto en datos y análisis para alcanzar $274.3 mil millones para 2022. Sin embargo, gran parte de ese dinero no se gasta sabiamente. Analista de Gartner Nick Heudecker ha estimado que hasta el 85% de los proyectos de big data fallan.

Una gran parte del problema es que los números que aparecen en una pantalla de computadora toman un aire especial de autoridad. Una vez que los datos son extraídos a través de bases de datos masivas y analizados a través de software de análisis complejo, rara vez preguntamos de dónde provienen, cómo han sido modificados o si son aptos para el propósito previsto.

La verdad es que para obtener respuestas útiles de los datos, no podemos tomarlas como valor nominal. Tenemos que aprender a hacer preguntas reflexivas. En particular, necesitamos saber cómo se obtuvo, qué modelos se usaron para analizarlo y qué se omitió. Sobre todo, tenemos que ir más allá del uso de datos simplemente para optimizar las operaciones y aprovecharlos para imaginar nuevas posibilidades.

Podemos empezar preguntando:

¿Cómo se han obtenido los datos?

Data, se ha dicho, es el plural de la anécdota. Los eventos del mundo real, como transacciones, diagnósticos y otra información relevante, se registran y almacenan en granjas de servidores masivas. Sin embargo, pocos se molestan en preguntar de dónde provienen los datos y, lamentablemente, la calidad y el cuidado con que se recopilan los datos pueden variar ampliamente. De hecho, un estudio de Gartner recientemente fundar que las empresas pierden un promedio de 15 millones de dólares anuales debido a la mala calidad de los datos.

Centro de información

A menudo, los datos están sujetos a errores humanos, como cuando los empleados minoristas mal pagados y sin motivación realizan comprobaciones de inventario. Sin embargo, incluso cuando el proceso de recopilación de datos está automatizado, existen importantes fuentes de error, como cortes intermitentes de energía en torres de telefonía móvil o errores en el proceso de compensación de transacciones financieras.

Los datos que son de mala calidad o que se utilizan en un contexto incorrecto pueden ser peores que ningún dato en absoluto. De hecho, un estudio encontró que el 65% de los datos de inventario de un minorista eran inexactos. Otra preocupación, que se ha vuelto cada vez más importante desde que la UE aprobó estrictas Estándares de datos del RGPD es si hubo un consentimiento adecuado cuando se recogieron los datos.

Por lo tanto, no asuma que los datos que tiene son precisos y de buena calidad. Tienes que preguntar de dónde proviene y cómo se ha mantenido. Cada vez más, necesitamos auditar nuestras transacciones de datos con el mismo cuidado que lo hacemos con nuestras transacciones financieras.

¿Cómo se analizó?

Incluso si los datos son precisos y están bien mantenidos, la calidad de los modelos analíticos puede variar ampliamente. A menudo, los modelos se juntan desde plataformas de código abierto, como GitHub, y se reutilizan para una tarea en particular. En poco tiempo, todo el mundo olvida de dónde vino o cómo está evaluando un conjunto de datos en particular.

Los lapsos como estos son más comunes de lo que crees y pueden causar daños graves. Considere el caso de dos economistas prominentes que publicaron un documento de trabajo que advirtieron que la deuda estadounidense se acercaba a un nivel crítico. Su trabajo causó una tormenta política pero, como se vio después, habían hecho una error simple de Excel que los hizo exagerar el efecto de la deuda sobre el PIB.

A medida que los modelos se vuelven más sofisticados e incorporan más fuentes, también estamos viendo problemas cada vez más grandes con la forma en que se entrenan los modelos. Uno de los errores más comunes es exceso de ajuste, lo que básicamente significa que cuantas más variables use para crear un modelo, más difícil será hacerlo generalmente válido. En algunos casos, el exceso de datos puede dar lugar a pérdida de datos, en el que los datos de entrenamiento se mezclan con los datos de prueba.

Estos tipos de errores pueden afectar incluso a las empresas más sofisticadas. Amazon y Google, sólo para nombrar dos de los casos más destacados, han tenido recientemente escándalos muy publicitados relacionados con el sesgo modelo. Al igual que hacemos con los datos, tenemos que estar constantemente haciendo preguntas difíciles sobre nuestros modelos. ¿Son adecuados para el propósito para el que los estamos usando? ¿Están teniendo en cuenta los factores correctos? ¿La salida refleja realmente lo que está pasando en el mundo real?

¿Qué no nos dicen los datos?

Los modelos de datos, al igual que los humanos, tienden a basar los juicios en la información que está más disponible. A veces, los datos que no tienes pueden afectar tanto a la toma de decisiones como a los datos que tienes. Comúnmente asociamos este tipo de sesgo de disponibilidad con decisiones humanas, pero a menudo los diseñadores humanos lo pasan a sistemas automatizados.

Por ejemplo, en la industria financiera, aquellos que tienen un historial de crédito extenso pueden acceder al crédito mucho más fácil que aquellos que no lo hacen. Estos últimos, a menudo conocidos como clientes de «archivos ligeros», pueden encontrar dificultades para comprar un automóvil, alquilar un apartamento o obtener una tarjeta de crédito. (Uno de nosotros, Greg, experimentó este problema personalmente cuando regresó a los Estados Unidos después de 15 años en el extranjero).

Sin embargo, un archivo delgado no necesariamente indica un riesgo crediticio deficiente. Las empresas a menudo terminan rechazando clientes potencialmente rentables simplemente porque carecen de datos sobre ellos. Experian comenzó recientemente a abordar este problema con su Programa de impulso, que permite a los consumidores aumentar sus puntuaciones dándoles crédito por cosas como los pagos regulares de telecomunicaciones y servicios públicos. Hasta la fecha, millones se han inscrito.

Por lo tanto, es importante hacer preguntas difíciles sobre lo que puede faltar su modelo de datos. Si administra lo que mide, debe asegurarse de que lo que está midiendo refleje el mundo real, no solo los datos que es más fácil de recopilar.

¿Cómo podemos utilizar los datos para rediseñar productos y modelos de negocio?

Durante la última década, hemos aprendido cómo los datos pueden ayudarnos a dirigir nuestras empresas de manera más eficiente. El uso inteligente de datos nos permite automatizar procesos, predecir cuándo nuestras máquinas necesitan mantenimiento y servir mejor a nuestros clientes. Son datos que permiten a Amazon ofrecer el envío en el mismo día.

Los datos también pueden convertirse en una parte importante del producto en sí. Para tomar un ejemplo famoso, Netflix ha utilizado desde hace mucho tiempo el análisis inteligente de datos para crear una mejor programación por menos dinero– Sí. Esto ha dado a la empresa un borde importante sobre rivales como Disney y WarnerMedia.

Sin embargo, donde se pone realmente emocionante es cuando puede usar datos para reimaginar completamente su negocio. En Experian, donde trabaja Eric, han podido aprovechar la nube para pasar de entregar solo datos procesados en forma de informes de crédito a un servicio que ofrece a sus clientes acceso en tiempo real a datos más granulares en los que se basan los informes. Eso puede parecer un cambio sutil, pero se ha convertido en una de las partes de más rápido crecimiento del negocio de Experian.

Se ha dicho que los datos son el nuevo petróleo, pero es mucho más valioso que eso. Tenemos que empezar a tratar los datos como algo más que una clase de activos pasivos. Si se usa sabiamente, puede ofrecer una verdadera ventaja competitiva y tomar un negocio en direcciones completamente nuevas. Para lograr eso, sin embargo, no puede comenzar simplemente a buscar respuestas. Tienes que aprender a hacer nuevas preguntas.


Eric Haller Greg Satell
Via HBR.org


Eleva tus habilidades de liderazgo y negocios

Súmate a más de 52,000 líderes en 90 empresas mejorando habilidades de estrategia, gestión y negocios.