¿En qué datos de Covid-19 puede confiar?

La pandemia Covid-19 ha producido una marea de datos, pero ¿cuánto es bueno? Y como laico, ¿cómo puedes ordenar lo bueno de lo malo? Los autores sugieren algunas estrategias para dividir los datos útiles de los engañosos: Tenga cuidado con los datos que son demasiado amplios o demasiado estrechos, que provienen de tecnologías no investigadas, y los modelos producidos sin expertos relevantes. Por el contrario, buscar transparencia, consideración, expertos y plataformas abiertas, todas las cuales son signos de que los productores de los datos tienen fe en sus afirmaciones, son conscientes de sus puntos ciegos y están abiertos a que otros investigadores comprueben su trabajo.
¿En qué datos de Covid-19 puede confiar?
¿En qué datos de Covid-19 puede confiar?
Personal HBR

Hemos hecho nuestra cobertura del coronavirus gratuito para todos los lectores. Para que todo el contenido de HBR se entregue a tu bandeja de entrada, regístrate en el Alerta diaria boletín de noticias.

La pandemia Covid-19 ha creado una marea de datos. A medida que los países y las ciudades luchan por hacerse con el alcance y la escala del problema, las corporaciones tecnológicas y los agregadores de datos han aumentado, llenando la brecha con paneles de control puntuación de distanciamiento social basado en datos de ubicación de aplicaciones de teléfonos móviles y torres de celular, aplicaciones de seguimiento de contactos utilizando servicios de geolocalización y Bluetooth, y modelando esfuerzos para predecir la carga epidémica y las necesidades hospitalarias. Ante la incertidumbre, estos datos pueden proporcionar comodidad, hechos tangibles frente a muchas incógnitas.

En una situación de crisis como la que nos encontramos, los datos pueden ser una herramienta esencial para elaborar respuestas, asignar recursos, medir la eficacia de las intervenciones, como el distanciamiento social, y decirnos cuándo podríamos reabrir las economías. Sin embargo, datos incompletos o incorrectos también pueden enmudecer las aguas, oscureciendo matices importantes dentro de las comunidades, ignorando factores importantes como las realidades socioeconómicas, y creando falsos sentidos de pánico o seguridad, por no hablar de otros daños como exponer innecesariamente información privada. En este momento, los datos incorrectos podrían producir graves errores con consecuencias para millones de personas.

Lecturas adicionales

Lamentablemente, muchas de estas soluciones tecnológicas, por muy bien intencionadas que sean, no proporcionan el panorama claro que pretenden. En muchos casos, no hay suficiente compromiso con expertos en la materia, como los epidemiólogos que se especializan en modelar la propagación de enfermedades infecciosas o los médicos de primera línea que pueden ayudar a priorizar las necesidades. Pero debido a que las empresas de tecnología y telecomunicaciones tienen mayor acceso a los datos de dispositivos móviles, enormes recursos financieros y equipos más grandes de científicos de datos, que los investigadores académicos, sus productos de datos están siendo implementados a un volumen mayor que los estudios de alta calidad.

Ya sea que sea un CEO, un consultor, un responsable de políticas o simplemente alguien que esté tratando de entender lo que está pasando, es esencial poder clasificar los buenos datos de lo engañoso, o incluso equivocado.

Trampas comunes

Aunque es posible que no esté calificado para evaluar los detalles de cada panel, gráfico y estudio que vea, hay marcas rojas comunes que le permiten saber que los datos pueden no ser confiables. Esto es lo que hay que tener en cuenta:

Productos de datos que son demasiado amplios, demasiado específicos o carecen de contexto. Los datos sobreagregados —como las métricas nacionales de distanciamiento físico que algunos de nuestros mayores agregadores de datos del mundo— oscurecen las variaciones locales y regionales importantes, no son accionables y significan poco si se usan para comparaciones entre naciones, dado el masivo nivel social, demográfico y las disparidades económicas en el mundo.

Centro de información

Por el contrario, los datos excesivamente desagregados pueden causar un daño directo. Los profesionales de la salud pública y los expertos en privacidad de datos se basan en la proporcionalidad: solo use los datos que necesita absolutamente para el propósito previsto y no más. Hasta cierto punto, todos los datos corren el riesgo de violar la privacidad de las identidades individuales o grupales, pero publicar tarjetas de puntuación para barrios específicos corre el riesgo de avergonzar o castigar a las comunidades, al tiempo que ignoran las realidades socioeconómicas de la vida de las personas que les dificultan quedarse en casa. Ejemplos aún más granulares, como las pisadas en lugares de negocios identificables, corren el riesgo de desidentificar a grupos religiosos; pacientes que visitan hospitales oncológicos, clínicas de VIH o clínicas de salud reproductiva; o aquellos que buscan asistencia pública. Hace mucho tiempo, las comunidades médicas y de salud pública consideraban inaceptable el desenmascaramiento de dicha información sin consentimiento, pero las empresas han estado publicándola recientemente en paneles de control de acceso público.

Incluso los datos con una resolución espacial adecuada deben interpretarse con precaución: el contexto es clave. Supongamos que ve un mapa que muestra una disminución del 20% en la movilidad en un suburbio estadounidense y una disminución del 40% en una ciudad cercana después de que se anuncien medidas de distanciamiento social. La disminución en el suburbio puede empujar adecuadamente el distanciamiento físico a por debajo del umbral deseado, dado que sus residentes comenzaron con una línea de base relativamente baja para empezar. La ciudad todavía puede estar lejos de la reducción de movilidad necesaria para afectar significativamente las tasas de transmisión, ya que sus residentes eran muy móviles antes. Hasta que sepamos más acerca de cómo estos cambios en los patrones de movimiento afectan a los aspectos epidemiológicos de la enfermedad, debemos utilizar estos datos con precaución. Simplemente presentarlas, o interpretarlas sin una comprensión contextual adecuada, podría llevar inadvertidamente a imponer o relajar restricciones sobre la vida y los medios de subsistencia, basadas en información incompleta.

Las tecnologías detrás de los datos no están investigadas o tienen una utilidad limitada. Las soluciones tecnológicas, como el rastreo de contactos por teléfono móvil, una solución que está ganando vapor en muchos países — tener potencial no probado, pero sólo como parte de una estrategia global más amplia que incluya un sólido sistema de salud subyacente. Jason Bay, el líder del producto de la exitosa aplicación de rastreo de Singapur, TraceTogether advertencias que «el rastreo automatizado de contactos no es una panacea del coronavirus». Sin embargo, algunos esfuerzos de rastreo de contacto basados en aplicaciones se están utilizando para estratificar el riesgo de las personas, y estas estimaciones se están utilizando para tomar decisiones sobre cuarentena, aislamiento y libertad de movimiento, sin pruebas concomitantes.

Tanto los productores como los consumidores de salidas de estas aplicaciones deben entender dónde pueden quedar cortos. Pueden resultar muy útiles si experimentamos ondas recurrentes en los próximos meses, cuando los brotes pueden estar más localizados, y nuestra capacidad de prueba es proporcional a nuestras aspiraciones tecnológicas. Sin embargo, en ausencia de un plan de pruebas y tratamiento estrechamente acoplado, estas aplicaciones corren el riesgo de proporcionar falsas seguridades a las comunidades en las que las personas infecciosas pero asintomáticas pueden seguir propagando enfermedades, o requerir que un número injustificadamente elevado de personas se ponga en cuarentena. Por lo tanto, se desconoce la respuesta conductual de la población a estas aplicaciones y es probable que varíe significativamente entre las sociedades.

En algunos casos, los datos de las aplicaciones de seguimiento requieren otra advertencia: los métodos que utilizan no son transparentes, por lo que no pueden ser evaluados completamente por expertos. Algunas aplicaciones de rastreo de contactos siguen algoritmos de caja negra, lo que impide que la comunidad global de científicos las perfeccione o las adopte en otros lugares. Estas intervenciones no transparentes y no validadas, que ahora se están implementando (o retrocedio) en países como China, India, Israel y Vietnam — contravienen directamente la colaboración transfronteriza abierta que los científicos han adoptado para hacer frente a la pandemia Covid-19. Sólo se deben considerar algoritmos transparentes y minuciosamente verificados para aumentar las intervenciones de salud pública que afectan a la vida de millones de personas.

Los modelos se producen y presentan sin la experiencia adecuada. Tecnólogos bien intencionados y empresas consultoras altamente influyentes están asesorando a los gobiernos, y en consecuencia a las empresas y a la población en general de todo el mundo, sobre estrategias para combatir la epidemia, incluso mediante la construcción de modelos de proyección y predicción. Los modelos epidemiológicos que pueden ayudar a predecir la carga y el patrón de propagación de Covid-19 se basan en una serie de parámetros que, por el todavía, salvajemente incierto. Todavía nos faltan muchos de los datos básicos sobre esta enfermedad, como cuántas personas tienen síntomas, si las personas que han sido infectadas son inmunes a la reinfección y, sobre todo, cuántas personas han sido infectadas hasta ahora. En ausencia de datos fiables de pruebas virológicas, nos no se pueden ajustar los modelos con precisión, o saber con confianza cómo será el futuro de esta epidemia por todas estas razones, y sin embargo se están presentando números a los gobiernos y al público con la apariencia de certeza

Tomemos un ejemplo reciente: Una consultora global líder explicó sus proyecciones para una ciudad estadounidense de la costa este, superponiendo sobre ella lo que ellos denominaron «la curva de Wuhan». Las dos poblaciones y ciudades no pueden ser más diferentes en cuanto a su demografía y su infraestructura de atención de la salud. Esas simplificaciones excesivas corren el riesgo de que las proyecciones sean inexactas y de que se desvíen a tiempo recursos críticos de los lugares que más los necesitan. Las empresas cuentan con los vastos recursos necesarios para traducir rápidamente el conocimiento generado a partir de sus datos y tecnologías a los gobiernos y las comunidades, pero están adquiriendo experiencia en forma colectiva dentro de sus filas. Aunque puede ser tentador querer moverse con velocidad, un enfoque rápido de «moverse rápido y romper las cosas», el sello distintivo de nuestra cultura de startups, es inapropiado aquí. Combinar este entusiasmo con el tipo adecuado de experiencia en materia puede ir más lejos.

Lea atentamente y confíe con cautela

Confiar en fuentes confiables siempre es un buen consejo, pero ahora es una necesidad absoluta. Aquí hay algunas boyas para ayudarle a navegar hacia la costa, ya sea productor o consumidor de datos.

Transparencia: Busque cómo se presentan los datos, la tecnología o las recomendaciones. Cuanto más transparentes sean los proveedores en cuanto a la representatividad de sus datos, métodos analíticos o algoritmos, más seguros estarán de su proceso y más abiertos al escrutinio público. Estos son los socios de conocimiento más seguros.

Ejemplo: el gobierno de Singapur era totalmente transparente sobre el código, el algoritmo y la lógica utilizados en su aplicación de contacto TraceTogether. Durante el lanzamiento de la aplicación, publicaron abiertamente un resumen de política y un white paper describiendo el funcionamiento racional de la aplicación, y lo más importante, su protocolo («BlueTrace») y base de código («OpenRace»), lo que permite una revisión abierta.

Consideración: Busca señales de arrogancia. El desprecio absoluto de la privacidad, los derechos civiles o los hechos científicos bien establecidos desmienten la confianza excesiva en el mejor de los casos, y la imprudencia en el peor de los casos. Es probable que este tipo de enfoques resulte en la mayoría de los daños. Los analistas que son conservadores en sus recomendaciones, comparten la incertidumbre asociada con sus interpretaciones y sitúan sus hallazgos en el contexto local apropiado probablemente sean más útiles.

Ejemplo: Telenor, el gigante noruego de telecomunicaciones ha liderado el camino en el uso responsable de datos de movilidad agregados de registros de torres de telefonía celular. Sus datos han sido utilizados, en estrecha colaboración con científicos y profesionales locales, para modelar, predecir y responder a brotes en todo el mundo. Telenor ha publicado abiertamente sus métodos y ha proporcionado orientación tecnológica sobre cómo los datos de las telecomunicaciones pueden ser utilizados en emergencias de salud pública en un formato responsable y anónimo que no corre el riesgo de desidentificación.

Experiencia: Busca a los profesionales. Examinar las credenciales de quienes proporcionan y procesan los datos. Nos enfrentamos a un diluvio de datos e interpretación de los tipos equivocados de expertos, lo que resulta en una alta relación entre ruido y señal. En los días más alcistas, no queremos que nuestros banqueros sean nuestros cirujanos.

Ejemplo: Imperial College, entre otros grupos académicos, ha estado involucrado en la orientación de los tomadores de decisiones en la respuesta Covid-19 del Reino Unido desde los primeros días de la epidemia, a través del trabajo de la Centro MRC para el Análisis Mundial de Enfermedades Infecciosas. En los Estados Unidos, las colaboraciones de larga data entre departamentos de salud estatales y locales y grupos de investigación se han visto reforzadas por nuevas asociaciones de colaboración. En ambos países, estos esfuerzos dependen fundamentalmente de la financiación sostenida de centros que puedan apoyar el desarrollo de métodos y la capacitación durante períodos interepidémicos y movilizarse para responder cuando se produzcan crisis.

Plataformas abiertas: Busca a los colaboradores. Hay varios agregadores de datos comprometidos a apoyar un ecosistema de comunidades, empresas y socios de investigación, compartiendo datos o códigos de manera segura y responsable. Esos enfoques abiertos de ecosistemas, aunque no son fáciles de gestionar, pueden producir grandes dividendos.

Ejemplo: Cuando empresas tecnológicas como Camber Systems, Cubeiq y Facebook han permitido a los científicos examinar sus datos, los investigadores pueden comparar datos a través de estos nuevos flujos de datos para tener en cuenta la representatividad y corregir sesgos, haciendo que los datos sean aún más útiles. La red de datos de movilidad Covid-19, de la que formamos parte, consiste en una colaboración voluntaria de epidemiólogos de todo el mundo que analiza datos agregados de empresas tecnológicas para proporcionar información diaria a funcionarios municipales y estatales de California a Dhaka, Bangladesh. Los gobiernos transmiten las lagunas de información que existen en su planificación y formulación de políticas, los científicos ayudan a determinar los mejores enfoques analíticos para subsanar esas deficiencias y las empresas tecnológicas ponen a disposición los datos a los que tienen acceso en un formato significativo e interpretable. Todo intercambio de datos sigue estrictas directrices éticas institucionales y se ajusta a la legislación local e internacional. Los productos diarios hablan de las necesidades articuladas de los funcionarios gubernamentales colaboradores.

Esta pandemia ha sido estudiada más intensamente en menos tiempo que cualquier otro acontecimiento humano. Nuestro mundo globalizado ha generado y compartido rápidamente una gran cantidad de información al respecto. Es inevitable que haya datos malos y buenos en esa mezcla. Estos datos masivos, descentralizados y de fuentes multitudinarias se pueden convertir de manera confiable a conocimientos que salvan vidas si se moderan por experiencia, transparencia, rigor y colaboración. Al tomar sus propias decisiones, lea atentamente, confíe cuidadosamente y, en caso de duda, busque a los expertos.

Si nuestro contenido gratuito le ayuda a lidiar con estos desafíos, por favor considere suscribirse a HBR. Una compra de suscripción es la mejor manera de apoyar la creación de estos recursos.


Satchit Balsari Caroline Buckee Tarun Khanna
Via HBR.org

Related Posts
No deje que una sola métrica conduzca su negocio

No deje que una sola métrica conduzca su negocio

Es imposible capturar las complejidades de su negocio con una sola métrica. Dé prioridad a un solo número titular, excluyendo a todos los demás, e invariablemente dejará a mucha gente y prioridades fuera. Además, es probable que restrinja su crecimiento. En su lugar, debe pensar en una constelación de métricas que se centran en la medición de tres cosas: cantidad, calidad y eficiencia. Estas tres métricas en relación entre sí cuentan la historia de su negocio y permiten priorizar y alinear. Se convierten en un lenguaje abreviado internamente al comprometer recursos y hacer inversiones, o compensaciones. Ninguna métrica es perfecta. Pero comprender y reevaluar regularmente la relación entre la cantidad, la calidad y la eficiencia es fundamental para comprender más profundamente su negocio, y para mantenerse ágil. Le permitirá dirigir lo que más importa, la experiencia del cliente, y empoderar a todos sus equipos en el proceso. Hecho bien, las métricas son una de las mejores maneras de hacer que las personas entiendan realmente cómo su trabajo afecta al negocio de una manera positiva.

Leer más
Cómo las empresas pueden utilizar los datos de los empleados de manera responsable

Cómo las empresas pueden utilizar los datos de los empleados de manera responsable

Tras las recientes violaciones de los datos de los clientes, las empresas están reconociendo la necesidad de más protección y transparencia en torno a la recopilación y el uso de los datos de los clientes. Sin embargo, pocos han prestado la misma atención a las cuestiones derivadas de la recopilación y extracción de datos sobre el lugar de trabajo. Una encuesta de más de 10.000 trabajadores y 1400 ejecutivos de nivel C, en 13 países y 13 industrias, encontró que más del 90% de los empleados están dispuestos a dejar que sus empleadores recopilen y utilicen datos sobre ellos y su trabajo, pero sólo si se benefician de alguna manera. Y albergan serias preocupaciones sobre cómo las empresas podrían usar los datos. Tal vez por una buena razón: sólo el 30% de los ejecutivos cuyas empresas utilizan datos de mano de obra reportaron estar muy seguros de que están utilizando los datos de manera responsable. Hay mucho en juego en el mal uso de los datos de los empleados, incluida la pérdida de ingresos debido a la pérdida de confianza de los empleados. Entonces, ¿cómo pueden las empresas utilizar los datos del lugar de trabajo de una manera efectiva, responsable y ética? Tres prácticas pueden ayudar: dar a los empleados más control, crear un sistema de controles y balances y utilizar datos para elevar a las personas en lugar de penalizarlas.

Leer más