Por qué la mayoría de las evaluaciones de desempeño son sesgadas y cómo solucionarlas

Evite las preguntas abiertas.

Por qué la mayoría de las evaluaciones de desempeño son sesgadas y cómo solucionarlas

Más de 50,000 líderes se mantienen al día con el futuro de los negocios.

Reportes radicalmente breves que ahorran 2,000+ horas de investigación

Estás aprendiendo en buena compañía

logo amazon
logo salesforce
logo mercadolibre
logo google
logo femsa
logo aeromexico
Resumen.

La mayoría de las evaluaciones de desempeño siguen un patrón predecible: invitan a los empleados a escribir sobre sus logros y lo que necesitan mejorar, y luego los gerentes escriben evaluaciones del desempeño de sus empleados. Sin embargo, si bien los gerentes pueden esforzarse por ser lo más meritocráticos posible, nuestras evaluaciones son imperfectas y, con demasiada frecuencia, sesgadas. Por inocua que parezca la forma típica, la investigación ha encontrado que a menudo permite que nuestros sesgos implícitos se cuelen. El problema es la «caja abierta». La mayoría de los formularios hacen preguntas generales a los gerentes sobre sus empleados y ofrecen un espacio en blanco que los gerentes pueden llenar con evaluaciones, consejos y críticas según lo consideren conveniente. Pero cuando el contexto y los criterios para realizar evaluaciones son ambiguos, el sesgo prevalece más. Afortunadamente, los investigadores también han demostrado que las personas pueden tomar medidas para reducir esa ambigüedad y ser más objetivos al llenar la caja abierta.


Para muchas empresas, la temporada de revisión del rendimiento comienza con el nuevo año. Aunque cada organización depende de un proceso de evaluación diferente, la mayoría sigue un patrón predecible: en primer lugar, invitan a los empleados a escribir sobre sus logros y lo que necesitan mejorar. Luego, los gerentes escriben evaluaciones de su trabajo, ofrecen comentarios y califican su desempeño en una escala de cuán bien cumplieron las expectativas.

La base de este proceso es la creencia de que al reflexionar sobre el desempeño de las personas y codificarlo en un formulario de evaluación, podremos evaluar sus méritos de manera objetiva, recompensar de manera justa y ofrecer comentarios útiles para ayudarles a desarrollarse el próximo año. Pero si bien podemos esforzarnos por ser lo más meritocráticos posible, nuestras evaluaciones son imperfectos y con demasiada frecuencia sesgados.

Por inocua que parezca la forma típica, nuestra investigación ha encontrado que a menudo permite que nuestros sesgos implícitos se cuelen. El problema es la «caja abierta». La mayoría de los formularios hacen preguntas generales a los gerentes sobre sus empleados, por ejemplo, «Describir las formas en que el desempeño del empleado cumplió sus expectativas» o «¿Cuáles son sus logros significativos?» y ofrecer un espacio en blanco o una caja abierta que los gerentes puedan llenar con evaluaciones, consejos y críticas según lo consideren conveniente.

La ambigüedad de estas preguntas es por diseño: son generales y abiertas precisamente porque deben aplicarse a todos los miembros de la organización, independientemente de su nivel o función. Por lo tanto, cuando el formulario indica «Describe las formas en que el desempeño del empleado cumplió tus expectativas», se espera que los gerentes recuerden o averigüen por sí mismos cuáles eran las expectativas específicas para ese empleado en particular.

El problema es que cuando el contexto y los criterios para realizar evaluaciones son ambiguos, el sesgo prevalece más. Tantos estudios han demostrado, sin estructura, que es más probable que las personas confíen en el género, la raza y otros estereotipos a la hora de tomar decisiones, en lugar de elaborar evaluaciones cuidadosamente utilizando procesos y criterios acordados que se aplican de manera coherente a todos los empleados.

Y si bien la ambigüedad abre la puerta al sesgo, nuestra investigación muestra que las personas pueden tomar medidas para reducir esa ambigüedad y ser más objetivas al llenar la caja abierta.

Caja abierta = abierta al sesgo

Nuestro equipo de investigación del Laboratorio de Liderazgo Femenino de VMware de Stanford llevó a cabo estudios en profundidad de los procesos de evaluación en tres empresas con sede en EE. UU. Descubrimos patrones de ambigüedad en la forma en que se escriben las revisiones del desempeño que pueden llevar a una desventaja para las mujeres.

Al analizar las revisiones de desempeño escritas de hombres y mujeres, descubrimos que las mujeres tenían más probabilidades de recibir retroalimentación vaga que no ofrecían detalles concretos de lo que habían hecho bien ni de lo que podían hacer para avanzar. Es más probable que a las mujeres se les diga, por ejemplo, que «trabajen más en persona» sin ninguna explicación sobre el tema que hay que superar ni el objetivo del cambio. Los hombres tenían más probabilidades de recibir evaluaciones más largas que se centraban en sus habilidades técnicas, en comparación con las evaluaciones más breves para las mujeres que estaban más preocupadas por sus habilidades de comunicación.

A continuación observamos algunos discusiones sobre rendimiento en dos empresas en lo que se conoce como reuniones de «calibración» o «revisión de talentos». En estas sesiones, los líderes tienen un período de tiempo fijo (por ejemplo, tres minutos) para justificar la calificación de un empleado y, a continuación, discuten y alinean sus calificaciones. Al igual que con las revisiones escritas, estas presentaciones orales tuvieron un amplio grado de variación en lo que se trató.

En algunos casos, la conversación se centró en los logros y fortalezas del empleado. En otros, se ofreció una visión equilibrada que incluía oportunidades de mejora. Las personas variaban en cuanto a qué criterios eran importantes o valorados, y estos patrones de varianza a menudo seguían expectativas de género. La mayoría de las críticas a las personalidades de las mujeres se referían a ser demasiado agresivas, donde la mayoría de los hombres se referían a ser demasiado blandos.

El formato informal permitió a los líderes anular las presentaciones de los demás con frases sencillas como: «El estilo no importa. Es genial y es irrelevante». Y la falta de estructura dio lugar a revisiones muy diferentes que tendían a favorecer a los hombres, describiéndolos de manera que se alineaban con el liderazgo y les proporcionaban el entrenamiento que necesitan para avanzar, a la vez que ofrecen a las mujeres menos elogios y menos orientación práctica con la que trabajar.

Este tipo de variaciones en las evaluaciones no sorprendió a muchos directivos. En un proyecto, solo el 15% de las mujeres y el 24% de los gerentes masculinos tenían confianza en el proceso de evaluación del desempeño, mientras que la mayoría lo consideraba subjetivo y muy ambiguo.

«Restringir» la caja abierta

A la una sitio, exploramos cómo el equipo podría solucionar la ambigüedad en su gestión del rendimiento. Estuvimos de acuerdo en que una revisión de su sistema de evaluación del desempeño no era la respuesta. Un nuevo sistema no cambiaría necesariamente la forma en que los gerentes escriben las evaluaciones de manera diferente para los hombres que para las mujeres. En cambio, identificamos un conjunto de acciones discretas que los gerentes podrían tomar para que sus evaluaciones sean más justas y efectivas.

Dado que las cajas abiertas en los documentos de revisión del desempeño invitaban a sesgar, buscamos formas de exigir especificidad en las evaluaciones de los gerentes. Con la aportación de los gerentes, creamos una lista de verificación para ayudarles a hacer referencia de forma coherente a datos específicos y predeterminados al llenar las casillas abiertas. En primer lugar, preguntó «¿Ha recopilado las siguientes evidencias/datos de este empleado durante los últimos 6 meses?» para asegurarse de que se recopilaran datos comparables para todos los empleados. Luego, la lista de verificación pedía a los gerentes que utilizaran los mismos criterios para todos los empleados, pidiéndoles: «Al escribir sus evaluaciones, ¿consideró lo siguiente (criterios previamente acordados)?»

Guiados por estas preguntas, los gerentes pudieron ofrecer comentarios más específicos y basados en pruebas a sus empleados. Al final de nuestro compromiso, el 90% de los directivos nos dijeron que creían que el proceso les había ayudado a ser más coherentes y justos. También se sentían más seguros; uno nos dijo: «Antes de perderme, lo admito. Ahora tenía criterios claros y juzgaba a todos por igual».

En otro sitio, cuando los directivos aplicaban sistemáticamente sus criterios a los empleados, se redujeron las brechas de género en las calificaciones, eliminando la representación excesiva de los hombres en la categoría de alto desempeño y de las mujeres en el medio.

También puede hacer que sus revisiones de desempeño sean más justas y coherentes, incluso si su organización no cambia el formulario de evaluación. Aquí hay tres cosas pequeñas, simples pero impactantes, que puedes hacer para «restringir» la caja abierta:

Cree una rúbrica para las evaluaciones. Los gerentes suelen informar que comienzan a escribir sus evaluaciones sin antes revisar los objetivos originales de sus empleados ni establecer una metodología para garantizar que las evaluaciones sean justas. Un eficaz rúbrica define en primer lugar los criterios con los que se evaluará el desempeño del empleado. Luego, requiere tomar pruebas de los resultados del empleado para evaluar si cumplieron o no las expectativas.

Al crear primero una rúbrica y luego rellenar la caja abierta con su evaluación y comentarios, será menos propenso a verse influenciado por sus reacciones intestinales. Investigación muestra que cuando aceptas por primera vez los criterios utilizados en la evaluación y luego haces la evaluación, es menos probable que dependas de estereotipos y que tus evaluaciones son menos sesgadas.

Crea mejores mensajes . Al escribir reseñas, los gerentes a menudo varían en cuanto a lo que cubren, cuánto escriben e incluso cuán específicos o vagos son los comentarios. Puede ser tentador pensar que esta variación refleja el desempeño real del empleado («¡Es genial! Por supuesto que tengo mucho que decir sobre él.»), cuando en realidad podría ser un sesgo implícito en la acción. Los mejores avisos pueden ayudarte a abordar cada revisión de manera similar, asegurando que todos sean evaluados y considerados de manera coherente e igualitaria. Realice la pregunta: «Describa las formas en que el desempeño del empleado cumplió sus expectativas». Para ser más justo y coherente, podrías pedirte que identifiques tres resultados específicos y medibles para cada uno de tus empleados.

Ejecute una comprobación de coherencia. Acostúmbrese a releer todas las reseñas para garantizar la coherencia. Incluso si ha aclarado los criterios y creado listas de verificación para guiar sus evaluaciones, es posible que siga siguiendo patrones que sean más favorables para algunos empleados. Si busca uniformidad, o patrones de variación, puede encontrar formas adicionales de eliminar el sesgo.

Impulsar el rendimiento diario

Limitar la caja abierta puede ser una herramienta para las evaluaciones formales del desempeño, pero también durante las interacciones cotidianas. En una empresa tecnológica mediana, compartimos este enfoque para bloquear el sesgo con un grupo de gerentes. Un gerente de desarrollo vio instantáneamente cómo esto se aplicaba a sus reuniones individuales semanales con su equipo. A menudo hacía preguntas abiertas sobre qué apoyo necesitaba cada persona. Tras reflexionar, el gerente se dio cuenta de que los hombres solían pedir su apoyo en cuestiones técnicas, mientras que las mujeres a menudo piden orientación para interactuar eficazmente con sus equipos.

Esta variación en la retroalimentación podría llevar a que los hombres y mujeres de su equipo desarrollaran diferentes conocimientos especializados, pero también a diferentes trayectorias profesionales. Lo que necesitaba era que cada empleado fuera ambos un experto técnico y un líder de equipo competente. Como resultado, dijo que ya no utilizaría preguntas amplias y abiertas, sino que indicaría específicamente a sus empleados sobre cuestiones técnicas y de gestión.

Lo que el director de desarrollo (y las muchas personas con las que hemos contratado) aprendieron es que la ambigüedad en las evaluaciones puede llevar a sesgos. Aprovechan esta información y encuentran formas de utilizar las rúbricas y las indicaciones para ser coherentes y justos. Puede ser tentador pensar que podemos confiar en nuestros instintos. Pero el desafío es que el sesgo implícito se cuelan, y es realmente difícil de ver y, por lo tanto, detenerlo en seco. Estas tres estrategias aparentemente simples son poderosas precisamente porque nos ayudan a evitar nuestras impresiones imperfectas y a menudo comprometidas, y a cumplir nuestra intención de ser justos con todos.