domingo, 25 de agosto de 2013

Los 4 niveles de evaluación de Kirkpatrick, revisitados

Foto: Egidio Levendale - Flickr
Donald Kirkpatrick tiene el modelo de evaluación de la capacitación más ampliamente utilizado en el mundo. Publicado primero a fines de los años 50, con el tiempo se ha convertido en un clásico y en un referente obligatorio. Éste identifica cuatro niveles independientes pensados como una secuencia de maneras para evaluar un programa de entrenamiento:
1. Reacción
2. Aprendizaje
3. Conducta
4. Resultados
Lo anterior no significa que sea igualmente aceptado por todos. Entre las críticas que se le han planteado están que se presta a simplificaciones y malos entendidos, por ejemplo cuando se trata de diferenciar entre los niveles 2 y 3. A pesar de ello, las taxonomías alternativas no han tenido éxito en reemplazar un modelo ya cumple 54 años.
En 1997, un grupo de 4 profesores liderados por George Alliger preparó un artículo para la Armada de Estados Unidos planteando una mejora en el famoso modelo. Para ello, mantuvo en general los niveles incorporando algunos subniveles y precisando algunos conceptos. La propuesta contiene lo siguiente:

Original
Modelo aumentado
Reacciones

Reacciones
  •       Afectivas: la más frecuente forma de evaluación, pregunta por la satisfacción con la actividad. Se suele recopilar a través de encuestas al terminar el entrenamiento. Es importante debido a que los entrenados son uno de los “clientes” de la capacitación, y porque su opinión influye en variables relevantes como la asistencia futura, la publicidad “boca a boca” de otras actividades, financiamiento del área de entrenamiento, etc.
  •      Juicios de utilidad: busca identificar la utilidad percibida del entrenamiento para el desempeño laboral posterior; pregunta por la relevancia, el valor práctico y si la capacitación afectará la habilidad para desempeñarse en el puesto.

Aprendizaje
Aprendizaje
  •       Conocimiento inmediato: Mediciones realizadas generalmente utilizando test tradicionales, como pruebas de selección múltiple, preguntas abiertas
  •       Retención de conocimiento: Mediciones realizadas un tiempo después del entrenamiento, similares a las anteriores en cuanto al método, sólo que realizadas un tiempo después
  •       Demostración de conducta o habilidad: Incluye indicadores de competencia o de cambio conductual cuando son medidas durante el entrenamiento. Esto incluye simulaciones, juegos de rol, puntajes o notas en clases centradas en el desempeño del puesto de trabajo

Conducta
Transferencia
Implica conducta en el trabajo; la medición ocurre no sólo después del entrenamiento, sino que hace referencia a un aspecto cuantificable del puesto. Puede incluir muestras de trabajo u outputs de diferente tipo.
Resultados
Resultados
Implica un impacto organizacional; ganancias en la productividad, satisfacción de clientes, ahorros, rentabilidad, clima organizacional o satisfacción laboral (en el caso del entrenamiento de jefaturas).

Alliger continuaba un esfuerzo que había comenzado en 1989, cuando hizo un meta análisis de las relaciones entre los diferentes niveles de evaluación. En la segunda ocasión, aumentó la cantidad de estudios que establecían algún vínculo entre los diferentes niveles de Kirkpatrick, llegando a 34. Algunos hallazgos que se derivan del artículo son los siguientes:
•        Los resultados muestran correlaciones modestas, en el mejor de los casos, entre los diferentes niveles. Las más altas se obtienen al interior de cada nivel, lo que sugiere validez convergente que refuerza conceptualmente la taxonomía
•        Las evaluaciones de reacción basadas en aspectos afectivos, si bien son relevantes para efectos de gestión y como registro de la satisfacción tienen una baja utilidad para predecir transferencia o aprendizaje
•        Las evaluaciones de reacción basadas en la utilidad no tienen correlaciones de importancia con el aprendizaje inmediato, sin embargo sí correlacionan moderadamente con transferencia.
•        Las mediciones de aprendizaje basado en demostraciones de habilidad correlacionan con la transferencia en una magnitud similar a las mencionadas. De esta forma, el aprendizaje conductual no predice mejor la aplicación en el puesto, comparado con las medidas de reacción basadas en la utilidad
•        Debido a la baja correlación entre las medidas de reacción y el aprendizaje inmediato, no debiera considerarse que las evaluaciones de nivel 1 reemplazan la medición del aprendizaje de nivel 2
•        La escasez de estudios sobre el impacto de resultados no permite establecer su relación con el resto de los niveles. Son necesarias más investigaciones al respecto
•       Recomiendan recoger información de reacción multifuente, incorporando la opinión de pares y supervisores, así como recoger información en el tiempo (1, 3 y 6 meses después del entrenamiento).

El meta análisis de Alliger es el esfuerzo más grande realizado en clarificar la relación entre los diversos niveles de evaluación de la capacitación y, aun así, desnuda que el conocimiento sobre el tema sigue siendo parcial y necesita muchas más horas de dedicación.



Alliger, G. & Tannenbaum, S. & Bennett, W. & Traver, H. & Shotland, A. (1997) A meta-analysis of the relations among training criteria. Personnel Psychology 50 (2): 341-358