J.A. LLEBRÉS: Validación de Experimentos

Se experimenta día a día con tecnología, medicamentos (hoy más que nunca), arquitectura, materiales y un largo etcétera pero ¿cómo se valida un experimento?, ¿cómo se asegura su objetividad al repetirlo? La validación de un experimento se realiza mediante la aplicación de lo que se denomina coeficiente de validez, a través de la correlación entre dos series de resultados: el del experimento y el de la prueba de comprobación. Así, un alto coeficiente de correlación en la validez de un experimento nos permitirá predecir un tipo de conducta partiendo únicamente de la aplicación del experimento. La correlación R es la correspondencia más o menos importante entre dos valores basada en un conjunto de cálculos de aplicación estadística.

Se estima la siguiente tabulación para los distintos valores de R (la correlación se evalúa entre 0 y 1):

-menos de 0.69 => R es baja o dudosa

-de 0.69 a 0.74 => R es moderada o débil

-de 0.75 a 0.84 => R es aceptable o buena

-de 0.85 a 0.94 => R es alta o muy buena

-de 0.95 a 0.99 => R es excelente

Una correlación R = 1 es perfecta y significa que las dos variables medidas se corresponden de forma absoluta en sus valores y variaciones.

Se pueden distinguir distintos tipos de validez:

1) De contenido o lógica: se expresa cuando el experimento representa el mejor criterio para evaluar la capacidad en estudio y se basa en el análisis de los casos que integran la prueba, su grado de dificultad, su estabilidad para medir lo pretendido y la relación con el objeto de la evaluación.

2) Predictiva: está en relación con el grado de probabilidad que presenta un experimento para predecir cuál será un resultado futuro de un individuo en relación a una determinada conducta o capacidad. Como norma general, este tipo de comprobación requiere mucho tiempo ya que es necesaria una amplia serie de medidas.

3) Empírica o referida a los criterios: puede realizarse poniendo en correlación los valores del experimento con los de otro experimento conocido ya validado (denominado prueba paralela) o poniendo en correlación los valores del experimento con un criterio exterior, como una competencia.

4) Factorial: se utiliza para la comparación entre experimentos. Si la correlación es alta (según la tabla anterior, entre 0.85 y 1), ambos experimentos tienen una alta correspondencia y si la correlación es baja o nula (menos de 0.69) cada experimento mide un aspecto diferente.

Por tanto, ha de buscarse una prueba de evaluación objetiva que no dependa de la persona u objeto que realiza el experimento y esta objetividad debe prevalecer en la construcción, aplicación, explicación, descripción e instrucciones de la realización del experimento. También ha de verse reflejada en que los grados de valoración del rendimiento obtenidos en las pruebas dependen de si la prueba en sí misma es objetiva o cuándo incide más la interpretación.

Lo más conveniente para corroborar la objetividad de un experimento es realizarlo con, al menos, dos equipos de evaluadores diferentes y en intervalos de tiempo reducidos aunque, dependiendo de la naturaleza del experimento, se puede dilatar más o menos el tiempo. Si se consigue un coeficiente de correlación que muestre una R cercana al 1 entonces los resultados obtenidos serán análogos obteniendo así un alto grado de objetividad del experimento.

Los criterios de calidad principales para la realización de un experimento (validez y objetividad) vienen acompañados de una serie de criterios secundarios, aunque no por ello carecen de importancia:

a) Normalización: consiste en transformar el valor del experimento a una ubicación con relación a una norma estadística. Se llega así a la realización de escalas de medidas que se elaboran a través de estudios estadísticos con el objetivo de la confección de las normas. La idea es obtener un elevado número de elementos que realicen el experimento para así poder, a través de la estadística (en concreto, de los teoremas de Lindenberg-Levy, la Ley Débil de los Grandes Números y la Ley Fuerte de los Grandes Números), "normalizar" los resultados obtenidos, esto es, que se distribuyan según la Distribución Normal con media y desviación típica conocidas.

b) Estandarización: para que sea válida la comparación de resultados recogidos sobre diferentes grupos objeto de estudio o sobre el mismo grupo objeto de estudio pero en períodos diferentes, es necesario estandarizar las técnicas de administración del experimento. Una pequeña variación en las reglas de realización de una prueba pueden alterar el resultado y su valoración posterior.

c) Economización: se considera un experimento económico aquel que sea realizable en poco tiempo, que precise poco material y maquinaria y que pueda ser interpretado fácilmente sin muchos cálculos.

d) Utilidad: se considera útil un experimento que analice una conducta o capacidad para cuyo conocimiento existe una necesidad práctica y un auténtico interés de conocimiento.

e) Probabilidad: el experimento debe ser realizado con éxito por un porcentaje elevado de personas u objetos que estén capacitados para su desempeño.

El rigor debe superar a la opinión cuando de experimentar se trata, y espero que sirva esta entrada para clarificar cómo se ha de regular la realización (seria) de un experimento.

jueves, 21 de enero de 2021

Validación de Experimentos