-->

miércoles, 4 de diciembre de 2013

Comparación de medias

Hay distintos tipos de comparación de medias según las características de nuestras variables y la procedencia de nuestras muestras. La prueba T de Student es el estadístico usado para realizar el contraste de nuestras hipótesis. De modo genérico, cuando hablemos de comparación de medias, la hipótesis inicial será que nuestras variables son independientes entre sí, es decir, que las medias de la variable dependiente son iguales para los distintos grupos de la variable independiente. La hipótesis alternativa será que las medias son diferentes entre sí.

Prueba T para muestras independientes: Es la prueba que usaremos en la mayor parte de las ocasiones cuando trabajemos con datos de encuesta. Mediante este procedimiento compararemos la media que adopta una variable continua para las categorías de otra variable categórica-dicotómica. Si la variable categórica tiene más de dos categorías de respuesta deberemos usar la ANOVA o análisis de la varianza. Para llevar a cabo la comparación de medias de muestras independientes, los individuos de ambos grupos, de ambas submuestras, han de haber sido seleccionados de manera aleatoria.

Prueba T para muestras relacionadas: Se utiliza cuando las muestras no son independientes, sino que están relacionadas, por ejemplo cuando tenemos información de una misma muestra en dos momentos distintos. Las muestras están relacionadas puesto que las respuestas de un individuo a una pregunta están relacionadas con las respuestas que da ese mismo individuo a la misma pregunta en un momento diferente. Esta prueba resulta algo más rara en ciencias sociales, ya que normalmente no contamos con dos mediciones iguales para una misma muestra.

Prueba T para muestras independientes:

Requisitos:

Ya hemos visto que este estadístico se utiliza cuando tenemos una variable continua y otra categórica con dos categorías de respuesta. Además, hemos visto que las muestras deben ser independientes entre sí y haber sido seleccionadas de manera aleatoria, requisito que suelen cumplir todas las encuestas diseñadas para ser representativas de una población.

Procedimiento:

Ahora vamos a ver cómo calcular e interpretar dicha comparación de medias. Para ver si las diferencias obtenidas en nuestra muestra, es decir las diferencias de medias que muestran nuestros datos, son representativas de la población de estudio usaremos la prueba T de Student, cuya distribución alcanza valores similares a la normal cuando se trabaja con muestras grandes con muchos grados de libertad. Antes de estudiar la relación entre las medias de nuestros subgrupos hemos de saber si podemos asumir varianzas iguales para estos grupos, ya que el cálculo del estadístico variará en función de este supuesto.

Para ello, antes de realizar el test de medias, necesitamos realizar otro contraste en el que la hipótesis inicial será que las varianzas de nuestros grupos son iguales y la alternativa que son diferentes.

Para no perdernos vamos a ir viendo paso a paso como realizamos una comparación de medias. Para ello, vamos a utilizar un ejemplo extraído de la tercera oleada de la encuesta mundial de valores, año 2000. Aunque la encuesta realiza el estudio en muchos países, nosotros hemos filtrado los resultados solo para los casos de España. Por ejemplo, si queremos saber si existe diferencia entre lo que opinan del aborto hombres y mujeres deberíamos usar una comparación de medias para muestras independientes. Nuestras variables serían sexo y justificación del aborto, que está medida en una escala de 1 a 10 y que, por tanto, podemos considerar métrica, según se acostumbra en investigación social.

Como siempre, el primer paso es examinar nuestras variables y eliminar del análisis los casos perdidos. La variable justificación del aborto se pregunta de la siguiente manera “Dígame, por favor, para cada una de las siguientes cosas, si piensa que siempre se puede justificar, si no puede ser justificada o que está entre un extremo y otro, utilizando esta tarjeta” (la tarjeta presenta valores desde el 1 hasta el 10).

Cómo se pide en SPSS:

En el menú análisis, seleccionamos comparación de medias y prueba T para muestras independientes. La variable cuantitativa la colocamos en variables a contrastar, mientras que la variable dicotómica la colocamos en variable agrupación. Cuando tenemos activa esta variable debemos pinchar sobre definir grupos. Se abre otro menú en el que debemos especificar los grupos que queremos comparar. En nuestro caso, queremos comparar hombres, codificados con un 1 y mujeres, codificadas con un 2. Ya estamos listos para generar nuestro análisis.

Análisis



La primera tabla nos muestra las características principales de nuestros grupos. Hay 603 mujeres con una media de 4,53 y una desviación típica de 3,001. Mientras que hay 574 hombres con una media de justificación del 5,11 y una desviación típica de 2,992. Por tanto, a simple vista los hombres son ligeramente más tolerantes que las mujeres en lo que al aborto se refiere, al menos según los datos de nuestra muestra. Para ver si estas diferencias son aplicables a la población general y no son simplemente consecuencia de las diferencias de nuestra muestra usamos la prueba T.



En la segunda tabla tenemos la prueba de igualdad de medias. Como hemos dicho anteriormente, la T de Student se calcula de manera diferente dependiendo de si se ha asumido que los grupos, hombres y mujeres, tienen una misma varianza o no. En este enlace se puede ver cómo calcular la T de Student en los dos supuestos. La prueba de Levene para igualdad de varianzas, que SPSS saca por defecto, realiza dicho contraste. El nivel de significación es de 0,163, como el valor es mayor que 0,05 no podemos rechazar la hipótesis nula y por tanto asumimos que ambos grupos tienen una varianza similar. Gracias al test de Levene, sabemos que debemos mirar en la primera fila del estadístico T cuando se asumen varianzas iguales. La tabla dice que nuestro estadístico t vale 3,333 con 1.175 grados de libertad. Conocido el estadístico y los grados de libertad podemos calcular el valor de p, es decir el coeficiente de significación, acudiendo a la tabla de la distribución de Student. Cuando hay muchos grados de libertad, la distribución de Student es igual a la normal. Por supuesto, SPSS trabaja por nosotros y nos dice que la significación bilateral, el valor de “p”, es igual 0,01. Al ser inferior a 0,05, rechazamos la hipótesis inicial de igualdad de medias y decimos que las diferencias de medias halladas en nuestra muestra son aplicables a la población de estudio, en este caso, la población española. Por tanto, de nuestro análisis de medias se desprende que los españoles en general tienen un nivel medio de tolerancia ante el aborto y que dicha tolerancia es ligeramente mayor entre los hombres.

No hay comentarios:

Publicar un comentario