Queridos amigos, ¿cómo están? Espero que todo bien. Bienvenidos a un maravilloso capítulo de Stats SOS. En la aventura de hoy, presentaremos un post que vendría a ser la continuación del anterior. En esta oportunidad veremos el uso del post hoc, cuando se realiza un análisis de varianza o ANOVA.
En ese caso, el objetivo de la aventura de hoy es presentar y describir de manera muy sencilla el análisis de Post Hoc del ANOVA. En este caso, nos centraremos en dos análisis que son muy comunes, el Scheffe y el Games Howell.
Antes que nada, les pido que se relajen y no se asusten con los nombres, recuerden que estos análisis aparecen cuando un nuevo matemático descubre una nueva fórmula. Así que respiremos, tomemos algo caliente o una refrescante bebida helada y continuemos.
Como bien ya lo saben, el objetivo primordial del ANOVA es conocer si es que existe diferencia o relación entre múltiples grupos (variable categórica) y una variable de intervalo. Si esto les suena a una lengua oscura y escondida no hay problema, los posts de tipos de variables y del ANOVA podrán ayudarlos a refrescar su memoria. El problema que tiene el ANOVA es que no nos especifica qué grupos se diferencian entre sí. Por está razón se inventaron los análisis Post Hoc.
En ese caso, el objetivo de un análisis Post Hoc de ANOVA es conocer después de haber realizado un ANOVA qué relaciones específicas hay entre los grupos y la variable de intervalo que se quiere medir. En otras palabras, qué grupos específicamente se diferencian entre sí con respecto a nuestra variable de intervalo. ¿Suena traumático? ¡No hay problema! Vamos a un ejemplo para aclarar esta explicación.
En una investigación queremos saber si existe relación y hay diferencias entre el Autoconcepto entre cuatro grupos: presuntos sanos, personas con psicosis, personas con ansiedad generalizada y personas que tienen trastorno evitativo. Intuyo que las personas que siguen más la rama clínica estarán contentas con el ejemplo de hoy.
En ese caso, tenemos dos variables: variable A que serían los cuatro grupos de personas y variable B que vendrían a ser los puntajes de la prueba de Autoconcepto.
¡Muy bien! Ahora que tenemos todos los datos en el SPSS podemos proceder a hacer el análisis, para ello tenemos que seguir la siguiente ruta:
Analizar/Comparar medias/ANOVA de un factor/
En este caso, en la lista de dependientes es necesario poner la variable de intervalo en nuestro ejemplo el puntaje de Autoconcepto. Luego, en la casilla de factor, es necesario poner la variable que representan los cuatros diferentes grupos.
Si se fijan es la misma ruta que el post anterior, sin embargo, a la ruta previamente mostrada tenemos que agregar lo siguiente:
1) Hacemos click en el boton “opciones” y marcamos la casilla “descriptivos” y “Prueba de homogeneidad de las varianzas” (si esto les suena familiar, genial, sino siempre pueden ir aquí a ver qué significa esto). Luego continuar.
2) Hacemos click en el boton de “Post Hoc” y marcamos las casillas “Scheffe” y “Games Howell”. Luego en la parte de abajo verán una casilla vacía que dice “Nivel de significación”. Aquí es necesario poner el nivel de significacia que desean utilizar, por lo general, en las ciencias sociales se usa 5% de significancia así que tendrían que poner 0.05. Si esto no les suena familiar, ¡No hay problema! pueden ir a este post que les dará un pequeño recordatorio de qué significa el 0.05. Luego deben poner continuar y finalmente aceptar.
Entiendo que hay bastantes análisis de post hoc disponibles en esta pestaña, sin embargo, por motivos prácticos he decidido presentar los más utilizados. Si quieren mayor información sobre los otros análisis, siempre pueden dejar un comentario en la sección de abajo. (Ver comentario abajo).
¡Bueno! Ya estamos casi en la recta final, ¿Siguen aquí conmigo? ¡Espero que sí! Luego de todo lo realizado, deberían salir cinco tablas, pero por motivos prácticos solo pegaremos cuatro de ellas.
Tabla 1: Descriptivos
Esta tabla básicamente les da los estadísticos descriptivos como por ejemplo, la media o la desviación estándar de autoconcepto por cada uno de los grupos. Si no recuerdan qué son estos conceptos, ¡no se angustien! siempre pueden volver a este enlace para resfrescar su memoria.
Tabla 2 y 3: Prueba de homogeneidad de varianzas y la prueba ANOVA
Estas dos tablas nos dicen dos cosas muy importantes. Primero, la tabla 2 de homogeneidad de varianzas nos dice si es que las varianzas de los cuatros (uno por uno) son homogéneas (o iguales) o heterogéneas (diferentes). En este caso, por ser mayor a 0.05 la significación las varianzas son homogéneas. Si se fijan, esto es bien parecido a lo que hicimos cuando analizamos t-student. Esto es porque todos estos análisis están relacionados entre sí. Si no se fijaron, ¡todo bien! Un recordatorio de esto, pueden encontrarlo aquí.
Por otro lado, la tabla 3 nos muestra el análisis de varianza o ANOVA. En este caso, el ANOVA tiene una significación menor de 0.05, lo cual significa que podemos decir que sí existen diferencias en los puntajes de autoconcepto entre los grupos. El problema, ¡es que no sabemos entre quienes! Pero todo bien, eso lo veremos a continuación. Los que quieren mayor explicación sobre el ANOVA no hay problema, pueden hacer un viaje en el tiempo hacia este post y revisar lo que significa.
Finalmente, llegamos a la parte central de nuestro post de hoy.
Tabla 4: Análisis Post Hoc de Scheffe y Games Howell
Lamento que los números de la tabla se vean tan pequeños, pero no se preocupen, si hacen click en la imagen esta aparecerá en un tamaño fácil de leer.
La tabla 4 nos muestra los análisis de Post Hoc Scheffe y Games Howel. Primero lo primero, ¿Cuándo se debe usar cada uno? ¡Muy sencillo! ¿Recuerdan la tabla 2 de homogeneidad de varianzas? Bueno, esta tabla nos permite decidir cuál análisis usar. Si las varianzas son homogéneas es necesario utilizar Scheffe porque este estadístico está diseñado para esa situación. En cambio, si las varianzas son heterogéneas es necesario utiliza el análisis Games Howell. Ojo, pestaña y ceja, si escogen uno lo mejor es que se olviden del otro porque ambos están diseñados para situaciones distintas.
¡Muy bien! En este caso, tenemos que utilizar Scheffe porque las varianzas son homogéneas (ver tabla 2). ¿Qué nos dice esta tabla? Compara cada grupo, uno contra el otro. La primera columna aparecen todos los grupos que el SPSS los marca como “I” esto significa que es el grupo de referencia con el cual se quiere comparar. La segunda columna salen los grupos “J” que representan a cada uno de los grupos restantes.
Para darles un ejemplo, en el primer caso, la media de autoconcepto del grupo “Psicosis” se compara contra la media de autoconcepto de los grupos “Trastorno evitativo”, “Ansiedad generalizada” y “Presunto sano”. Los resultados de esta comparación aparecen en la tercera columna titulada “Diferencia de medias I-J”. ¿Qué diablos significa eso? Calma, respiren. Esa columna solo te da el resultado de: la media de autoconcepto del grupo con psicosis (I) – la media de autoconcepto del grupo con trastorno evitativo. Si es positivo, el resultado el promedio de autoconcepto del grupo con psicosis es más alto, si es negativo, el promedio del grupo con trastorno evitativo es mayor.
Ok, hasta ahí todo muy bonito, pero por favor, dime, ¡¿cómo sé si son significativas las diferencias?! Calma, respira, valiente lector, muy sencillo. Es necesario que veas la columna de la significación. Si la significación es menor a 0.05 entonces perfecto, las diferencias son significativas, entonces existen diferencias estadísticamente significativas entre las medias de esos dos grupos.
En el primer caso, podemos ver que la comparación entre el promedio de autoconcepto del grupo de Psicosis y el promedio de autoconcepto del grupo de trastorno evitativo tiene una significación de 1.00 (ver tabla 4). Esto significa que hay más de 5% de probabilidad (0.05) que los puntajes promedio de estos dos grupos sean iguales o casi iguales. Por ello, no hay diferencias significativas entre los promedios de autoconcepto de los grupos de psicosis y trastorno evitativo.
Por otro lado, cuando se compara psicosis y ansiedad generalizada y presunto sano, las significación en ambos casos es menor al 1% (0.00). Por ello, hay una probabilidad menor al 1% de que el promedio de autoconcepto del grupo con psicosis sea igual a los promedios de autoconcepto de los grupos de ansiedad generalizada y presunto sanos. Por ende, sí hay diferencias estadísticamente significativas.
¿Siguen aquí? ¿Están sanos y salvos? ¡Muy bien! Los felicito por haber llegado a la parte final, solo quedan dos cosas pequeñas por decir. Por un lado, si desean saber las medias de cada grupo para ponerlo en su reporte ¡no hay problema! Estas las pueden encontrar en su tabla de descriptivos.
Finalmente, podemos decir que sí existen diferencias significativas entre los puntajes de autoconcepto entre 3 de los cuatro grupos. Aquí no se encontraron diferencias entre los puntajes de autoconcepto entre los grupos de psicosis y trastorno evitativo. Sin embargo, sí se encontraron diferencias en el autoconcepto entre los otros grupos. El grupo con mayor promedio de autoconcepto fueron los presuntos sanos y el grupo con menor media fueron las personas con trastorno evitativo.
¡Muy bien! Ya solo faltan, 4 páginas de texto y terminamos. En realidad no, por el momento esto ha sido todo por hoy. Les agradezco mucho haber llegado hasta aquí. Entiendo que este post ha sido bien largo y tedioso, pero creo que era necesario darles las diferentes partes para que sea más fácil entender. Para el siguiente post he decidido virar un poco e ir a uno de los análisis más utilizados y centrales en la estadística básica. La correlación de pearson. Por lo pronto, es todo por hoy. Espero que estén muy bien. ¡Buen fin de semana para todos! ¡Buenas vibras!
Bibliografía recomendada
Miller Jr, R. G. (1997). Beyond ANOVA: Basics of applied statistics. CRC Press.
Hola Juan Carlos como estas? Gracias por los valiosos aportes de estadística. Te hago una consulta, en el caso de hacer una prueba chi cuadrado, podría utilizar el analisis post hoc de Games Howell para determinar cual fue el grupo que el que presentó la estadística más significativa?
Evalué por ejemplo en una muestra de alumnos de 1 a 5 año de la facultad una pregunta y lo hice con el test de chi cuadrado. Me dio como resultado, que era estadisticamente significativa.
Pero queria saber si con algún analisis post hoc puedo determinar la relacion mas significativa entre los grupos.
LikeLike
Hola Ana Laura,
Quizás con ese análisis podrías conocer que grupos tienen una mayor distancia entre sí.
Me cuentas si eso te ayuda.
Gracias!
LikeLike