Estimados todos, bienvenidos a un nuevo capítulo de Stats SOS, en esta pequeña aventura veremos qué significa la interacción en estadística.
Si bien este es un tema conceptual que luego se lleva a la práctica creo que es importante dedicarle un post debido a que en nuestros análisis nos toparemos con muchas situaciones donde dos variables interactúan entre ellas.
En ese caso, y yendo al punto, el objetivo de este post es describir de manera sencilla la interacción entre dos variables estadísticas.
En la vida diaria, nosotros solemos interactuar con personas todos los días. Es más, la definición de interacción es algo como “ejercer una acción o relación recíproca de dos o más personas o cosas”. Lo mismo ocurre en estadística la única diferencia es que además de esta relación, esto se puede ver matemáticamente.
Mas adelante, veremos que la interacción se toma muy en cuenta cuando se hacen análisis con dos o más variables. Algunos ejemplos de estos análisis los veremos luego como son el ANOVA de dos vías y la regresión multiple.
¡Muy bien! Vamos a lo nuestro, primero, ya sabemos que la interacción describe la relación recíproca entre dos personas o cosas. En estadística, la interacción es la relación recíproca entre dos variables. En otras palabras, estas variables suelen tener algo en común o están relacionadas y tienen algo de varianza compartida (covarianza). Los que no recuerdan qué es una varianza, siempre pueden regresar a este post que podría ayudarlos a refrescar la memoria. Además, si desean saber qué es una relación estadística, este post también puede ser de ayuda.
Vamos a un ejemplo ficticio, imagínense que quieren saber qué efecto tiene la edad y el nivel educativo en el salario que uno obtiene en la actualidad. Muy bien, en ese caso tenemos tres variables: a) Edad, b) Nivel educativo y c) Salario.
¡Muy bien! ¿Hasta ahí va todo bien? ¡Perfecto, sigamos! Luego de recoger la información, analizamos nuestra data y nos damos cuenta, que por un lado la edad y por otro lado el nivel educativo, tienen un efecto en el salario que uno obtiene. ¡Excelente! Estamos felices y contentos, apagamos la computadora y nos vamos a celebrar.
Sin embargo, en medio de nuestra celebración les contamos a nuestros amigos nuestro trabajo y una interesante discusión aparece. En esta, una amiga que también está interesada en conocer el salario del campo laboral nos pregunta, ¿Pero, no habría la posibilidad que a mayor edad la persona tenga mayor nivel educativo y eso influya en el salario?
En ese momento, una idea en nuestra mente aparece y pensamos, ¡Sí, es posible que eso ocurra! En otras palabras, es posible que haya una interacción entre edad y el nivel educativo de una persona y esta pueda afectar en el salario. En ese caso, al día siguiente volvemos a correr el análisis y nos percatamos, que era cierto, no solo existe un efecto de la edad y el nivel educativo en el salario, sino que estas variables interactuando conjuntamente también tienen un efecto en el incremento del salario.
En estadística, esta interacción es representada como una multiplicación. En sencillo y siguiendo nuestro ejemplo, en la pantalla de la computadora verán edad*nivel educativo. En términos técnicos, como se mencionó previamente, esto significa que ambas variables están relacionadas entre sí y tienen algo de varianza compartida. Si desean profundizar en esta idea les recomiendo ir a este post sobre correlaciones que les puede dar más luces sobre la relación de dos variables.
¡Muy bien! Creo que eso sería todo por hoy, si bien este post ha sido más de carácter teórico, verán que más adelante el concepto de interacción cobrará bastante importancia cuando hagamos análisis con muchas variables. ¿Por qué? Porque es importante saber si es que las variables que ponemos en nuestros análisis son independientes entre sí o si están relacionadas (interactúan).
En otras aventuras, veremos cómo la interacción estará presente. En algunos casos esta puede resultar una dificultad para nuestro análisis (ejemplo: en la regresión lineal múltiple) y en otros puede ser de gran utilidad (ejemplo: en el ANOVA de dos vías).
¡Espero que todos estén muy bien! Les deseo muchos éxitos. ¡Buenas vibras!
Bibliografía recomendada
Tabachnick, F., & Fidell, L. (2013). Multivariate statistics. Pearson. NY.
Hola Juan Carlos! Quería agradecerte por tu página, en verdad está muy buena y me está ayudando bastante en mi trabajo, la información está sencilla y precisa! Espero futuros post sobre No parametricas, por favor!! gracias!!
LikeLike
Hola Daniel! Me alegra mucho que mi página esté siendo de utilidad para ti. Si bien tenía planeado hacer análisis No paramédicos mucho después podría hacer una excepción y poner los más sencillos para en lugar de trabajar primero con todo los paramétricos y luego no paramétricos presentar de manera paralela.
Eres la segunda persona que ya me los pide así que creo que es importante presentarlos.
¡Gracias a ti!
¡Buenas vibras!
LikeLike
Pingback: Dos caminos, un destino: el ANOVA de dos vías | Stats SOS
Sería genial Juan Carlos! Al menos la noción básica de cómo usarlos, sino igual estaré a la espera para más adelante! Felicitaciones y sigue adelante!
LikeLike
Hola Daniel,
No te preocupes. En su momento (pronto), voy a poner diferentes técnicas no lineales (que a su vez son no paramétricas). Al comienzo pondré las más sencillas, los equivalentes de la t-student y el ANOVA pero cuando los datos no son parametricos y las variables no son de intervalo. Así que no te preocupes, llegará. ¡Muchas gracias por escribir!
¡Buenas vibras!
LikeLike
Estimado Juan Carlos,
Una pregunta: En caso de que se me presente una interacción significativa en un ANOVA de dos vías, ¿Es adecuado utilizar un método pos-hoc de comparaciones múltiples que me ayude a interpretar dónde ocurre la interacción (Tukey, LSD de Fisher, etc.)?
Muchas gracias por tu ayuda!
Saludos!!
LikeLike
Estimado Manuel,
Muchas gracias por escribir a Stats SOS.
La respuesta adecuada es sí, sería lo mejor.
Mucho éxito!
LikeLike