Estimados todos, bienvenidos a otro maravilloso capítulo de Stats SOS. En este caso, seguiremos surcando los caminos de la regresión logística, pero en este caso, nos enfocaremos más en la interpretación. Como vimos en el post anterior, a veces la regresión logística puede ser algo complicada de interpretar. Por ello, es que les traigo esta pequeña aventura que nos describirá brevemente las diversas maneras de interpretar el mismo resultado.
En ese caso, el objetivo de hoy es describir diversas formas de interpretar los resultados de una regresión logística. ¡Muy bien! ¡Aquí vamos! Bueno, como ustedes bien saben, en el post pasado sobre regresiones logísticas, analizamos cuál era la probabilidad que una persona consumiera alcohol en el último mes tomando en cuenta el sexo y si la persona había fumado cigarrillos o no en el último mes. Luego de analizar los resultados obtuvimos múltiples tablas pero para efectos de este ejemplo sólo analizaremos las que tienen resultados concretos.
¡Excelente! ¡Sigamos adelante! El primer resultado que obtuvimos fue el siguiente:
En este caso, en el post anterior realizamos al siguiente interpretación: “en promedio, existe 14.763 veces la posibilidad que una persona haya consumido alcohol en el último vez a que no lo haya hecho”. Pero…¿que pasaría si yo quisiera decir esto por cantidad de personas? ¿Lo podría decir usando porcentajes? ¿Quizás podría usar probabilidades? ¡Claro que sí! Es posible analizar el mismo dato utilizando todas las formas: así les haré un pequeño listado de cómo se interpretaría si utilizara todo lo mencionado previamente:
Por cantidad de personas:
“En promedio, por cada 10 personas que no consumen alcohol en el último mes, 140 sí consume alcohol en el último mes”. ¿Difícil? ¡No hay problema vamos a porcentajes!
Utilizando porcentajes:
Primero tenemos que hacer el cálculo del porcentaje: 14.763 – 1 = 13.763*100
“En promedio, existe 1376% más posibilidad que una persona haya consumido alcohol en el último mes que no haya consumido” Asu…¡No! El porcentaje está demasiado difícil…mejor vamos a probabilidades.
Probabilidades:
Para ello, antes tenemos que transformar los OR (recuerden los OR son Odds ratio y en la tabla están expresados como “EXP(B)”). Por eso, debo hacer el siguiente cálculo:
Probabilidad = 14.763 / 1+ 14.763 = 93%
¡Genial! La interpretación de esto sería la siguiente:
“En promedio, existe una probabilidad de 93% que una persona haya consumido alcohol en el último mes a que no lo haya hecho”.
¿Hasta ahí todo bien? ¡Muy bien! Sigamos adelante, ahora pasemos a interpretar ya no el promedio general de consumo de alcohol en el último mes sino las diferencias entre sexo. Aquí les pongo el cuadro con el que nos aventuramos previamente: Recuerden, en este caso el grupo de referencias son los hombres, entonces el valor de la tabla es el que se le asignan a las mujeres.
Por cantidad de personas:
“En promedio, por cada 100 hombres que han consumido alcohol en el último mes, 96 mujeres han consumido alcohol en el mismo mes”.
Utilizando porcentajes:
Primero tenemos que hacer el cálculo del porcentaje: 1-.965 = 0.035*100 = 3.5%.
“En promedio, existe 3.5% menos posibilidad que una mujer consuma alcohol en comparación de un hombre en el último mes”.
Probabilidades:
Nuevamente, al igual que la oportunidad pasada, debemos hacer el cálculo:
Probabilidad = .965/1 + .965 = 49%.
¡Perfecto! ¡Ahora que tenemos la probabilidad viene la interpretación!
“En promedio, existe 49% de probabilidad que una mujer haya consumido alcohol en el últimos mes en comparación de un hombre”.
Bueno queridos amigos de la vida, eso sería todo por hoy. Como ven, existen múltiples maneras de interpretar una regresión logística, la idea acá no es confundirlos sino al contrario, darles múltiples herramientas para que ustedes puedan interpretar como mejor les parezca y sea más comprensible, este análisis. Recuerden de poner like en Facebook seguirnos en Twitter, seguirnos acá en el blog del estadística y obviamente dejar sus maravillosos comentarios. ¡Qué les vaya excelente!
Juan Carlos hola!! Una pregunta,
Cuando se tiene una variable continua como predictora, cómo se interpreta el resultado? Por ejemplo, tengo una variable A (lenguaje sencillo) que se mide en una escala del 1 al 5 y otra variable B (interés) que es dicotómica. El log odds de esa variable es de 1.51 y, por tanto, la probabilidad, de .60. ¿Cómo se leería el resultado de manera muy concreta? Podría ser: Por cada punto adicional en la variable lenguaje sencillo, la probabilidad de tener interés en el producto aumenta en 60%? Mi duda es, qué pasa si aumenta 2 puntos; la probabilidad aumenta en 120%?
Muchas gracias por tu ayuda!!
LikeLike