Bueno, ya vamos unos cuantos posts sobre estadística y, como verán, hemos revisado una serie de términos básicos. Esto cada vez se pone un poco más complejo, pero no se preocupen, vamos poco a poco.
Lo más importante es aprender porque, al final del día, este blog es un espacio de aprendizaje para ustedes y para mí. Sus comentarios, preguntas y sugerencias me ayudan a enriquecer este blog y también mis conocimientos en general, por eso estoy muy agradecido con ustedes.
¡Muy bien! Tal como mencionamos en el post pasado, el objetivo de este post es hacer una breve y sencilla descripción sobre los intervalos de confianza. Antes de definirlos, citaré una frase que nos puede introducir al tema: “El único uso que conozco que tienen los intervalos de confianza es tenerles confianza”. L. J. Savage.
Aunque esta frase puede ser un poco drástica y exigente, tiene algo de cierto. Los intervalos de confianza así como el valor p, son estadísticos que pueden ser muy controversiales por una serie de razones. Más adelante, haremos breve mención de ello, pero en comentarios profundizaremos sobre esto.
Vamos a lo nuestro. Los intervalos de confianza, como su nombre lo dice es un intervalo o rango que tiene dos límites: el superior y el inferior. Entre esos valores se encuentra el nivel de confianza que es el espacio o rango que tenemos para que nuestros valores sean verdaderos, y por ende no cometamos ningún error de medición (ver post sobre tipos de error).
Por lo general, se utiliza un nivel de confianza de 95% para tener justamente 5% de margen de error (en este caso, es bastante parecido al valor p, que solo permite 5% de error). Quizás esto no es muy claro, mejor vamos a explicarlo con un ejemplo.
Queremos saber la diferencia de ansiedad en un grupo de estudiantes de escuela secundaria y compararlo con el promedio de ansiedad de todos los estudiantes del colegio. El grupo A, son estudiantes de un salón de clases que el profesor considera que son más ansiosos que el promedio de todo el colegio. Entonces, contrata a un grupo de investigadores para que hagan el estudio. Este grupo tiene como hipótesis que el grupo A tendrá mayor ansiedad que el promedio de todos los estudiantes o población del colegio. Entiendo que puede ser un ejemplo quizás algo trivial pero la idea es exponer en la práctica cómo es que funcionan lo intervalos de confianza.
El grupo A que son 30 personas tiene los siguientes puntajes:
(20,20,40,50,60,100,20,20,40,50,60,100, 20,20,40,50,60,100, 20,20,40,50,60,100, 20,20,40,50,60,100).
En ese caso, se calcula el promedio de ansiedad de los alumnos (48.33) y la varianza 772.98, (si no recuerdan esto, ¡no hay problema! pueden ir al post de estadística descriptiva y ahí encontrarán la definición de estos conceptos).
Mientras tanto, el promedio de ansiedad de toda la población de ese colegio es de 44.66. Este número lo hemos puesto arbitrariamente, pero este resultado se obtienes si es que se le toma la prueba a todos los alumnos del colegio y se saca el promedio.
No se preocupen por lo cálculos, también se pueden hacer en SPSS lo importante es entender el concepto.
Luego de ello, se calculan los intervalos de confianza del grupo A. Si alguien tiene interés en la fórmula con más detalle, en la parte de comentarios estará.
Intervalo de A va de -183.80 hasta 280.46
Ok, no se asusten con los números enormes, lo importante es ver el intervalo. Entonces todo el espacio entre esos números es el nivel de confianza. ¿Qué nos dice esto? Que ese es el rango que no debe caer el promedio de toda la escuela para ser diferente del grupo de alumnos A. Si el resultado cae fuera de ese rango entonces sí es significativo el promedio. En este ejemplo, el promedio del grupo A (44.66) sí está entre -183.80 y 280.46.
En ese caso, no hay diferencias significativas en los promedios de puntajes de ansiedad entre el salón A y la población de ese colegio. En este caso, al ver los promedios vemos que el grupo A no tiene mayor puntaje que la población con un nivel de confianza de 95%. Entonces, los jóvenes que el profesor pensaba que eran más ansiosos, (Grupo A) no tienen mayor ansiedad que el promedio general de todo el colegio.
Si bien, este ejemplo es un poco particular, esta es la idea de los intervalos de confianza. Algunos pros y contras de utilizar los intervalos de confianza en lugar del valor p son los siguientes:
Pros: Los intervalos son más flexibles que el valor p ya que te da un rango de posibilidades para determinar si un valor es significativo o no (ver post de estadística inferencial), en vez de un solo valor (el valor p o significación en SPSS).
Contras: Si el rango es demasiado grande (como es este caso), puede que el análisis esté sesgado, en otras palabras que podamos afirmar algo como verdadero cuando es falso (error tipo 1) (ver post de tipos error). Por ello, muchas veces, el mejor use para los intervalos de confianza, es tenerles confianza.
Bueno, creo que eso es todo por hoy. Si han llegado hasta acá, ¡Los felicito! Entiendo que este post puede haber sido un poco pesado y técnico, pero espero que me haya dejado entender y que el concepto de los intervalos de confianza sea más claro para ustedes. Recuerden que pueden hacer todas las preguntas que quieran o dejar todos sus comentarios. Encantando de poder ayudarlos, comentar sobre sus dudas o contribuir con más información.
El siguiente post será un poco distinto, pondré algunos gráficos y tablas de SPSS y los interpretaremos. El objetivo será explicar qué es la distribución normal y, según algunos valores que nos da el SPSS, cuándo la distribución o curva de sus puntajes, es normal o, también llamada, “paramétrica”.
¡Buenas vibras para todos!
Bibliografía recomendada
Clark, ML. (2004). Los valores p y los intervalos de confianza: ¿En qué confiar? Revista Panamericana de salud pública. 15(5), 293-296.
Para los interesados en los cálculos, existen diversas fórmulas para calcular los intervalos de confianza dependiendo del análisis que utilicen. Aquí se comparó una muestra contra la población. Por ello, la fórmula utilizada fue la siguiente:
X – 95% de confianza * S1/raiz-de n < u < X + 95% de confianza * S1/raiz-de n
En ese caso, X = al promedio de la muestra, S1 es igual a la varianza y 95% de confianza según la tabla Z es equivalente a 1.96.
Se calcula el intervalo y si el promedio de la población cae dentro de este, entonces existen diferencias entre los grupos.
Espero les haya servido. ¡Buenas vibras a todos!
LikeLiked by 1 person
Pingback: Dos caminos, un destino: el ANOVA de dos vías | Stats SOS
Buenos dias señor Drago, en primer lugar queria felicitarlo por tan excelente trabajo, el dia de hoy presento mi tesis de pregrado y no tuve mucha ayuda del tutor, ojala hubiera conseguido antes suy bloc se que mis analisis no fueran tan malos jaja… no tendra algo que explique como hacer los limites de una investigacion? se que voy con ese punto malo, pero repito no he recibido ayuda de alguien y me voy a exponer eso mal lamentablente
LikeLike
Buenos días fiorella,
Muchas gracias por escribir a Stats SOS y gracias por tus palabras.
Lamentablemente no tengo ningún post sobre las limtiaciones de una investigación. Eso está más relacionado a metodología de investigación y no tanto específicamente estadística.
No conozco tu investigación, sin embargo, algunas limitaciones de los estudios suele ser que la muestra no es representativa de la población y esto está relacionado a que la muestra no fue tomada aleatoriamente. Otro ejemplo de limitación es que no se pudo obtener información específica que pueda enriquecer aún más el estudio. A primera vista eso es lo que se me ocurre pero lamentablemente como no conozco tu trabajo de investigación no se qué más decirte. Espero que de todos modos esto sea de ayuda.
¡Mucho éxito!
LikeLike
Hola!!! Una pregunta tengo entendido que si el Intervalo de confianza atraviesa la unidad el valor de p no es significativo aunque sea menor de 0.05 es cierto?
LikeLike
Estimad@,
Muchas gracias por escribir a Stats SOS. Esto es cierto solo en modelo multiplicativos. Un típico ejemplo de un modelo multiplicativo está dentro de la Regresión Logística. En estos caso, cuando el EXP(B) del SPSS cruza la unidad entonces el valor p no es significativo.
Por otro lado, en una regresión lineal simple o múltiple cuando el intervalo de confianza del beta cruza el “0” el valor p no es significativo.
¡Mucho éxito! Y ojalá verte nuevamente por acá.
LikeLike
Pingback: ¿Números muy fríos? ¡Presentemos gráficos! | Stats SOS
Buenas noches, Juan Carlos. Felicitaciones por el blog que en realidad me es bastante útil por ser tan didáctico. Tengo una duda al respecto: Qué sucede si yo tengo dos poblaciones A y B y quisiera comparar, por ejemplo, el nivel de autoestima de ambos grupos y sacar los intervalos de confianza al 95%? el SPSS me arrojaría una tabla con el valor t, la sig. y los intervalos de confianza. Qué tendría que revisar en dicha tabla para determinar si hay diferencias significativas entre ambos grupos? Gracias por la respuesta
LikeLike
Estimado Andy,
Muchas gracias por escribir a Stats SOS. Tendrías que revisar las columnas finales. Tendrías que ver los valores mínimos y máximos de los intervalos. Si se cruzan quiere decir que no existen diferencias. Pero si no se traslapan sí hay diferencias significativas en los grupos.
¡Mucho éxito!
LikeLike
Hola Juan Carlos, gracias por este espacio! Tengo una pregunta, pueden los intervalos de confianza de 2 muestras superponerse y aún así encontrar en el test de hipótesis que la diferencia entre ambas medias es estadísticamente significativa? Gracias! PAtricia Farias de Buenos Aires
LikeLike
Hola Patricia, no debería pero si ocurre es que tienes un error tipo 1. Ojo, la significancia estadística está sujeta al tamaño de muestra, entonces eso puede pasar. Saludos!
LikeLike
Gracias Juan Carlos, estudiando mi segundo año de Maestría en Investigación…y encontré tu blog! Muchísimas gracias, leyéndolo todo de a poco! Apasionada por la estadística, saludos!
LikeLiked by 1 person