“Yo no enseño a mis alumnos, solo les proporciono las condiciones en las que puedan aprender.”
– Albert Einstein.
Hola a todos,
Primero que todo, ¡Bienvenidos! Antes que nada, dejemos todos nuestros prejuicios atrás de la estadística (que es fea, espantosa, imposible de entender) o ¿Por qué si estudié ciencias sociales tengo que llevar uno (o dos) maldito(s) curso(s) de estadística? ¡Si yo no quiero investigar!
Este blog es de un psicólogo pero no solo para otros colegas sino en general para cualquier profesional que quiera tener algún dato puntual de estadística. Esto no es blog para matemáticos, aquí no veremos la parte matemática de la estadística. Más bien, aquí pondremos todo lo que es aplicado, ¿Por qué se usa un análisis? ¿Qué análisis hacer en qué situación? ¿Cómo solucionar situaciones complicadas con los análisis? Entre otras cosas.
Finalmente, espero les sea útil para lo que deseen, pasar su curso, terminar la tesis, investigación, etc.
Y lo más importante espero que después de leer algún post sientan que la estadística no es espantosa, imposible, fea, sino que entre otras cosas, es comprensible y útil :). Creo que los psicólogos que nos gusta la estadística podemos a veces ser un poco incomprendidos, pero bueno, la idea es que nos mostremos, que nos dejemos conocer y hacer ver a los demás que el mundo de la estadística en psicología y otras ciencias sociales también puede ser genial.
Recuerden que pueden dejar sus mensajes preguntando sobre cualquier análisis que necesiten y si está en mis manos responder, encantado y feliz de poder ayudar.
¡Bienvenidos a todos, a este maravilloso mundo! ¡Abrochen su cinturón y vamos para adelante!
Excelente iniciativa. Ya era hora de que alguien lo haga.
LikeLiked by 1 person
¡Gracias!
Sí, ahora mantenerlo y hacerlo crecer. ¡Muchas gracias!
¡Un abrazo!
LikeLike
Pingback: ¡Bienvenidos amigos! | Estadística para todos, hecho por un psicólogo
Hola Juan Carlos, te felicito por la iniciativa pues será de mucha utilidad para la investigación en psicología. Aprovecho para consultar sobre un tema que usualmente veo en las tesis, cuando se realizan los análisis de correlación entre dos constructos, ¿qué puntaje determina si esta es alta, media o baja?
LikeLike
Hola Silvia,
Muchas gracias por leer mi post y seguir el blog. Habrá un post sobre correlaciones pero de todos modos respondo a tu duda. Intuyo que te refieres a la correlación de Pearson.
El tema con la magnitud de las correlaciones es una regla de dedo, entonces tu escoges al autor.
Lo clásico es usar al fundador de todo esto que es Cohen.
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.), New Jersey: Lawrence Erlbaum Associates.
El plantea lo siguiente:
0 – .10 correlacion nula o casi nula
.11 – .29 correlacion baja
.30 – .49 correlacion moderada
.50 – adelante correlación fuerte
Esto te puede dar una idea pero es una regla “de dedo”
Por ejemplo autores más actuales te dicen esto.
Hemphill, J. (2003). Interpreting the magnitude of correlation coefficients. American Psychologist. 58(1) 78-80. DOI: 10.1037/0003-066X.58.1.79.’
Después de haber revisado varias investigaciones empíricas en psicolgía el pone lo siguiente:
Tercio menor o baja 0 – .20
Tercio medio o mediana .21 – 30.
Tercio mayor o alta .31 hacia arriba.
Entonces como ves es como ir a pescar. Lo más importante es que reportes la correlación, si es directa o inversa y si es significativa. Además, que cites al autor del que te basas para dar tu afirmación sobre la fuerza de la correlación.
Si es que tuviera que escoger, usaría a Cohen porque es el que más trabajó sobre magnitudes de correlaciones y poder estadístico. Varios libros lo citan y suele ser una fuente confiable, aunque a veces un poco exigente, especialmente para ciencias sociales.
Espero que te haya servido mi respuesta, ¡Muchas buenas vibras! ¡Hasta la vista!
LikeLike
Muchísimas gracias por tu respuesta Juan Carlos, justo tengo en mis manos el libro de Cohen que mencionas! (2da edición), lo había sacado porque tenía esa duda ya que otros autores hacen referencia a una correlación media a partir de .5 y comprendo que debo citar la fuente, eso haré! Gracias nuevamente y estaré a la espera del post sobre correlaciones. Saludos!!!
LikeLike
Me alegro haberte podido ayudar Silvia.
¡Buenas vibras! ¡Hasta la vista!
LikeLike
Juanca, una pregunta!!..esas interpretaciones de Cohen solo son válidas para CORRELACIONES? Mi duda es si se mantienen o cambian cuando hablo de la magnitud de coeficientes en una RELACIÓN LINEAL?
MIL GRACIAS!
LikeLike
Estimado/a,
Muchas gracias por escribir en el blog. Esas interpretaciones de Cohen están dirigidas a correlaciones (pearson).
Sobre tu otra pregunta, en realidad la correlación es una relación lineal y el coeficiente de correlación es un coeficiente de relación lineal.
Sin embargo, como mencionas la palabra magnitud podrías también estar refiriéndote a otro análisis como por ejemplo, la t-student que también es un análisis que genera una relación lineal (la única diferencia es que relaciona una variable de intervalo (numérica) con una dicotómica (dos grupos)).
Dicho esto, cuando usas por ejemplo, magnitud del efecto (o tamaño del efecto) en una comparación de medias los puntos de corte son distintos.
Por ejemplo: d = .20 es un efecto pequeño, d = .50 es un efecto medio y d = .80 un efecto grande según la convención estadística. Más información sobre esto puedes encontrarla en:
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.), New Jersey: Lawrence Erlbaum Associates.
Así como en la página web de G*Power: http://www.gpower.hhu.de/en.html
Espero que esto haya servido. Cualquier cosa encantado que vuelvas a escribir.
¡Buenas vibras!
LikeLike
Hola Juan Carlos
es un tema especial la correlación de pearson,
el formulismo nos dice como varían conjuntamente dos variables y que relación tienen respecto al producto de la dispersión de las dos variables. y nos da valores de 0.1, 0.2, 0.5, 0.7, etc.
cuando se hace un scatter-plot puedo ver que la nube de puntos se relaciona muy bien con los valores de la correlación.
entonces la correlación tiene que contrastarse con el fenómeno estudiado, en mi caso si correlaciono cobre con arsénico y si la correlación es buena espero tener un mineral que contenga cobre y arsénico como es la enargita o arsenopirita. Si correlaciono Cobre Molibdeno espero tener un mineral con cobre y otro con molibdeno que van juntos en la naturaleza, como es el caso de la calcopirita y molibdenita.
LikeLike
Hola Carlos,
Así es, tienes toda la razón. Lo interesante de los Scatterplots es que te dan una representación gráfica de un número. Debo confesarte que les tengo estima a este tipo de representaciones. Son muy útiles.
Tu descripción sobre cobre y arsénico y cobre con molibdeno también representan una correlación. Buscas en la naturaleza “objetos” que compartan algo entre sí. La covarianza (o varianza compartida) del cobre y del molibdeno, vendría a ser la molibdenita.
Si estás interesado, hay un post sobre la correlación de Pearson :).
¡Muchas gracias por compartir tu ejemplo! Muy gráfico y claro.
¡Buenas vibras!
LikeLike
Hola JC, necesito tu ayuda urgente!!! como tú eres un capo en todo lo que es estadística, quisiera pedirte ayuda… Debo establecer para mi tesis el cálculo de sujetos que necesito para mi muestra de acuerdo al G power, y considerar un nivel de confianza de 0.95. Te cuento que usaré 3 cuestionarios o test, uno es de soporte social (cuenta con 20 ítems y con 5 áreas) el otro es el Inventario de Depresión de Beck ( cuenta con 21 ítems) y el otro es de Estrés parental (cuenta con 36 ítems y 3 áreas). Mi variable independiente es Sintomatología depresiva y el grupo es de madres de 15 a 19 años, con bebés de un mes a un año. Madres primigestas.
LikeLike
Hola Vanessa,
Gracias por escribir en el blog. Bueno, estoy en un proceso de aprendizaje, sé algunas cosas pero vamos de a pocos. De todos modos gracias por el cumplido.
El G*Power es un programa que lo que hace es calcular el poder estadístico de tus análisis. Aparte, te ayuda a calcular tamaños de muestra (cuanta gente necesitas), según el poder estadístico (que vendría a ser la precisión en tus análisis para evitar errores tipo 1 o 2, en la pestaña de conceptos hay un post sobre esto).
Más información sobre el programa puedes encontrarla en este enlace: http://www.gpower.hhu.de/en.html
Los autores mencionan cuando usas el G*Power que tienes que citarlos, eso puedes verlo en la página pero para facilitarte un poco la referencia que te pongo a continuación es la que ellos piden que cites.
– Faul, F., Erdfelder, E., Buchner, A., & Lang, A.-G. (2009). Statistical power analyses using G*Power 3.1: Tests for correlation and regression analyses. Behavior Research Methods, 41, 1149-1160.
Mira, te recomendaría que bajes el programa para que puedas entender de qué trata. Ahí tienes que poner la familia a la que pertenece tu análisis. Por lo que entiendo, debe ser una regresión múltiple y esta pertenece a la familia de los análisis que usan la F de Fisher (más información sobre esto puedes encontrarla en el post de regresión simple).
Luego tienes que poner el tipo de análisis que quieres utilizar. Como en tu caso es una regresión múltiple, pondría la primera opción “deviation from zero”, porque tu modelo de regresión es una clásica regresión múltiple.
Si te fijas, un poco más abajo dice el tipo de análisis de poder, como tú quieres calcular el tamaño de la muestra, a priori sería la opción para ti. Esto es porque quieres calcular la cantidad de gente que necesitas para tener una análisis confiable antes de hacer el análisis.
El programa por defecto te da la confianza al .95 así que no hay problema, en realidad los números que hay a continuación F2, el alfa (está como símbolo) y 1 – beta (en símbolo), también ya están predeterminados para obtener la cantidad de gente necesitas con una confianza al 95% entonces todo bien.
Luego, en la parte de predictores, ahí tu tienes que determinar cuántos predictores quieres usar. Los predictores son las variable independientes. Quizás el post de regresión simple podría aclarar mejor que es una variable independiente (puedes encontrarlo en la pestaña de regresiones).
Por ejemplo, como prueba puse que para 3 predictores que quieren explicar sintomatología depresiva (siguiendo tu ejemplo), necesitas por lo menos 119 personas para tener datos confiables.
Te recomiendo decidir cuántos predictores vas a poner en tu modelo de regresión múltiple para que sea más fácil calcular.
El G*Power es un programa bien amigable la única cosa que puede ser fastidiosa es que es en inglés.
Espero que la explicación te haya servido.
¡Cualquier cosa encantado de recibir más comentarios!
¡Buenas vibras!
LikeLike
Wow!!!! Impresionada! No entiendo nada pero gracias a ti como que esto se hace más llevadero y fácil. Gracias por tu ayuda JC, eres un trome!!!! Eternamente agradecida!
Que sigan los éxitos!!!
LikeLike
Estimada,
Muchas gracias por el comentario, me inquieta un poco que no entiendas nada. Si tienes alguna pregunta encantado de poder responderte. Agradezco mucho el halago, vamos de a pocos, aprendiendo como siempre. Espero tener noticias tuyas pronto.
¡Buenas vibras!
LikeLike
Hola llevo el MBA en Centrum, recién veré a detalle el blog, soy comunicador social de profesión y me cuesta adaptarme a los nuevos conceptos, te aseguro que si me ayuda sin duda lo recomendaré a todos mis contactos, desde ya te agradezco por el aporte.
LikeLike
Estimado Wesley,
Muchas gracias por comentar en Stats SOS. Gracias a ti por leer este espacio, espero que sea de ayuda para ti y pueda aclarar algunos conceptos.
Encantado de recibir más comentarios tuyos.
¡Saludos! ¡Muchos éxitos en tu MBA!
LikeLike
Buenas tardes profesor,
ante todo felicitarle, tanto por su excelencia pedagógica como por su exposición siempre tan amena. He revisado rápidamente los materiales, me ha parecido que no ha publicado sobre la prueba KD 20
Estoy interesada en esta prueba, tengo algunas dudas, podría preguntarle las dudas que tengo?
Gracias
LikeLike
Estimada Francisca,
Muchas gracias por escribir a Stats SOS. Una pregunta, cuando te refieres al KD 20, te refieres a la prueba Kuder Richardson? Te recomendaría trasladar tu pregunta al post sobre confiabilidad y Alfa de Cronbach.
Encantado, postea todas las dudas que tengas, feliz de poder ayudarte.
¡Mucho éxito!
LikeLike
Buenas noches profesor, me gustaría preguntar con respecto a la escala de ansiedad y depresiòn de Goldberg, qué tipo de validez es la que presenta? ¿De constructo, predictiva? y si es así, cuánto de validez predictiva/constructo/etc es la que tiene?
LikeLike
Estimada Karen,
Gracias por escribir a Stats SOS. Disculpa la demora pero no he tenido una computadora disponible estos días. Mira, si mi memoria no falla el instrumento de Golsberg es el GHQ-12. Ese instrumento tiene una validez de constructo porque hace un análisis factorial confirmatorio para probar la estructura de la escala.
Mucho éxito!
LikeLike
Estimado JC! Quería saber si puedes apoyarme con una inquietud! Estoy realizando un estudio cuantitativo y me gustaría hacer un análisis factorial sobre las dimensiones mas relevantes entre la participación y redes de apoyo. Mi problema es que he debido recodificar mis variables a dicotómicas (se que no es el ideal) porque no tengo suficientes escalas likert (y mis variables no permiten valores de ese tipo pues son de caracterización de personas. Creo que esto ha hecho que mi KMO y Bartlett no me sugieran realizar análisis factorial… ¿puede ser? ¿Sólo puedo mejorar estos análisis si consigo variables escalares o simplemente mis variables no tienen correlación estadística significativa?
Te agradecería enormemente que pudieses orientarme en esta inquietud. Atento a tu respuesta.
LikeLike
Estimado Pothalo,
Muchas gracias por escribir a Stats SOS. En sí, no puedes hacer un análisis factorial exploratorio con variables dicotómicas porque el análisis que mencionas es lineal. Sin embargo, para ello, podrías hacer un análisis factorial exploratorio para variables categóricas (CATPCA).
¡Mucho éxito!
LikeLike
Muchas gracias por tu respuesta JC! Probaré como dices a ver cómo me va. Saludos!
LikeLike
Juan Carlos hola! Muchas gracias por siempre estar ayudándonos a todos. Tengo una consulta. Se puede utilizar el Gpower para delimitar mi muestra para realizar un AFE, con el objetivo de validar una escala de 20 ítems? Me he descargado el programa y no estoy seguro a qué familia de análisis pertenece el AFE. O si, por el contrario, el programa no te ayuda para estos análisis.
Muchas gracias por tu ayuda,
Saludos
LikeLike
Estimado Jesus,
Muchas gracias por escribirme a Stats SOS. El AFE no está en el Gpower. Pero para darte una idea, más o menos necesitaría 10 personas por cada ítem. Por ello, necesitarías aproximadamente 200 personas.
¡Mucho éxito!
LikeLike
Buenos días Juan Carlos. Mil gracias por compartir su conocimiento.
Quiero pedirle su colaboración con la siguiente inquietud:
En un proyecto hidroeléctrico (creación de embalse) se desarrolla un programa para monitorear la producción agropecuaria en aspectos sanitarios y productivos antes y después de la creación del embalse pues se estima que éste modifique el microclima de la región y se impacte negativamente el sector agropecuario.
En el aspecto productivo se tienen las producciones promedio de leche por vaca/día de enero a diciembre desde octubre de 2013 hasta la fecha, sin embargo el embalse se creó en junio 2015 y me interesa analizar si hay diferencias significativas en los promedios (litros de leche/vaca/día) tomados antes de la creación del embalse versus después de la creación del embalse.
Inicialmente considero como grupos los meses y como tratamiento 1 el promedio que tengo de todos los eneros a diciembre antes del embalse (linea base) y como tratamiento 2 el promedio de los eneros a diciembre después del embalse.
Es correcta esta organización de los datos?
Con ANOVA puedo analizar? que tipo?
E F M A M J J A S O N D
T1 Linea base 3,89 4,79 4,87 4,02 4,43 4,19 4,39 4,53 4,29 4,54 4,49 4,24
T2 Monitoreo 5,37 5,05 4,68 5,04 5,10 4,99 4,93 4,83 4,68 5,11 5,65 5,01
LikeLike
Estimado Eric,
Muchas gracias por escribir a Stats SOS. Mira si tienes múltiples púntos a lo largo del tiempo creo que con un ANOVA de medidas repetidas podrás responder a tu pregunta de investigación. Si tienes solo 2 puntos a lo largo del tiempo tendría que ser una prueba t para muestras relacionadas. Pero por lo que veo en las letras y los dos vectores finales son múltiples grupos. Con un ANOVA podrás lograrlo.
Primero calcula sin diferenciar los grupos y luego introduciendo la covariable grupos. Así sabrás si cambian a lo largo del tiempo y luego si se puede atribuir a tus diferentes tratamiento.
¡Mucho éxito!
LikeLike
He quedado maravillada con tu blog. Estoy bastante desorientada con una investigación que estoy realizando. Tengo 9 factores (que miden la efectividad del liderazgo directivo en establecimientos educacionales), cada uno de estos factores está formado por varibles( 37 en total). Quiero saber cómo relacionar estos factores y saber si uno afecta al otro, no sé como indicarle al SPSS que cada variable se agrupa dentro de un factor. Además qué factores afectan negativa o positivamente el liderazgo.
LikeLike
Buenas tardes, He leído algunos de sus blogs sobre las correlaciones de Pearson. Estoy haciendo un estudio en el área de psicología donde tengo dos variables, en los resultados de correlación tengo datos de 0.70, 0.73, etc que los tomó en cuenta como correlación considerable, porque tengo entendido que resultados a partir de 0.70 son considerables. También tengo resultados con datos de 0.67, 0.65, etc que los tome en cuenta como moderado. Ahora mi duda es la siguiente: Encontré información donde me indican que a partir de 0.70 es considerable, sin embargo otras fuentes me indican que partir de 0.60 ya es considerable, mi duda es esa, no sé cuál de las fuentes está correcta, es por ello que solicitó su ayuda para que me pueda aclarar y me pueda enviar si tuviera los valores significativos de correlación de Pearson, junto con algún autor que respalde, gracias.
LikeLike
Estimado@,
Muchas gracias por escribir a Stats SOS. Lo saqué de los clásicos criterios de Cohen.
Mucho éxito!
Juan Carlos
LikeLike
Realmente muy interesante la web. Soy psicólogo e investigador de Arg., y me es muy útil clarificar y afianzar los conceptos aquí vertidos. Gracias!
LikeLike
Tengo los resultados de 144 encuestas de una evocación de palabras jerarquizadas.
Me recomendaron como validación hacer un índice y un gráfico de similitudes, aplicar escalamiento multidimensional, correspondencias múltiples y un análisis de componentes principales. Mis dudas son:
1. ¿Cuál es el tipo de escalamiento multidimensional que debo utilizar? Métrico o no métrico
2. ¿Si en el escalamiento se utilizan solo las frecuencias?
3. ¿A partir de la matriz obtenida en el procedimiento anterior se utilizan los componentes principales?
4. De ser así, por el tipo de datos que tengo, hay algún análisis específico que debo de utilizar de componentes principales
Muchas gracias.
LikeLike
Estimada Evelyn,
Muchas gracias por escribir a Stats SOS. Enumero tus preguntas para que sea más fácil.
1) No métrico porque al final usarás una matriz de correlaciones como insumo y no distancias euclideanas.
2) Se usan las correlaciones entre los ítems en realidad.
3) Componentes principales es un método distinto a un escalamiento multidimensional. En el escalamiento te saldrán puntos de estrés que describirá cuán bien ajuste el ítem o dista de todos los demás.
4) Si usas un método de componentes principales estarías usando un análisis factorial exploratorio que es distinto a un análisis de escalamiento multidimensional.
Mucho éxito!
LikeLike
¡Hola Juan Carlos!
Recién me tope con tu blog y me parece maravilloso. En la facultad de psicología de la UANL estoy llevando el curso de investigación cuantitativa y me ha encantado el tema de la estadística, sin embargo hay cosas en las que estoy muy atrasado y me gustaría aprender. Muchas gracias por hacer la estadística más placentera; por personas como tu surge la motivación de querer saber más.
LikeLike