¡Pero qué linda relación tienen! La correlación de Pearson

Posted on March 10, 2015 by Juan Carlos Saravia

Estimados todos, bienvenidos a otro maravilloso capítulo de Stats SOS. Espero que estén muy bien, que estén disfrutando de sus diversas actividades y de buena salud.

Muy bien, luego de un mensaje agradable de bienvenida para ustedes motivados y valientes lectores, vamos a lo nuestro. El objetivo de este post es explicar y describir de manera sencilla (como siempre) la correlación de Pearson.

Primero que todo, ¿Qué es una correlación a qué suena esto? En sencillo, una correlación es la relación que tienen dos variables, o en otros términos cuánta varianza comparten dos variables. Existen diferentes tipos de correlaciones, pueden ser lineales o no lineales y como siempre llevan el nombre de la persona que inventó la operación matemática.

En esta oportunidad veremos la correlación de Karl Pearson, que es uno de los análisis estadísticos que más se utilizan en el mundo. Como comentario queridos lectores, ¡sí! no se pueden imaginar cuan utilizada es esta correlación, incluso en algunos análisis la estamos utilizando sin realmente darnos cuenta. Sin embargo, no se preocupen a medida que vayamos avanzando por el maravilloso camino de la estadística les iré comentando dónde esta correlación está presente.

¿Cómo funciona la correlación de Pearson? Muy sencillo, de verdad que sí. Esta correlación se utiliza cuando se quiere encontrar la relación lineal entre dos variables que son de intervalo. Los que no recuerdan qué es una variable de intervalo ¡no hay problema! Siempre pueden volver en el tiempo, a este post que puede darles un pequeño recordatorio.

Les pido que tengan muy en cuenta estas dos ideas, por eso las voy a repetir acá. Para utilizar una correlación de Pearson, las variables deben: a) Tener una relación lineal entre sí. b) Ambas variables deben ser de intervalo. La correlación de Pearson no tiene nada que ver con que si la distribución sea paramétrica o no. Repito, no tiene nada que ver con que la distribución sea paramétrica o no. ¡Muy bien! Ahora que sacamos el elefante morado de la habitación podemos seguir.

¿Qué significa una relación lineal? Como ya hemos mencionado en post anteriores con la T-student y el ANOVA, una relación lineal en este caso es cuando dos variables de intervalo están relacionadas linealmente. Suena repetitivo, ¿no? Ampliemos la idea. Dos variables (A y B) están relacionadas directamente o positivamente cuando al subir los puntajes de la variable A, también suben los puntajes de la variable B. Por otro lado, otras dos variables (C y D), también pueden estar relacionadas de manera inversa o negativamente. Esto ocurre cuando los puntajes de la variable C se incrementan y los puntajes de la variable D se reducen.

¡Mejor vamos a un ejemplo! Imagínense que queremos saber si existe una relación entre la percepción de salud general y la práctica de actividad física. En ese caso, juntamos nuestros cuestionarios y le preguntamos a una serie de personas (en este ejemplo son 448), cuán saludable se considera (variable A) y la práctica de actividad física que hace (variable B). Ambas variables han sido medidas con diversos ítems (o preguntas) y se ha sacado en base a la suma de todos estas preguntas un puntaje para salud general (variable A) y para práctica de actividad física (variable B). Entonces, ambas variables podrían ser tratadas como de intervalo.

Luego de haber hecho todo esto, vamos al SPSS y seguimos la siguiente ruta:

Analizar/Correlaciones/Bivariadas/

Les aparecerá una nueva ventana, en el recuadro que dice “Variables” es necesario poner ambas variables que queremos estudiar. En este caso, pondremos la variable A (Salud general) y la variable B (Práctica de actividad física). Luego, miraremos abajo donde dice “coeficientes de correlación” y solo marcaremos la casilla que dice “Pearson”. Finalmente, pondremos aceptar.

Un cuadro como este les debería aparecer.

¿Qué significa este cuadro? El número que dice “correlación de Pearson” muestra cuán relacionadas están las variables. Un tema importante es que la correlación va desde -1 hasta 1. Si la correlación tiene un signo positivo como en este caso, quiere decir que a mayor puntaje de salud general, habrá mayor puntaje de actividad física. La correlación es de .345 y es significativa porque es menor a 0.05 (ver la línea que dice “Sig bilateral”). Si no recuerdan que significa esto, siempre pueden ir a este post que los puede ayudar. Entonces, finalmente, podemos decir que la salud general está relacionada positivamente con la práctica de actividad física. En este caso, tienen 34.5% (.345) de varianza compartida que también es llamada covarianza. De este modo, ambas variables tienen una relación de 34.5% o .345. Recomendación, en sus reportes usen mejor .345 que es lo más comúnmente utilizado.

¿Estuvo sencillo? ¿Siguen acá? ¡Muy bien! Les pondré otro ejemplo rápidamente. En este caso, nuevamente quisimos analizar la relación entre la variable A (Salud general) con una nueva variable C (Consumo de alcohol). Esta variable está representada por la cantidad de tragos que una persona consume a la semana, por ello es de intervalo. Nuevamente, seguimos los mismos pasos que el análisis pasado.

Ruta: Analizar/Correlaciones/Bivariadas/

En este caso, los resultados fueron los siguientes:

La relación entre salud general y consumo de alcohol es de -.027 con una significación de .565. Esta tabla nos dice varias cosas: a) la relación entre consumo de alcohol y salud general es inversa porque hay un signo negativo (-.027). Entonces, a mayor consumo de alcohol menor es la percepción de salud general. ¡Sin embargo! b) la relación entre estas dos variables no es significativa, porque la significación es de .565 número que es muchísimo mayor a 0.05. Entonces, no hay relación significativa entre estas dos variables. Finalmente, c) la relación entre Salud general y consumo de alcohol es casi nula. El número -.027, nos da cuenta que solo hay una relación o covarianza compartida de 2.7% lo cual es nada.

¿Siguen ahi conmigo? ¿Están asustados o algo por el estilo? ¡Intuyo que no! Ustedes son valientes e inteligentes lectores que le han dado la oportunidad a la estadística, una disciplina incomprendida por el mundo de las ciencias sociales. Ahora, les presentaré dos último temas importantes. Por un lado, ¿cuál es la representación gráfica de todos estos números? Además, les pondré una tabla clásica de cómo se define si una correlación es más fuerte o más débil.

Primero la representación gráfica:

Antes que nada, los puntos representan cada puntaje de cada individuo que respondió las pruebas. En otras palabras, un punto es la representación gráfica de la respuesta de una persona. Ese punto, evidencia los puntajes de las pruebas tanto de Salud general como también de práctica de actividad física o consumo de alcohol (dependiendo del ejemplo que quieran tomar).

Por ejemplo, el eje Y (el eje vertical) sería la línea donde se pueden representar los puntajes de Salud general y el eje X (el eje vertical) sería la línea donde se pueden representar los puntajes de práctica de actividad física o consumo de alcohol. En ese caso, si el primer sujeto obtuvo 30 en salud general y 20 en prácticas de salud, la gráfica mostrará un punto en el valor 30 del eje Y (Salud general) y ese mismo punto estará en el valor 20 del eje X (práctica de actividad física).

¡Muy bien vamos la interpretación! El gráfico A les muestra una clara y común relación positiva o directa entre dos variables. Como ven, cuando el puntaje de una variable sube y el puntaje de la otra también lo hace. El gráfico B nos muestra una relación negativa o inversa porque cuando suben los puntajes de una variable bajan los puntajes de la otra. Por otro lado, el gráfico C muestra un ejemplo cuando no hay una relación entre dos variables. No sube ni baja, es una nube que flota sin dirección. Finalmente, el gráfico D es bien interesante. Si se fijan, sí hay un comportamiento y la gráfica tiene una forma (una forma cuadrática). Sin embargo, esta forma o comportamiento no es lineal por ello, la correlación de Pearson lo tomará como si no hubiera correlación o relación, debido a que el análisis de Pearson solo capta relaciones lineales.

¿Siguen acá conmigo? Se que este post ha sido un poco largo, pero ya estamos en la parte final. ¿Cómo saber cuán fuerte es una correlación? Existen una serie de reglas que diversos estadístas y matemáticos han propuesto. Para efectos prácticos les presentaré la clásica y más común clasificación, los criterios de Cohen para la fuerza de una correlación.

Para hacerlo más sencillo y práctico les presentaré una tabla que les puede ser de ayuda:

Esta tabla les dará un aproximado de cuán fuerte es la relación que obtuvieron. Por ejemplo, en nuestro primer análisis obtuvimos una correlación de .345 que sería equivalente a una correlación baja. En nuestro segundo análisis obtuvimos una correlación de .027 que sería equivalente a un correlación casi nula. De todos modos, hay que tener cuidado con estos criterios porque son arbitrarios y muchas veces muy rígidos y exigentes, en este caso siempre es bueno utilizar su propio criterio como analista o investigador.

¡Muy bien! Si han llegado hasta acá los felicito, sinceramente, ha sido un post largo y con muchos temas. Sin embargo, no considero que hubiera sido lo mejor dividirlo en dos. Para la siguiente aventura de Stats SOS, volveremos un poco hacia atrás y a pedido del público trataré la T-student, pero esta vez su aplicación cuando se tienen muestras o medidas relacionadas entre sí.

Los felicito por haber llegado hasta acá, ya saben que cualquier consulta, siempre pueden ir a la parte de comentarios y escribir, encantado de recibir sus comentarios y noticias. ¡Buenas vibras!

Bibliografía recomendada

Tabachnick, F., & Fidell, L. (2013). Multivariate statistics. Pearson. NY.

About Juan Carlos Saravia

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.

View all posts by Juan Carlos Saravia →

This entry was posted in Básico 1.0 and tagged coeficientes de correlación, Correlación, Pearson, relación lineal. Bookmark the permalink.

55 Responses to ¡Pero qué linda relación tienen! La correlación de Pearson

silviavallejos says:

March 10, 2015 at 4:35 PM

Genial! Había estado esperando este tema hace tiempo! Muchas gracias por la información, es de gran ayuda 🙂

LikeLike

Reply
- JC Saravia Drago says:
  
  March 10, 2015 at 4:39 PM
  
  Hola Silvia, me alegro que te sirva. Más bien disculpa por haber hecho larga la espera. ¡Buenas vibras!
  
  LikeLiked by 1 person
  
  Reply
  - silviavallejos says:
    
    March 10, 2015 at 4:46 PM
    
    Muchas gracias!!! 🙂 🙂
    
    LikeLike
    
    Reply
Luis Cordova says:

March 12, 2015 at 2:33 AM

Muy didáctico ´profesor Saravia. Muchos adultos como yo hemos tenido una pésima formación en estadística y psicometría. Ahora tenemos jóvenes docentes que nos enseñan algo que no aprendimos. Felicitaciones.

LikeLike

Reply
- JC Saravia Drago says:
  
  March 12, 2015 at 7:46 AM
  
  Estimado Luis Cordova,
  
  Agradezco mucho su mensaje y me alegra mucho que este por estos lares interesado en la estadística. Espero que este sea (como bien lo describe) un espacio de aprendizaje didáctico y entretenido.
  Saludos y espero volver a verlo por aquí. Recuerde, si tiene una pregunta sobre algún tema encantado de responder.
  ¡Buenas vibras!
  
  LikeLike
  
  Reply
  - Bell says:
    
    May 31, 2018 at 10:21 PM
    
    Gracias me ha ayudado mucho esta explicación, podría hacerlo de la misma manera pero con T student por favor 😀
    
    LikeLike
    
    Reply
    - Juan Carlos Saravia Drago says:
      
      October 23, 2018 at 8:07 PM
      
      Estimado Bell,
      
      Claro! Hay un post de T student también! Puedes encontrarlo en las pestañas de arriba.
      
      Mucho éxito!
      
      LikeLike
      
      Reply
Pingback: Tan parecidos que parecen relacionados: La t-student de muestras relacionadas | Stats SOS
Pingback: Pero mira, ¡qué genial cómo interactúan! La interacción estadística | Stats SOS
Pingback: Gonzalo apoya la aditividad: Los 4 supuestos de la regresion lineal | Stats SOS
Pingback: Un día llegó la regresión múltiple | Stats SOS
Marco Carranza says:

May 13, 2015 at 12:43 PM

Es excelente la información y felicito la iniciativa. (Y)
Por otra parte sería importante recomendarnos alguna bibliografía para extender nuestros conocimientos.

LikeLike

Reply
- JC Saravia Drago says:
  
  May 13, 2015 at 1:17 PM
  
  Estimado Marco Carranza,
  
  Agradezco mucho su comentario. Perfecto, su sugerencia es excelente, la tomaré en cuenta. Ya he comenzado a agregar bibliografía en los posts, pero cuando no cite pondré bibliografía recomendada abajo.
  Por lo pronto, este libro puede ser de ayuda para profundizar sobre correlaciones y otros temas más. Ire completando de a pocos los posts anteriores con bibliografía recomendada.
  Field, A. (2013). Discovering Statistics using IBM SPSS Statistics. UK: Sage.
  ¡Buenas vibras!
  
  LikeLike
  
  Reply
Pingback: ¿Tienes confianza? La confiabilidad y el Alfa de Cronbach | Stats SOS
Anónimo says:

June 17, 2015 at 11:18 PM

Hola! Primero q nada muchas gracias por dedicar el tiempo para redactar sobre tan importantes temas. La estadística es algo que recientemente me esta atrapando y bueno aún estoy en camino ^_^

Gracias a blogs como los tuyos es que puedo seguir adelante!
Estoy haciendo un análisis de correlaciones…
Mi muestra es normal mayor a 500 personas y tanto la asimetría como la curtosis no son extremas. Por lo tanto estoy usando pearson para las correlaciones. Mi pregunta es qué tan recomendable es hacer un análisis de correlaciones entre los items?

De antemano muchas gracias! 🙂

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  June 18, 2015 at 6:26 AM
  
  Estimado/a,
  
  Muchas gracias por escribir a Stats SOS. Me alegra mucho que te esté atrapando la estadística, considero que es muy entretenida e interesante.
  
  Tu tamaño de muestra es importante lo cual es excelente. Por otro lado, te hago un comentario: la correlación de pearson se aplica cuando los puntajes de las pruebas son de intervalo. Por ello, la asimetría, la curtosis y que la distribución de tus puntajes sea normal no es un requisito para aplicar esta correlación. Ok, luego que esto salió del camino vamos a tu pregunta.
  
  Es posible hacer una correlación entre los ítems pero no encuentro cuál sería el objetivo de hacer esto. Si deseas ver cuán bien funcionan los ítems y la estructura factorial de la prueba, considero que hacer una correlación entre los ítems es muy importante. Sin embargo, si ese no es el objetivo no se cuán recomendable sería hacerlo y con qué fin. Como siempre, depende del objetivo de tu estudio.
  Espero que esto haya ayudado.
  ¡Muchos éxitos!
  
  LikeLike
  
  Reply
  - Anónimo says:
    
    June 18, 2015 at 8:53 PM
    
    He hecho un análisis factorial para ver la estructura de la escala de seguridad ocupacional y todo ok, pero mi objetivo al hacer correlaciones entre items es ver qué tanto se relaciona el item5 (los jefes nos comunican las políticas de seguridad industrial) con 3 items más que miden comportamientos o actitudes propensas a producir un incidente dentro de la organización.
    
    agradeceré tus comentarios.
    
    LikeLike
    
    Reply
    - Juan Carlos Saravia Drago says:
      
      June 19, 2015 at 7:47 AM
      
      Estimado/a,
      
      Muchas gracias por escribir a Stats SOS. Sobre la pregunta, es posible hacer una correlación de pearson entre dos ítems, la respuesta es sí, es totalmente plausible.
      Por otro lado, tomando en cuenta que la estructural factorial está ok y probablemente el alfa de cronbach también, no sería sorpresivo que se encuentre una correlación alta entre ambos ítems.
      Pero sí, es posible hacer ese análisis. Si está en línea con los objetivos de su estudio adelante.
      ¡Muchos éxitos!
      
      LikeLike
      
      Reply
      - Anónimo says:
        
        June 19, 2015 at 6:16 PM
        
        Gracias Juan (Y)
        
        LikeLike
sara030589 says:

January 10, 2016 at 3:05 AM

Estimado Juan Carlos:
Disculpa que aparezca como spam en cada uno de tus post últimamente; sin embargo, no te imaginas lo que he avanzado gracias a su lectura. Necesito hacerte una pregunta: tengo que hacer correlaciones entre mi variable dependiente ( nivel de estrés) y otras de intervalo. Sin embargo, en dos de estas escalas, los puntajes totales, están categorizados ( 1= consumo de bajo riesgo, 2= consumo de riesgo, 3=…); en la otra escala los puntajes totales han sido dicotomizados. Mi pregunta es: ¿ tengo que correlaciones con estas escalas? o, como están categorizadas o dicotomizadas me conviene más aplicar con ellas un ANOVA y una T de student. Espero que me hayas entendido, de antemano te agradezco tu ayuda…

LikeLike

Reply
- sara030589 says:
  
  January 10, 2016 at 3:07 AM
  
  Me corrijo, la pregunta es: si tengo que hacer correlaciones con estas escalas?
  
  LikeLike
  
  Reply
  - Juan Carlos Saravia Drago says:
    
    January 11, 2016 at 7:23 PM
    
    Hola Sara,
    
    Nuevamente gracias por escribir a Stats SOS. No, con las variables que estás trabajando un ANOVA o un T-student serían las opciones para ti.
    
    ¡Mucho éxito!
    
    LikeLike
    
    Reply
- Juan Carlos Saravia Drago says:
  
  January 11, 2016 at 7:22 PM
  
  Estimada Sara,
  
  Muchas gracias por escribir a Stats SOS y puedes hacer todas las preguntas que quieras. La respuesta a tu pregunta es no, no puedes hacer correlaciones con una variable con categorías y una de intervalo.
  Lo mejor sería hacer una t-student o un ANOVA eso depende de la cantidad de grupos que tienes en tu variable que tiene categorías. Como bien sabes tu, la T- student se usa con vairable con solo 2 categorías y el ANOVA cuando tienes más de dos categorías. Estos análisis también muestran la relación entre dos variables.
  
  ¡Muchos éxitos!
  
  LikeLike
  
  Reply
Frine Maria Yucra Chambi says:

February 17, 2016 at 9:19 PM

MUCHAS GRACIAS, MG. JUAN CARLOS, FUE DE GRAN AYUDA PARA MÍ. DIOS LO BENDIGA.

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  February 17, 2016 at 10:33 PM
  
  Estimada Frine,
  
  Muchas gracias por escribir en Stats SOS. Me alegro que haya sido de ayuda el blog. Los mismos deseos para ti.
  
  Saludos y mucho éxito
  
  Juan Carlos
  
  LikeLike
  
  Reply
José Ávila says:

May 31, 2016 at 4:54 PM

Estimado Juan Carlos

Muchas gracias por tus aportes, los he estado siguiendo y en verdad son valiosos y agradables.
Quiero formularte una pregunta. ¿Existe algún mecanismo, prueba o procedimiento para detectar si las correlaciones son espurias? En algunos casos parece muy simple “desechar” evidencias sin mayor sentido, por ejemplo, hace unas semanas veía en una red social que alguien publicó una nota “periodística” en la que informaban que tener vello en el pecho se correlacionaba significativamente con el IQ.
Sin embargo, no siempre parece tan clara la espuriedad de una relación. Hace poco identifiqué datos en los que observaba que la Satisfacción con la vida correlacionaba negativamente con la Autoaceptación (del bienestar psicológico) y la Autonomía (como estrategia de afrontamiento), pero correlacionaba al tiempo positivamente con la Solución de problemas (Afrontamiento). Parece incongruente que tener una autoaceptación disminuida y escasa autonomía te genere más satisfacción con la vida, a la vez que esas relaciones también resultan opuestas con la Búsqueda de solución de problemas (al tratarse de una estrategia de afrontamiento activa, si busco solucionarlos debería ser autónomo, por ejemplo).
He buscado en la literatura información sobre cómo probar si una correlación es espuria pero no encuentro mayores respuestas.
Agradezco la ayuda que me puedas ofrecer.
Saludos fraternos

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  June 1, 2016 at 9:07 AM
  
  Estimado José,
  
  Muchas gracias por escribir a Stats SOS. Sí, es posible detectar las correlaciones espurias utilizando correlaciones parciales. Lo que observa las correlaciones parciales es si otra variable adicional está jugado un rol.
  Para seguir el ejemplo de los hombres con vello en el pecho e IQ, si esos hombres por ejemplo la gran mayoría trabajan en ocupaciones donde tienen que leer mucho y calcular varias operaciones matemáticas es probable que estén “mas familiarizados con pruebas de inteligencia”, entonces en el fondo no es vello en el pecho sino que todas esas personas tienen una característica extra que no se está midiendo.
  
  Prometo hacer pronto un post sobre correlaciones parciales usando un modelo de regresión para ver el tema.
  
  Saludos y mucho éxito en tu búsqueda.
  
  LikeLike
  
  Reply
  - José Ávila says:
    
    June 1, 2016 at 3:40 PM
    
    Muchas gracias por tu respuesta Juan Carlos. Estaré a la espera de tu post sobre correlaciones parciales, ojalá puedas mostrar ejemplos sobre la detección de espuriedad.
    Saludos cordiales.
    
    LikeLike
    
    Reply
    - Juan Carlos Saravia Drago says:
      
      June 1, 2016 at 3:44 PM
      
      Estimado José,
      
      Muchas gracias por escribir a Stats SOS. Sí, no te preocupes lo haré.
      
      ¡Mucho éxito!
      
      LikeLike
      
      Reply
Pingback: ¿Números muy fríos? ¡Presentemos gráficos! | Stats SOS
gregory says:

June 6, 2017 at 12:32 PM

estoy trabajando con diseño factorial completo con tres pruebas centrales total 11 trtamiento en un solo bloque como interpreto los resultados.
Análisis de Varianza para Volumen de Poros
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
A:Ratio Molar: S:Hg 1.99001 1 1.99001 9.03 0.0398
B:pH 1.25611 1 1.25611 5.70 0.0754
C:Relacion MG/RSM-E 0.0666125 1 0.0666125 0.30 0.6118
AB 3.71281 1 3.71281 16.84 0.0148
AC 2.40901 1 2.40901 10.93 0.0298
BC 0.0190125 1 0.0190125 0.09 0.7836
Error total 0.81898 4 0.220474
Total (corr.) 10.3355 10
R-cuadrada = 91.4673 porciento
R-cuadrada (ajustada por g.l.) = 78.6682 porciento
Error estándar del est. = 0.469547
Error absoluto medio = 0.231405
Estadístico Durbin-Watson = 1.24766 (P=0.1669)
Autocorrelación residual de Lag 1 = 0.186177

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  June 7, 2017 at 8:44 AM
  
  Estimado Gregory,
  
  Muchas gracias por escribir a Stats SOS. Entiendo los números que pones sin embargo si me dieras un poco de contexto sobre qué es lo que estás analizando sería más fácil poder darte una respuesta que te sea más útil.
  
  ¡Mucho éxito!
  
  LikeLike
  
  Reply
Jose Pizarro says:

September 9, 2017 at 9:37 AM

Hola Juan Carlos
Voy a usar correlación biserial para medir relación entre una variable cuantitativa continua y ua variable dicotómica categórica. ¿tiene sentido?. Y si es asi que prueba de significación se podría utilizar? Anteriormente he usado la “t” para Pearson, Muchas gracias por la respuesta.

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  September 11, 2017 at 9:20 AM
  
  Hola José,
  
  Muchas gracias por escribir a Stats SOS. Sí, tiene sentido lo que planteas. En SPSS, puedes correr la correlación de Pearson son las variables que mencionas y automáticametne te corre una correlación biserial puntual. Así que vas por buen camino.
  
  ¡Mucho éxito!
  
  LikeLike
  
  Reply
Claudia Vera Cano says:

October 8, 2017 at 5:42 PM

Estimado Juan Carlos
Le escribo para pedirle ayuda pues estoy haciendo mi tesis y durante el análisis de datos me generaron muchas dudas. Gracias a un amigo pude dar con su página Stats sos lo cual me ha ayudado muchisimo; sin embargo, me generó muchas dudas tu publicación acerca de las correlaciones de pearson y spearman. Comentas que, el usa una u otra, no depende de si las variables son paramétricas o no paramétricas, sino del tipo de variable (ordinal, nominal o intervalo). Eso me ha generado mucha confusión pues pensaba que se utilizaba spearman en variables no paramétricas y pearson en paramétricas. Esta duda no me permite continuar con mi análisis de datos. Yo estoy utilizando dos instrumentos una es el de ansiedad rasgo-estado (IDARE) y el estilo personal del terapeuta; el primero tiene dos escalas y el segundo cinco. Al momento de hallar la normalidad de las escalas, las dos de ansiedad me salieron con distribución no paramétrica. Las cinco escalas del segundo cuestionario (estilo personal del terapeuta) me salió con distribución paramétrica. Por lo tanto, al momento de realizar el análisis de correlación utilicé el estadístico de Spearman. Ahora según lo que tu comentas en tu publicación, mis dos variables serían de tipo intervalo. Mi duda es si, por ello, tendría que utilizar el estadístico de Pearson, ya que la distribución de la normalidad no tendrían nada que ver.
Te pido por favor, me pudieses ayudar diciéndome si estoy entendiendo correctamente. Disculpa por el texto enorme.
Agradezco tu tiempo.
Saludos.

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  October 9, 2017 at 8:21 AM
  
  Estimada Claudia,
  
  Muchas gracias por escribir a Stats SOS. Exáctamente, tendrías que usar la correlación de Pearson porque Spearman te cambia los datos de numéricos a ordinales dado que trabaja con ese tipo de datos. Además, tu buscas una relación lineal y la correlación de Spearman es monotónica.
  
  ¡Mucho éxito!
  
  LikeLike
  
  Reply
  - Claudia Vera Cano says:
    
    October 10, 2017 at 9:26 AM
    
    Hola Juan Carlos
    Quisiera hacerte una pregunta más, ¿porqué se considera entonces que se debe usar spearman o pearson dependiendo de la normalidad de las variable? Me parece que siempre, en los trabajos de la universidad, lo he trabajado de esa forma o puede que haya sido un error mío; es por ello, que esto me está generando muchas dudas.
    Muchas gracias por tu respuesta, tu página es buenísima, me ha ayudado a refrescar temas de estadística que ya había aprendido y estoy aprendiendo cosas nuevas también.
    Saludos!
    
    LikeLike
    
    Reply
    - Juan Carlos Saravia Drago says:
      
      October 10, 2017 at 9:41 AM
      
      Estimada Claudia,
      
      Muchas gracias por escribir a Stats SOS. Spearman es un distribución que no asume ningún tipo de distribución de datos. Por ello es que se le llama “no paramétrica” (a pesar que tenga igual parámetros pero esa es una discusión para otro día). Por eso es que te lo enseñaron de esa manera. Seguro en el camino se asumió que “no paramétrico” es que “no tenga una distribución normal o simétrica” cuando en realidad “no paramétrico” para este caso es que “no asume una distribución específica”.
      
      ¡Mucho éxito!
      
      LikeLike
      
      Reply
Anonymous says:

October 21, 2017 at 12:12 PM

Buenos días, mi consulta es la siguiente cuando se utiliza un instrumento para medir por ejemplo ansiedad y sus alternativas son Si/No. Estas respuestas pasan a transformarse en puntuaciones T. A la hora de realizar una análisis de asociación de esta variable con rendimiento académico (bueno (promedio escolar=4.00 a 5.00)-regular(promedio escolar=3-3.99)-fracasado (promedio escolar=por debajo de 2), use correlación de Pearson o puedo usar biserial? Gracias

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  October 23, 2017 at 8:40 AM
  
  Estimad@,
  
  Muchas gracias por escribir a Stats SOS. Si ambas variables terminan teniendo un puntaje cuantitativo podrías usar una correlación de Pearson. Si una es cuantitativa y la otra es nominal con dos opciones (Sí/No), ahí puedes usar Biserial puntual o una T Student.
  
  ¡Mucho éxito!
  
  LikeLike
  
  Reply
Anonimo says:

June 2, 2018 at 11:52 AM

Hola Juan Carlos! Una pregunta, si estoy realizando una correlación de Spearman, también puedo usar los criterios de Cohen? Tengo en cuenta que generalmente se usa Pearson a pesar de la normalidad o no normalidad, sin embargo aun me interesaria saber si sera aplicable
Saludos y gracias!

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  June 5, 2018 at 7:38 AM
  
  Estimad@,
  
  Muchas gracias por escribir a Stats SOS. Sí podrías usar los criterios de Cohen para Spearman. Por otro lado, la distribución normal de los datos no tiene nada que ver con el tipo de correlación que utilices.
  
  Mucho éxito!
  
  LikeLike
  
  Reply
Eduardo says:

June 9, 2018 at 11:40 AM

Buenos días, Juan Carlos. Ante todo enhorabuena por tus explicaciones tan didácticas. Me gustaría preguntarte por algo que me tiene bloqueado. Estoy haciendo correlaciones entre tres grupos (1, 2 y 3) por un lado y 10 grupos (a-j) por otro lado, es decir: 1-a; 1-b; 1-c.. ; y luego 2-a; 2-b; 2-c… etc. ¿Sería necesario hacer el ajuste Bonferroni ahí? Lo digo porque he visto en algunos artículos que hacen estos ajustes (concretamente en correlaciones parciales) y ahora me asalta la duda. ¿Cuándo se hacen entonces ajustes Bonferroni en correlaciones y cómo pueden calcularse? Tengo spss, y ese ajuste solo está en ANOVAS. ¡Muchísimas gracias por tu ayuda!

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  October 23, 2018 at 8:10 PM
  
  Estimado Eduardo,
  
  Muchas gracias por escribir a Stats SOS. El ajuste de Bonferoni se da más en ANOVA y no tanto en la regresión. Si bien ambos en el fondo vienen de la misma familia y son el mismo análisis son que uno con múltiples grupos y el otro con variables que solo tienen dos grupos. En este caso Bonferroni solo se aplicaría para ANOVA.
  
  Mucho éxito!
  
  LikeLike
  
  Reply
Anonymous says:

July 1, 2018 at 9:59 PM

Hola Juan Carlos, después de un año vuelvo a tu página con más preguntas, tratando de comprender mis resultados de análisis. Tengo un par de dudas:
Primero, cuando hay una varianza compartida muy baja, ¿significa que en la muestra algunas variables tuvieron esa relación (positiva digamos) y otras no? ¿O es que en general el aumento de una tiene muy poco que ver con el aumento de la otra?
Segundo, ¿es posible que una relación cuadrática sea leída de manera lineal pero con una varianza compartida muy baja? Medí dos variables (Percepción emocional e Ira), y se esperaba una relación negativa, sin embargo salió positiva. Pienso que, según literatura, cuando hay mucha percepción ya no sea adecuado y genere que Ira también suba. Sin embargo, quería saber si podía suceder esto desde lo estadístico. No sé si me dejé entender.
¡¡Te agradezco de antemano la ayuda!! Saludos

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  July 2, 2018 at 8:09 AM
  
  Estimad@,
  
  Muchas gracias por escribir a Stats SOS. Voy a enumerar tus preguntas:
  1) Sí, tal cual si la correlación es baja quiere decir que las variables no se relacionan mucho entre sí.
  2) Sí podría ocurrir pero la relación lineal sería bien baja y la forma cuadrática explicaría mucho mejor el modelo.
  
  Mucho éxito!
  
  LikeLike
  
  Reply
  - Anonymous says:
    
    July 14, 2018 at 9:19 PM
    
    Entiendo. Muchas gracias!!
    
    LikeLike
    
    Reply
Carla says:

December 5, 2018 at 5:30 PM

Estimado Juan Carlos:
Primero, felicitarte por tu página, me ha ayudado mucho y despejado muchas dudas. Tengo una consulta. Entiendo que la correlación de Pearson se utiliza para evaluar variables que tengan una relación línea, por lo que estoy haciendo los análisis de relación gráficos de las variables, pero desde qué grado (no sé si es correcto decir grado) de relación lineal puedo considerar que efectivamente tienen esa relación. Por ejemplo, al realizar los gráficos aparece en la parte superior derecha un R2 Lineal = 0,02 ¿podría afirmar que tienen algún grado de relación lineal? O ¿Cuál es el rango desde el que puedo afirmar esa relación para justificar la correlación de Pearson.

Espero se entienda la pregunta.

Saludos

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  December 5, 2018 at 10:06 PM
  
  Estimada Carla,
  
  Muchas gracias por escribir a Stats SOS. Mira, yo tomaría que una correlación existe desde un r = .10. Si bien en ese caso el R2 te saldrá bajo podrías comenzar a partir de un valor de correlación (r) a partir de .10.
  
  Mucho éxito!
  
  LikeLike
  
  Reply
Alejandra Cabrera says:

January 15, 2019 at 12:13 PM

Hola Juan Carlos,
Muchas gracias por este blog y por tu generosidad al compartir tus conocimientos.
Tengo una confusión tremenda porque estoy analizando una escala que intenta medir la valoración del patrimonio cultural y correlacionarlo con la exposición al patrimonio (o sea las visitas que hace la gente a monumentos y museos). Pero la relación me da negativa. ¿Será que estoy haciendo una mala interpretación de los datos?

Correlaciones
Creenc Creencias sobre el patrimonio
ConductaV Conducta sobre el patrimonio Correlación de Pearson -,094*
Sig. (unilateral) ,033
N 388
* La correlación es significativa al nivel 0,05 (unilateral).

Correlaciones
NTOT Natid Total
ConductaV Conducta sobre el patrimonio Correlación de Pearson -,126**
Sig. (unilateral) ,007
N 380
** La correlación es significante al nivel 0,01 (unilateral).

Muchas, muchas gracias,

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  January 30, 2019 at 10:12 PM
  
  Estimada Alejandra,
  
  Muchas gracias por escribirme a Stats SOS. Si bien tu correlación es positiva casi no supera el .10 lo cual es bastante baja más allá de que sea positiva o negativa es posible que estas variables no se relacionen entre sí y por eso salen resultados confusos. La significancia podría estar saliendo significativa por el tamaño de muestra que tienes.
  
  Mucho éxito!
  
  LikeLike
  
  Reply
pablo says:

May 21, 2019 at 9:50 PM

Hola, Juan Carlos. quería consultarte sobre una pregunta que surgió en mi facultad, ¿por qué falla el coeficiente de correlación lineal o correlación de Pearson en el cuarteto de anscombe? entiendo que a simple vista es fácil ver que los gráficos 2 al 4 no se comportan linealmente pero teóricamente debería estar mal y no encuentro el por que te da para todos una muy alta correlación. Desde ya muchas gracias y éxitos!

LikeLike

Reply
Ligia Munoz says:

June 13, 2019 at 2:24 PM

Hola Juan Carlos, estoy leyendo tu post y me pareció genial. Solo tengo una duda, en el manual de graphpad (que es el que estoy usando), el porcentaje de relación se lo otorgan a R^2, no a r, es decir, si mi r=0.5 R^2=0.25 y ese es el porcentaje en que covarian ¿qué es lo correcto? gracias.
Saludos.

LikeLike

Reply
maria clara says:

October 13, 2020 at 7:13 PM

Hola Juan Carlos! gracias pro este post, me fue de mucha ayuda. Me gustaria preguntarte por los criterios de Cohen para la fuerza de una correlación, donde podria tener acceso a las referencias de ese cuadro? por otro lado, si mis correlaciones varian de .30 a .35, como se interpretarian? como bajas? aun que sean dentro del marco de una investigacion en psicologia, con variables como consumo y ansiedad y depresion?
Gracias

LikeLike

Reply
- Juan Carlos Saravia Drago says:
  
  March 11, 2021 at 10:08 AM
  
  Hola Maria Clara, sí lamentablemente sí serían bajas según esos criterios. Pero sí, haría hincapié que dado que es una investigación en ciencias sociales obtener correlaciones tan altas es difícil. Exitos!
  
  LikeLike
  
  Reply