No es paramétrico, ¿Y ahora? ¡Cómo comparo! La U de Mann-Whitney

Estimados todos, ¿cómo les va? Saludos, muchos saludos para ustedes. Espero que estén muy bien. Nosotros aquí seguimos avanzando, escribiendo más posts, compartiendo y creciendo. ¿Y por qué no? ¡De eso se trata, de aprender y crecer! Espero que para este momento le hayan perdido el temor a este tema de la estadística y sus aventuras por acá estén siendo muy gratas.

Tal como me pidieron, por un momento me moveré del mundo lineal. En el post de hoy, ¿adivinen qué vamos a tratar? (Así es, el título tiene la clave y creo que ya pueden adivinar los objetivos del post :)). Aunque no lo crean, ya hemos visto algunas ideas sobre este análisis. Si volvemos en el tiempo al post de rangos promedio, verán que al final mencionamos la U de Mann Whitney. Esto se debe a que este análisis trabaja con rangos promedio. 

Dicho esto, vamos a lo nuestro. La U de Mann Whitney es un análisis no lineal, que trabaja con variables ordinales y lo que busca es contrastar dos grupos diferentes cuando los datos que queremos comparar son ordinales o con una distribución no normal. ¿Qué es esto? No se preocupen, si no recuerdan qué es una variable ordinal siempre pueden volver a ese post, si su curiosidad continúa pueden ir a este post para recordar qué es una distribución no normal.

En palabras coloquiales, la U de Mann Whitney, es la versión no lineal de la T-Student para muestras independientes (que es un análisis lineal). Los que no recuerdan qué es una T-Student siempre pueden ir a este post que les podría ser de mucha.

Entonces, recapitulando antes de ir a nuestro maravilloso ejemplo. La U de Mann Whitney tiene dos funciones importantes: a) Comparar datos ordinales de dos grupos distintos y para ello, comparamos los rangos promedio. b) En el momento que la distribución de los puntajes de alguno de nuestros grupos no es normal, utilizamos este análisis. Sin embargo, como ustedes bien saben, excelentes lectores, los puntajes son variables de intervalo (ver post), por ello, no se pueden usar l0s rangos promedio porque esos cálculos están diseñados para variables ordinales. ¡Entonces! ¿Qué hacemos? Contenemos las lágrimas y el susto, y en lugar de comparar los rangos promedios, comparamos las medianas. ¿Por qué las medianas? Muy sencillo, porque este estadístico es el punto céntrico en un grupo de puntajes y eso soluciona el problema que la distribución de los puntajes que tienen no sea normal. Los que no recuerden detalles sobre la mediana siempre pueden volver a este post. 

¡Muy bien! ¿Siguen acá? ¿Se asustaron? Estoy seguro que no. Mejor vamos a un ejemplo, para este caso solo pondré uno:  Una comparación de dos grupos con una variable de intervalo y que la distribución de sus puntajes es no normal. ¿Por qué? Porque este blog está dirigido ha profesionales de ciencias sociales. El uso de los rangos promedio  tiene un peso más matemático. Además, por motivos prácticos, es bien complicado interpretar un rango promedio. De todos modos, quería presentarlo porque es importante que sepamos que existe y tenerlo en cuenta para no cometer el error de usarlo cuando no se debe utilizar. 

Imagínense que tenemos curiosidad de conocer si existen diferencias en la percepción de ingreso mensual necesario para vivir (Variable A) entre hombres y mujeres (Variable B). Encuestamos a nuestros participantes peruanos, luego, ingresamos toda la data y…¿Qué hacemos? Primero, antes que nada debemos revisar si es que la distribución de nuestra (variable A) es no paramétrica. 

Para hacer esto tenemos que hacer dos pasos.

Paso 1: Separar nuestra variable entre hombres y mujeres.

Para ello, en SPSS debemos seguir a la siguiente ruta:

Datos/Dividir archivo/

Aquí debemos hacer click (pinchar) en la opción que dice “Comparar grupos” y luego ingresar en “Grupos basados en” la variable “Sexo” para comparar por sexo. Luego Aceptar. 

Paso 2: Revisar la asimetria y curtosis para ver si la distribución es no paramétrica o no. Los que no recuerdan qué eran estos estadísticos, siempre pueden ir a este post que les puede dar un excelente recordatorio. Recuerden que existen ciertos criterios. Si la asimetría es mayor a 3 y/o la curtosis es mayor a 8, esto quiere decir que la distribución es no normal. Para mayor información pueden ir a este post. (Kline, 1998; 2005).

Para revisar la asimetría y curtosis debemos seguir la siguiente ruta:

Analizar/Estadísticos descriptivos/Frecuencias/Estadísticos/

Aquí sería bueno solo marcar, Curtosis, Asimetría y Mediana (que la usaremos luego). Luego ponemos en “Variables” la percepción de ingreso mensual necesario para vivir (Variable A) y Aceptar.

Los resultados obtenidos fueron una asimetría de 6.163 y una curtosis de 92.039 para la distribución de puntajes de hombres y una asimetría de 4.53 y una curtosis de 53.92 para la distribución de puntajes de mujeres. Como ven esto es claramente mayor a los valores que comentamos antes entonces podemos decir que la distribución de puntajes es no parametríca. ¿Qué puntajes? Los de percepción de ingreso mensual necesario.

¡Que genial! Ahora tenemos que hacer la prueba de significancia y ver si hay diferencias por sexo en la percepción de ingreso mensual necesario.

Para ello debemos seguir dos pasos.

Paso 1: Sacar la división por sexo.

En este caso, debemos volver a esta ruta.

Datos/Dividir archivo/

Aquí es necesario presionar en la opción que dice. Analizar todos los casos no crear grupos. Luego, obviamente, Aceptar.

¡Perfecto!

Paso 2: Hacer la prueba de U de Mann Whitney.

Para ello, debemos seguir la siguiente ruta:

Analizar/Pruebas no paramétricas/Cuadros de diálogos antiguos/2 muestras independientes/

En este caso uso cuadros de diálogos antiguos porque me gusta ponerme “old school” :).

Luego, en lista de contrastar variables ponemos la que queremos medir. En este caso es la percepción de ingreso mensual necesario para vivir (Variable A), luego en variable de agrupación ponemos Sexo (Variable B). Aparte, podemos hacer click (pinchar) en opciones y poner descriptivos para tener los estadísticos descriptivos y Aceptar. 

Nota: Es importante que esté marcada la casilla que dice U de Mann Whitney, porque sino ¡estaremos haciendo otro análisis!

¡Genial! ¡Ahora a ver nuestras tablas!

Tabla 1

descriptivosUmann

Esta primera tabla básicamente lo que nos menciona son los estadísticos descriptivos de la prueba así como la cantidad de personas (la N). Los que no recuerdan qué era un estadísticos descriptivo siempre pueden ir a este post. Aquí no me detendré mucho, más bien pasaré velozmente hasta la tabla que más nos importa.

Tabla 2

Umannwhitneyrangos

En este tabla están los rangos promedios. Como ya les mencioné la U de Mann Whitney trabaja con Rangos promedios, pero son muy difíciles de interpretar. Aparte, cuando se comparan grupos con una variable que tiene una distribución no normal, se usa U de Mann Whitney pero se revisa la Mediana. Esta tabla solo la puse para que sepan cómo trabaja el SPSS, pero recuerden no reporten en sus informes los rangos promedios al comparar variables que tienen una distribución no paramétrica.

Tabla 3

significancia

¡Excelente! ¡Vamos a lo que nos interesa! Como ustedes pueden ver bien, aquí hay varios estadísticos. La U de Mann-Whitney, sale a raíz de una serie de cálculos utilizando los rangos promedios y la Z. Pero para términos prácticos, lo que más nos interesa es si hay diferencias entre sexo por percepción de ingreso mensual necesario para vivir. En ese caso, tenemos que ver la significación y percatarnos como siempre, si es menor a 0.05 o no. Si no recuerdan por qué usamos ese punto de corte, siempre pueden volver en el tiempo a este post que toca este tema con mayor profundidad.

¡Genial! Como vemos, la significación es mucho menor a 0.05 lo cual significa que sí existen diferencias entre percepción de ingreso mensual necesario para vivir por sexo. Pero ahora, la pregunta del millón, ¿Cuál es mayor?

¡Muy sencillo! ¿Recuerdan que calculamos la Mediana anteriormente? ¡Bueno! ¡Ahora, nos será de ayuda!

Para este caso, no pondré una tabla extra para no llenarnos de tablas. En este ejemplo, la mediana para hombres salió 1200 mientras que para mujeres 1000. Combinando estos datos con la tabla 3, podemos decir que existe una diferencia significativa en la percepción de ingreso mensual necesario para vivir entre hombres y mujeres. Donde los hombres, perciben que se necesita mayor dinero para vivir mensualmente que las mujeres.

Entiendo que este post, ha sido realmente bastante largo, pero espero que sigan acá, valientes lectores. Estos análisis no se suelen utilizar demasiado, pero de todos modos es bueno conocerlos y uno nunca sabe cuándo puede toparse con una situación que requiere utilizarlos. Para la siguiente aventura me gustaría sorprenderlos. Por ello, no les diré el análisis que haremos. Sino que me encantaría que ustedes mismos se sorprendan cuando aparezca.

Recuerden que siempre pueden comentar en la parte de comentarios y encantado de responderles.

¡Buenas vibras para todos!

Referencias

– Kline, R. B. (1998). Principles and practice of structural equation modeling. NY: Guilford Press.
– Kline, R.B. (2005), Principles and Practice of Structural Equation Modeling (2nd Edition ed.). New York: The Guilford Press.

Advertisement

About Juan Carlos Saravia

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
This entry was posted in Básico 2.0 and tagged , , , , , . Bookmark the permalink.

41 Responses to No es paramétrico, ¿Y ahora? ¡Cómo comparo! La U de Mann-Whitney

  1. Daniel says:

    Juan Carlos, Bastante interesante el post! Dos consultas simples con respecto al modo de definir si es paramétrico o no. En vez de verificar la normalidad con la curtosis y la asimetría, es posible determinarlo con el grafico de prueba de normalidad y sus estadisticos?
    Segundo, que es exactamente un análisis no paramétrico? Cuando las variables no se comportan de manera lineal y nada más? Quisiera saber un poco más en términos teóricos a qué se refiere con no paramétrico.

    Gracias!

    Like

    • Hola Daniel,

      ¡Muchas gracias por tu comentario! Sobre tus preguntas:
      1) Sí, es posible determinarlo con el Histograma que te muestra gráficamente la distribución de tus puntajes. Por otro lado, los estadísticos Shapiro Wilk y Kolmogorov Smirnov también son de ayuda. El tema con estos análisis especialmente el segundo es que hay una tendencia a arrojar que la distribución no es paramétrica o normal, cuando en realidad la distribución de los puntajes no está tan lejos de la normalidad.
      2) Más que un análisis no paramétrico es que los puntajes están distribuidos de forma no paramétrica o normal.
      Por ejemplo, la U de Mann Whitney es un análisis no lineal, porque no asume que la relación de las variables tiene una forma lineal (como lo hace la t-student o más claramente la correlación de Pearson). Como este análisis no asume que la relación de dos variables (sexo y percepción de ingresos) tienen una relación lineal entonces no requiere de variables que tienen puntajes con una distribución normal (paramétrica).
      Dicho esto, se utiliza la U de Mann Whitney para analizar datos que no están distribuidos de forma normal porque este análisis no se perjudica si los datos son de esta manera. En cambio, en la T-student el requisito para su uso es que la relación sea lineal entre dos variables y que la distribución de los puntajes de las variables sea normal o paramétrica.
      Espero que esto haya sido de ayuda, cualquier cosa siempre puedes seguir escribiéndome. ¡Qué todo vaya bien!
      ¡Buenas vibras!

      Like

  2. Daniel says:

    Muchas gracias! todo está clarisimo!

    Like

  3. Cecilia Chau says:

    Te sigo en tus mensajes y realmente aprendo mucho

    Like

  4. Pingback: ¿Muestras no paramétricas relacionadas? La W-wilcoxon | Stats SOS

  5. Anonymous says:

    Hola Juan Carlos,

    Tu blog está muy bueno, felicitaciones! La verdad es que me está ayudando bastante con mis análisis para la tesis. Te quería hacer una consulta… Mi tesis es sobre afrontamiento y autoeficacia en adultas jóvenes internas en un establecimiento penitenciario de Lima Metropolitana. Mi muestra total es de 110 internas.

    Estoy realizando comparaciones de medias a partir de variables sociodemográficas y de condición penitenciaria. Mi duda es que algunos análisis me han salido significativos y están super interesantes pero los grupos que comparo (dos muestras) son bastante distintos en proporción.

    Por ejemplo,
    – Autoeficacia de acuerdo a asistencia a terapias individuales… la cantidad de personas que asiste es de 98 y la que no asiste es de 12
    – Estrategias de afrontamiento enfocadas en el problema de acuerdo a si son primarias o reincidentes es de 107 vs 3
    … y así con varias variables

    Mi duda es si existe algun punto de corte minimo para que realmente se considere porque pensaba en que normalmente nos piden una n mayor a 30. No se si considerar esos análisis o si es necesario hacer algún análisis posterior.

    Quería saber tu opinión

    Muchas gracias y que te esté yendo muy bien!

    Like

    • Estimado/a,

      Muchas gracias por escribir en el blog. A ver, voy a responder a tu consulta de la siguiente manera, primero sacaremos el tema de los tamaños de la muestra y luego iremos directo a tu consulta sobre las comparaciones de medias.
      1) Sí, lo convencional es un N = 30 por cada grupo, sin embargo, esta regla es arbitraria, hay otros autores que te dicen 20 o incluso 50. Es arbitrario, pero lo que te puedo decir es que por ejemplo, si calculas tu tamaño de muestra (N), a priori de hacer tu estudio para un efecto grande (tamaño del efecto de 0.8) (el más general de todos) como mínimo necesitas 35 personas por grupo.
      Esto se puede calcular con el G*Power, un programa gratuito que está en internet. Aquí pongo el enlace si es que quieres revisar el programa: http://www.gpower.hhu.de
      2) Resuelto el punto 1, vamos al dos, hay un tema con tus grupos. Son demasiado disparejos entonces las comparaciones serían posiblemente sesgadas. Por ende, no recomendaría analizar esos grupos con esos tamaño de muestra. ¡Pero no desesperes! Hay varias rutas para enfrentar este tema. Iré desde la mejor pero mucho más complicada hasta la más sencilla.
      a) Puedes recoger más data, en otras palabras agrandar tu muestra. Esta puede ser una opción difícil por razones de tiempo entre otras cosas.
      b) Puedes distribuir los grupos de manera distinta. En lugar de hacer clasificaciones como asiste a terapia individual vs no asiste a terapia individual, quizás separar en tres grupos con características diferentes pero tomando en cuenta está característica sobre terapia individual. Por dar un ejemplo, separar en tres grupos donde un grupo ha ido 4 veces o más a terapia, un segundo grupo entre 3 o 2 veces y un tercer grupo 1 o ninguna vez a terapia. Aquí pongo un ejemplo, esto podría permitirte equiparar los grupos y tener grupos más homogéneos. Lo importante es que haya algo de teoría detrás de la nueva clasificación que hagas.
      c) Tomando en cuenta la homogeneidad de los grupos también sería importante revisar la normalidad, porque con grupos muy pequeños (12 personas), es menor la probabilidad que la distribución de los puntajes de Autoeficacia tengan una distribución normal. Ni hablar del grupo de 3 personas, creo que eso no está en discusión, con 3 personas es muy complicado comparar. Aquí la opción b se vuelve muy atractiva para utilizar.
      Dicho esto, luego de revisar la normalidad intentar una U de Mann Whitney podría ser un camino porque este análisis no toma en cuenta si los grupos tienen puntajes con distribución normal. Pero de todos modos intentaría equiparar lo más posible los grupos y ver si puedo hacer una t-student.
      d) Aquí nos podemos poner más creativos pero a la vez más conservadores. No solo reportaría valores p (significancia) argumentando que con muestras más pequeñas es fácil obtener una significancia que sea sesgada (entonces podemos caer en un error tipo 1 o tipo 2). En el blog en la pestaña de conceptos hay un post sobe tipos de errores aquí dejo el enlace: http://statssos.net/2014/11/24/errores-existian-errores-en-estadistica/
      Entonces, reportaría los tamaños del efecto que es la famosa d de Cohen. Aquí pongo un enlace para poder ver estas fórmulas la página 4 puede ser de mucha ayuda para esta situación: http://www.bwgriffin.com/gsu/courses/edur9131/content/Effect_Sizes_pdf5.pdf
      Ojo, pestaña y ceja, no te alarmes con los cálculos, estos puedes hacerlos a mano (sobretodo la desviación estándar) o le puedes pedir al programa estadístico que te de la desviación estándar de autoeficacia (por ejemplo) de tus 110 personas y con eso tienes la desviación estándar agrupada (Pooled standard deviation). Luego sí tendrías que calcular la d de cohen pero ese cálculo es más amigable (aunque con excel lo puedes hacer también :)).
      ¿Qué haces con esto? Muy sencillo, reportas estos cálculos, argumentas que no se pudo calcular una significancia sin el riesgo de caer en un error por la gran desigualdad de grupos pero que estos cálculos podría darnos indicios de la diferencia en autoestima entre tener terapia o no. Luego, recomendar que en estudios posteriores se podría recoger mayor cantidad de muestra para fortalecer esta idea (si es que encuentras un interesante tamaño del efecto) y si es que se puede reproducir esta diferencia con grupos con muestras más grandes.
      ¡Bueno! ¡Creo que salió bastante largo!
      Espero que haya podido ser de ayuda y me haya dejado entender. Muchos éxitos con tu investigación y ¡para adelante!
      ¡Buenas vibras!

      Like

  6. Anonymous says:

    Estimado Juan Carlos,

    Muchas gracias por tu ayuda. Me queda mucho más claro lo que debo hacer. Sin embargo, me quedaron un par de dudas…

    Con respecto al punto d), no me queda muy claro si el análisis es también para análisis no paramétricos o si ahí se haría algo distinto. Te lo pregunto porque casi todos mis análisis son con U de Mann Whitney y en el link que me mandaste salía d de cohen para T-tests.

    Por otro lado, me quedó una duda a partir de tu señalamiento en el punto c). Cuando uno desea realizar comparación de medias o medianas entre una escala y una variable sociodemográfica. Por ejemplo, autoeficacia y grado de instrucción, entiendo que primero debo sacar una prueba de normalidad para decidir que análisis hacer posteriormente (NP-P). Yo he pedido la prueba de normalidad para grado de instrucción en general, entonces si es que autoeficacia me salió P y grado de instrucción NP, realicé análisis no paramétricos. Según lo que me planteas, entiendo que debería de haber segmentado el grupo para pedir la prueba de normalidad? Es decir, separarlo en mis etiquetas (con estudios superiores- sin estudios superiores). Entiendo que ahí tendría que ver la normalidad de cada subgrupo, decidir si es P o NP y luego compararlo con la normalidad de autoeficacia y decir si finalmente mis análisis son P o NP. Esa parte es la que no me queda muy clara… de ser así como se le pide a SPSS que haga dicha división… o esta bien pedirlo en general?

    Muchas gracias por tu ayuda!

    Carolina

    Like

    • Estimada Carolina,

      De nuevo, muchas gracias por escribir aquí en los comentarios.
      A ver, comencemos con el punto d. Si necesitas usar U de Mann Whitney, entonces no puedes usar la de d cohen. Como me decías que estabas haciendo comparaciones de medias fuí por esa ruta. ¡Pero no nos desesperemos! Hay solución. En lugar de usar la d de cohen puedes usar la r de Rosentock que es un cálculo para el tamaño del efecto cuando utilizas análisis no lineales como en este caso la U de Mann Whitney.
      En el libro de Andy Field puedes encontrar esa fórmula:

      Click to access andy-field-discovering-statistics-using-spss-third-edition-2009.pdf

      Sobre el punto c, así es. Debes segmentar los grupos y correr un análisis de normalidad para tus grupos. Este post sobre U de Mann Whitney puede ayudar porque ahí está la ruta de cómo hacer ese proceso. La data la divides con esta ruta:
      Datos/Dividir archivo/
      Luego corres la normalidad por cada grupo.
      Si encuentras alguna dificultad, no hay problema, este mismo post justo va paso por paso cómo hacer la U de Mann Whitney e incluso cómo dividir o segmentar por diferentes grupos. Así que todo bien.
      Espero que me haya dejado entender sobre el punto C y D.
      ¡Muchos éxitos!
      ¡Buenas vibras!

      Like

  7. Pingback: Mis grupos son diferentes ¿Cuán diferentes? El tamaño del efecto | Stats SOS

  8. Patricia says:

    Antes de nada, agradecerte infinitamente tu trabajo. ¡No sabes lo mucho que me ha ayudado tu blog!
    Quería hacerte una pregunta: He utilizado una U de Mann-Whitney para comparar las puntuaciones entre dos grupos (alumnos con sintomatología – alumnos sin sintomatología) en 3 variables (medidas en escala likert) en dos momentos distintos con los mismos alumnos (examen 1 y examen 2). A su vez, antes de realizar la U de Mann-Whitney, dividí los datos (datos / dividir archivo / comparar grupos) en dos (hombres y mujeres).
    Acabo de leer sobre la prueba de Kruskal-Wallis y veo que también cuadraría con las características de mi análisis. Tengo las significaciones y he mirado también el tamaño del efecto y los datos me parecían tener mucho sentido pero… ¿Debería considerar el uso de KW en lugar de la U de Mann-Whitney?

    ¡Muchísimas gracias!

    Like

    • Estimada Patricia,

      Muchas gracias por escribir a Stats SOS. A ver sobre tu tema hay varias situaciones y por ende múltiples análisis, voy a enumerarlos para hacer más ordenado el discurso:
      1) Está muy bien que hagas una U de Mann-Whitney para muestras independientes (grupo con y sin sintomatología)
      2) Para hacer el análisis con dos momentos distintos a lo largo del tiempo es mejor en este caso hacer una W de Wilcoxon que ve muestras relacionadas. En otras palabras, dos mediciones a la misma muestra a lo largo del tiempo.
      3) La prueba de KW es el análogo del ANOVA pero cuando tus muestras no son paramétricas. Por ende, para poder utilizarlo necesitas 3 grupos a más. En el Blog hay un post de ANOVA entonces ahí podrías mirar un poco de qué trata.

      Espero que esto sea de ayuda.

      ¡Mucho éxito!

      Like

  9. Guillermo says:

    Hola,
    Recientemente he realizado unos análisis con U de Mann-Whitney y veo que uno de los resultados con significación estadística tiene un valor U de .000. ¿Puede tratarse de algún error?
    Muchísimas gracias por tu ayuda. Tu página es siempre un gran recurso para aprender.
    Un saludo,

    Like

    • Hola Guillermo,

      Muchas gracias por escribir a Stats SOS. Cuando tu U es igual a 0 significa que todos los datos de uno de tus grupos es mayor a todos los datos de otro de tus grupos. Si el valor p es significativo entonces esas diferencias son estadísticamente significativas.

      En otras palabras, no hay un problema en tu análisis.

      Saludos y mucho éxito

      Like

  10. Noemí says:

    Hola Juan Carlos,

    Tengo una duda sobre la presentación de mis datos. He realizado una prueba U de Mann y he presentado los resultados en una tabla en la que aparece en valor de U, Z y p. Creo que sería interesante ofrecer antes algunos estadísticos como la Media y la DT, pero no sé si eso tiene mucho sentido puesto que la prueba U se basa en los rangos promedio (y el rango promedio, a simple vista no me dice demasiado). ¿Tiene sentido? ¿Debería mejor exponer la Mediana en lugar de la Media?

    Muchísimas gracias por tu ayuda con este y con muchos otro temas… ¡¡¡Tu blog es una gran ayuda!!!

    Like

    • Hola Noemí,

      Muchas gracias por escribir a Stats SOS. Muy preciso tu comentario. Exactamente, no hace mucho sentido presentar medias, haría mucho más sentido presentar medianas y contrastarlas.

      ¡Me alegra que el blog es de ayuda para ti!

      ¡Mucho éxito!

      Like

  11. ache90 says:

    Juan Carlos, una consulta:

    ¿Se suele comparar medianas cuando los dos grupos que tienes difieren mucho en el N? Es decir si yo tengo un grupo con 20 personas y otro con 70, valdría la pena hacer el análisis? aun sabiendo que entre los dos grupos hay una diferencia de 50 personas?
    Te lo pregunto porque desde lo que yo recuerdo que nos explicaron no era lo mas adecuado, es decir que no habría mucho sentido.
    En la investigación que estoy realizando no es mi objetivo hacer este tipo de comparaciones, las he realizado de manera complementaria, pero no con todas las variables sociodemográficas, justamente por ese motivo, y no se si estoy en lo correcto o no.
    Espero puedas orientarme.

    Carolina

    Like

    • Hola Carolina,

      Muchas gracias por escribir a Stats SOS. Mira, la respuesta real es “depende”. Por un lado, comparas medianas si es que uno de los grupos tiene puntajes donde la distribución no es paramétrica. Si ambas distribuciones de puntajes son paramétricas, puedes comparar medias sería lo más adecuado.

      El otro tema, que es la desproporción de los dos grupos, le diste al blanco. Es posible hacerlo pero no es muy recomendable. Por ejemplo, puede ser que encuentres diferencias significativas entre los grupos pero dada la gran diferencia de personas que hay en cada grupo puede ser que tu hallazgo sea porque estás comparando grupos muy desiguales y no porque específicamente son diferentes.

      En conclusión, si estuviera en tu posición no lo haría creo que tu lógica está bastante acertada.

      ¡Mucho éxito!

      Like

  12. adrianseg says:

    Buenas Juan Carlos, estoy realizando una U de Mann-Whitney para dos grupos independientes. Al ser puntuaciones de una escala (compuesta por tres subescalas), sino he entendido mal no puedo basarme en los promedios para decir que grupo puntúa más o menos alto al tener una U singificativa. El problema viene al usar las medianas, ya que en un caso concreto, en las subescalas coinciden las medianas y la U es singificativa. ¿Cómo averiguo que grupo puntúa más algo que otro sino puedo utilizar la media o el promedio? gracias.

    Like

  13. Ale says:

    Hola Juan Carlos,

    Muy interesante tu post sobre la U de Mann Whitney. Tenía algunas preguntas. Primero, si el valor U tiene alguna interpretación, más alla de solo ver la significación (por ejemplo, si me sale U=563, ¿sería un valor muy bajo o no importa ese valor para determinar diferencias de grupos?). Asimismo, quería preguntarte qué tan importante es sacar la r de Rosentock si mi muestra es de 119 participantes.

    Gracias por tus posts! son un éxito!

    Like

    • Estimada Ale,

      Muchas gracias por escribir a Stats SOS. La U está relacionada con la Z que a su vez está relacionada con la significancia estadística. De este modo, necesitas calcular la U para calcular la Z. Mientras más alta sea la Z más probabilidad hay que las diferencias que estás comparando sean significativas. En resumen, la U es un insumo que te sirve para eventualmente calcular la significancia estadística. Por ello, no me haría muchos problemas con ella y me encoaría primordialmente en la Z y en la significancia.

      ¡Mucho éxito!

      Like

  14. Cuauhtemoc says:

    Hola
    Juan Carlos
    Realice una encuesta a empresas de 10 preguntas y las respuesta están en escala Likert de 4 valores (1 ninguno 2 deficiente 3 aceptable 4 eficiente).
    Ejemplo:
    Respuesta Pregunta 1 – – – Respuesta Pregunta 10
    Empresa 1 2 3
    Empresa 2 3 2

    Empresa 20 2 3

    Lo que no se es como empezar a trabajar con estos datos estadísticamente. Aparte de esto algunas empresas son micro, otras son pequeñas y otras son medianas.

    Like

    • Estimado Cuauhtemoc,

      Muchas gracias por escribir a Stats SOS. No entiendo bien tu pregunta, ¿en qué quieres trabajar? ¿Qué resultados deseas obtener?
      Por otro lado, para poner las características de tu muestra sería necesario que pongas en columnas aparte el tipo de empresa (una variable) y otra variable (tamaño de la empresa).
      Si tu encuesta tiene un promedio general podrías sumar todos los puntajes y sacar el promedio de cada empresa de tu cuestionario y luego sacar un promedio de los promedios para obtener el promedio de tu encuesta con respecto a toda tu muestra de empresas.
      Otra posibilidad es trabajar pregunta por pregunta y describir (con frecuencias) cada pregunta según el tamaño de la empresa o el tipo de empresa. ¿Me dejo entender?

      ¡Mucho éxito!

      Like

  15. Cuauhtemoc says:

    Ejemplo:
    Respuesta Pregunta 1 – – – Respuesta Pregunta 10
    Empresa 1 2 3
    Empresa 2 3 2

    Empresa 20 2 3

    Like

  16. Cuauhtemoc says:

    Ejemplo
    R1 ——-R10
    Empresa 1—-2 ———2
    Empresa 2—-3———-3
    Empresa 3—-1———-4
    Empresa 20–2———-3

    Like

  17. Maria says:

    Estimado Juan Carlos,

    Realmente ha sido de gran ayuda tu Post. Pero me queda una duda, yo estoy utilizando una prueba de Soporte social y otra de Afrontamiento (el famoso COPE), en internas de un penal de Lima. Para mis variables sociodemográficas dicotomicas, he podido sacar mis estadisticos exitosamente (por ejemplo, en el caso de recibir visitas, que tiene como opcion SI o NO, situación juridica PROCESADA O SENTENCIADA), cuando las puse como variables de agrupación. No obstante, tengo variables como Tipo de Delito, que tienen un sin fin de opciones, pero que me gustaría agruparlos en Delitos Violentos y Delitos relacionados con Obtención de dinero Ilicito, como tambien en el caso de Grado de instrucción tengo Primaria Incompleta, Primaria Completa, y asi sucesivamente hasta Superior Completa, donde me gustaria agruparlos en Secundaria Incompleta para abajo y Secundaria completa para arriba. Pero no me queda claro como puedo hacer para agrupar estas variables al momento de realizar U Mann, debo crear otra variable en mi prueba? O hay alguna manera de hacerlo más fácilmente? Como comprenderas, las agrupo de esta manera para que salgan estadisticos más significativos…

    Like

    • Estimada María,

      Muchas gracias por escribir a Stats SOS. Si quieres crear categorías nuevas te recomendaría crear variables nuevas donde colapsas esos grupos. Colapsar es juntar grupos en uno y cambiarle de nombre.

      Por otro lado, si quieres hacer un análisis no paramétrico con múltiples categorías la U de Mann Whitney no te va a servir. Te recomendaría en ese caso usar primero la prueba de Kruskall-Wallis y luego la de U de Mann Whitney. Este análisis solo funciona con 2 grupos mientras que el Kruskall-Wallis funciona con múltiples grupos.

      ¡Mucho éxito!

      Like

  18. Anonymous says:

    Buenas noches, Juan Carlos, escribe un estudiante que está realizando su tesis con el psicodiagnóstico de Rorschach. Tengo una duda que me tiene estancado en el desarrollo de mi tesis y no encuentro respuestas en ningún lado. Inicialmente mi plan era que mi base de datos tenga como grupo de interés a estudiantes que practiquen un tipo de arte y como grupo de contraste a estudiantes no artistas (U de Mann Whitney entre poblaciones independientes tras obtener no paramétricos en su mayoría), pero finalmente el plan pasó a ser el de contrastar a mi grupo de interés con las normas peruanas de Matilde Raez del 2007, las cuales consisten en una tabla con todas las variables de Rorschach y sus estadísticos descriptivos. He revisado distintas tesis anteriores que contrastan con la data de Matilde y pareciera que todos lo hicieron distinto (varios usan Wilconxon para muestras relacionadas, aunque no me queda clara la relación de dichas muestras) y finalmente no encuentro la forma de cómo hacer la comparación. He corrido mis descriptivos (Explorar con gráficos de normalidad) y luego en una base nueva de SPSS comparé en dos filas las medianas que obtuve con las medianas de la norma (muestras no relacionadas – Mann Whitney), pero me salió todo sin diferencias y no creo que esté bien, por eso sigo dando vueltas… Podrías guiarme en cómo comparar una base de datos -conformada por distintos casos evaluados- con una tabla de estadísticos descriptivos que solo tiene el puntaje global de media, d.e., mediana, etc… de otra población? Estaría muy agradecido con tu guía, ya que youtube no lo logró hacer y la frustración es enorme… Saludos

    Like

    • Estimad@,

      Muchas gracias por escribir a Stats SOS. No me queda muy claro el caso pero en mi experiencia con este tipo de situaciones lo que he visto es que se utiliza la T para una muestra. Sería como si compares tus datos contra los de una población (en este caso los criterios de Matilde Raez).

      ¡Mucho éxito!

      Like

  19. luis says:

    Hola estimado Juan Carlos, solo me gustaría saber cómo se reportan los resultados de la prueba U de Mann-Whitney en un texto científico.
    Saludos.

    Like

  20. luis says:

    Que tal
    me gustaría saber como se reportan los resultados de un kruskal-wallis?
    Por favor
    Saludos

    Like

  21. Flavio says:

    Hola Juan Carlos, estoy con la parte estadística de mi tesis y me gustaría que me guiara en que estadisticos me conviene mas utilizar mi tema es medición de altura de plantas altura de la raíz y pesos de las mismas tengo 8 tratamientos con 10 repeticiones son 6 variables a medir de los 8 tratamientos 2 me dieron resultados de ceros (0) y los otros 6 si son normales que me recomienda usted utilizar?

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s