¿Muestras no paramétricas relacionadas? La W-wilcoxon

Estimados todos, bienvenidos a una nueva aventura de Stats SOS. Espero que estén muy bien. En el capítulo de hoy estamos de vuelta en el mundo no lineal. Así es, en la aventura de hoy, veremos el análisis del título de hoy. Aunque no lo crean, ya hemos visto ciertos elementos que nos podrán ayudar a entender con mayor facilidad este análisis.

¡Vamos a lo nuestro! El post de hoy, es describir de manera sencilla la W de Wilcoxon. Como ya mencioné, este análisis es no lineal. Pero además, se utiliza cuando ocurren dos cosas: a) tenemos muestras relacionados y b) cuando nuestros datos son ordinales o tienen una distribución no normal. Con calma, los que no recuerdan qué es un dato ordinal siempre pueden ir ha este episodio 🙂

En ese caso, este análisis, en sencillo, podría decirse que es la versión no lineal y no normal de la t-student de muestras relacionadas. Los que no recuerdan qué es este análisis siempre pueden ir a este post como un recordatorio :). Por otro lado, los que no recuerdan qué es una muestra no normal, ¡No hay problema! Siempre pueden volver a este post que les puede dar ciertas ideas.

Antes de comenzar nuestro ejemplo sería genial poder preparar todo el escenario para mostrar la W de Wilcoxon. Entonces, hasta ahora hemos dicho dos cosas: a) utiliza muestras relacionadas, b) usa datos ordinales  y ahora agregaré tres más: c) por defecto utiliza rangos promedio (ver post), d) cuando se quieren comparar dos mediciones de intervalo que la distribución no es normal se usa la mediana (ver post) y e) el análisis es útil para analizar un mismo grupo al que se le ha hecho dos mediciones en momentos distintos. Este análisis no se puede hacer con más de dos mediciones.

¡Excelente ahora vamos a lo nuestro! (tambores de entrada), un ejemplo. Imagínense que queremos ver si es que la música clásica realmente nos ayuda a recordar mayor información. En ese caso, juntamos 32 jóvenes y hacemos la siguiente tarea:

Paso 1: Les mostramos 15 palabras, a los jóvenes en una presentación y la exposición de cada palabra dura 5 segundos. Luego que terminamos, les entregamos una hoja de papel y les pedimos que escriban todas las palabras que recuerdan. Esta sería nuestra primera medida, la variable A que llamaremos, “pre-música”

Paso 2: Luego de una semana, recopilamos a los mismos jóvenes y les mostramos las mismas 15 palabras, en la misma cantidad de tiempo, pero en este caso mientras que hacemos la presentación de las palabras, les ponemos a los participantes como música de fondo Ave María de Schubert, (aquí la tonada). Luego de las 15 palabras, repetimos la misma tarea, les entregamos una hoja de papel a los participantes y les pedimos que escriban todas las palabras que recuerdan. Esta sería nuestra segunda medida, la variable B que llamaremos “música”.

¡Excelente, luego de recopilar toda la data, la ponemos en el paquete estadístico (en este caso utilizaremos SPSS) y analizamos la información.

¿Analizamos la información? ¡Un momento! Antes que nada debemos ver si ambas medidas tienen puntajes con distribución normal.

Para ello, debemos seguir la siguiente ruta:

Analizar/Frecuencias/Estadísticos/

Aquí, pinchamos (o hacemos click) en asimetría, curtosis y mediana (al igual que en la U de Mann Whitney esto se usa luego). Luego en la casilla que dice Variables debemos poner nuestra Variable A y B. Después, Aceptar.

¡Muy bien! Ahora debemos percatarnos si es que la asimetría es mayor a 3 y la curtosis mayor a 8, que muestra que los puntajes de una medida no tienen una distribución normal. (Kline, 1998; 2005). Para el ejemplo, asumamos que este caso se dio.

Luego de ello, vamos al análisis. Para ello, debemos de seguir la siguiente ruta:

Analizar/Pruebas no paramétricas/Cuadros de diálogos antiguos/2 muestras relacionadas.

¡Listo! Esta ruta se sigue, porque queremos hacer un análisis que no asume que nuestros puntajes tienen una distribución normal, los cuadros antiguos porque somos old school 🙂 y 2 muestras relacionadas porque se mide al mismo grupo dos veces a lo largo del tiempo. 

Luego, nos aparecerá un cuadro de diálogo y ahí tenemos que poner nuestras variables. Ahí veremos que sale un cuadro llamado Contrastar pares. En este caso, en variable 1 tenemos que poner nuestra medición previa que la llamamos “pre-música”, luego en variable 2 es necesario que pongamos la segunda variable que en nuestro ejemplo se llama “música”. Por otro lado, para que sea más fácil reportar nuestros resultados, podemos ir a opciones y marcar en la casilla de descriptivos y poner continuar. 

¿Vamos bien? ¡Sigamos adelante! Seguidamente, debemos de poner el análisis que queremos hacer. Ahí hay varias opciones, pero nosotros para este caso queremos utilizar Wilcoxon entonces, hacemos click (pinchamos) en esa opción y ponemos Aceptar. Ojo pestaña y ceja: Siempre hay que revisar esto no vaya a ser que terminemos realizando otro análisis. 

Bueno, después de un recorrido largo comenzamos en la etapa final de nuestro post. ¡Los análisis de nuestras tablas!

Aquí nos aparecerán las siguientes 3 tablas:

Tabla 1:

descriptivosWilcoxonEsta tabla lo único que nos muestra son los estadísticos descriptivos de nuestras variables y la cantidad de personas por grupo (N). Los que no recuerdan qué son estadísticos descriptivos, siempre pueden volver a este post.

Tabla 2:

rangospromediosWilcoxon

Esta tabla como ya comentamos anteriormente nos muestran los rangos promedio. Esta tabla tan solo la he puesto para que podamos ver que el SPSS utiliza por defecto los rangos promedio para calcular la W de Wilcoxon. Los que no recuerdan qué son los rangos promedio siempre pueden volver a este post. En general, estos resultados lo que nos está diciendo es que se están comparando los puntajes de Música y Pre Música. Entonces, lo que hace el SPSS es hacer un conteo (La N) de cuántas personas tuvieron menos puntaje en la prueba con música que sin música (Rangos negativos, que es igual a 13). Aparte, cuantas personas tuvieron más puntaje en la prueba con música que sin música (Rangos positivos, que es igual a 12). Finalmente, cuándo el puntaje de pre música y música fueron iguales (Empates, que es igual a 7). Aparte, como ya mencione nos muestra los rangos promedio y la suma de rangos promedio.

Tabla 3

 SignificanciaWilcoxon

Esta tabla es la más importante de nuestro análisis.  Nos muestra el valor Z (que es acorde a las tablas de significancia, estas tablas las pueden encontrar en este post). Entonces, está tabla lo que nos dice es si comparamos los puntajes de música y pre música, obtenemos un puntaje Z igual a (-.514), para este caso no iré a la matemática, pero para obtener este resultado se realiza un cálculo con una fórmula (los interesados siempre pueden dejar un comentario :)).

Además, para un puntaje Z de -.514, se obtiene una significancia de .607. Esto como nosotros muy bien sabemos es claramente no significativo porque está muy por encima de 0.05. Esto demuestra, que no hay diferencias significativas entre la capacidad para recordar palabras con o sin música.  Los que no recuerdan por qué llegamos a esta conclusión siempre pueden ir a este post que les puede ayudar a refrescar la memoria.

¡Muy bien! Aún no satisfechos con este resultado, por si acaso revisamos las medianas de las dos mediciones nos encontraremos que la mediana es igual a 5 en ambos casos. Ello refuerza el hallazgo de la tabla 3 que nos propone que no hay diferencias entre las dos medidas. Para este caso no he puesto la tabla para no llenarnos de tablas :).

¡Muy bien! Creo que esto sería todo por hoy, espero que esta aventura les haya gustado. En broma y broma ya hemos visto varios análisis: las comparaciones de grupos independientes y dependientes  de muestras con puntajes con distribución normal (ver enlaces en los nombres).  Así como la comparación de grupos independientes y dependientes con puntajes que tienen una distribución no normal. Para la siguiente aventura relacionada a este tema, iremos un paso más adelante. Ya no solo sabremos, que hay diferencias sino cuán grandes son estad diferencias y para ello utilizaremos algo llamado tamaño del efecto. 

¡Así que estén muy preparados! Pero ustedes valientes lectores son unos guerreros entonces estoy seguro que no tendrán ningún problema.

Recuerden que siempre es un placer recibir comentarios en la sección posterior. Aparte, los interesados en seguir las aventuras de este blog siempre pueden ir al botón Seguir que se encuentra arriba de su pantalla.

¡Muy buenas vibras!

Referencias

– Kline, R. B. (1998). Principles and practice of structural equation modeling. NY: Guilford Press.
– Kline, R.B. (2005), Principles and Practice of Structural Equation Modeling (2nd Edition ed.). New York: The Guilford Press.

Advertisement

About Juan Carlos Saravia

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
This entry was posted in Básico 2.0 and tagged , , . Bookmark the permalink.

6 Responses to ¿Muestras no paramétricas relacionadas? La W-wilcoxon

  1. Paola says:

    Buenos dias… Gracias por tu explicación… quería consultarte por el tamaño del efecto… ¿Es relevante reportarlo en este tipo de prueba? ¿con que estadístico se efectúa? ¿como lo estimamos en SPSS?

    Gracias

    Like

  2. Buenas primero para felicitarte por el blog, es perfecto! me aclaro bastantes dudas ademas que es muy entendible y ameno, quisiera consularte veras…mi investigacion tiene dos variables:la dramatizacion y la expresion oral, dentro de cada uno hay 10 subindicadores; al trabajar con niños los datos que obtuve me salieron dispersos y en la prueba de normalidad me salen que no son normales, lo aplique en el pre test y post test, ¿es asi?, he visto por conveniente aplicar una prueba no parametrica de la W de Wilconxon y me sale bien en ambas variables, pero mi otra duda va a que si en mi tesis debo poner que NO ME SALIO LA PRUEBA DE NORMALIDAD?, o no lo pongo?…
    Gracias 😀

    Like

    • Estimada Mayra,

      Muchas gracias por escribir a Stats SOS. Agradezco tus palabras, te recomendaría que lo pongas, si bien se puede sobre entender que si usas W de Wilcoxon los datos no tienen una distribución normal es mejor hacer la especificación.

      ¡Mucho éxito!

      Like

  3. Anonymous says:

    Buenas tardes estoy trabajando con un grupo control (3 personas) y con un experimental (3 personas) en ambos grupos se les aplicó un pretest. Al grupo experimental tuvo una intervención con TCC y luego de terminada la intervención se le aplicó un postest. Hice las corridas con el SPSS usando t student con muestras independientes y muestras relacionadas. Hice las corridas para saber si mi muestra se distribuye normalmente y en efecto salió que se distribuye normalmente. La corridas con el programa indican la efectividad del programa ya que hubo diferencias significativas Mi duda es que si hice lo correcto ya que mi muestra en total son 6 de los cuales 3 del grupo control y 3 del grupo experimental.
    También hice las corridas como ensayo con las prueba no parametricas y los resultados con la U Mann Withney coinciden con la t para muestras independientes. Un diferencia en los resultados usando la W Wilcoxon (no son significativas) y la t muestra relacionadas (son significativas) con el grupo experimental (pretest= puntaje ansiedad promedio 76 en postest= puntaje ansiedad promedio 22).
    Espero su comentarios para despejar mis dudas y terminar el informe.
    Saludos

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s