¡No puedo comparar cosas medidas de diferente manera! Los puntajes Z

Estimados todos,

Como siempre es un gran gusto tenerlos aquí en Stats SOS. La aventura de hoy nuevamente será corta pero bastante útil.

¿Alguna ves se han preguntado cómo hace la gente para comparar algo que está medido de manera diferente? Por ejemplo, en la escuela nos dicen que si tenemos dos valores, uno en metros y otro en centímetros tenemos que poner todo en centímetros para que se pueda comparar o medir correctamente, ¿cierto?

¡Bueno! El mismo tango ocurre en estadística cuando tenemos por ejemplo pruebas psicológicas. Le llamamos que la métrica es distinta. En otras palabras, que dos variables (ustedes ya saben muy bien lo que es una variable :)) están medidas de diferente manera. Para eso, necesitamos algo, llamado puntajes Z. 

De este modo, la aventura de hoy es describir qué son los puntajes Z y cómo calcularlos con el SPSS. En sencillo, un puntaje Z es un valor estándar que permite comparar dos variables que antes estaban medidas con unidades (metros, kilómetros, etc) diferentes. En ese caso, se está transformando un puntaje medido de una forma y se mide de otra. En términos técnicos, es la distancia que tiene un valor o persona específica del promedio de toda la muestra.  Si el puntaje Z es positivo, quiere decir que esa persona tiene un puntaje por encima del promedio de toda la muestra o grupo. Si el puntaje Z es negativo, esa persona tiene un puntaje que está por debajo del promedio. Aparte, otra gran utilidad que tienen los puntajes Z es que estos se distribuyen de manera normal (¿recuerdan qué es esto? ver aquí).

Aquí les muestro la fórmula:

 

zscore

Ojo, no se asusten con esto, solo les pongo la fórmula para que se vea más claro. Entonces, así como mencionaba para lo que es muy útil el puntaje Z es para comparar o relacionar dos variables que están medidas de manera diferente y poner todos los valores en una misma forma o misma medida.  Además, es sumamente útil para saber cuan lejos los puntajes de las personas están por debajo o por encima del promedio de todo el grupo. En otras palabras, pone el promedio de todo el grupo como punto de referencia (en un puntaje Z el “0” significa que el valor de la persona es igual al promedio de todo el grupo) para describir la muestra.

¡Muy bien! ¿Cómo se sienten? ¿Están bien? Estoy seguro que sí. Para aliviarnos de esto, vamos a un ejemplo práctico.

Imaginen que tenemos una muestra de 100 personas donde queremos conocer el consumo de drogas ilegales y cuántas personas consumen una gran cantidad de estas y cuántas no. Entonces asumimos que una cantidad alta son todas las personas que tienen un consumo de dos unidades en puntaje Z por encima del promedio y un consumo bajo es el resto. Para ello, podemos usar nuestros puntajes Z. ¿Preparados?

Cuando ya tenemos nuestra base de datos en el SPSS, podemos hacer lo siguiente:

Analizar/Estadísticos descriptivos/Descriptivos/

Luego, introducimos la variable que nos interesa en el recuadro de la derecha y marcamos la casilla que está en la parte inferior de la ventana “Guardar valores tipificados como variables” y luego ponemos aceptar. ¡Nada más!

Después de todo esto, regresen a su base de datos y verán que al final tendrán una nueva variable que dice “Zsustanciailegales” y tendrán valores negativos y positivos. 

¡Fantastico! Ya tienen la variable Z creada. Lo único que hizo el SPSS es aplicar la fórmula que les mostré arriba a los puntajes de consumo de sustancias ilegales para los 100 participantes. ¿Ven? La formula no era tan terrible y el SPSS nos ayuda a hacer el cálculo, pero recuerden jóvenes valores mundiales, es vital que ustedes sepan qué está haciendo el SPSS para que no los sorprenda :).

¡Muy bien! Ahora vamos a la recta final. Ya que tengo mi puntaje Z ahora lo que necesito es saber qué porcentaje de las 100 personas que tengo tienen un alto consumo de drogas ilegales y qué porcentaje no. Aquí, con un análisis de frecuencia creo que bastaría. ¡Así que vamos a eso!

Analizar/Estadísticos descriptivos/Frecuencias

Introduzco en la casilla de la mano derecha mi nueva variable “puntaje Z” y pongo a aceptar ¡y listo! Después de todo esto, les tendría que salir una tabla más o menos así.

resultadosZ

Si observo el porcentaje válido puedo ver que 4% de mi muestra tiene un consumo alto de drogas ilegales y 96% (el resto) no. (Ver la columna 1 donde salen los puntajes y al final hay un grupo que consume más de dos unidades por encima del promedio. Luego ver la columna 3 donde dice porcentaje válido y pueden ver 4% de toda la muestra de 100 personas consume bastante drogas ilegales).  ¡Listo! Con eso ya tenemos la respuesta a nuestra inquietud :).

¡Ven muchachos y muchachas! ¡Todo muy bien! No pasó nada terrible ni nada, con esto podemos ver cómo el puntaje Z que es una transformación me ayuda a conocer más sobre las características de mi muestra. Para los que no me crean que esta transformación genera que los puntajes estén distribuidos de manera normal o paramétrica aquí el ejemplo.

histograma.jpg

Espero que este pequeño capítulo allá sido útil para ustedes :), nota importante, esto también lo pueden hacer con múltiple variables y el programa les hará el trabajo de calcular el puntaje para que puedan medir sus variables con una misma métrica y distribuidos normalmente para poder conocer más sobre sus cómo se comportó su muestra con respecto a las variables que evaluaron.

¡Mucho éxito y ya nos veremos pronto, ya les pondré otros ejemplos de transformaciones de datos y lo útil que pueden ser para nosotros realizarlos. ¡Vamos gente! Súbanse al carro, la estadística no es fea y puede ser muy útil e interesante para nosotros. Nuevas aventuras habrán, recuerden de poner “like” en la página de Facebook, seguirnos en Twitter y por supuesto, comentar con todas sus preguntas e inquietudes sobre este tema. Encantado de responder, recuerden ustedes son los que hacen que este blog exista :).

Advertisement

About Juan Carlos Saravia

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
This entry was posted in Conceptos, Uncategorized and tagged , . Bookmark the permalink.

14 Responses to ¡No puedo comparar cosas medidas de diferente manera! Los puntajes Z

  1. Elizabeth says:

    Excelente post. Me encanta la explicación práctica y sencilla de cómo utilizar esta transformación de puntajes para el análisis de datos.

    Like

  2. Pedro Balestrini says:

    Buenas! Me gustaría hacer una consulta. Supongamos que tengo una muestra de 60 participantes. Mido a los sujetos de esa muestra en dos variables diferentes (variable A y variable B)
    Tengo una hipótesis de diferencia de grupo direccional: “Dentro de esta muestra, la media de la variable A será mayor que la de la variable B”.
    No quiero hacer ninguna prueba inferencial. Sólo quiero obtener una medición válida para la muestra. (De lo contrario, recurriría a una prueba T. Pero este no es el caso.)
    Ahora, las variables están medidas en escalas métricas diferentes. Supongo que debo tipificar los puntajes de las variables a puntajes Z. Ahora, las medias de las dos distribuciones van a ser 0. ¿Qué comparo entonces? ¿Las medianas?
    Un saludo cordial

    Like

    • Estimado Pedro,

      Muchas gracias por escribir a Stats SOS. Estimado Pedro, ¿podrías ser un poco más claro en tu explicación? Por lo que le entiendo quieres comparar a un mismo grupo en dos mediciones diferentes. Si no quieres hacer ninguna prueba inferencial pero sí ver si A es mayor que B yo lo que haría es un gráfico de barras donde se parte que “0” es el centro (que en este caso sería la media porque has estandarizado los puntajes). Si en general ves que lo puntajes de A están más alejados de la media hacia abajo (osea son menores que la media) y los de B más alejados de la media pero hacia arriba (osea son mayores que la media) ahí podrías tener una aproximación a la respuesta que buscas.

      ¡Mucho éxito!

      Like

  3. Alan says:

    Estoy comparando los estados de un país por sus características demográficas(densidad, esperanza de vida, etc) Lo que busco es encontrar cual es el estado mas parecido a uno especifico. ¿Es correcto usar transformar todas las variables con puntajes z para y encontrar la media de mis variables, siendo la media mas cercana a la de mi estado, el estado mas parecido?

    Like

    • Hola Alan,

      Muchas gracias por escribir a Stats SOS. Ese procedimiento lo que te dirá cuántas desviaciones estándar está tu estado en comparación al promedio de todos los estados. Ahí podrías ver nada más que estado está igualmente lejano o cercano al promedio de todos los estados. Me queda la duda si tu realmente quieres eso.

      ¿Cuál es tu objetivo?

      ¡Mucho éxito!

      Like

      • Alan Rios says:

        Muchas gracias,
        Mi objetivo es encontrar el estado mas similar al mio dadas las siguientes variables: PIBpC, Esperanza de vida y Densidad poblacional. Lo que he hecho es obtener los puntajes z de las tres variables, después obtengo la media de los tres puntajes para cada estado y el mas cercano a la media de los puntajes de mi estado, lo asumo como el estado mas similar dadas dichas variables, espero haber sido claro. Gracias Nuevamente.

        Like

  4. Blanca says:

    Hola buen día! Gracias por este post y responder a nuestras dudas.

    Una duda, se puede usar la puntuación Z para hacer un prerest-postest (medición de impacto) si en la evaluación inicial se usó una escala diferente a la de la evaluación poBlancastest? Gracias de antemano

    Like

  5. Marcela Ruiz says:

    Hola me podrías explicar por favor como transformar datos de una prueba en la cual use puntajes de escala ( 1 al 9), en pruebas sensoriales para realizar anova. Agradezco de antemano por tu ayuda

    Like

    • Hola Marcela,
      Me podrías dar un poco más de información para responder tu pregunta? Porque si tienes una escala del 1 al 9 quizás podrías hacer promedios de esos números. Me cuentas si todo salió bien!

      Like

    • Anonymous says:

      Hola Juan Carlos, Se trata de una prueba sobre la evaluación sensorial para la aceptación de un producto alimentario (jugo de frutas, en diferentes proporciones, haciendo un total de 4 tratamientos), y se colocan puntuaciones que van de 1 a 9. 1 es no me agrada y 9 me encanta (muy aceptable), en este estudio se consideran a 25 personas de diferentes edades (estaría bien considerarlas como bloque?).
      Entonces para compararlos se requiere de un anova en DBCA pero mi dilema es debo transformar los datos? o solo los promedio? Agradezco mucho tu respuesta.

      Like

      • Hola! Si tienes una especie de escala likert como me compartes, una salida es tomar esta variable como intervalo y hacer un ANOVA como dices. Transformar los datos también puede ser, pero me pregunto qué es lo que buscas obtener con ello. Mucho éxito!

        Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s