Estimados todos,
Como siempre es un gran gusto tenerlos aquí en Stats SOS. La aventura de hoy nuevamente será corta pero bastante útil.
¿Alguna ves se han preguntado cómo hace la gente para comparar algo que está medido de manera diferente? Por ejemplo, en la escuela nos dicen que si tenemos dos valores, uno en metros y otro en centímetros tenemos que poner todo en centímetros para que se pueda comparar o medir correctamente, ¿cierto?
¡Bueno! El mismo tango ocurre en estadística cuando tenemos por ejemplo pruebas psicológicas. Le llamamos que la métrica es distinta. En otras palabras, que dos variables (ustedes ya saben muy bien lo que es una variable :)) están medidas de diferente manera. Para eso, necesitamos algo, llamado puntajes Z.
De este modo, la aventura de hoy es describir qué son los puntajes Z y cómo calcularlos con el SPSS. En sencillo, un puntaje Z es un valor estándar que permite comparar dos variables que antes estaban medidas con unidades (metros, kilómetros, etc) diferentes. En ese caso, se está transformando un puntaje medido de una forma y se mide de otra. En términos técnicos, es la distancia que tiene un valor o persona específica del promedio de toda la muestra. Si el puntaje Z es positivo, quiere decir que esa persona tiene un puntaje por encima del promedio de toda la muestra o grupo. Si el puntaje Z es negativo, esa persona tiene un puntaje que está por debajo del promedio. Aparte, otra gran utilidad que tienen los puntajes Z es que estos se distribuyen de manera normal (¿recuerdan qué es esto? ver aquí).
Aquí les muestro la fórmula:
Ojo, no se asusten con esto, solo les pongo la fórmula para que se vea más claro. Entonces, así como mencionaba para lo que es muy útil el puntaje Z es para comparar o relacionar dos variables que están medidas de manera diferente y poner todos los valores en una misma forma o misma medida. Además, es sumamente útil para saber cuan lejos los puntajes de las personas están por debajo o por encima del promedio de todo el grupo. En otras palabras, pone el promedio de todo el grupo como punto de referencia (en un puntaje Z el “0” significa que el valor de la persona es igual al promedio de todo el grupo) para describir la muestra.
¡Muy bien! ¿Cómo se sienten? ¿Están bien? Estoy seguro que sí. Para aliviarnos de esto, vamos a un ejemplo práctico.
Imaginen que tenemos una muestra de 100 personas donde queremos conocer el consumo de drogas ilegales y cuántas personas consumen una gran cantidad de estas y cuántas no. Entonces asumimos que una cantidad alta son todas las personas que tienen un consumo de dos unidades en puntaje Z por encima del promedio y un consumo bajo es el resto. Para ello, podemos usar nuestros puntajes Z. ¿Preparados?
Cuando ya tenemos nuestra base de datos en el SPSS, podemos hacer lo siguiente:
Analizar/Estadísticos descriptivos/Descriptivos/
Luego, introducimos la variable que nos interesa en el recuadro de la derecha y marcamos la casilla que está en la parte inferior de la ventana “Guardar valores tipificados como variables” y luego ponemos aceptar. ¡Nada más!
Después de todo esto, regresen a su base de datos y verán que al final tendrán una nueva variable que dice “Zsustanciailegales” y tendrán valores negativos y positivos.
¡Fantastico! Ya tienen la variable Z creada. Lo único que hizo el SPSS es aplicar la fórmula que les mostré arriba a los puntajes de consumo de sustancias ilegales para los 100 participantes. ¿Ven? La formula no era tan terrible y el SPSS nos ayuda a hacer el cálculo, pero recuerden jóvenes valores mundiales, es vital que ustedes sepan qué está haciendo el SPSS para que no los sorprenda :).
¡Muy bien! Ahora vamos a la recta final. Ya que tengo mi puntaje Z ahora lo que necesito es saber qué porcentaje de las 100 personas que tengo tienen un alto consumo de drogas ilegales y qué porcentaje no. Aquí, con un análisis de frecuencia creo que bastaría. ¡Así que vamos a eso!
Analizar/Estadísticos descriptivos/Frecuencias
Introduzco en la casilla de la mano derecha mi nueva variable “puntaje Z” y pongo a aceptar ¡y listo! Después de todo esto, les tendría que salir una tabla más o menos así.
Si observo el porcentaje válido puedo ver que 4% de mi muestra tiene un consumo alto de drogas ilegales y 96% (el resto) no. (Ver la columna 1 donde salen los puntajes y al final hay un grupo que consume más de dos unidades por encima del promedio. Luego ver la columna 3 donde dice porcentaje válido y pueden ver 4% de toda la muestra de 100 personas consume bastante drogas ilegales). ¡Listo! Con eso ya tenemos la respuesta a nuestra inquietud :).
¡Ven muchachos y muchachas! ¡Todo muy bien! No pasó nada terrible ni nada, con esto podemos ver cómo el puntaje Z que es una transformación me ayuda a conocer más sobre las características de mi muestra. Para los que no me crean que esta transformación genera que los puntajes estén distribuidos de manera normal o paramétrica aquí el ejemplo.
Espero que este pequeño capítulo allá sido útil para ustedes :), nota importante, esto también lo pueden hacer con múltiple variables y el programa les hará el trabajo de calcular el puntaje para que puedan medir sus variables con una misma métrica y distribuidos normalmente para poder conocer más sobre sus cómo se comportó su muestra con respecto a las variables que evaluaron.
¡Mucho éxito y ya nos veremos pronto, ya les pondré otros ejemplos de transformaciones de datos y lo útil que pueden ser para nosotros realizarlos. ¡Vamos gente! Súbanse al carro, la estadística no es fea y puede ser muy útil e interesante para nosotros. Nuevas aventuras habrán, recuerden de poner “like” en la página de Facebook, seguirnos en Twitter y por supuesto, comentar con todas sus preguntas e inquietudes sobre este tema. Encantado de responder, recuerden ustedes son los que hacen que este blog exista :).
Excelente post. Me encanta la explicación práctica y sencilla de cómo utilizar esta transformación de puntajes para el análisis de datos.
LikeLike
Estimada Elizabeth,
Muchas gracias por escribrir en Stats SOS. Agradezco tus palabras y fantástico recibir comentarios tuyos en el futuro.
Mucho éxito
LikeLike
Buenas! Me gustaría hacer una consulta. Supongamos que tengo una muestra de 60 participantes. Mido a los sujetos de esa muestra en dos variables diferentes (variable A y variable B)
Tengo una hipótesis de diferencia de grupo direccional: “Dentro de esta muestra, la media de la variable A será mayor que la de la variable B”.
No quiero hacer ninguna prueba inferencial. Sólo quiero obtener una medición válida para la muestra. (De lo contrario, recurriría a una prueba T. Pero este no es el caso.)
Ahora, las variables están medidas en escalas métricas diferentes. Supongo que debo tipificar los puntajes de las variables a puntajes Z. Ahora, las medias de las dos distribuciones van a ser 0. ¿Qué comparo entonces? ¿Las medianas?
Un saludo cordial
LikeLike
Estimado Pedro,
Muchas gracias por escribir a Stats SOS. Estimado Pedro, ¿podrías ser un poco más claro en tu explicación? Por lo que le entiendo quieres comparar a un mismo grupo en dos mediciones diferentes. Si no quieres hacer ninguna prueba inferencial pero sí ver si A es mayor que B yo lo que haría es un gráfico de barras donde se parte que “0” es el centro (que en este caso sería la media porque has estandarizado los puntajes). Si en general ves que lo puntajes de A están más alejados de la media hacia abajo (osea son menores que la media) y los de B más alejados de la media pero hacia arriba (osea son mayores que la media) ahí podrías tener una aproximación a la respuesta que buscas.
¡Mucho éxito!
LikeLike
Estoy comparando los estados de un país por sus características demográficas(densidad, esperanza de vida, etc) Lo que busco es encontrar cual es el estado mas parecido a uno especifico. ¿Es correcto usar transformar todas las variables con puntajes z para y encontrar la media de mis variables, siendo la media mas cercana a la de mi estado, el estado mas parecido?
LikeLike
Hola Alan,
Muchas gracias por escribir a Stats SOS. Ese procedimiento lo que te dirá cuántas desviaciones estándar está tu estado en comparación al promedio de todos los estados. Ahí podrías ver nada más que estado está igualmente lejano o cercano al promedio de todos los estados. Me queda la duda si tu realmente quieres eso.
¿Cuál es tu objetivo?
¡Mucho éxito!
LikeLike
Muchas gracias,
Mi objetivo es encontrar el estado mas similar al mio dadas las siguientes variables: PIBpC, Esperanza de vida y Densidad poblacional. Lo que he hecho es obtener los puntajes z de las tres variables, después obtengo la media de los tres puntajes para cada estado y el mas cercano a la media de los puntajes de mi estado, lo asumo como el estado mas similar dadas dichas variables, espero haber sido claro. Gracias Nuevamente.
LikeLike
Hola Alan,
Muchas gracias por escribir a Stats SOS. Sí me quedó claro.
Mucho éxito!
LikeLike
Hola buen día! Gracias por este post y responder a nuestras dudas.
Una duda, se puede usar la puntuación Z para hacer un prerest-postest (medición de impacto) si en la evaluación inicial se usó una escala diferente a la de la evaluación poBlancastest? Gracias de antemano
LikeLike
Hola Blanca,
Muchas gracias por escribir a Stats SOS. No porque las escalas has cambiado la métrica, hablas por desviaciones estándar pero conceptualmente parecen ser cosas distintas.
Mucho éxito!
LikeLike
Hola me podrías explicar por favor como transformar datos de una prueba en la cual use puntajes de escala ( 1 al 9), en pruebas sensoriales para realizar anova. Agradezco de antemano por tu ayuda
LikeLike
Hola Marcela,
Me podrías dar un poco más de información para responder tu pregunta? Porque si tienes una escala del 1 al 9 quizás podrías hacer promedios de esos números. Me cuentas si todo salió bien!
LikeLike
Hola Juan Carlos, Se trata de una prueba sobre la evaluación sensorial para la aceptación de un producto alimentario (jugo de frutas, en diferentes proporciones, haciendo un total de 4 tratamientos), y se colocan puntuaciones que van de 1 a 9. 1 es no me agrada y 9 me encanta (muy aceptable), en este estudio se consideran a 25 personas de diferentes edades (estaría bien considerarlas como bloque?).
Entonces para compararlos se requiere de un anova en DBCA pero mi dilema es debo transformar los datos? o solo los promedio? Agradezco mucho tu respuesta.
LikeLike
Hola! Si tienes una especie de escala likert como me compartes, una salida es tomar esta variable como intervalo y hacer un ANOVA como dices. Transformar los datos también puede ser, pero me pregunto qué es lo que buscas obtener con ello. Mucho éxito!
LikeLike