Recuerden la estadística es la ciencia que utiliza conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. En ese caso, no es una ciencia exacta, sino el arte de las probabilidades.
En el post de hoy, definiremos fácilmente la estadística descriptiva. Además, expondremos los principales conceptos de este tipo de estadística y presentaremos ejemplos para cada uno.
Aunque no lo crean, usamos constantemente la estadística. Por ejemplo, si decimos “Tal vez jale la prueba preparatoria” o “Quizá vaya al cine” estamos hablando de probabilidades. Tan sencillo como eso.
Ahora, vamos un paso más allá. En general, en la estadística clásica existen dos tipos: la estadística descriptiva y la estadística inferencial. Por motivos prácticos, en este primer post solo tocaremos la estadística descriptiva.
Antes de empezar, quiero adelantarles algo muy importante: este tipo de estadística no es la que más se usa en psicología. En otras especialidades como la epidemiología o demografía, se utiliza mucho este tipo de estadística. Asimismo, si revisan informes anuales de los Ministerios encontrarán que la emplean constantemente para informar datos descriptivos: cuántas personas han acudido al hospital en un periodo de tiempo; cuántos peruanos tienen trabajo: cuántos niños y adolescentes estudian en escuelas públicas, etc.
Entonces, la estadística descriptiva, como su nombre lo dice, lo que pretende es describir. Así como nosotros describimos, por ejemplo, una pintura y decimos “Es bonita, tiene colores azules, verdes, representa esto, etc.”, este tipo de estadística hace lo mismo. ¿Cómo describe? Usando su propio lenguaje. Así como nosotros usamos el lenguaje, la estadística usa la media, la mediana, la moda, la desviación estándar y la varianza para describir poblaciones.
Antes de ir a un ejemplo pasaré a definir, en pocas y simples palabras, qué es cada una:
La media: Es el promedio de puntajes de un grupo o varios grupos. Por ejemplo, si tenemos 20 personas y 10 tuvieron 20 en su examen de estadística y las otras 10 sacaron 15, entonces el promedio de la clase es de 17.5. Esto se da porque sumamos todos los puntajes o notas que obtuvieron (de ahí sale el término “Sumatoria” al que tanto temor le tenemos “Σ”) y lo dividimos entre la cantidad de alumnos (20 en este caso).
La mediana: Es el punto céntrico que se obtiene de varios números que están ordenados. Por ejemplo, si tenemos 5 números, (1,2,3,4,5), la mediana en este caso es “3” porque es el valor que está en el medio (1,2,3, 4, 5). Entonces hay la misma cantidad de números para la derecha como para la izquierda. Ojo, pestaña y ceja, para sacar este puntaje los números deben estar ordenados correlativamente (de menos a más).
La moda: Como su nombre lo dice, es el puntaje “que está de moda”. En otras palabras, el que se repite más. Por ejemplo, en un grupo de números: 1,2,2,3,4,5. La moda es “2” porque se repite dos veces, a diferencia de los otros números que solo se repiten 1 sola vez.
¡Ya ven! ¡Es sencillo y puede ser bastante amigable!
Sigamos. La desviación estándar o desviación típica: Es un estadístico que te dice cuánto los puntajes se alejan de la media. En otras palabras, cuánto la distribución o cantidad de puntajes que hay en un grupo se alejan del promedio. Vamos con un ejemplo: están haciendo una investigación y le toman una prueba de stress a 10 personas. En una prueba de stress donde puedas puntuar como mínimo 5 y como máximo 60, estas 10 personas tienen los siguientes puntajes: (20,30,45,23,50,37,42,10,9,17). Esto nos da una media de: 28.3. En otras palabras, el grupo tiene un puntaje promedio de 28.3 de stress. Esta media tiene una desviación estándar de 14.71. Eso quiere decir que los puntajes de todo el grupo de personas se alejan del promedio (28.3) en 14.71. Esto puede darse hacia la derecha (28.3 + 14.71 = 43.01) así como para la izquierda (28.3 – 14.71 = 13.59). Si alguien está interesado en la fórmula de la desviación estándar puede ir a la parte de comentarios de este post y ahí obtendrá la fórmula. En sí, he intentado poner la menor cantidad de fórmulas posible ya que hoy en día los paquetes estadísticos hacen los cálculos, lo importante es que tengamos claros los conceptos.
Entiendo que este concepto puede ser un poco fastidioso, pero es muy útil, por ejemplo, cuando se quieren conocer los puntajes de elecciones municipales. Por ejemplo, si un candidato “A” tiene un porcentaje de aprobación promedio de 41% con una desviación estándar de 5%, entonces sus puntajes pueden ir del 36% al 46%. Si el candidato “B” tiene un porcentaje de aprobación promedio de 38% y con una desviación estándar de 4%, sus puntajes pueden ir del 34% al 42%.
Lo anterior quiere decir que, en un momento, el candidato “A” puede tener más aprobación que el “B”. En otro, el “B” puede tener más aprobación. Entonces, aún no se puede determinar un claro ganador ya que los puntajes de aprobación pueden variar o poner a cualquier de los dos como ganador.
Espero que no se desanimen después de esta explicación y sigan leyendo ¡Ustedes pueden! Vamos para adelante con la varianza.
La varianza: Es, en sencillo, el cuadrado de la desviación estándar. Entonces, ¿deben tener algo en común, no? Bueno, lo tienen.
La varianza representa cuánto varían todos los puntajes del grupo. Volvamos al ejemplo de las 10 personas y el estrés. Si la desviación estándar es 14.71, entonces la varianza es 216.38 (si no me creen saquen la calculadora de la computadora y multipliquen 14.71 por 14.71 y verán :)). Esto quiere decir que los puntajes de estas 10 personas varían en 216.38. Si bien esto es ahorita un poco borroso, veremos que en estadística inferencial este término será vital e importantísimo.
Bueno, creo que un merecido descanso para todos eso lo mejor. Si han llegado hasta acá y no murieron en el intento, ¡Los felicito! ¡Muchas buenas vibras y hasta la próxima! En el siguiente capítulo veremos Estadística inferencial, que suele hacerse en psicología. ¡Hasta la vista!
Bibliografía recomendada
Coolican, H. (2014). Research Methods and Statistics in Psychology. Psychology Press: USA.
Sigue para adelante con el Blog!
LikeLike
Para los interesados, la desviación estándar se obtiene de la siguiente manera: Sacas el promedio de tu grupo con los siguientes puntajes: (20,30,45,23,50,37,42,10,9,17). El promedio de esas 10 personas equivale a 28.3. Luego, restas el promedio de cada uno de los puntajes de cada sujeto: 20 – 28.3, 30 – 28.3, etc. El resultado de cada una de las restas las sumas y luego ese resultado, lo elevas al cuadrado. Luego que tienes ese número lo divides entre la cantidad de sujetos (en este caso 10). Finalmente, el número que te salió de todas esas operaciones le sacas la raíz cuadrada y ¡bum! tendrás 14.71. Otra opción es que le pidas al SPSS que lo haga por ti. 🙂
LikeLike
Genial la publicación, impresionante tu añadido.
Aun recuerdo el curso Estadística en EE.GG.LL. Nos pidieron llevar calculadora científica para hacer esos análisis. Yo, muy humildemente llevé mi calculadora. Hice todos los análisis con mi calculadora (herencia) que solo tenía funciones básicas. Fue impresionante todo lo que ponía para lograrlo. Fui el único estudiante que llenó todo el cuadernillo y que sacó un 20 en esa prueba.
Me has hecho recordar buenas épocas entre yo y ella (la Estadística)… Épocas que nunca más volverían si no fueran por este blog. ¡Gracias!
LikeLike
¡Gracias Moises por tu comentario! Me alegra tener lectores tan motivados en el tema como tu. ¡Sí! Se suele empezar con la calculadora, es impresionante como haces tantos pequeños cálculos para llegar al número necesario.
Eso me hace pensar en lo impresionante que es la tecnología y que la computadora hace miles de cálculos en fracción de segundos. ¡Gracias a ti! ¡Un abrazo!
LikeLike
Osea a cada numero de la muestra le resto el promedio? Eso dejaria mas claro el concepto, estoy sufriendo para entender, casi he muerto en el intento.
Estaba pensando si la Desviacion Estandar te dice “cuánto los puntajes se alejan de la media”, porque la media + la desviacion estandar no suma tu resultado mas alto de la muestra (50 en tu ejemplo): y, si le restas a la media la desviacion estandar te daria el mas bajo de tu muestra.
Creo que mirando la formula se hace mas claro el concepto, no se :s
LikeLike
Hola Maria Paz, a ver, respira. Sí, puedes decir cuanto varía o los puntajes se alejan de la media. Así es. En realidad, mirando las formulas, sí sigues los conceptos sí se vuelven más claros. Pero vas por buen camino.
Para sacar la desviación puedes hacerlo también con la formula de varianza:
(1/ n -1)*(Suma(Puntaje – Media de todos los puntajes)) al cuadrado.
Luego que tienes la varianza solo le sacas la raiz cuadrada y listo.
Las formulas te resumen todo, lo más importante es entender el concepto para luego aplicar la formula. Espero que te haya ayudado.
¡Suerte! y ¡Buenas vibras!
LikeLike
Juan Carlos, me encantó la manera dictáctica de explicar el abc de la estadística. Espero con ansias el post de estadística inferencial =)
LikeLike
¡Muchas gracias! Pronto colgaré el post de estadística inferencial. ¡Buenas vibras! ¡Hasta la vista!
LikeLike
Pingback: Cerveza, estadística y la t-student | Estadística para todos, hecho por un psicólogo
Pingback: ¡Es significativo! ¿Qué es eso? La estadística inferencial | Stats SOS
Pingback: La vida después del ANOVA: el Post Hoc | Stats SOS
Pingback: Tan parecidos que parecen relacionados: La t-student de muestras relacionadas | Stats SOS
Pingback: Pero mira, ¡qué genial cómo interactúan! La interacción estadística | Stats SOS
Pingback: Dos caminos, un destino: el ANOVA de dos vías | Stats SOS
Pingback: No es paramétrico, ¿Y ahora? ¡Cómo comparo! La U de Mann-Whitney | Stats SOS
Pingback: Gonzalo apoya la aditividad: Los 4 supuestos de la regresion lineal | Stats SOS
Pingback: ¿Muestras no paramétricas relacionadas? La W-wilcoxon | Stats SOS
Pingback: Mis grupos son diferentes ¿Cuán diferentes? El tamaño del efecto | Stats SOS
En cual post explicas que es el valor p ? Resulta que para mi examen no puedo ser un robot y aceptar Ho si es mas grande de 0.05, tengo que explicar porque.
LikeLike
Hola Maria Paz,
Muchas gracias por escribir a Stats SOS. En el post de estadística inferencial que está en la pestaña de conceptos tendrás toda la información que necesitas.
¡Muchos éxitos con tu examen!
LikeLike
yo hice los datos pero me salio 38.8, muy buena tu explicación me gusto mucho y aunque casi no le entiendo me gustaría aprender un poco mas por mi materia de metodología de la investgacion ya que maneja mucho la estadística, espero mas de tu AYUDA
LikeLike
Estimada Angie,
Gracias por escribir a Stats SOS. No tengo muy claro en qué te salió 38.8 pero quizás podrías revisar los paréntesis o el orden en que hiciste las operaciones.
¡Mucho éxito!
LikeLike
Muchas gracias por las explicaciones. Creo que me van a salvar para el examen. Pero haciendo el cálculo que propones me sale 0. Y si no tengo en cuenta los signos tampoco me da el resultado que tú das: Hago las restas de cada puntuación con la del promedio. Sumo los resultados (sin considerar los signos), . Lo elevó al cuadrado. Lo divido entre el número de datos y hago la raíz. Me da 39,52
LikeLike
Estimado Gurutze,
Muchas gracias por escribir y disculpa la demora, a pesar que todos los comentarios son importantes, algunos comentarios a veces se me pasan con tantos que recibo. Has revisado si las operaciones se están efectuando en el orden correcto? Es de las más difíciles a las más fáciles. La raíz primero y luego al final la suma. Ojalá todo vaya bien!
Mucho éxito!
LikeLike
Hola muy buenos tus post la vdd me están sirviendo, solo tengo una duda respecto a tu ejemplo de la media.
“La media: Es el promedio de puntajes de un grupo o varios grupos. Por ejemplo, si tenemos 20 personas y 10 tuvieron 20 en su examen de estadística y las otras 10 sacaron 15, entonces el promedio de la clase es de 17.5. Esto se da porque sumamos todos los puntajes o notas que obtuvieron (de ahí sale el término “Sumatoria” al que tanto temor le tenemos “Σ”) y lo dividimos entre la cantidad de alumnos (20 en este caso).”
estoy entre estos 3 argumentos
1.- si son 20 personas seria 10+10+10+10+10+10+10+10+10+10+15+15+15+15+15+15+15+15+15+15+15=250 / 20 =12.5
2.- 20+15 =35/20=1.75
3.- para ese 17.5 seria
20+15=35/2=17.5
si me pudieras aclarar lo agradecería.
LikeLike
Hola Luis,
Yo usaría el primer argumento, cambia todos tus 10 por 20 y te saldrá 17.5.
Mucho éxito!
LikeLike