En este tema veremos la función de los datos observados. Los que dan la
idea de la magnitud o tamaño de los datos (medidas de posición o tendencia
central) y los que nos dan información acerca de la heterogeneidad de nuestras
observaciones (medidas de dispersión o variabilidad).
Medidas de
tendencia central:
Pretenden resumir todos los datos en un único valor. Definimos tres
medidas de tendencia central, media, mediana y moda.
Media, (x)
Se calcula para variables cuantitativas y se trata del centro geométrico
o de gravedad de nuestros datos
Mediana,
(Me)
Se calcula para variables cuantitativas, es un número tal que al menos
el 50 % de los datos es menor o igual que la mediana y al menos el 50 % mayor o
igual. Si hay más de una mediana tomamos el punto medio entre la mediana mayor
y la más pequeña, que serán los datos que aparecen en la muestra y sirven como
medianas.
Moda, (Moda)
Es el valor con mayor frecuencia. Si hay más de una, la variable se
dice multimodal y puede calcularse para cualquier tipo de variable. Si los
datos están agrupados hablamos de clase modal y será aquella para la que el
cociente frecuencia relativa dividido entre amplitud (fi/ci) es mayor.
Medidas de posición:
Cuantiles
Se calculan para variables cuantitativas y al igual que la mediana sólo
tienen en cuenta la posición de los valores en la muestra. Casos particulares
de cuantiles son los cuartiles, los percentiles y los deciles (estos últimos
dividen la muestra ordenada en 10 partes):
Cuartiles
Dividen la muestra ordenada en 4 partes.
Q1, primer cuartil, al menos
el 25 % de los datos son menores o iguales que ´el y al menos el 75 % de los
datos son mayores o iguales que ´el.
Q2, segundo cuartil, es la
mediana, Q2 = Me.
Q3, tercer cuartil, al menos
el 75 % de los datos son menores o iguales que ´el y al menos el 25 % de los
datos son mayores o iguales que ´el.
Q4, cuarto cuartil, es el
mayor valor que se alcanza en la muestra.
Percentiles
Dividen la muestra ordenada en 100 partes.
Deciles
Dividen la muestra ordenada en 10 partes
Medidas de dispersión:
Recorrido o rango
Diferencia entre el mayor y menor valor de una muestra
Desviación media respecto de la mediana
Desviación típica, (s)
Cuantifica el error que cometemos si representamos una muestra únicamente
por su media.
Varianza muestral, (s2)
Rango semiintecuartícilo y amplitud intercuartil
El rango semiintercuartílico es la mitad de la diferencia entre el
tercer y primer cuartil, Q = (Q3 − Q1)/2. La amplitud intercuartil es el doble
del valor anterior, 2Q = (Q3 − Q1).
Coeficiente de variación, (CV)
No hay comentarios:
Publicar un comentario