domingo, 26 de mayo de 2013

Medidas de tendencia central, posición y dispersión.

En este tema veremos la función de los datos observados. Los que dan la idea de la magnitud o tamaño de los datos (medidas de posición o tendencia central) y los que nos dan información acerca de la heterogeneidad de nuestras observaciones (medidas de dispersión o variabilidad).

Medidas de tendencia central:
Pretenden resumir todos los datos en un único valor. Definimos tres medidas de tendencia central, media, mediana y moda.

Media, (x)
Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos

 Mediana, (Me)
Se calcula para variables cuantitativas, es un número tal que al menos el 50 % de los datos es menor o igual que la mediana y al menos el 50 % mayor o igual. Si hay más de una mediana tomamos el punto medio entre la mediana mayor y la más pequeña, que serán los datos que aparecen en la muestra y sirven como medianas.

 Moda, (Moda)


Es el valor con mayor frecuencia. Si hay más de una, la variable se dice multimodal y puede calcularse para cualquier tipo de variable. Si los datos están agrupados hablamos de clase modal y será aquella para la que el cociente frecuencia relativa dividido entre amplitud (fi/ci) es mayor.
                                        

                                         

Medidas de posición:

Cuantiles
Se calculan para variables cuantitativas y al igual que la mediana sólo tienen en cuenta la posición de los valores en la muestra. Casos particulares de cuantiles son los cuartiles, los percentiles y los deciles (estos últimos dividen la muestra ordenada en 10 partes):

Cuartiles
Dividen la muestra ordenada en 4 partes.
Q1, primer cuartil, al menos el 25 % de los datos son menores o iguales que ´el y al menos el 75 % de los datos son mayores o iguales que ´el.
Q2, segundo cuartil, es la mediana, Q2 = Me.
Q3, tercer cuartil, al menos el 75 % de los datos son menores o iguales que ´el y al menos el 25 % de los datos son mayores o iguales que ´el.
Q4, cuarto cuartil, es el mayor valor que se alcanza en la muestra.

Percentiles
Dividen la muestra ordenada en 100 partes.

Deciles
Dividen la muestra ordenada en 10 partes

Medidas de dispersión:

Recorrido o rango
Diferencia entre el mayor y menor valor de una muestra

Desviación media respecto de la mediana

Desviación típica, (s)
Cuantifica el error que cometemos si representamos una muestra únicamente por su media.

Varianza muestral, (s2)

Rango semiintecuartícilo y amplitud intercuartil
El rango semiintercuartílico es la mitad de la diferencia entre el tercer y primer cuartil, Q = (Q3 − Q1)/2. La amplitud intercuartil es el doble del valor anterior, 2Q = (Q3 − Q1).

Coeficiente de variación, (CV)
  

No hay comentarios:

Publicar un comentario