Medidas de dispersión

Las medidas de centralización no bastan para explicar las características de una distribución estadística. Nos podemos encontrar con distribuciones que teniendo los paramétros centrales muy parecidos o iguales presenten comportamientos muy diferentes. Por eso se introducen los llamados parámetros o medidas de dispersión que informan del grado de variación de los datos respecto de la media.

Una primera idea de la dispersión de la distribución nos la da el rango o recorrido, diferencia entre el valor máximo y el mínimo de la distribución, aunque más información nos ofrece el rango o recorrido intercuartílico, diferencia entre el tercer y el primer cuartil. Al considerar éste estamos eliminando los valores extremos, el 25% inferior y el 25% superior.

Lo que habitualmente interesa más es conocer en qué medida los datos se desvían, en promedio, de la media. A la diferencia entre cada valor observado y la media la llamamos desviación, esta desviación será un nº positivo o negativo, y tal como está definida la media, la suma de todas las desviaciones es 0.

  • Si tomamos las desviaciones en valor absoluto y calculamos la media de estos valores absolutos obtenemos un parámetro llamado desviación media.
  • Si hacemos la media de los cuadrados de las desviaciones obtenemos un parámetro llamado varianza, que designamos con s2.

La desviación típica

La desviación típica es la raíz cuadrada (positiva) de la varianza, es el parámetro de dispersión más utilizado.

La calculamos:
   
Utilizando habitualmente la segunda fórmula, llamada "reducida" de más fácil manejo.

  • Si sumamos una constante a todos los valores de la distribución la desviación típica no varía.
  • Si multiplicamos todos los valores por la misma cantidad la desviación típica queda multiplicada por esa cantidad.
Calcula la desviación típica de la distribución:
(0,20]
8
(20,40]
23
(40,60]
40
(60,80]
19
(80,100]
10
Cambia en la tabla algunos valores de las frecuencias y observa como varía la desviación típica y la varianza; cambia también los intervalos, por ejemplo multiplica todos por 10, o suma 5 a cada extremo, y comprobarás las propiedades de la desviación típìca.
Para cambiar los valores basta escribirlos en la celda correspondiente y pulsar ENTER. Para volver a los datos iniciales pulsa INICIO.

El coeficiente de variación    

Las dos distribuciones cuyo histograma se ha representado, tienen la misma media, pero desviaciones típicas diferentes.
Observa que cuanto menor es la desviación más apuntado es el histograma.
También puede ocurrir que dos distribuciones tengan la misma desviación típica pero las dispersiones sean totalmente diferentes, por eso definimos el coeficiente de desviación, utilizado para comparar las dispersiones de dos variables estadísticas que vienen expresadas en distintas unidades.
Es el cociente entre la desviación típica y la media y habitualmente se expresa en porcentaje.
                     
Cuanto más pequeño sea el coeficiente de variación más concentrados estarán los datos alrededor de la media.

Arrastra los puntos blancos con el ratón de forma que varíe la altura de cada rectángulo del histograma y observa cómo aumenta o disminuye la desviación típica y el coeficiente de variación.

 
Mª José García Cebrian, 2006