La varianza es una medida aritmética que nos permite conocer la dispersión que existe en un conjunto de datos. Matemáticamente hablando, la varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de cierta distribución estadística.

Viene representada por el símbolo σ², que es la letra griega sigma en minúscula elevada al cuadrado, por lo que es una unidad de medida al cuadrado. Si deseas conocer la desviación estándar sólo deberás calcular la raíz cuadrada de la varianza.

Los resultados de la varianza nos dirán si los valores del conjunto estudiado están agrupados, cerca o dispersos. Un resultado pequeño indica que los valores están bastante agrupados, y en cambio, si el resultado de la varianza es grande, significa que los datos están dispersos.

Su uso es muy amplio estadísticamente hablando, por ejemplo, comparando la varianza de dos conjuntos de valores, por ejemplo femeninos y masculinos, se puede saber si una variable tiene un efecto destacable. Por otro lado, si estás creando un modelo estadístico la varianza puede indicar que estás ajustando mucho los datos.

A continuación te mostramos cómo calcular la varianza.

Tipos de varianzas

Podemos calcular la varianza muestral, es decir, cuando tenemos una población extremadamente grande, cogeremos una muestra y de ahí se estimarán los resultados.

La varianza de la población es el cálculo de la varianza d  el total de la población. Se calcula usando todos los datos de la población de estudio.

La varianza de datos agrupados es otro caso en el que calcularemos la varianza cuando los datos de estudios están agrupados en diversas categorías o en grupos.

Propiedades de la varianza

  • El valor de la varianza siempre será igual o mayor que cero.
  • Si se le suma un mismo número a todos los valores de la variable que tenemos en cuenta, la varianza permanece igual.
  • Si se multiplican todos los valores de la variable por un mismo número, entonces la varianza resultará multiplicada por el cuadrado de ese número utilizado.
  • Si disponemos de diversas distribuciones que poseen la misma media y si sabemos sus varianzas, podremos calcular la varianza total.

Datos sobre la varianza

  • La varianza es muy sensible a los valores extremos, al igual que la media, por lo que si tenemos valores muy extremos la varianza puede no ser del todo fiable.
  • Si no podemos calcular la media de una distribución, entonces tampoco podremos calcular la varianza de dicha distribución.
  • Las desviaciones resultan al cuadrado, por lo que la varianza no usa la misma unidad que los datos utilizados en su cálculo.

Calcular la varianza muestral

Cómo calcular la varianza

Xᵢ= cada dato de la distribución.

Cómo calcular la varianza= media aritmética de la distribución (sumaremos todos los valores de la distribución y dividiremos el resultado por la cantidad de datos que tenemos).

N= número de valores que tenemos en la distribución muestral.

Para calcular la varianza muestral nos proporcionarán algunos valores de todo el conjunto poblacional. Digamos por ejemplo que tenemos la siguiente distribución:

9, 8, 6, 5, 3, 2

Para calcular la varianza de esta distribución comenzaremos calculando su media:

 

Cómo calcular la varianza

Calcular la varianza de la población

Cómo calcular la varianza

En este caso el proceso sería completamente igual que el anterior, lo único es que varían los símbolos que usaremos en la fórmula y que usaremos todos los datos que componen la población, por lo que el resultado de la varianza será exacto.

Primero: calcularemos la media de los datos de la distribución

Segundo: calculamos la suma de los cuadrados de  las diferencias de los datos respecto a la media aritmética.

Por último: dividiremos el resultado entre el número de datos total que proporciona la población.

Calcular la varianza de datos agrupados

Para calcular la varianza de datos agrupados partiremos de datos incluidos en grupos y la cantidad de veces que se repite un dato en el grupo.Cómo calcular la varianza

Por ejemplo, partiremos de estos datos:

Li= valor inferior

Ls= valor superior

Xi= Marca de clase – valor medio calculados con los datos inferiores y superiores.

Fi= frecuencias (cantidad de veces que se repiten los datos en el grupo)

N= es la suma de todas las frecuencias

n-1= suma de frecuencias menos . (usaremos este dato en vez de n cuando calculamos la varianza de datos agrupados de una muestra).

Con este ejemplo calcularemos la varianza poblacional para varios grupos de salarios y los números de trabajadores que hay en cada grupo.

  salarios Lisalarios Lsfi -nº trabajadoresXiXi*fi
100200121501800
200300102502500
300400153505250
400500184508100
5517650

 

Primero: calcularemos la marca de clase

Segundo: calcularemos Xi*fi

Tercero: con estos datos calculamos el promedio

Media= 17650/55=320.91

A continuación calcularemos la varianza:

Xᵢ – Cómo calcular la varianza(Xᵢ – Cómo calcular la varianza(Xᵢ – Cómo calcular la varianza)² * fi
-170,9129209,92350519,01
-70,915028,1050280,99
29,09846,2812694,21
129,0916664,46299960,33
713454,545

Primero: calculamos Xᵢ – Cómo calcular la varianza

Segundo: el resultado lo elevamos al cuadrado

Tercero: el resultado lo multiplicamos por fᵢ

Cuarto: Sumamos todos los resultados de todas las clases

Quinto: Dividimos el resultado anterior entre N

σ²= 713454.545/55=12971,90

Con estos sencillos pasos y ejemplos ahora ya sabrás cómo calcular la varianza de tus distribuciones de datos estadísticos.

Fuentes:

http://datateca.unad.edu.co/contenidos/208041/Modulo_EXE/leccin_8_varianza_y_desviacin_tpica_estndar.html
http://probabilidadyest.blogspot.com.es/2014/01/desviacion-media-varianza-poblacional-y.html
http://www.definicionabc.com/general/varianza.php
http://dieumsnh.qfb.umich.mx/estadistica/vardatono.htm

¿Te ha gustado?
1 usuario ha opinado y a un 0,00% le ha gustado.