Cómo calcular varianzas

La varianza es una medida aritmética que nos permite conocer la dispersión que existe en un conjunto de datos. Matemáticamente hablando, la varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de cierta distribución estadística.

Viene representada por el símbolo σ², que es la letra griega sigma en minúscula elevada al cuadrado, por lo que es una unidad de medida al cuadrado. Si deseas conocer la desviación estándar sólo deberás calcular la raíz cuadrada de la varianza.

Los resultados de la varianza nos dirán si los valores del conjunto estudiado están agrupados, cerca o dispersos. Un resultado pequeño indica que los valores están bastante agrupados, y en cambio, si el resultado de la varianza es grande, significa que los datos están dispersos.

Su uso es muy amplio estadísticamente hablando, por ejemplo, comparando la varianza de dos conjuntos de valores, por ejemplo femeninos y masculinos, se puede saber si una variable tiene un efecto destacable. Por otro lado, si estás creando un modelo estadístico la varianza puede indicar que estás ajustando mucho los datos.

A continuación te mostramos cómo calcular la varianza.

Tipos de varianzas

Podemos calcular la varianza muestral, es decir, cuando tenemos una población extremadamente grande, cogeremos una muestra y de ahí se estimarán los resultados.

La varianza de la población es el cálculo de la varianza d  el total de la población. Se calcula usando todos los datos de la población de estudio.

La varianza de datos agrupados es otro caso en el que calcularemos la varianza cuando los datos de estudios están agrupados en diversas categorías o en grupos.

Propiedades de la varianza

  • El valor de la varianza siempre será igual o mayor que cero.
  • Si se le suma un mismo número a todos los valores de la variable que tenemos en cuenta, la varianza permanece igual.
  • Si se multiplican todos los valores de la variable por un mismo número, entonces la varianza resultará multiplicada por el cuadrado de ese número utilizado.
  • Si disponemos de diversas distribuciones que poseen la misma media y si sabemos sus varianzas, podremos calcular la varianza total.

Datos sobre la varianza

  • La varianza es muy sensible a los valores extremos, al igual que la media, por lo que si tenemos valores muy extremos la varianza puede no ser del todo fiable.
  • Si no podemos calcular la media de una distribución, entonces tampoco podremos calcular la varianza de dicha distribución.
  • Las desviaciones resultan al cuadrado, por lo que la varianza no usa la misma unidad que los datos utilizados en su cálculo.

Calcular las varianzas muestral

Cómo calcular la varianza

Xᵢ= cada dato de la distribución.

Cómo calcular la varianza= media aritmética de la distribución (sumaremos todos los valores de la distribución y dividiremos el resultado por la cantidad de datos que tenemos).

N= número de valores que tenemos en la distribución muestral.

Para calcular la varianza muestral nos proporcionarán algunos valores de todo el conjunto poblacional. Digamos por ejemplo que tenemos la siguiente distribución:

9, 8, 6, 5, 3, 2

Para calcular la varianza de esta distribución comenzaremos calculando su media:

 

Cómo calcular la varianza

Calcular las varianzas de la población

Cómo calcular la varianza

En este caso el proceso sería completamente igual que el anterior, lo único es que varían los símbolos que usaremos en la fórmula y que usaremos todos los datos que componen la población, por lo que el resultado de la varianza será exacto.

Primero: calcularemos la media de los datos de la distribución

Segundo: calculamos la suma de los cuadrados de  las diferencias de los datos respecto a la media aritmética.

Por último: dividiremos el resultado entre el número de datos total que proporciona la población.

Calcular las varianzas de datos agrupados

Para calcular la varianza de datos agrupados partiremos de datos incluidos en grupos y la cantidad de veces que se repite un dato en el grupo.Cómo calcular la varianza

Por ejemplo, partiremos de estos datos:

Li= valor inferior

Ls= valor superior

Xi= Marca de clase – valor medio calculados con los datos inferiores y superiores.

Fi= frecuencias (cantidad de veces que se repiten los datos en el grupo)

N= es la suma de todas las frecuencias

n-1= suma de frecuencias menos . (usaremos este dato en vez de n cuando calculamos la varianza de datos agrupados de una muestra).

Con este ejemplo calcularemos la varianza poblacional para varios grupos de salarios y los números de trabajadores que hay en cada grupo.

  salarios Li salarios Ls fi -nº trabajadores Xi Xi*fi
100 200 12 150 1800
200 300 10 250 2500
300 400 15 350 5250
400 500 18 450 8100
55 17650

 

Primero: calcularemos la marca de clase

Segundo: calcularemos Xi*fi

Tercero: con estos datos calculamos el promedio

Media= 17650/55=320.91

A continuación calcularemos la varianza:

Xᵢ – Cómo calcular la varianza (Xᵢ – Cómo calcular la varianza (Xᵢ – Cómo calcular la varianza)² * fi
-170,91 29209,92 350519,01
-70,91 5028,10 50280,99
29,09 846,28 12694,21
129,09 16664,46 299960,33
713454,545

Primero: calculamos Xᵢ – Cómo calcular la varianza

Segundo: el resultado lo elevamos al cuadrado

Tercero: el resultado lo multiplicamos por fᵢ

Cuarto: Sumamos todos los resultados de todas las clases

Quinto: Dividimos el resultado anterior entre N

σ²= 713454.545/55=12971,90

Con estos sencillos pasos y ejemplos ahora ya sabrás cómo calcular la varianza de tus distribuciones de datos estadísticos.

 

¿Te ha gustado?
564 usuarios han opinado y a un 47,16% le ha gustado.
8 Comentarios
  1. f dice

    Creo que hay un error en las primeras 2 fórmulas, abajo dice N y creo que es n-1. Gracias, excelente página.

    1. Armandito dice

      En la primera formula que se refiere a la varianza de la muestra abajo no va N, tiene que ir n-1. Mientras que, cuando se neceita calcular la varianza poblacional es correcto tener N abajo

    2. En el ejemplo anterior, que se puede decir de la desviacion esyandar? Hay o no dispersion respecto a ña media. Como se trata de salarios, me ayudaria a hacer ajustes en los mismos corrigiendo posibles dispersiones? dice

      En el ejercicio sobre salarios, como se aplican los resultados de forma practica para corregir posibles dispersiones respecto al salario promedio?

  2. gabriela dice

    alguien me podría decir cuando usar la formula para VARIANZA DE DATOS AGRUPADOS Y NO AGRUPADOS… por favor

  3. Fathima dice

    Muy buena pagina

  4. César Leiva C. dice

    Hola.
    Un trabajador que tenga un ingreso correspondiente al límite superior de una clase, por ejemplo 200 unidades monetarias, en cuàl clase queda incluído en la primera clase o en la segunda, que también tiene a 200 como límite inferior de la clase subsiguiente. Agradezco su respuesta por favor.

  5. Javier dice

    Como calculo el punto de pedido necesario para un almacén de lavadoras, si el nivel de servicio que se quiere lograr es del 95% (k=1,64). Este artículo posee una demanda de 400 aparatos al mes, con un varianza de 100. Además se sabe que el proveedor se demora unas 5 semanas en poner a disposición la mercancía. Y calculo también el stock de seguridad

    Gracias

  6. Erik dice

    Pues lo único en lo que tengo duda es de como sacaron
    _
    X

Deja un comentario

Tu dirección de email no será publicada.