Varianza y
desviación estándar
La desviación sólo significa qué tan lejos de lo
normal
La
desviación estándar (σ) mide cuánto se separan los datos.
La
fórmula es fácil: es la raíz cuadrada de la varianza. Así que,
"¿qué es la varianza?"
Varianza
la
varianza (que es el cuadrado de la desviación estándar: σ2)
se define así:
Es la media de las diferencias con la media elevadas
al cuadrado.
En
otras palabras, sigue estos pasos:
1.
Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)
Ejemplo
Tú
y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las
alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula
la media, la varianza y la desviación estándar.
Respuesta:
Media =
|
600
+ 470 + 170 + 430 + 300
|
=
|
1970
|
= 394
|
|
|
|||
5
|
5
|
así
que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Ahora
calculamos la diferencia de cada altura con la media:
Para
calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la
media:
Varianza: σ2 =
|
2062 +
762 + (-224)2 + 362 + (-94)2
|
=
|
108,520
|
= 21,704
|
|
|
|||
5
|
5
|
Así
que la varianza es 21,704.
Y
la desviación estándar es la raíz de la varianza, así que:
Desviación
estándar: σ = √21,704 = 147
y
lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas
están a distancia menos de la desviación estándar (147mm) de la media:
Así
que usando la desviación estándar tenemos una manera "estándar" de
saber qué es normal, o extra grande o extra pequeño.
Los
Rottweilers son perros grandes. Y los Dachsunds son un
poco menudos... ¡pero que no se enteren!
Elevar
cada diferencia al cuadrado hace que todos los números sean positivos (para
evitar que los números negativos reduzcan la varianza)
Y
también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000
es mucho más grande que 502=2,500.
Pero
elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo
deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más
útil.
1- Media aritmética
La media aritmética es la suma de todos los datos
dividida entre el número total de datos. Se calculan dependiendo de cómo
vengan ordenados los datos.
Ejemplo:
¿Cuál es la media de las edades de Andrea y sus primos?
2- Moda
La moda de un conjunto de datos es el dato que más veces se
repite, es decir, aquel que tiene mayor frecuencia absoluta. Se
denota por Mo. En caso de existir dos valores de la variable que
tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún
valor, no existe moda.
- Ejemplo1:
¿Cuál es el dato que más se repite en el ejemplo anterior?
El dato que más se repite es el 1, es el que
tiene mayor frecuencia absoluta (4 veces).
La moda del número de hermanos es 1
- Ejemplo 2:
2, 3, 4, 5 , 6 , 9
En este conjunto de datos no existe ningún valor que se
repita, por lo tanto, este conjunto de valores no tiene moda.
- Ejemplo 3:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo=
1, 5, 9
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y
esa frecuencia es la máxima, tienevarias modas.
No hay comentarios.:
Publicar un comentario