Desviación estándar
Na Galipedia, a wikipedia en galego.
En probabilidade e estatística, a desviación estándar é a medida máis común de dispersión. Dito de xeito sinxelo, mide qué tan dispersos están os valores en unha colección de datos.
A desviación estándar está definida como a raíz cadrada da varianza. Defínese de esta maneira para darnos unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.
O termo desviación estándar foi introducido en estatística por Karl Pearson en 1894.
Índice |
[editar] Interpretación e aplicación
A desviación estándar é unha medida do grado de dispersión dos datos do valor promedio. Dito de otra maneira, a desviación estándar é simplemente o "promedio" ou variación esperada con respecto da media aritmética.
Unha desviación estándar grande indica que os puntos están lonxe da media e unha desviación pequena indica que os datos están agrupados cerca da media.
Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. As súas desviacións estándar son 7, 5 e 1, respectivamente. A terceira mostra ten unha desviación moito menor que as outras duas porque os seus valores están máis cerca de 7.
A desviación estándar pode ser interpretada como unha medida de incertidume. A desviación estándar de un grupo repetido de medidas danos a precisión de estas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, a desviación estándar desas medidas é de vital importancia: se a media das medidas está demasiado alonxada da predicción (coa distancia medida en desviacións estándar), entón consideramos que as medidas contradicen a teoría. Isto é de esperarse xa que as medicións caen fora do rango de valores dos cuales sería razoable esperar que ocurreran se o modelo teórico fora correcto.
[editar] Desglose
A desviación estándar (DS/DE), tamén coñecida como desviación típica, é unha medida de dispersión usada en estatística que nos dice cánto tenden a alonxarse os valores puntuales do promedio nunha distribución. De feito, específicamente a desviación estándar é "o promedio da distancia de cada punto respecto do promedio". Sóese representar por unha S ou coa letra sigma, .
A desviación estándar dun conxunto de datos é unha medida de cánto se desvían os datos da súa media. Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.
É posible calcular a desviación estándar como a raíz cadrada da integral
onde
- A DS é a raíz cadrada da varianza da distribución
Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.
Anque esta fórmula é correcta, na práctica interesa realizar inferencias poblacionales, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)
Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:
[editar] Exemplo
Aquí móstrase cómo calcular a desviación estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }
1. Calcular o promedio .
- .
Neste caso, N = 4 porque temos catro datos:
- Sustituindo N por 4
- Este é o promedio.
2. Calcular a desviación estándar
- Sustituindo N por 4
- Sustituindo por 7
- Esta é a desviación estándar.