Desviación estándar
Na Galipedia, a wikipedia en galego.
En probabilidade e estatística, a desviación estándar é a medida máis común de dispersión. Dito de xeito sinxelo, mide qué tan dispersos están os valores en unha colección de datos.
A desviación estándar está definida como a raíz cadrada da varianza. Defínese de esta maneira para darnos unha medida da dispersión que é (1) un número non negativo e (2) ten as mesmas unidades que os datos.
O termo desviación estándar foi introducido en estatística por Karl Pearson en 1894.
Índice |
[editar] Interpretación e aplicación
A desviación estándar é unha medida do grado de dispersión dos datos do valor promedio. Dito de otra maneira, a desviación estándar é simplemente o "promedio" ou variación esperada con respecto da media aritmética.
Unha desviación estándar grande indica que os puntos están lonxe da media e unha desviación pequena indica que os datos están agrupados cerca da media.
Por exemplo, as tres mostras (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8) cada unha teñen unha media de 7. As súas desviacións estándar son 7, 5 e 1, respectivamente. A terceira mostra ten unha desviación moito menor que as outras duas porque os seus valores están máis cerca de 7.
A desviación estándar pode ser interpretada como unha medida de incertidume. A desviación estándar de un grupo repetido de medidas danos a precisión de estas. Cando se vai determinar se un grupo de medidas está de acordo co modelo teórico, a desviación estándar desas medidas é de vital importancia: se a media das medidas está demasiado alonxada da predicción (coa distancia medida en desviacións estándar), entón consideramos que as medidas contradicen a teoría. Isto é de esperarse xa que as medicións caen fora do rango de valores dos cuales sería razoable esperar que ocurreran se o modelo teórico fora correcto.
[editar] Desglose
A desviación estándar (DS/DE), tamén coñecida como desviación típica, é unha medida de dispersión usada en estatística que nos dice cánto tenden a alonxarse os valores puntuales do promedio nunha distribución. De feito, específicamente a desviación estándar é "o promedio da distancia de cada punto respecto do promedio". Sóese representar por unha S ou coa letra sigma,
.
A desviación estándar dun conxunto de datos é unha medida de cánto se desvían os datos da súa media. Esta medida é máis estable que o percorrido e toma en consideración o valor de cada dato.
É posible calcular a desviación estándar como a raíz cadrada da integral
onde
- A DS é a raíz cadrada da varianza da distribución
Así a varianza é a media dos cadrados das diferencias entre cada valor da variable e a media aritmética da distribución.
Anque esta fórmula é correcta, na práctica interesa realizar inferencias poblacionales, polo que no denominador en vez de n, úsase n-1 (Corrección de Bessel)
Tamén temos outra función máis sinxela de realizar e con menos risco de ter equivocacións:
[editar] Exemplo
Aquí móstrase cómo calcular a desviación estándar de un conxunto de datos. Os datos representan a idade dos membros de un grupo de nenos. { 5, 6, 8, 9 }
1. Calcular o promedio
.
.
Neste caso, N = 4 porque temos catro datos:
Sustituindo N por 4
Este é o promedio.
2. Calcular a desviación estándar 
Sustituindo N por 4
Sustituindo
por 7
Esta é a desviación estándar.











![\sigma = \sqrt{\frac{1}{8} \left [ (4.589-4.596)^2 + (4.318-4.596)^2 + (4.256-4.596)^2 + (4.624-4.596)^2+(4.903-4.596)^2+(4.867-4.596)^2+(4.420-4.596)^2 +(4.790-4.596)^2\right ] }](../../../math/5/d/5/5d5bcf9809ad547e7982e33fd68dea2d.png)
![\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }](../../../math/6/2/c/62c241b9f368cfa8d1d37b0a53950a55.png)




