Standardafvigelse
Fra Wikipedia, den frie encyklopædi
Standardafvigelsen eller spredningen bruges inden for sandsynlighedsregning og statistik og er et udtryk for, hvor meget en stokastisk variabel fordeler sig omkring dens gennemsnit. Standardafvigelse er lig med kvadratroden af varians og er dermed mål for det samme. Derfor har standardafvigelse i modstætning til varians samme enhed som den stokastiske variabel og kan derfor være lettere at fortolke. Ligesom varians er standardafvigelse afhængig af skala, hvilket for eksempel betyder, at de samme størrelser i centimeter vil have 10 gange så stor standardafvigelse, hvis de bliver målt i meter.
[redigér] Definition
Standardafvigelsen for en stokastisk variabel X benævnes σ (eller eventuelt σX hvis det skal gøres klart, hvilken stokastiske variabel der er tale om) og er defineret som:
Her angiver E(X) forventningsværdien for X (det sande gennemsnit).
Standardafvigelsen er altså kvadratroden af gennemsnittet af kvadraterne på den enkelte observations afvigelse fra gennemsnittet. Det betyder, at én stor afvigelse har større indflydelse end mange små. Således vil 1 observation med afvigelse på 2 bidrage med en størrelsesorden af 4, hvor 2 observationer med en afvigelse på 1 samlet kun vil bidrage med en størrelsesorden af 2. Dette betyder igen, at blot en enkelt fejlobservation kan påvirke standardafvigelsen meget – hvor det vil påvirke gennemsnittet i mindre grad.
[redigér] Empirisk standardafvigelse
For en stikprøve udregnes standardafvigelsen normalt som kvadratroden af den empiriske varians:
.
Hvor xi for i = 1..N er observationerne og
er gennemsnittet af disse værdier.
Dette er dog ikke et centralt estimat, hvilket betyder, at der en systematisk afvigelse mellem den sande standardafvigelse og stikprøvens standardafvigelse. Forskellen bliver dog lille, når der er mange observationer. For et mindre antal observationer, kan følgende formel bruges:
hvor max(X) − min(X) = R angiver variantionsbreden for stikprøven. d er en konstant, som afhænger af hvor mange observationer, man har i stikprøven. Nedenstående tabel viser værdier af d for N = 2 ... 10 observationer:
-
n 2 3 4 5 6 7 8 9 10 d 1,128 1,693 2,059 2,326 2,534 2,704 2,847 2,970 3,078
[redigér] Tolkning af standardafvigelse for normalfordelte variable
For en normalfordelt variabel er det let at tolke standardafvigelsen: 68% af datapunkter, vil være maksimalt en standardafvigelser væk fra gennemsnittet, 95% maksimalt to standardafvigelser og 99,7 maksimalt tre standardafvigelser. Da mange variable (ifølge den centrale grænseværdissætning) kan antages at være normalfordelte, kan dette bruges til de fleste målinger.
Tabellen viser, hvor meget af data, der vil ligge inden et interval af middelværdien plus/minus de givne spredninger.
| σ | 68,26894921371% |
| 2σ | 95,44997361036% |
| 3σ | 99,73002039367% |
| 4σ | 99,99366575163% |
| 5σ | 99,99994266969% |
| 6σ | 99,99999980268% |
| 7σ | 99,99999999974% |



