Standardafvigelse: Forskelle mellem versioner

Content deleted Content added
m Linkrettelse (væk fra flertydig)
→‎Definition: Primært typografisk ændringer.
Linje 2:
 
== Definition ==
Standardafvigelsen for en [[stokastisk variabel]] <math>X</math> benævnes σ<math>\sigma</math> (eller eventuelt <math>\sigma_X</math> hvis det skal gøres klart, hvilken stokastiske variabel der er tale om) og er defineret som:
 
:<math>\sigma = \sqrt{\mbox{E}[(X-\mbox {E}(X)mu)^2}] </math>
 
Her angiver <math>\mu=E\left(X\right)</math> middelværdien for <math>X</math> (det sande gennemsnit).
 
Standardafvigelsen er altså kvadratroden af middelværdien af kvadraterne på den enkelte observations afvigelse fra middelværdien. Det betyder, at én stor afvigelse har større indflydelse end mange små. Således vil 1 observation med afvigelse på 2 bidrage med en størrelsesorden af 4, hvor 2 observationer med en afvigelse på 1 samlet kun vil bidrage med en størrelsesorden af 2. Dette betyder igen, at blot en enkelt [[fejlobservation]] kan påvirke den estimerede standardafvigelsen meget – hvor det vil påvirke gennemsnittet i mindre grad.
Linje 19:
:<math> s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}</math>,
 
hvor <math>\overline{x}</math> er gennemsnittet af observationerne. Selvom <math>s²^2</math> er et [[estimat|centralt estimat]] for variansen, er s ikke et centralt estimat for standardafvigelsen<ref>Probability and Statistics for Engineers'' (2000) af Miller & Freund (Prentice Hall), ISBN 0-13-017974-4, 6. udgave, side 275''</ref>. Dette betyder, at der er en systematisk negativ afvigelse mellem den teoretiske standardafvigelse og stikprøvens standardafvigelse, hvis denne formel bruges. Forskellen bliver dog lille, når der er mange observationer og i praksis ses bort fra, at det ikke er et centralt estimat.
 
For et lille antal observationer (5 eller mindre), kan følgende formel bruges for at opnå et centralt estimat.
Linje 53:
Man skal være opmærksom på, at for større datasæt vil s være den bedste af de to estimater. Den alternative formel bruges mest indenfor industriel kvalitetskontrol i tilfælde, hvor det ikke er muligt at have en stor stikprøve.
 
UestimationEstimation af standardafvigelsen kan lettes ved brug af formlen
 
:<math>\frac{1}{n}\sum_{i=1}^n (x_i - \overline{x})^2=\frac{1}{n}\sum_{i=1}^n x_i^2 - \fracbar{(\sum_{i=1x}^nx_i)^2}{n}</math>,
 
hvilket betyder, at man kan summere data op løbende uden at beholde de enkelte observationer.