Korrelation: Forskelle mellem versioner

Content deleted Content added
Dalmer (diskussion | bidrag)
Korrektion af matematisk formel + fodnote+omflytning af afsnit
Dalmer (diskussion | bidrag)
m Et par afklarende tilføjelser til teksten
Linje 1:
'''Korrelation''' (eller "ko-relation", "sam-relation") er i [[statistik]] et mål for ''sammenhængsgraden'' mellem et sæt af to [[stokastisk variabel|variable]]/målinger. En høj korrelation betyder, at det ene sæt af variable kan forudsiges fra det andet og omvendt, eller at begge variable i en vis udstrækning er et resultat af samme fælles årsag, eller at de evt. er kommet til at dele et fælles betydningsindhold (rent semantisk).<ref>Ønsker man fx korrelationen udregnet mellem to menneskelige egenskaber, som ''loyalitet'' og ''trofasthed'', bliver resultatet uundgåeligt en meget høj korrelation, der vil have forholdsvis ringe forklaringsværdi, da begge disse egenskaber rent sprogligt i vid udstrækning dækker nøjagtig det samme.</ref> Korrelation betyder således ikke nødvendigvis, at der er en direkte årsagssammenhæng mellem to variabler.
 
For eksempel er ''vægt'' og ''højde'' to variable hos mennesket, der i en vis udstrækning er afhængige af hinanden – højere personer er ofte tungere end lavere personer. Men afhængigheden er ikke perfekt. Personer med samme højde kan som bekendt godt have forskellig vægt, trods alt. Ikke desto mindre er det i dette tilfælde tydeligt for enhver, at der i det mindste ''gennemsnitlig'' kan iagttages en vis relation mellem højde og vægt blandt mennesker. Størrelsen af denne relation beregnes ved hjælp af nedenstående matematiske formel og ender med et slutresultat, kaldet en korrelationskoefficient (eller ”'''r'''”), som varierer fra –1,00 til +1,00. Og jo nærmere '''r''' er til yderpunkterne +1,00 eller –1,00 jodesto større eller tættere er sammenhængen mellem de to variable.
 
Såfremt '''r''' er tæt på 0,00 betyder det, at der ikke er nogen sammenhæng mellem variablerne. Hvis '''r''' er positiv betyder det, at når en variabel (fx ''vægthøjde'') bliver større, så bliver den anden variabel (fx ''højdevægt'') det også, og omvendt. Hvis '''r''' derimod er negativ, betyder det, at når en variabel bliver større, så bliver den anden mindre (kaldes omvendt korrelation). - Når det gælder korrelationen mellem højde og vægt hos mennesket, ses den ofte beregnet til '''r''' = +0,72 under forudsætning af, at man til brug for beregningen har fået målt højden og vægten hos et stort antal mennesker. Korrelationen kan (i dette tilfælde) således vise, hvor meget vægten afhænger af højden. - Desværre er korrelationskalaen fra -1,00 og til + 1,00 ikke en lineær skala på samme måde som på et målebånd eller en lineal, men følger i stedet en cosinus-funktion.
 
En korrelationskoefficient som denne på 0,72 giver dog endnu mere mening, dersom tallet også opløftes i 2. potens. I så fald bliver resultatet 0,52. Denne talværdi kaldes koefficientens ''varians'', hvilket betyder/afslører, at enten styres relationen mellem ''højde'' og ''vægt'' imed virkelighedenhøjden som årsag til vægten for 52 % vedkommende - eller kunogså styres relationen mellem de to variable af den samme fælles årsag for blotligeledes 52 % vedkommende. For de resterende 48 % vedkommende skyldes forholdet mellem højden og vægten således andre forhold eller omstændigheder.
 
I forbindelse med gennemførelsen af fx store forskningsprojekter el.lign. med rigtig mange forskellige variable, foretager man ofte korrelationsberegninger parvis mellem alle de udmålte variable indbyrdes for bl.a. at kunne reducere mængden af, hvad der under udregningen måtte vise sig at være variable af mindre betydning - en proces, som vil fremme hele overskueligheden i data-materialet. Det gøres ved at stille et sådant sæt af krydstabulerede korrelationsberegninger op i en to-dimensional ''korrelationsmatrice'', som herefter vil kunne danne udgangspunktet for udregningerne til en såkaldt ''faktor-model'' ved hjælp af [[faktoranalyse]] (sker teoretisk via brugen af ''matrix-algebra'' - i praksis via en computer-kørsel).
Linje 19:
Det kan bemærkes, at <math>\sqrt{\mbox{var}(X)} = \mbox{std}(X)</math>.
 
Hvis den empiriske korrelation ønsket regnetudregnet uddirekte fra et datasæt, kan denne formel benyttes:
 
: <math>\mbox{r}(X,Y)= \frac{\sum x_iy_i-n \bar{x} \bar{y}}{(n-1) s_x s_y}=\frac{n\sum x_iy_i-\sum x_i\sum y_i}
Linje 31:
[[Karl Pearson]] viderførte Bravais og Galton's arbejde<ref>[[Karl Pearson]], "Mathematical contributions to the theory of evolution III: Regression, heredity, panmixia", ''Philo. trans. Roy. Soc. London Ser. A'', 187:253-318</ref>, og det almindelige mål for korrelationen – "korrelationskoefficienten" – betegnes nu også ''Pearsons korrelation''.
 
== HenvisningerNoter ==
{{Reflist}}