Korrelation: Forskelle mellem versioner

Content deleted Content added
Dalmer (diskussion | bidrag)
m Rettelse af stavefejl + omplacering af afsnit.
Dalmer (diskussion | bidrag)
m Afsluttende tilpasning af omplaceret afsnit.
Linje 1:
'''Korrelation''' (eller "ko-relation", "sam-relation") er i [[statistik]] et mål for ''sammenhængsgraden'' mellem et sæt af to [[stokastisk variabel|variable]]/målinger.
 
Det teoretiske grundlag for korrelationsberegningen skyldes oprindelig den franske matematiker [[Auguste Bravais]], der tilbage i 1840'erne udgav en række artikler, omhandlende anvendt matematik og statistik.<ref>Auguste Bravais, "Sur les probabilités de erreurs de situation d'un point", ''Mem. Acad. Royal. Sci. Inst. France'', 9:255-332. (1846),</ref> Den praktiske anvendelse af korrelationsberegningen blev dog først påbegyndt omkring 1889 af [[Francis Galton]]<ref>Francis Galton, "Co-relations and their measurement, chiefly from antropometric data", ''Proceedings of the Royal Society of London'', 45:135-145</ref> (en fætter til Charles Darwin), som fik brug for korrelationsberegninger til at kunne sammenligne størrelsen af forskellige legemsdele på dyr og mennesker i forbindelse med studiet af evolutionsteoriens følgevirkninger. Galton baserede sine korrelationsberegninger på sin egen matematiske definition af en universel statistisk måleenhed, som han kaldte en [[standardafvigelse]]. Den engelske matematiker [[Karl Pearson]] videreførte Bravais' og Galton's arbejde og bidrog endeligt i 1896 til formlens nuværende udseende.<ref>Karl Pearson, "Mathematical contributions to the theory of evolution III: Regression, heredity, panmixia", ''Philo. trans. Roy. Soc. London Ser. A'', 187:253-318.</ref> Og det almindelige mål for korrelationen – den såkaldte "korrelationskoefficient" – betegnesblev nuherefter betegnet som ''Pearsons produkt-moment korrelation''.
 
- - - - - - - - - - - - - - - - - - -
En høj korrelation betyder, at det ene sæt af variable kan forudsiges fra det andet og omvendt, eller at begge variable i en vis udstrækning er et resultat af samme fælles årsag, eller at de evt. er kommet til at dele et fælles betydningsindhold (rent semantisk).<ref>Ønsker man fx korrelationen udregnet mellem to menneskelige egenskaber, som ''loyalitet'' og ''trofasthed'', bliver resultatet uundgåeligt en meget høj korrelation, der vil have forholdsvis ringe forklaringsværdi, da begge disse egenskaber rent sprogligt i vid udstrækning dækker nøjagtig det samme.</ref> (Korrelation betyder således ikke nødvendigvis, at der er en direkte årsagssammenhæng mellem to variabler).
 
En høj korrelation betyder, at det ene sæt af variable kan forudsiges fra det andet og omvendt, eller at begge variable i en vis udstrækning er et resultat af samme fælles årsag, eller at de evt. er kommet til at dele et fælles betydningsindhold (rent semantisk).<ref>Ønsker man fx korrelationen udregnet mellem to menneskelige egenskaber, som ''loyalitet'' og ''trofasthed'', bliver resultatet uundgåeligt en meget høj korrelation, der vil have forholdsvis ringe forklaringsværdi, da begge disse egenskaber rent sprogligt (semantisk) i vid udstrækning dækker nøjagtig det samme.</ref> evt. er kommet til at dele et fælles betydningsindhold. (Korrelation betyder således ikke nødvendigvis, at der er en direkte årsagssammenhæng mellem to variabler).
 
For eksempel er ''vægt'' og ''højde'' to variable hos mennesket, der i en vis udstrækning er afhængige af hinanden – højere personer er ofte tungere end lavere personer. Men afhængigheden er ikke perfekt. Personer med samme højde kan som bekendt godt have forskellig vægt. Ikke desto mindre er det i dette tilfælde tydeligt for enhver, at der i det mindste ''gennemsnitlig'' kan iagttages en vis relation mellem højde og vægt blandt mennesker. Størrelsen af denne relation beregnes ved hjælp af nedenstående matematiske formel og ender med et slutresultat, kaldet en korrelationskoefficient (eller '''"r"'''), som varierer fra -1,00 til +1,00. Og jo nærmere '''r''' er til yderpunkterne +1,00 eller -1,00 desto større eller tættere er sammenhængen mellem de to variable.