Forskel mellem versioner af "Korrelation"

363 bytes tilføjet ,  for 5 år siden
m
Præcisering af indholdet i fodnote 9.
(Sidste tekstafsnit ang. faktoranalyse omskrevet til mere forståeligt sprogbrug)
m (Præcisering af indholdet i fodnote 9.)
Såfremt '''r''' er tæt på 0,00 betyder det, at der ikke er nogen sammenhæng mellem variablerne. Hvis '''r''' er positiv betyder det, at når en variabel (fx ''højde'') bliver større, så bliver den anden variabel (''vægt'') det også, og omvendt. Hvis '''r''' derimod er negativ, betyder det, at når en variabel bliver større, så bliver den anden mindre (kaldes omvendt korrelation). - Når det gælder korrelationen mellem højde og vægt hos mennesket, ses den ofte beregnet til '''r''' = +0,72 under forudsætning af, at man til brug for beregningen har fået målt højden og vægten hos et stort antal mennesker. Korrelationen kan (i dette tilfælde) således vise, hvor meget vægten afhænger af højden. – Desværre er korrelationskalaen fra -1,00 og til +1,00 ikke en lineær skala på samme måde som på et målebånd eller en lineal, men følger i stedet en kurvelineær [[cosinus|cosinus-funktion]]. Der er med andre ord ikke samme afstand mellem fx to korrelationskoefficienter på henholdsvis '''r''' = +0,83 og +0,85 sammenlignet med afstanden mellem to andre korrelationskoefficienter, lydende på henholdsvis '''r''' = +0,33 og +0,35. Differencen er ganske vist begge steder 0,02 nummerisk set. Men i førstnævnte tilfælde er værdien af dette interval ''(på dette sted af korrelationsskalaen)'' noget større end i sidstnævnte tilfælde, nemlig hele 71%.<ref>Såfremt korrelationsskalaen ønskes vægtet således, at den i stedet kan optræde med en spredning som en normalfordelt skala, anvendes en særlig variabeltransformation, kaldet ''Fishers z' transformation.''</ref>
 
En korrelationskoefficient som den anførte på +0,72 giver dog endnu mere mening, dersom tallet også opløftes i 2. potens. I så fald bliver resultatet 0,52. Denne talværdi kaldes koefficientens ''varians'', hvilket betyder/afslører, at enten styres relationen mellem ''højde'' og ''vægt'' med højden som årsag til vægten for 52% vedkommende - eller også styres relationen mellem de to variable af den samme fælles årsag for ligeledes 52% vedkommende. For de resterende 48% vedkommende skyldes forholdet mellem højden og vægten således helt andre omstændigheder.<ref>Spørgsmålet er dog her, om det nu også i virkeligheden giver god mening overhovedet at korrelere de indsamlede rå data for hhv. højde og vægt med hinanden? Vægten er jo indlysende en variabel, som hidrører fra målingen af et tredimensionalt objekt - mens højden er en variabel, der alene tager sigte på kun den ene af måleobjektets tre dimensioner. Såfremt man ønsker et mere præcist udtryk for den reelle sammenhængsgrad imellem højde og vægt hos mennesket, vil det givetvis være mere retvisende først at transformere den ene af variablerne, så begge variable dermed kan bringes på samme dimensionelle niveau, inden de korreleres med hinanden. Det kunne fx gøres ved først at tage kubikroden til alle vægt-tallene, inden selve udførelsen af korrelationsberegningen. En sådan forudgående variabeltransformation vil sandsynligvis kunne resultere i en noget højere korrelationskoefficient - og dermed afsløre en væsentlig tættere sammenhæng mellem højde og vægt, end først udmålt. (Det er således altid vigtigt, at man sørger for at overveje hvilke [[måleskalaer|talskalaer]], som det er mest relevant at benytte i forbindelse med en påtænkt korrelationsberegning).</ref> Til sammenligning kan nævnes, at utallige undersøgelser har vist, at korrelationen vedrørende intelligenskvotienten<ref>Intelligensbegrebet dækker over en række mentale evner, som fx indlæringshastighed, problemløsning, [[hukommelsesspændvidde]], opfattelsesevne, læsefærdighed, skriftlighed, talbehandling, abstraktionsevne, o.lign.</ref> hos enæggede tvillinger, adskilt fra fødslen og bortadopteret til hver sit sociokulturelle miljø at vokse op i, i gennemsnit findes at ligge så højt som '''r''' = +0,84. Opløftes dette tal i 2. potens, ses variansen at udgøre, at ca. 70% af intelligens-niveauet hos det enkelte menneske må anses for arveligt bestemt fra dets forældre, mens de resterende kun ca. 30% kan tilskrives miljøbetingede faktorer, herunder specielle uddannelsesvilkår, o.lign.<ref>Det skal doghertil bemærkes, at intelligensniveauet igennem de sidste hundrede år globalt set hele tiden langsomt ses at flytte sig i opadgående retning med ca. 3 IQ-points pr. 10-år ([[Flynn-effekten]]), hvorefter effekten indtil videre er stoppet op og fladet ud umiddelbart efter årtusindskiftet. Menneskeheden synes med andre ord at kunne blive klogere i takt med den globale udvikling. FænomenetOpdagelsen af fænomenet har fåetinternationalt mangegivet anledning til store uddannelsespolitiske dønninger, idet venstreorienterede kredse verden over atfandt hævdegrundtanken i deres uddannelsespolitik styrket derved, at intelligensforskellene ermellem væsentligkloge og mindre kloge børn og unge således mere etsynes socialtat produkt,skyldes end''social etarv'' genetiskend produktmedfødt ''intelligens''. Konklusionen Påstanden er imidlertid siges at være stærkt overdrevet og næppe korrekt. I så fald ville man lige så vel kunne hævde, at menneskets gennemsnitshøjde er mere et socialt eller ernæringsmæssigt produkt, end just et genetisk produkt, blotselv fordiom gennemsnitshøjden i Vesten i løbet af de sidste et hundrede årårs dramatisk ændrede ernærings- og sundhedstilstand kun ses øget med ca.blot 109 cm. Arvens betydning for både ''intelligensniveauet'' (målt i IQ) og ''højden'' (målt i cm) er ifølge hyppigt gentagne korrelationsberegninger væsentlig større end miljøets betydning – på de her nævnte to områder medaf en størrelsesorden af henholdsvis 70% og 80%.</ref>
 
Formlen for den mest benyttede korrelationsberegning (Pearson’s produkt-moment korrelation) er baseret på brugen af almindelige metriske [[måleskala|talskala]]er, dvs. ''ratioskalaer'' og ''intervalskalaer''. Både ''vægt'' og ''højde'' udmåles således altid på en ratioskala. Skulle man derimod ønske at korrelere en feberkurve med fx en kurve for blodsænkningstallet,<ref>''Blodsænkning'' er en måling af, hvor meget de røde blodceller synker ned gennem en blodprøve i et reagensglas i løbet af en time. Analysen bruges ofte af læger til at påvise og følge kroniske betændelsestilstande i kroppen, men den siger dog ikke noget konkret om nøjagtig hvilken sygdom, der er tale om.</ref> vil det altid ske på en intervalskala. Feberkurven, der måles i Celsius grader, har nemlig lige så lidt som skalaen for blodsænkningstallet et såkaldt [[absolut nulpunkt]],<ref>Talskalaer med et ''absolut nulpunkt'' er kendetegnet ved ikke at indeholde negative talværdier. Da Celsius-skalaen indeholder negative tal (fx 10 graders frost = - 10<sup>o</sup>), har den kun et ''relativt nulpunkt'', nemlig der, hvor vand fryser til is. Derimod har en anden temperaturskala, Kelvin-skalaen, et sådant absolut nulpunkt (0<sup>o</sup> K), og som har vist sig at ligge på - 273,15<sup>o</sup> Celsius, hvor intet vil kunne blive koldere end det.</ref> hvilket betyder, at beregninger via multiplikation og division reelt ikke giver nogen mening – kun addition og subtraktion vil matematisk set være mulig på intervalskalaer. Man kan dog i begge tilfælde være sikker på, at en vægt på 100 kg ligger nøjagtig midt imellem 90 kg og 110 kg. Ligesom 40<sup>o</sup> i feber ligger nøjagtig midt imellem 39<sup>o</sup> og 41<sup>o</sup> i feber.
604

redigeringer