Stokastisk variabel

For alternative betydninger, se Variabel.
Der er for få eller ingen kildehenvisninger i denne artikel, hvilket er et problem. Du kan hjælpe ved at angive troværdige kilder til de påstande, som fremføres i artiklen.

En stokastisk variabel er inden for sandsynlighedsregning og statistik uformelt set en variabel, hvis værdi påvirkes af tilfældigheder. Dens mulige værdier er hver associeret med en vis sandsynlighed. Værdierne kunne f.eks. repræsentere de mulige udfald af et endnu ikke udført eksperiment. En stokastisk variabel kaldes i nogle tilfælde også en tilfældighedsvariabel, jf. det engelske random variable.

Stokastiske variable betegnes ofte med store bogstaver som f.eks. , og .

Definition

redigér

Formelt set defineres en stokastisk variabel som en målbar afbildning   hvor   betegner et sandsynlighedsrum, for et passende sandsynlighedsmål  , og   et målbart rum. I tilfældet hvor   siger man at   er en reel stokastisk variabel.

En umiddelbar konsekvens af denne definition er, at urbilledet af en stokastisk variabel   inducerer et nyt sandsynlighedsmål   givet ved   for alle  . Det er sædvane at betegne   ved notationen  .

Diskrete og kontinuerte stokastiske variable

redigér

Hvis billedet af   under   er højst tælleligt, altså hvis  , siger vi at   er en diskret stokastisk variabel. I tilfældet hvor   og   siger vi at   er en kontinuert stokastisk variabel.

Fordelingsfunktioner

redigér

Lader vi   betegne vores sandsynlighedsrum med sandsynlighedsmål  , siger vi at funktionen   givet ved   er fordelingsfunktionen for  .

Fordelingsfunktionen siges at karakterisere funktionen: gælder der for to sandsynlighedsmål   og   at   for alle  , så følger det at  .

Fordelingsfunktioner for reelle stokastiske variable

redigér

Hvis   betegner en reel stokastisk variabel og   et sandsynlighedsmål, siger vi at fordelingen af   er givet ved fordelingsfunktionen   for   og vi skriver her,

 .

Simultane fordelinger

redigér

Definitionen for fordelingen af en reel stokastisk variabel inspirerer ydermere en naturlig udvidelse i det tilfælde hvor   med   betegner en flerdimensionel reel stokastisk variabel. Vi kan her tilsvarende definere en fordelingsfunktion   hvor vi skriver,

 .

Vi siger i dette tilfælde at   betegner den simultane fordeling af  .

Tætheder

redigér

Hvis fordelingsfunktionen for en reel stokastisk variabel   kan udtrykkes som  -integralet af en funktion   for et mål  , siger vi at   har tæthed   mht. målet  . I tilfældet hvor   er Lebesgue-målet  og   er Riemann-integrabel, siger vi ofte blot at   har tæthed   og der gælder i dette tilfælde at,

 .

Eksempler på stokastiske variable

redigér

Da fordelingsfunktionen for en stokastisk variabel karakteriserer fordelingen, undlader man ofte diskussioner om det bagvedliggende sandsynlighedsrum  , da det i de fleste steder er svært at beskrive og arbejde med eksplicit. Herunder giver vi dog nogle eksempler på eksplicit definerede stokastiske variable, samt også eksempler på stokastiske variable hvis fordeling defineres ud fra deres fordelingsfunktioner.

Diskret stokastisk variabel

redigér

Et eksempel på en diskret stokastisk variabel er summen af kast med terninger. Vi lader   være en stokastisk variabel med et diskret ligefordelt sandsynlighedsmål  , det vil sige   for alle  . Definerer vi her   ser vi at   og   er derfor en diskret stokastisk variabel.

En fortolkning af   er per konstruktion at den betegner summen af øjne ved kast af   fair  -sidede terninger. Vi kan her se at sandsynligheden for at få en sum af   øjne er givet ved,

 .

Bernoullifordelingen

redigér

At en stokastisk variabel   er Bernoullifordelt med parameter  , karakteriseres meget simpelt af det tilfælde hvor   antager værdien   med sandsynlighed   og værdien   med sandsynlighed  . Vi skriver ofte,

 ,

som karakterisering af denne fordeling. En fortolkning af Bernoullifordelingen kan være at der er sandsynlighed   for at en begivenhed indtræffer, og sandsynlighed   for at den ikke gør. Vi skriver her typisk  .

Alternativt kan Bernoullifordelingen karakteriseres ud fra punktsandsynlighederne ved,

 .

Binomialfordelingen

redigér

Vi siger at en stokastisk variabel   er Binomialfordelt med parametre   og  , hvis fordelingen af   karakteriseres af punktsandsynlighederne,

 .

En fortolkning af Binomialfordelingen er at vi udfører   uafhængige eksperimenter   af Bernoullifordelte stokastiske variable, alle med parameter  , og definerer her   som summen af disse, det vil sige  . Vi skriver her at  .

Poissonfordelingen
redigér

Man kalder en stokastisk variabel   for Poissonfordelt med parameter   hvis fordelingen af   kan karateriseres ved punktsandsynlighederne,

 .

Vi skriver i dette tilfælde at  . Det kan let vises at Poissonfordelingen blot er grænseopførslen, som  , for en Binomialfordelt stokastisk variabel   med  defineret således at  . Vi ser her at vi har,

 ,

hvor tilnærmelsen gælder for store   og små  .

Kontinuer stokastisk variabel

redigér

Lad   være en reel stokastisk variabel med et ligefordelt sandsynlighedsmål  , det vil sige at   for alle  , hvor   almindeligvis betegner Lebesgue-målet på  . Lader vi nu   følger det fra en simpel udregning at  , og  , altså er   en kontinuer stokastisk variabel. Vi ser her at vi har,

 .

Vi ser yderligere for punktsandsynligheden i  , at der gælder,

 ,

hvilket eksemplificerer idéen om at kontinuerte stokastiske variable har sandsynlighed   i deres punkter.

Normalfordelingen

redigér

Inden for sandsynlighedsregning og statistisk spiller Normalfordelingen en central rolle. Det anses af mange for den vigtigste fordeling. Vi siger at en stokastisk variabel   er normalfordelt med parameter   og  , hvis den har tæthedsfunktionen

 .

I dette tilfælde skriver vi at  . I specialtilfældet hvor   og   siger vi at   følger en standard Normalfordeling. Vi anvender ofte notationen   eller blot   for tæthedsfunktionerne når   er standard Normalfordelt og tilsvarende   eller   for fordelingsfunktionerne. I dette tilfælde får vi at,

 .

Især spiller den standard Normalfordeling en hovedsaglig rolle i Den Centrale Grænseværdisætning.

Eksponentialfordelingen

redigér

Vi siger at   følger en Eksponentialfordeling med parameter  , hvis den karakteriseres af tæthedsfunktionen,

 .

Vi kan her finde et eksplicit udtryk for den tilsvarende fordelingsfunktion, som er givet ved

 .

Hvis   er Eksponentialfordelt, skriver vi  .

Da fordelingsfunktionen kan udtrykkes eksplicit ved elementære funktioner, er det ikke unormalt at man støder på en alternativ definition af Eksponentialfordeling centreret omkring fordelingsfunktionen frem for tæthedsfunktionen.

Integration af stokastiske variable

redigér

Lader vi   betegne en stokastisk variabel og   siger vi at   har endelig forventning, hvis   er integrabel mht. målet  . Vi kalder integralet for forventningen af   og skriver,

 ,

hvor   og   er den hhv. positive og negative del af  . Vi betegner ved   mængden af alle  -integrabel stokastiske variable på  .

Forventning fra tæthed

redigér

Hvis en kontinuer stokastisk variabel   har tæthed  , som er Riemann-integrabel, kan den forventede værdi findes simpelt ved integralet,

 .

I tilfældet hvor   er diskret, findes en lignende metode der kan udtrykket som en sum,

 .

Disse udtryk gør det i praksis lettere at udregne forventningen for de mere velkendte stokastiske variable der kan karakteriseres fra en tæthed.

-næsten sikkert

redigér

Vi siger at to stokastiske variable er ens næsten sikkert og skriver    -n.s. hvis  . Denne definition er blot en indskrænkelse af det målteoretiske begreb  -næsten overalt til specialtilfældet med sandsynlighedsmål. En ækvivalent definition af    -n.s. er at  .

Ved   betegner vi mængden af ækvivalensklasser for integrable stokastiske variable under ækvivalensrelationen  -n.s.

Uafhængighed

redigér

Hvis   og   betegner to stokastiske variable, siger vi at   og   er uafhængige hvis der for alle valg af   og   gælder at  .

Uafhængighed af stokastiske variable har en række af nyttige egenskaber, blandt andet ved beregningen af forventningen og variansen.

Konvergens

redigér

Udover det sædvanlige konvergensbereb, gælder en række andre typer af konvergens for stokastiske variable. Vi giver her et par eksempler på de mest anvendte.

Næsten sikker konvergens

redigér

Vi siger at en sekvens   af stokastiske variable konvergerer mod   næsten sikkert hvis    -n.s., det vil sige hvis  . I dette tilfælde skriver vi   fra det engelske almost surely.

Konvergens i  

redigér

En sekvens   af stokastiske variable konvergerer mod   i  , eller blot i   hvis   og   er underforstået, hvis både   og   er i   og der ydermere gælder at  . Vi anvender ofte notationen   i dette tilfælde.

Konvergens i sandsynlighed

redigér

Vi siger at en sekvens   af stokastiske variable, konvergerer mod   i sandsynlighed, hvis der for alle valg af   gælder at  . Vi skriver her at  .

Blandt disse typer af konvergens siger man ofte at konvergens i sandsynlighed er svagest ment i den forstand at både næsten sikker konvergens samt konvergens i   medfører hver især konvergens i sandsynlighed.

Notation

redigér

Mange dele af sandsynlighedsteori er lempelig med den anvendte notation. Det er som eksempel sjældent man nogensinde laver nogle dybe betragtninger om strukturen af det bagvedlæggende sandsynlighedsrum  , og det er næsten aldrig at man eksplicit formulerer det. Af denne årsag er man sjældent interesseret i de konkrete funktionsværdier   for  , og blot denoterer disse ved  .

Yderligere i introducerende sandsynlighedsregning, betragter man sjældent stokastiske variable som egentlige afbildninger. De bliver ofte her betragtet som seperate matematiske strukturere som defineres ud fra deres egenskaber i forbindelse med deres tætheder og fordelingsfunktioner. Dette lægger også op til den almindeligt anvendte notation  ,   og   frem for de mere stringente  ,   og  .

Hvis vi for en vilkårlig indeksering   har en sekvens   som tilhører den samme ækvivalensklasse i  , det vil sige at    -n.s. for alle  , er det sædvane at betegne dem blot ved en repræsentant   for ækvivalensklassen. Dette skyldes at stokastiske variable tilhørende samme ækvivalensklasse i   ofte deler en række af egenskaber.