Model (matematik): Forskelle mellem versioner

Content deleted Content added
Tilføjet artikel om at bygge en matematisk model
No edit summary
Linje 11:
 
==Bygning af matematiske modeller==
=== <b>Indledning</b><p> ===
Processen med at lave beregninger på problemstillinger fra virkelighedens verden kaldes matematisk modellering. Modeller er jo netop en efterligning af virkeligheden. Man får ikke det hele med. Modeller er forsimplinger, der fokuserer på det vigtigste. Dette er helt naturligt og nødvendigt i modelbygningen.
<p>I denne artikel præcenteres det sprog, der anvendes i denne proces, så man kan begynde at tale om, hvad der sker i modelbygningen. Det er oplagt, at nogle modeller er ”bedre” end andre. Nogle modeller kan give mere sikre og præcise resultater end andre. Hvis de fysiske modeller var lige så usikre som vejrforudsigelser var det aldrig lykkedes at sende astronauter til månen. Men hvori består forskellen på de fysiske modeller for sted, hastighed og acceleration og så vejrmodellerne? Forklaringen skal findes i de forskellige faser, der gennemløbes i modelbygningen. Det er faser som: systembeskrivelse, matematificering, abstraktion, idealisering, estimering, verifikation og validitet. Disse begreber præsenteres i denne artikel.
<p>For at holde fokus på de præsenterede begreber er der bevidst valgt meget simple eksempler, så kendskab til lineære og eksponentielle funktioner er nok for at kunne følge de matematiske ræsonnementer. Det er ikke matematikken, der er det vigtige i artiklen.
=== <p><b> De seks faser i arbejdet med matematiske modeller</b> ===
<p>Matematiske modeller er forsøg på at beskrive et fænomen i den virkelige verden ved hjælp af det matematiske sprog. Ved at benytte de matematiske værktøjer, og begreber kan man beskrive et område, som interesserer os. Formålet kan enten være at forstå nogle sammenhænge i det fænomen, som man beskriver, eller det kan være at få forskellige løsningsforslag til at løse et problem.
Her er nogle helt konkrete eksempler på fænomener, som man kan belyse ved hjælp af matematik.
Linje 24:
</li>
<li>Regeringen skal for næste års finanslov fastlægge nogle rammer for landets økonomi. Som en del af debatten og forhandlingerne mellem de forskellige partier indgår også konsekvensberegninger af forskellige lovforslag. Disse beregninger er foretaget i store komplekse matematiske modeller, der simulerer landes økonomi.
Anvendelsen af matematik, som beskrivelse af et fænomen i den virkelige verden, kaldes matematiske modeller. Ved at bruge ordet model understreges også, at det netop ikke er hele virkeligheden, som beskrives. En model er jo netop forskellig fra virkeligheden. Kort fortalt så beskriver man virkeligheden med matematik fx i matematiske ligninger, laver beregninger på ligningerne, og så tager man løsningen og fører det matematiske svar tilbage til det oprindelige problem og kommer med løsningsforslag baseret på beregningerne. Det er denne proces, som udfoldes i det følgende. </li>
</ol>
<p>
=== <b> Eksempel 1: Pris for at køre i taxa</b> ===
<b><p>
1. Problem<p></b>
Man vil gerne kunne beregne, hvor meget en tur i taxa koster afhængig af, hvor mange kilometer man kører. Man vil fx gerne kunne svare på:
<pol><li>a. Hvad koster en tur på 43 km?
<p/li><li>b. Hvor langt kan man køre for 453 kroner?
 
<p>
</li></ol>
2. Systemet
 
<p>Man skal nu beskrive det system, som man ønsker at lave en model for. Man vælger at beskrive prisen for en tur i taxa, som om den kun afhænger af de kørte kilometer. I virkeligheden koster det ekstra for brugen af cykelstativ, nattakst og for den brugte tid, men det vælger man fra i systembeskrivelsen. Systemet er kendetegnet ved (bestemt af) de eksogene variable. I dette eksempel er det startgebyret og kilometer prisen. Den endogene variabel er den variable, der beregnes i (bestemmes af) modellen. I dette eksempel er det den afhængige variabel (prisen).
 
<b>2. Systemet
</b><p>Man skal nu beskrive det system, som man ønsker at lave en model for. Man vælger at beskrive prisen for en tur i taxa, som om den kun afhænger af de kørte kilometer. I virkeligheden koster det ekstra for brugen af cykelstativ, nattakst og for den brugte tid, men det vælger man fra i systembeskrivelsen. Systemet er kendetegnet ved (bestemt af) de eksogene variable. I dette eksempel er det startgebyret og kilometer prisen. Den endogene variabel er den variable, der beregnes i (bestemmes af) modellen. I dette eksempel er det den afhængige variabel (prisen).
<p>
<b>3. Matematificering
</b><p>Nu oversæter man systembeskrivelsen til et matematisk sprog. Det er oplagt at lave en funktion taxa_pris(x), der bestemmer prisen for at køre x kilometer i taxaen.
<p><p>
I systembeskrivelsen har man fravalgt at medtage nattakst og minuttakst. Derfor kan man nøjes med en funktion af én variabel. Man har foretaget en abstraktion ved at fravælge nogle ting, som i den virkelige verden faktisk påvirker prisen.
Line 50 ⟶ 53:
Man har også lavet en idealisering ved at sige, at prisen vokser lineært med det kørte kilometertal. Man har fraregnet at de kørte minutter også påvirker prisen og nattakst samt brug af cykelstativ er heller ikke medtaget.
<p><p>
<b>4. Beregninger
</b><p>For at kunne foretage egentlige beregninger er man imidlertid nødt til at gøre modellen klar. De eksogene variable, som i denne taxa model er prisen per kørt kilometer p og startgebyret q, kan man nemt fastlægge ved fx at ringe til et lokalt taxafirma. De vil så svare, at de regner med en kilometerpris på 17 kr/km og et startgebyr på 48 kr. Men de vil også svare, at nu skal man huske nattakst og gebyr for brug af cykelstativ osv. osv. I denne model har man dog valgt at se bort fra disse beløb (at abstrahere fra dem) og derfor er man kun interesseret i at p=17 kr/km og q=48kr. Denne proces, som i taxa eksemplet er meget simpelt, kaldes for estimering af modellens parametre. Ofte er denne proces mindst lige så kompliceret som at opstille selve modellen, men her er det altså meget enkelt.
<p>
Nu er modellen klar til at kunne lave beregninger på. I et mere realistisk eksempel end taxa eksemplet vil man dog gerne sikre sig, at modellens beregninger svarer til de observationer, som man kan finde ude i den virkelige verden. Man skal sammenligne modelberegningerne med resultater fra den virkelige verden. Dette er ofte ganske indviklet og for nogle matematiske modeller helt umuligt. Det at sammenligne modellens resultater med virkeligedens data kaldes for verificering. Ordet verificering betyder at efterprøve rigtigheden af noget, og det er jo lige præcist det, som man ønsker for at sandsynliggøre, at modellen er brugbar. Man kan desværre aldrig bevise, at den er korrekt, men jo grundigere man er med verificeringen jo mere tillid kan man have til modellen.
Line 58 ⟶ 61:
<p>
<p>
<b>5. Løsninger
</b><p>Nu, efter flere siders snak, kan man nu begynde at besvare spørgsmål på basis af den matematiske model.
<p>
Det første spørgsmål er: Hvad koster en tur på 43 km? For det første skal man bemærke, at de 43 km ligger inden for den definitionsmængde, som er opstillet for modellen. Man kan så sætte x=43 km og beregne taxa_pris(43).
Line 75 ⟶ 78:
<p>Man kan køre 23,284 km for 453 kroner.
<p>
=== <b> Eksempel 2: Længden af en gedde</b> ===
<p>Dette eksempel er inspireret af www.dfu.min.dk/fiskepleje
<p>
<b>1. Problem</b>
<p>Man vil gerne kunne beregne længden af en gedde i Skjern Å som en funktion af geddens alder. Man vil fx gerne kunne svare på:
 
<p>a. Hvor lang er en gedde på 4 år?
<pol><li>b. Hvor gammellang er en gedde på 354 cmår?
<p/li><li>a. Hvor langgammel er en gedde på 435 årcm?
<p>
</li></ol>
<p>2. Systemet
<p><b>2. Systemet
</b><p>Man skal nu beskrive det system, som man ønsker at lave en model for. Der er mange forhold, der påvirker en geddes længde. Modellen kan derfor naturligvis kun beskrive en gennemsnitsgedde. Forhold som fødemængde, temperatur, geddens forældres længde, størrelsen af den plads, der er i åen, kan tænkes at påvirke geddens alder. I systembeskrivelsen vælges, at sige, at kun geddens alder bestemmer længden. Der er derfor en stor grad af abstraktion fra konkrete forhold og modellen beskriver kun en gennemsnitsgedde.
Systemet er derfor fastlagt af de eksogene variable, der er bestemt af alle mulige tænkelige forhold, men hvordan de i dette eksempel er påvirket af forældre, føde, plads ser man bort fra. De endogene variable er de variable, der bliver beregnet i modellen. Også kaldet de afhængige variable. I dette eksempel er den afhængige variabel (længden).
<p>
<pb>3. Matematificering
</b><p><p>Nu skal man gå fra systembeskrivelsen til den matematiske beskrivelse. Man ønsker at beskrive længde som funktion af tid. Gedde_længde(t).
<p>
I systembeskrivelsen har man besluttet at se bort fra konkret, hvordan plads, føde og forældre har indflydelse på geddens alder, så modellen bliver en beskrivelse af en gennemsnitsgedde i åen. Man har dermed lavet en abstraktion ved at fravælge nogle ting, som i den virkelige verden faktisk påvirker en rigtig geddes længde.
Line 100 ⟶ 104:
Man laver hermed en idealisering ved at ”gætte” på, at en gedde vokser som mange andre dyr og derfor passer til denne vækstligning.
<p>
<b>4. Beregninger
</b><p><p>Tallene L, v og p skal bestemmes for at kunne foretage beregninger på modellen. Dette kaldes for estimering af modellens parametre. I denne situation vil biologerne i praksis tage ud til åen og fange et antal gedder. Herefter måles fiskenes alder og deres længde, og der laves regression på de indsamlede data. Herefter kan for gedder i Skjern Å bestemmes til
<p>
L=114,6; v=0,927 og p=0,14
Line 107 ⟶ 111:
Nu kan man foretage beregninger på modellen. For et vurdere om modellen er brugbar i virkeligheden skal man dog sammenligne den med nogle rigtige tal for gedder. Denne proces hedder at verificere modellen. Men det var jo også den måde, som man brugte til at bestemme L, v og p. Derfor er det svært at vurdere modellens validitet. Validiteten bliver dog styrket af, at biologerne har god erfaring for at denne form for vækstmodel ofte kan beskrive dyrs vækst.
<p>
<b>5. Løsninger</b>
<p>Først nu er det relevant at begynde at anvende modellen til at svare på de stillede spørgsmål.
<p>
De to spørgsmål er:
<pol><li>a. Hvor lang er en gedde på 4 år?
<p/li><li>b. Hvor gammel er en gedde på 35 cm?
</li></ol>
<p>
 
 
<p>Svaret på det første spørgsmål findes ved gedde_længde(4) og det andet spørgsmål ved at løse ligningen gedde_længde(t)=35.
<p>
Line 125 ⟶ 131:
<p>Og en gedde fra Skjern Å på 35 cm kan anslås at være 2 år gammel.
<p>
=== <b> Eksempel 3: Indiske drengebørns højde</b> ===
<p>Dette eksempel er inspireret af http://adoptmed.org/topics/growth-charts.html
<p>
<p><b>1. Problem</b>
<p>Man vil gerne kunne beregne højden af et barn født af indiske forældre og opvokset i Indien. Man vil fx gerne kunne svare på:
<pol><li>a. Hvor høj er en dreng på 7 år?
 
<p/li><li>b. Hvor gammel er en dreng på 100 cm?
<p>
 
2. Systemet
</li></ol>
<p>Man skal nu beskrive det system, som man ønsker at lave en model for. På samme måde som i ovenstående eksempel er der mange forhold, der gør sig gældende og man er nødt til at være mere præcis for, hvordan man vil gribe det an. Der er jo stor individuel variation. Praksis indenfor lægevidenskaben er at man taler om median for børnenes højde som et udtryk for, hvordan deres højder udvikler sig. Et andet spørgsmål er, hvad mener man med drenge? Er det op til 16 år, 18år eller 20år. Og hvor gammel er man, når man er dreng? 0 måneder, 6 måneder 1 år?
 
<pb>2. Systemet
</b><p>Man skal nu beskrive det system, som man ønsker at lave en model for. På samme måde som i ovenstående eksempel er der mange forhold, der gør sig gældende og man er nødt til at være mere præcis for, hvordan man vil gribe det an. Der er jo stor individuel variation. Praksis indenfor lægevidenskaben er at man taler om median for børnenes højde som et udtryk for, hvordan deres højder udvikler sig. Et andet spørgsmål er, hvad mener man med drenge? Er det op til 16 år, 18år eller 20år. Og hvor gammel er man, når man er dreng? 0 måneder, 6 måneder 1 år?
<p>
Min systembeskrivelse kan derfor blive for denne opgave: Man ønsker at beskrive højdeudviklingen (defineret som medianen) for indiske skolebørn (5-15 år).
Line 140 ⟶ 149:
På samme måde som i ovenstående eksempel er der mange faktorer, der kan påvirke en drengs højde. Medfødte og sociale faktorer spiller ind. Dette ønsker man ikke at bygge ind i modellen, men man vil blot beskrive en gennemsnitlig udvikling målt ved medianen. Det er derfor en markant afgrænsning af systemet, at påstå, at et barns udvikling kun afhænger af dets alder, men det accepterer jeg, fordi man kun ønsker en generel model og ikke en model for et enkelt barn. Den eneste eksogene variabel, som man medtager, er derfor tiden målt i år. Den eneste endogene variable er højden målt i centimeter.
<p>
<b>3. Matematificering
</b><p>Nu skal man gå fra systembeskrivelsen til den matematiske beskrivelse. Man ønsker at beskrive højden som funktion af alder: højde(t).
<p>
I min systembeskrivelse har man besluttet at se bort fra hvordan det enkelte barns højde udvikler sig. Man har derfor foretaget en abstraktion ved at fravælge en lang række forhold.
Line 151 ⟶ 160:
Det er en idealisering at vælge en lineær funktion, men den usikkerhed tager man med i forhold til hvor praktisk den er at regne med.
<p>
<b>4. Beregninger
</b><p>For at kunne lave beregninger på min model skal man have bestem de to parametre tilvækst_på_et_år og højde_ved_fødsel. Parametrene skal estimeres. Ved at lave en lineær regression på data (Mange detaljer her: http://adoptmed.org/topics/growth-charts.html), der findes i materialet kan man fastlægge parametrene:
<p>
tilvækst_på_et_år = 5,5 cm
Line 165 ⟶ 174:
Verificeringen består derfor i at sammenligne med virkelige data. Og ikke andet.
<p>
<b>5. Løsninger
</b><p>Som den sidste del af opgaven er så, at svare på de oprindelige spørgsmål, der lå til grund for at opstille modellen.
<p>
De to spørgsmål er:
<pol><li>a. Hvor høj er en dreng på 7 år?
<p/li><li>b. Hvor gammel er en dreng på 100 cm?
 
<p>
</li></ol>
 
 
Svarene kan umiddelbart findes ved beregninger i modellen. Højde(7) - tallet 7 indsættes på t’s plads i modellen. Hermed fås højde(7)=118. Da alderen 7 år ligger inden for modellens gyldighedsområde, kan man regne med at resultatet er troværdigt hvis eller vores verificering af modellen viser, at modellen er god. Og svaret på det andet spørgsmål findes ved at løse ligningen højde(x)=100. Svaret er t=3,3. t=3,3 er imidlertid uden for modellens gyldighedsområde og resultatet skal derfor behandles med forsigtighed eller helt forkastes.
<p>
Disse svar er de matematiske svar. Oversat til den virkelige verdens sprog vil svarene lyde
a. <ol><li>50% af indiske drenge på 7 år vil have højden 118 cm eller der under. Forklaringen på denne besværlige formulering på 50% er, at tallene i modellen bygger på median tal for mange indiske drenge. Man kan derfor kun udtale on med en vis usikkerhed.
<p>
</li><li>
a. 50% af indiske drenge på 7 år vil have højden 118 cm eller der under. Forklaringen på denne besværlige formulering på 50% er, at tallene i modellen bygger på median tal for mange indiske drenge. Man kan derfor kun udtale on med en vis usikkerhed.
<p>b. For 50% af indiske dreng på 100 cm vil højden svare til en alder på 3,3 år, men resultatet ligger uden for modellens gyldighedsområde, og kan derfor som udgangspunkt ikke bruges.
</li></ol>
<p>
 
=== <b> Efterskrift</b> ===
<p>Denne artikel har kun haft en meget begrænset fokus, når talen er på matematisk modellering. Man har alene præsenteret et sprog, som man kan benytte, når man skal tale om faserne i den matematiske modelleringsproces. Det gør det muligt at forklare i hvilke faser en konkret modelbygning går godt og bygger på et solidt videnskabeligt grundlag og i hvilke faser man er ude i gætteri. Sådan er al videnskab. Nogle gange bare mere and andre. Med denne artikel kan man let forklare hvornår det går godt og hvornår der kan optræde fejl.
<p>Men når det kommer til at arbejde med matematiske modeller er der mange andre aspekter, der også kunne være en artikel værd.
Line 186 ⟶ 199:
<p>
Andersen 1980 side 12 m. fl. nævner, at når det kommer til at vurdere modellers validitet kan man vurdere dem på en skala efter følgende validitetskriterier:
<ol><li><p>1. ”Forventningsvaliditet.
Modellens resultater er i rimelig overensstemmelse med, hvad der er forventet (af modellen eller af systemet).
<p/li><li>
2. Reproduktionsvaliditet.
Modellen kan reproducere data, som er kendt fra systemet (data er kendt ved opstilling af modellen).
<p/li><li>
3. Forudsigelsesvaliditet.
Modellen opfylder 1. og 2. og kan forudsige data, som kan findes i systemet. (Modellen er opbygget uden kendskab til eller uden udnyttelse af kendskabet til disse data).
<p/li><li>
4. Strukturvaliditet.
Udover at opfylde 1. 2. og 3. er modellens struktur en afspejling af systemets struktur.”
<p/li>
 <p/ol>
=== <b> Litteratur</b> ===
<ul>
<li>Andersen, Tommy R. m. fl.; ODIN Undervisningsmateriale til et kursus i differentialligningsmodeller, Tekster fra IMFUFA, Roskilde Universitetscenter, Nr. 29, 1980. http://milne.ruc.dk/ImfufaTekster/pdf/29.pdf </li>