SIR-modellen

SIR-modellen er en matematisk-epidemiologisk kompartmentmodel, der kan beskrive udviklingen af visse epidemier.[1][2]

Tidskursus for de tre grupper

ModelRediger

En population, der består af et konstant antal af N individer, vil under modellen deles op i tre grupper: de modtagelige, S (susceptible), de syge (I for inficerede), og de fjernede, R, dvs. immune og/eller døde (R for removed). Det antages i SIR-modellen, at individer i populationen i tilfælde af smitte vil overgå fra den ene gruppe til den anden til den tredje, således at de til start er susceptible, hvorefter de er inficerede, hvorefter de overgår til den fjernede gruppe.

Dette sygdomsforløb er en grov forsimpling, idet der ikke tages højde for bl.a. latenstid, der er en periode imellem den raske og den infektiøse, hvor et individ er inficeret, men ikke smittende, og der tages heller ikke forbehold for, at personer i den fjernede gruppe kan overgå til den modtagelige igen (eksempelvis ved at immuniteten fortager sig). Desuden antager modellen også, at populationen er konstant, hvilket under længerevarende epidemier kan skabe en usikkerhed, der skyldes befolkningstilvækst, indvandring osv. Hvis det vurderes, at disse usikkerhedsfaktorer er insignifikante, kan man med forbehold anvende SIR-modellen til en epidemiologisk undersøgelse af en epidemi.

Modellen beskrives ved følgende sæt af koblede differentialligninger

 
 
 

Disse differentialligninger beskriver overførslen af individer fra det første kompartment til det andet til det tredje, hvor S(t) beskriver antallet af susceptible, I(t) antallet af infektiøse og R(t) antallet af fjernede (jf. forklaringen ovenfor).

En heuristisk forklaring for første ligning er, at en susceptile, hvoraf der er S(t), i et lille tidsinterval har en chance på I(t)/N for at møde en inficeret, raten for infektion er i det korte tidsinterval lig risikoen for infektion ved kontakt givet ved koefficienten beta. Tredje ligning følger per definition af gamma koefficienten, der beskriver raten, hvormed en syg forlader populationen. Anden ligning er en sammenstilling af første og tredje ligning, idet disse beskriver tilstrømning og afvandring.

Endvidere har vi, eftersom modellen antager, at populationen er konstant, at den samlede population N er givet ved:

 

Typisk, så vil   fordi der endnu ikke er nogen, der er påvirket af epidemien. Endvidere vil  , dvs den indledende smitte vil være meget lille. Dermed vil  .

EgenskaberRediger

Den samlede population er konstant (og er således en bevaret størrelse), idet

 .

Der findes endnu en bevaret størrelse, som findes på følgende måde [3]: I ligning 3 isoleres I(t) og dette indsættes i ligning 1. Det giver

 .

Ved at dividere med S(t) får vi:

 .

Venstresiden kan skrives som  . Hermed kan vi integere på begge sider:

 .

Nu benytter vi, at R(0)=0, og resultatet kan dermed skrives som:

 

Estimation af parametreRediger

For at kunne bruge modellen kræves kendskab til parametrene  ,   og  , samt begyndelsesværdien  .

Estimering af Rediger

I det følgende antages det, at   er kendt. Lader vi   i ligning 5 så får vi

 

Vi lader nu også   i ligning 4, og det giver:

 .

Efter lang tid er alle de syge enten døde eller raske, og derfor er  . Det giver:

 .

Fra før havde vi, at  , og dermed kan vi skrive ligning 6 som:

 

Vi indfører nu overlevelsen  , så bliver ovenstående ligning reduceret til:

 

Denne ligning giver altså en relation mellem de to ukendte parametre   og  , ud fra kendskab til den samlede overlevelse   af epidemien. Det kan vises, at denne brøk er det samme som det basale reproduktionstal.[4]

 

Det er vigtigt at huske, at når der skrives overlevelse i denne udledning refererer det til brøkdelen af individer i gruppen af modtagelige (S) efter uendelig lang tid. I praksis vil en stor del af individerne i gruppen R også overleve med mindre sygdommen har 100% dødelighed. Dermed vil brøkdelen af individer som overlever epidemien være større end p med en faktor som afhænger af sandsynligheden for at et inficeret individ som går fra gruppen I til gruppen R enten dør eller overlever og er immun.

Estimering af Rediger

Det forudsættes, at   er kendt, og specielt også, at de ugentlige dødstal   er kendt. Vi betragter nu det tidspunkt  , hvor dødstallet   har sit maksimum. Dette sker (ifølge ligning 3) netop når   har et maksimum. Ifølge ligning 2 så har   et maksimum, når højresiden er lig med 0, dvs.

 

Ved at dividere med   så får vi:

 

Indsættes nu   i ligning 5, så får vi:

 ,

idet vi også har sat  . Ligeledes giver ligning 4, at

 .

I den sidste ligning isoleres   og det indsættes i den forrige ligning:

 

Heri indsætter vi det fundne udtryk for  :

 

Ud fra denne ligning kan   bestemmes til:

 

Den maksimale værdi af   antages kendt og kaldes for  . Indsættes   i ligning 3 får vi så:

 

og dermed, at

 .

Ud fra ovenstående er det således muligt at estimere   ud fra kendskab til det maksimale dødstal   og den samlede overlevelse  .

Eksempel på estimation af parametre ud fra dataRediger

Betragt følgende fiktive data. En population på 10000 personer oplever en epidemi. For hver uge er dødstallet opgjort til:

uge 1 2 3 4 5 6 7 8 9
dødstal 86 291 813 1462 1388 776 331 128 47

Først summerer vi alle de døde, det giver 5322 i alt. Resten må være overlevet, dvs. 4678 personer. Det giver en overlevelse  . Herfra udregner vi brøken:

 

Dernæst udregner vi det maksimalt antal smittede:

 

Til sidst aflæser vi det største dødstal, det giver  , og finder heraf:

 

samt

 

Hermed har vi fundet et estimat på modellens parametre.

Estimation ved hjælp af regressionRediger

En alternativ måde at estimere parametrene på går ud på at bruge regression [5].

Ud fra ligning 2 kan man isolere   på højresiden:

 

Når   er lille, så er   næsten konstant. Så i begyndelsen af epidemien vil differentialligningen for   approksimeres med:

 

fordi  

Tilsvarende, når epidemien er næsten slut, så vil samme differentialligning kunne approksimeres med:

 

I begge tilfælde er der tale om en ekspontiel sammenhæng, og vi har derfor følgende egenskaber for  :

 

 ,

hvor   og   er ukendte konstanter. Konstanterne   og   opfylder:

 

 

Værdierne of   og   kan bestemmes ved eksponentiel regression af dødstallene  , og dermed kan man bestemme   og  :

 

 

Eksempel med regressionRediger

Ved at lave eksponentiel regression på henholdsvis de første tre uger, og de sidste tre uger, så finder vi:

 

 

Heraf beregner man

 

 

ReferencerRediger

  1. ^ Kermack WO, McKendrick AG (August 1, 1927). "A Contribution to the Mathematical Theory of Epidemics". Proceedings of the Royal Society A 115 (772): 700–721. doi:10.1098/rspa.1927.0118.
  2. ^ Allan Baktoft "Matematik i virkeligheden. Bind 1", Forlaget Natskyggen, 2. udgave, 2011, s. 47-60 (s. 45-70 behandles desuden andre epidemimodeller)
  3. ^ sites.google.com - sir-model
  4. ^ Holland Jones, James (2007), Notes on   (PDF) (engelsk), Stanford University, s. 1-2, hentet 2. april 2020. 
  5. ^ sites.google.com - sir-model. side 10, sætning 2