Corona-viruset

hvor mange kommer til å smittes og dø?

Opprinnelig publisert 1. mars 2020; oppdatert 27.09.2020

Dagens oppdatering begynner lengre nede i dokumentet. Det som står før det er ikke oppdatert.

Vi har samlet tall fra WHOs situasjonsrapporter og skal lage prognose. Vårt tallmateriale kan du laste ned her: corona_virus.txt. Første kolonne er dato, annen kolonne samlede antall smittede i hele verden, og tredje kolonne samlede antall smittede utenfor Kina.

Dette er altså kumulative tall. Ved å ta differensen mellom morgendagens tall og dagens får vi smitteraten: antall nye smittede per døgn i dag. Vi skal bruke følgende modell for smitteraten:

ρ ( t ) = 1 2 π N σ e x p ( 1 2 ( t μ ) 2 σ 2 )

Det er altså simpelthen normalfordelingen ganget med N. Vi har at:

ρ ( t ) d t = N

Det betyr at N er det totale antall individer som vil bli smittet før epidemien er over. Sett:

C = N 2 π

Da er:

N = 2 π C

Vi vil nå beregne logaritmen til ρ(t):

l n ρ ( t ) = l n C σ 1 2 ( t μ ) 2 σ 2 = ( l n C σ 1 2 μ 2 σ 2 ) + ( μ σ 2 ) t + ( 1 2 1 σ 2 ) t 2

Det er altså et annengradspolynom i t hvor koeffisientene er funksjoner av C, μ og σ. Planen er nå å bruke dataene til å utføre lineær regresjon og estimere disse koeffisientene a0, a1, a2. Når det er gjort får vi et system av tre ligninger:

l n C σ 1 2 μ 2 σ 2 = a 0
μ σ 2 = a 1
1 2 1 σ 2 = a 2

Løser tredje ligning og finner...

1 σ 2 = 2 a 2

Løser annen ligning og finner...

μ = 1 2 a 1 a 2

Da kan vi løse første ligning også og finner...

l n C σ = a 0 1 4 a 1 2 a 2

Hvilket gir:

C 2 = 1 2 1 a 2 e x p ( 2 a 0 1 2 a 1 2 a 2 )

Da er vi fremme og har funnet C, μ og σ uttrykt ved a0, a1, a2. Når vi har estimert disse koeffisientene kan vi derfor regne ut C, μ og σ. C gir oss N så vi får vite hvor mange som kommer til å smittes alt i alt. Legg merke til at μ og σ ikke avhenger av a0. Det er viktig som du nå skal se.

Dataene vi har brukt bygger for det meste på laboratorie-prøver. Men den 13. februar gikk Kina over til å rapportere kliniske diagnoser også. Da så vi et sprang oppover på nærmere tyve tusen fall. Vi må også regne med at det finnes flere smittede enn som er undersøkt av lege. Det er altså klart at vi må korrigere dataene oppad med en viss faktor k. Hvilken virkning har det på koeffisientene? Vi regner og finner...

l n ( k ρ ( t ) ) = l n k + l n ρ ( t ) = l n k + ( a 0 + a 1 t + a 2 t 2 ) = ( a 0 + l n k ) + a 1 t + a 2 t 2

Virkningen blir altså å legge ln(k) til a0. Men siden μ og σ ikke avhenger av a0 forandres de ikke. Det er gunstig, for μ er epidemiens høydepunkt, mens σ gir oss dens varighet. Disse egenskapene påvirkes ikke av underrapportering, bare den er konsekvent!

For Kina brukte vi k = 1.5 og regnet ut μ = 18.56, σ = 8.07, N = 86705. Vi definerer farsottens varighet som et 95 % sentralt konfidensintervall. Det ble [2.74, 34.39]. Tidens nullpunkt er 21. januar. Så farsotten begynte rundt den 24. januar og sluttet 21 + 34.39 - 31 = 24. februar. Ja, det stemmer, farsotten i Kina er over for denne gang. Den varte i 34.39 - 2.74 = 32 dager omtrent. Den nådde sitt høydepunkt omkring 21 + 18.56 - 31 = 9. februar. Med k = 1.5 ble totalt N = 86705 kinesere smittet. Men denne verdien av k er selvfølgelig usikker så dette vet vi egentlig ikke. Den kan for alt vi vet ligge mye høyere. Sykdommens dødelighet globalt er omlag 3.65 % så vi anslår antall døde kinesere til 86705 * 0.0365 = 3164. Men det er som sagt ikke stort mer enn en gjetning.

At farsotten er slutt i Kina er godt nytt! Men de må passe seg så de ikke opphever karantenene for snart, for da kan den blusse opp igjen. Hva så med Europa? Her befinner farsotten seg tildels i den eksponensielt voksende fasen så det er umulig å se enden på det, men noen land kan vi lage prognose for: Italia, Frankrike, Tyskland. Hvis forløpet i Kina er noe å holde seg til kan vi forvente at farsotten vil rase hele mars og et stykke inn i april før den er utmattet. Men Kina tydde til ekstreme virkemidler for å demme opp for smittespredning; i Europa gjorde regimene ingenting før begivenhetene til slutt tvang dem. Så vi må nok regne med at dette vil vare lengre og kreve flere ofre i Europa enn i Kina, i forhold til folketallene. Alt kommer an på adferden til europeiske folk: Hvis de trosser dumme råd fra regimene og helsebyråkratiene og satser på sikkerhet går det godt; i motsatt fall kan det føre til en katastrofe vi sent vil glemme.

Oppdatering 27.09.2020 . Nedenfor finner du prognoser for andre land enn Kina. Til dette benytter vi datasettet fra John Hopkins University som tilrettelagt på humdata.org. Det er time_series_covid19_confirmed_global_narrow.csv vi bruker (ikke oppdatert). Det ligger der tidsserier for mange land. Vi skal se på de tre hardest rammede landene, foruten Kina: Sør-Korea, Iran og Italia. Etterhvert også andre europeiske land: Spania, Frankrike, Tyskland og Norge. Samt USA, England, Russland, Sverige, Brasil og India. De daglige oppdateringene kommer fra worldometers. Første bølge er nå over i mange land og prognosene oppdateres ikke mer. I andre land er det for tidlig å gi prognose. Det eneste landet som for tiden har oppdatert prognose er Russland.

landkurvehøydepunktsmittedebegynnersluttervarighet
korea.csvkorea.svg2. mars756418. februar14. mars25
frankrike.csvfrankrike.svg11. april14891215. mars8. mai54
norge.csvnorge.svg22. mars86876. mars18. mai73
italia.csvitalia.svg25. mars2409662. mars31. mai90
spania.csvspania.svg2. april36842410. mars2. juni84
tyskland.csvtyskland.svg31. mars1814029. mars1. juni84
england.csvengland.svg15. april35270723. mars28. juli127
russland.csvrussland.svg14. juni?13. april??
sverige.csvsverige.svg20. juni?25. mars??
usa.csvusa.svg25. juli?24. mars??
brasil.csvbrasil.svg1. august?20. april??
india.csvindia.svg??15. april??
iran.csviran.svg??7. mars??

Her betyr "smittede" totalt antall smittede når farsotten er over. Det er altså en prognose. Begynnelse og slutt er som sagt definert som endepunktene i et sentralt 95 % konfidensintervall. Når det er slutt i et land kommer bare 2.5 % til å smittes etter dette.

Vi har tegnet kurver for smitteraten i disse landene. Forløpene viste seg klart usymmetriske og vi gikk over fra normalfordelingen til gammafordelingen som modell. Prognosene bruker gammaen.

Sør-Korea Landet opplevde en annen bølge, men den er nå nær utdødd. Dødeligheten er 401 / 23611 = 1.7 % .

Iran Raten har steget kraftig den siste tiden og har nå satt rekord. Dødelighet: 25589 / 446448 = 5.7 % .

Italia Annen bølge er temmelig beskjeden så langt. Dødelighet: 35835 / 309870 = 11.6 % .

Spania Annen bølge er værre enn første. Tidsserien revideres stadig vekk og derfor blir vi ført på villspor i blant. Dødelighet: 31232 / 735198 = 4.2 % .

Frankrike. Nytt utbrudd med himmeltur. Det ser ille ut. Annen bølge er værre enn første. De kom så fort og lett gjennom første men tar det igjen nå. Dødeligheten er 31727 / 562178 = 5.6 % .

Tyskland En mild annen bølge. Dødelighet: 9534 / 286338 = 3.3 % .

Norge. Heller ikke Norge unnslapp annen bølge, men den er forholdsvis mild. Skyldtes nok Spania-turisme. Dødelighet: 270 / 13698 = 2.0 % .

USA Raten ligger midt på treet. Dødelighet: 209453 / 7321343 = 2.9 % .

England (UK). Annen bølge er i full gang og blir ille. Dødeligheten er 41988 / 465271 = 9.0 % .

Russland. Nedgangen har stoppet opp og raten driver høyere igjen. Dødeligheten er 20324 / 1151438 = 1.8 % .

Sverige. Vi er godt ute i september og raten ligger fortsatt lavt. Folk ble vel skremt i sommer og beskytter seg nå godt selv hvor det ikke er pålagt. Dødeligheten er 5880 / 94027 = 6.3 % .

Brasil. Toppen ser ut til å være passert men smitteraten svinger ennå voldsomt. Dødelighet: 141776 / 4732309 = 3.0 % .

India. Har det endelig toppet? 95574 / 6073348 = 1.6 % .

Som vi ser varierer dødeligheten svært fra land til land, med Russland på bunnen med bare 1.2 % opp til Frankrike på 15.2 %. Hva kan forklare denne gigantiske forskjellen? I land hvor farsotten kom sent i gang har mange syke ennå ikke rukket å dø. Det sies at det tar 14 dager å dø av sykdommen; i alle fall tar det noen dager. Land som ikke har nådd toppen kommer nok til å stige i dødelighet etterhvert. Men dette forklarer ikke hvorfor Sør-Korea ligger så mye lavere enn Kina, for begge steder er det forbi. Italia hadde høyest dødelighet av alle land lenge før det nådde toppen. I Frankrike og Tyskland begynte det samtidig, men Frankrike ligger mye høyere enn Tyskland. Vi ser at fasen i farsotten har begrenset forklaringsevne; det er noe annet også. Har noen land vært flinkere til å beskytte sårbare grupper - gamle og syke - mot smitte enn andre?

Hvis du kikker på statistikken til worldometers ser du at barn i alderen 0-9 år har null dødelighet. Siden er den 0.2 % opp til 40 år. Over det vokser den bratt med alderen opp til 14.8 % i den høyeste aldersgruppen 80+ år. Hos coronavirusupdate angir de 0.2 % for alle aldersgrupper opp til 40 år. Vi mistenker derfor at aldersfordelingen blant smittede forklarer mye av forskjellen på landenes dødelighet. Hvis det er slik at nesten alle smittede i Tyskland og Norge er unge mennesker så forklarer det vår felles lave dødelighet rundt 3-4 %. Er mange av de smittede i Iran og Italia gamle? Andreas Backhaus utredet dette spørsmålet for noen uker siden (Coronavirus: Why it’s so deadly in Italy). Der beviser han at svaret er ja: Italia kjennetegnes av en særdeles høy andel gamle blant smittede. I Sør-Korea er de fleste smittede unge, og i Tyskland enda yngre. Frankrike ligger et sted midt på treet (for noen uker siden). Vi tror vi kan godta dette som en fyldestgjørende forklaring.

Men hvorfor er så mange gamle mennesker smittet i Italia, i motsetning til Sør-Korea og Tyskland? Har noen land kultur for å pleie sine gamle hjemme i familien, mens andre parkerer dem på gamlehjem og sykehjem? Hvis de er samlet på pleiehjem er det lettere å isolere dem fra unge aktive smittebærende mennesker. Backhaus foreslår en annen forklaring: I Sør-Korea tar man prøver av alle mennesker; i Italia kun av personer med symptomer. Men mange unge smittede mennesker er lenge tilnærmet symptomfrie, og likevel smitter de andre. De er en vandrende dødsfelle for gamle. Når man ikke tester dem tillater man dem å spre smitten vidt og bredt slik at den når gamle.

Det påstås ofte på internett at Covid-19 ikke er farligere enn vanlig influensa. Hvordan er det med det? CDC estimates that so far this season there have been at least 38 million flu illnesses, 390,000 hospitalizations and 23,000 deaths from flu. (kilde). Dødeligheten er svært lav: 23 000 / 38 millioner = 0.06 %. Sammenlign det med dødeligheten for Covid-19 beregnet ovenfor i ulike land. Selv svineinfluensaen i 2009 forårsaket bare 18631 dødsfall i hele verden, i følge WHO. I Covid-19 ligger tallet mye høyere. Covid-19 er altså langt farligere enn alt annet som rammet oss i vår levetid. Derfor burde myndighetene i Europa ha gjort alt for å hindre smittespredning, men de gjorde ingenting før det var for sent. Nå må hele samfunnet stenges ned og folk låses inn for at regimet nektet å stenge grensene mot utsatte grupper! Alle kan se globalismens galskap og regimets ondskap.

Det påstås at det finnes langt flere smittede enn rapportert og at dødeligheten derfor ikke er høyere enn for influensa. Et eksempel på en nettside som påstår dette er off-guardian.org. Først bringer de en meningsytring fra en helsebyråkrat i England. Det beviser intet. Lengre ned i artikkelen henviser de til tre autoriteter som påstår noe. Det beviser heller ingenting. I vitenskapen finnes ingen autoriteter, kun bevis. Den tyske rapporten under punkt 3 er en politisk meningsytring, ikke en vitenskapelig utredning. Det er endeløst pratmakeri.

Så henviser de til swprs.org som har ført opp en rekke studier som angivelig beviser at dødeligheten er lav. Men gjør de det? Under punkt 1 står de estimerte dødelighetene (IFR) oppført. Den høyeste er 0.4 % men de fleste ligger langt under dette. Gå inn på worldometers.info og se på tallene for Spania. Det har 580 døde per million befolkning. Så selv om vi antar at alle spanjoler er smittet får vi en dødelighet på 0.058 % . Det samme gjelder mange andre land. Det er svært langt unna å være tilfelle at hele folket er smittet. En studie i Stockholm i april fant at 10 % var smittet, og det er en hardt rammet storby. Hvis så mange av spanjolene er smittet blir dødeligheten i Spania 0.58 %. Vi ser at estimatene i studiene oppført under punkt 1 er virkelighetsfjerne.

Under punkt 2 er estimatene enda lavere, mange null! Under punkt 3 er største 0.8 %. Under punkt 4 står estimater for utbredelsen i ulike storbyer som er særlig hardt rammede. Der står det 5 % for Spania og 11.3 % for Madrid. Da blir det 1.16 % dødelighet for Spania (0.058 * 20). Allerede det er høyt over influensaens 0.06 %. Men kan vi stole på disse estimatene? Mange av studiene er elendige. En av dem slutter at 29 % av hele Englands folk er smittet! Det er mye mer enn for den hardt rammede storbyen New York City på 19.9 %. Det kan ikke stemme. De bruker nok urealistiske modeller eller begår metodefeil. Husk at ingen klarte å forutsi pandemiens forløp. Ellers er det særlig hardt rammede områder og grupper som dekkes. De kan ikke være representative for hele landet.

En feilkilde som er vanskelig å overvinne når man foretar stikkprøveundersøkelser av mennesker er at deltagelsen er frivillig. De som vil delta har nok større sjanse for å være smittede enn de som ikke vil. Så utvalget blir skjevt. Andelen smittede i utvalget er høyere enn i folket.

Det er klart at det må finnes flere smittede enn som er registrert. På den annen side må det finnes flere Corona-døde enn som er registrert også. Hvem vet hva det sanne forholdstallet blir? Ingen som er ung og frisk dør av Covid-19. For å dø må man lide av noe annet. Det skjer nok i blant at dette andre blir ført opp som dødsårsak. Hvis døde (a) og smittede (b) er underskattet med samme faktor k blir forholdstallet (ka)/(kb) = a/b, altså riktig.

Det finnes dem som påstår at mange blir registrert som Covid-19 -ofre som egentlig dør av noe annet. Som sagt er alle enige om at man ikke dør av Covid-19 med mindre helsa er svekket av noe annet. Men de som får sine liv forkortet av Covid-19 er ofre for Covid-19 og skal regnes. Det er ikke feil. Ingen av oss lever evig og ingen sykdom kan gjøre mer enn forkorte våre liv. Kreft rammer nesten bare gamle mennesker; vil du da påstå at ingen dør av kreft? Bare gamle og syke dør av influensa; skal vi sammenligne dødeligheten av Covid-19 og influensa må vi regne på samme måte. Det er mulig at dødelighetene vi har beregnet ovenfor ligger for høyt, men de som påstår det har ikke klart å bevise det.

Et annet argument som ofte brukes til støtte for at Covid-19 ikke er farligere enn influensa er at dødstallet for influensa noen ganger har vært høyere enn hittil for Covid-19. Et eksempel er influensa-sesongen 2017-18 i Tyskland. Den tok livet av 25000 mennesker. Dødstallet for Tyskland hittil i Covid-19 finner du ovenfor og er mye lavere. Beviser ikke dette at influensaen er farligere enn Covid-19? Nei. For det første var den sesongen et sjeldent unntak. Vanligvis dør bare noen hundre av influensa i Tyskland under vinteren. For det andre ble svært mange smittet av influensa den vinteren. 9 millioner tyskere oppsøkte lege for sykdommen. Det må ha vært mange flere enn det som var smittet. Sammenlign det med samlet antall smittede i Tyskland for Covid-19. Farligheten uttrykkes i dødeligheten = døde / smittede. Man må regne med både antall døde og antall smittede. Farligheten styrer folks adferd: Er smitten ufarlig vokter man seg ikke mot smitte, mange blir smittet, og da blir også dødstallet anselig. Er smitten farlig blir man redd og vokter seg vel, få blir smittet, og da behøver ikke dødstallet bli stort. Derfor kan det skje at en ufarlig farsott tar livet av flere enn en farlig.

England hadde og Sverige har fremdeles en strategi som bygger på såkalt flokkimmunitet. Hva er det og har det noe for seg? Når en mann er immun mot viruset kan han ikke bli syk og ikke smitte andre. Hver gang du møter en person utfører du et Bernoulli-forsøk med sannsynlighet p for å bli smittet. Når 50 % av folket er immune halveres sannsynligheten i hvert møte til p/2. Du møter et visst antall personer i døgnet. Den forventede ventetid i Bernoulli-fordelingen er 1/p når parameteren er p. Når den i steden er p/2 blir ventetiden 1/(p/2) = 2/p, altså dobbelt så lang. Corona-epidemien varer et visst antall dager. Dobling av ventetiden kan gjøre at du klarer deg unna smitte inntil epidemien er forbi, skjønt du ikke selv er immun. De mange immune rundt deg fungerer som en rustning mot smitte, som naturlig isolasjon. Smitteraten avtar av seg selv når mange er blitt immune. Dette er flokkimmunitet.

Den kan ikke brukes som folkets strategi mot den smittsomme sykdommen med mindre immuniteten kan oppnås uten fare for de immuniserte. Vaksinasjon kan være en ufarlig måte, men er generelt ikke ufarlig. Hvis sykdommen er ufarlig for alle unntatt en liten utsatt gruppe vil denne gruppen naturlig oppnå smittevern ved at mange blir syke, friske igjen og immune. Men før disse mange blir immune er faren stor for at de utsatte smittes! Det er bedre at alle prøver å hindre smitte og at de utsatte vaksineres eller isoleres. Når sykdommen er høyt dødelig, som Covid-19, og ingen vaksine finnes, er eneste mulige strategi å hindre smittespredning. La oss se dette klart i nakne tall: Det norske folk har en gjennomsnittsalder på rundt 40 år. Altså 2 millioner unge og like mange gamle. De unge har dødeligheten 0.2 % (se ovenfor), mens de gamle har mye høyere dødelighet, kanskje 5 %. Hvis alle unge ble smittet ville vi få 2 millioner * 0.2 % = 4000, fire tusen, unge døde nordmenn! Med vår strategi for å hindre smittespredning har vi i skrivende stund bare 237 døde i alle aldre. Hvis alle unge ble smittet ville det dessuten være praktisk umulig å hindre at mange gamle ble smittet også. Med største anstrengelse ville nok halvparten av dem bli smittet. Det gir 1 million * 5 % = 50 000, femti tusen, døde blant nordmenn over 40 år! Ikke til å undre på at vanviddslandet Sverige er det eneste i verden som fabler om flokkimmunitet mot Covid-19.

Det er en ting til å merke seg: Det finnes ikke belegg for at man bygger opp immunitet mot Corona-viruset ved å overleve et sykeleie. Det er ikke selvsagt; tenk på forkjølelsesviruset: Man blir aldri immun mot forkjølelse og kan ikke vaksinere seg mot det. Det er fordi viruset stadig muterer. Vi vet at det allerede finnes flere varianter av Corona-viruset, hvilket tyder på at immunitet er uoppnåelig. Vaksinasjon er generelt en farefull og dårlig idé; i vår tid er overvåking av farsotters forløp, stengning av grenser og karantene mye bedre. Men helsevesenet satser alt på vaksinasjon fordi det er profittdrevet. Det tar ikke hensyn til vår folkehelse.

Det finnes dem som påstår at nedstengningen fra regjeringens side ikke har noen effekt og at man like gjerne kan holde samfunnet åpent for å skåne næringslivet. Man klager også over at nedstengningen innskrenker individets frihet og rettigheter. Hvordan er det med dette? For å ta det siste først: Det er feil at nedstengningen innskrenker individets frihet. Til daglig lever de fleste av oss under tvang: Barna har skoleplikt og gå på skolen; de voksne gå på jobb. Nedstengningen gir oss valgfriheten tilbake slik at vi kan beskytte oss selv og våre barn mot smitte. Har nedstengningen ingen effekt på smittespredningen? De fleste oppfører seg sikkert fornuftig med eller uten forsåvidt som de kan velge, men som sagt kan de ikke det uten regjeringens nedstengning. Dessuten finnes det et mindretall som handler uklokt og ødelegger for alle hvis de får anledning til det. Sammenlign smittekurvene og dødstallene for Norge og Sverige så ser du bevis for at nedstengningen virker. Når det gjelder næringslivet: Vi regner med at skaden minimeres av at man bringer farsotten under kontroll så fort som mulig. Å la den herje fritt som i Sverige må straffe seg i lengden. Sverige kanskje kan skryte av brukbare økonomiske tall i dag, men hva hjelper det når farsotten raser videre og flere og flere blir syke? Bedriftene kan ikke drive videre når de ansatte er blitt syke. Hvis ikke regjeringen stenger ned kommer sykdommen selv til å gjøre det.

Feilen var ikke å stenge ned men å ikke stenge grensene i tide og bruke karantene mot dem som hadde vært i smittede områder. Hadde regjeringen gjort det hadde vi sluppet farsott her i landet.

Det verserer rykter på nettet om at Covid-19-tallene er falske fordi virustesten er upålitelig. Et eksempel er State of the Nation. De skriver: How do we know with absolute certainty that these stats are untrue and made up? Because the COVID-19 test has been proven to be predictably inaccurate by various coronavirus attending physicians, medical researchers, qualified epidemiologists and investigative journalists. Not only do the COVID-19 tests produce countless false positives, they even result in false negatives, although quite infrequently. The overwhelming consensus of the experts is that the COVID-19 test kits themselves are flawed and unreliable. CORONAVIRUS TEST: A total fraud, gives up to 80% false positives, can be adjusted to produce any result. Dette er feil. Vi skal bruke litt tid på å forklare hvordan det ligger an.

Viruset bak Covid-19 kalles SARS-CoV-2. Et individ som testes kan befinne seg i tre tilstander: Aldri smittet, smittet nå, smittet før. For å oppdage hvem som er smittet nå bruker man RT-PCR -testen. Det står for Reverse Transcription Polymerase Chain Reaction. Det er en test som detekterer virusets RNA; altså må viruset være tilstede i kroppen i tilstrekkelig konsentrasjon for at testen skal gi positivt utslag. Befinner man seg tidlig i inkubasjonstiden eller sent i sykdomsforløpet er ikke dette oppfylt. For å oppdage hvem som har vært smittet før bruker man en serologisk test. Det er en test som oppdager antistoffer mot SARS-CoV-2 i blodet. Har man vært smittet har kroppens immunforsvar utviklet antistoffer som er spesifike for dette viruset.

En test har en viss sensitivitet og en viss spesifisitet. Hvis sensitiviteten er 70 % så betyr det at man i det lange løp får 30 % falske negativer. Hvis spesifisiteten er 95 % så betyr det at man i det lange løp får 5 % falske positiver. Det man helst vil bruke testen til er å estimere hvor mange i folket (eller en folkegruppe) som er og/eller har vært smittet. Da bruker man en av de to testene oven eller begge under ett. La p være andelen smittede i folket. Man trekker et tilfeldig individ av folket og X = 1 hvis dette er smittet, ellers 0. X er Bernoulli-fordelt med parameter p. Så tester man det og Y = 1 hvis det tester positivt, ellers 0. Det er klart at de to variablene X og Y ikke kan være stokastisk uavhengige, for vitsen med testen er at Y skal si oss noe om X. Testens sensitivitet er den betingede sannsynligheten r = P(Y = 1 | X = 1). Med s = P(Y = 1 | X = 0) er 1 - s = P(Y = 0 | X = 0) testens spesifisitet.

La q være sannsynligheten for at individet tester positivt. Da er Y Bernoulli-fordelt med parameter q. q = P(Y = 1) = P(Y = 1 ∩ X = 0 ∪ Y = 1 ∩ X = 1) = P(Y = 1 ∩ X = 0) + P(Y = 1 ∩ X = 1) = P(Y = 1 | X = 0) P(X = 0) + P(Y = 1 | X = 1) P(X = 1) = s(1 - p) + rp = (r - s)p + s . Da er p = (q - s) / (r - s) . Vi trekker nå et tilfeldig n-utvalg av folket og tester dem. Antallet som tester positivt er Z. Da er Z binomialfordelt med parameter q. Vi har at E Z = nq . Vi estimerer derfor q ved q^ = Z / n . q^ er forventningsrett (nøyaktig). Da estimerer vi p ved p^ = (q^ - s) / (r - s) . E p^ = (E q^ - s) / (r - s) = (q - s) / (r - s) = p, så p^ er også forventningsrett.

V a r p ^ = V a r q ^ ( r s ) 2 = q ( 1 q ) n ( r s ) 2

Her er q(1 - q) < 1/2 * 1/2 = 1/4 så

q ( 1 q ) n ( r s ) 2 < 1 4 n ( r s ) 2

Hvis vi vil at Var p^ < ε er det nok å velge

1 4 n ( r s ) 2 < ϵ

Det oppnår vi ved å velge

n > 1 4 ϵ ( r s ) 2

Som vi ser kan vi gjøre p^ vilkårlig presis ved å velge n stor nok. Men i praksis har vi økonomiske føringer på hvor stor n kan være. Så testen må være nokså god for at vi skal kunne bruke den. Vi må alltid ha at s < r. Men når s nærmer seg r nedenfra går uttrykket på høyre side i ulikheten mot uendelig. Da går testen mot å gi oss null informasjon om p og intet sampel er stort nok til å oppveie det. Så s må i praksis være mye mindre enn r. r = 0.70 og s = 0.05 er greit.

Hva vi har vist er at det slett ikke er nødvendig at testens sensitivitet og spesifisitet er nær 100 % for at vi skal kunne estimere p med god presisjon. Med rett statistisk metode oppnår vi det likevel. Men som vi også viste blir det dyrt om testen er dårlig, for da må sampelet være stort, mange testes. Hvordan helsemyndigheter rundt om i verden faktisk går frem vet vi ikke. Vi ser av uttrykket for p^ = (q^ - s) / (r - s) at når sensitiviteten og spesifisiteten er 100 %, r = 1 og s = 0, forenkler dette til p^ = q^ . Vi er redd mange naivt bruker q^ som estimator for p selv når testen er dårlig. Men det skal man aldri gjøre så testen behøver ikke være perfekt. I sitatet oven klages det over countless false positives, men falske positiver er det ikke mange av, bare 5 %; det er falske negativer det kan være mange av, helt opp til 30 %.

En annen ting er verd å påpeke. For at n-sampelet skal sette oss i stand til å estimere p må det være tilfeldig. I praksis er det vel sjelden det; man tester mest dem som har symptomer. Men da gjelder ikke formlene oven! p^ blir liggende altfor høyt.

Helhetsbildet i dag er dette: I det fjerne Østen er farsotten over, men vi ser et nytt utbrudd i Sør-Korea, som dog er hendøende. Iran var sakte på vei ned men har ruset den siste tiden. Alle europeiske land vi dekker kom seg gjennom første bølge, men vi ser nye utbrudd i Spania, Frankrike og England, og en viss oppgang i øvrige land. Etter himmelflukt har USA gjenvunnet kontrollen og ligger midt på treet. Russland er på vei ned, men det går meget sakte og kanskje har det stoppet opp. I Sverige er himmelflukten i sommer over og raten har kommet ned. India har muligens toppet nå men det er usikkert. Brasil har nok passert toppen.

Vi skal oppdatere prognosen hver dag inntil farsotten er over. Følg med! Glem ikke å lese Corona-viruset - må vi dø for Globalismen?.

Rønnaug og Erlend