Nesigurnost procjene brojnosti zaraženih SARS-CoV-2 virusom u Hrvatskoj na temelju serološkog ispitivanja opće populacije

(32) 2020/04/26

Broj osoba dosad zaraženih SARS-CoV-2 virusom u Hrvatskoj je nepoznanica. Serološko ispitivanje opće populacije je najavljeno kao način utvrđivanja brojnosti dosad zaraženih osoba, ali njime se ne može razriješiti ovo pitanje u smislu pružanja konačnog odgovora jer i samo predstavlja tek jednu od mogućih procjena uz koju se veže određena mjera nesigurnosti. Tema ovog osvrta su izvori te nesigurnosti. Najprije se izlaže jednostavnu procjenu brojnosti zaraženih koja se temelji na informacijama raspoloživima i prije provođenja serološkog ispitivanja, zatim obilježja serološkog testa značajna za pouzdanost procjene na temelju uzorka opće populacije, te prikaz simulacije očekivanog ishoda tog serološkog ispitivanja. Na kraju se navodi nekoliko napomena o reprezentativnosti uzorka i postupku prilagodbe rezultata dobivenih ispitivanjem na uzorku.

Jednostavna procjena na temelju pretpostavljenog udjela nepotvrđenih slučajeva

Jedan od načina okvirnog određivanja brojnosti zaraženih SARS-CoV-2 virusom polazi od broja potvrđenih slučajeva kojih u Hrvatskoj, u trenutku pisanja ovog osvrta, ima oko dvije tisuće. Tom se broju pridružuje simptomatske slučajeve koji su promakli epidemiolozima, a prema ovoj preliminarnoj procjeni Londonske škole za higijenu i tropsku medicinu s kraja mjeseca travnja takvih u Hrvatskoj ima približno dvije trećine. Simptomatskim slučajevima je potrebno pridružiti i one asimptomatske1, a procjene njihova udjela dostupne krajem travnja kreću se, približno, u prilično širokom rasponu od 30% do 80%.

Uz podatak o dvije tisuće potvrđenih slučajeva i pretpostavku da je samo oko 30% simptomatskih slučajeva potvrđeno i da je oko 60% asimptomatskih slučajeva izbjeglo potvrdi, moguće je procijeniti2 da je u Hrvatskoj dosad zaraženo približno 10666 [7539, 15096] osoba, odnosno 0.26% [0.18%, 0.37%] ukupnog stanovništva. Baš kao što postoji nesigurnost u pretpostavkama na kojima se temelji ovaj izračun, nesigurnost je nužno prisutna i u procjeni ukupne brojnosti zaraženih (slika 1). Uzimajući u obzir tu nesigurnost, na temelju rezultata ove prigodne analize možemo tek neodređeno zaključiti da je vrlo malo vjerojatno da je u Hrvatskoj dosad zaraženo više od 15-20 tisuća osoba.

Jednostavna procjena udjela zaraženih osoba uz pretpostavke o udjelu propuštenih (nepotvrđenih) simptomatskih i asimptomatskih slučajeva. Prikazana je pretpostavljena raspodjela udjela potvrđenih simptomatskih slučajeva, propuštenih asimptomatskih slučajeva, te procijenjeni broj dosad zaraženih osoba.

Slika 1: Jednostavna procjena udjela zaraženih osoba uz pretpostavke o udjelu propuštenih (nepotvrđenih) simptomatskih i asimptomatskih slučajeva. Prikazana je pretpostavljena raspodjela udjela potvrđenih simptomatskih slučajeva, propuštenih asimptomatskih slučajeva, te procijenjeni broj dosad zaraženih osoba.

Procjena na temelju serološkog ispitivanja opće populacije

Serološko ispitivanje opće populacije nije lišeno nesigurnosti procjene, a ona ponajprije izvire iz razine pouzdanosti nalaza serološkog testa, te veličine i reprezentativnosti uzorka ispitanika. Posljednja dva izvora nesigurnosti nije potrebno obrazlagati jer su prisutni kod svakog uopćavanja kojeg se čini na temelju uzorka, no prvi izvor je poželjno ukratko pojasniti.

Pouzdanost rezultata serološkog testa se izražava njegovom osjetljivošću i specifičnošću. Test je 100% osjetljiv ako se njime može uspješno prepoznati prisutnost protutijela u svim slučajevima kada su ona doista prisutna, a 100% specifičan kada negativan rezultat testa uvijek odgovara stvarnom izostanku protutijela. Rezultati serološkog testiranja, međutim, u pravilu nisu tako pouzdani. Britanski Centar za analizu epidemija i modeliranje objavio je 23. travnja ovaj izvještaj u kojem je dan prikaz pouzdanosti različitih trenutno dostupnih seroloških testova na SARS-CoV-2 virus iz kojeg je vidljivo da se njihova osjetljivost kreće u širokom rasponu od približno 50% do 90%, a njihova specifičnost u rasponu od 60% do gotovo 100%. Slijedi da je pouzdanost konkretnog serološkog testa kojim se utvrđuje broj zaraženih u populaciji važna pretpostavka pouzdanosti procjene, a korištenje bilo kojeg od trenutno raspoloživih testova podrazumijeva određenu nesigurnost. Stanje stvari je takvo da serološkim ispitivanjem opće populacije u Hrvatskoj neće biti moguće potpuno pouzdano utvrditi brojnost zaraženih SARS-CoV-2 virusom.

Nesigurnost procjene koja izvire iz nepouzdanosti testa je izraženija u slučajevima kada je stvarni broj zaraženih osoba u ukupnom stanovništvu malen. Na primjer, primjenom testa koji ima relativno visoku specifičnost od 98% očekivano će se dobiti rezultat od 2% (lažno) pozitivnih rezultata i onda kad u populaciji uopće nema zaraženih. Kad je stvarno stanje takvo da u populaciji ima manje od 2% zaraženih, lažno pozitivni rezultati takvog serološkog ispitivanja mogu znatno precijeniti njihovu brojnost. Na temelju prethodne jednostavne procjene u Hrvatskoj možemo očekivati vrlo mali broj zaraženih, tek oko 0.26%, pa bi vjerojatnost precijenjivanja brojnosti stvarno zaraženih osoba u tom slučaju mogla biti velika čak i uz korištenje serološkog testa koji ima relativno visoku pouzdanost.

Vjerojatni rezultati serološkog ispitivanja u Hrvatskoj

Prema dosad objavljenim informacijama, serološko ispitivanje opće populacije u Hrvatskoj se planira provesti na reprezentativnom uzorku veličine 1100 ispitanika. Kada bi stvarna rasprostranjenost zaraze SARS-CoV-2 virusom iznosila 1%, očekivano je uzorkom obuhvatiti 11 ispitanika čiji će nalazi biti pozitivni. Kada bi stvarna rasprostranjenost bila 0.2%, u uzorku bi se očekivano pojavilo približno dva ispitanika čiji će nalaz biti pozitivan. Uz to, zbog nesavršenosti serološkog testa, u uzorku će se očekivano pojaviti i lažno pozitivni nalazi, a dio ispitanika bit će lažno negativan. Te veličine zavise o osjetljivosti i specifičnosti korištenog testa. Na primjer, primjenom testa koji je 98% specifičan može se očekivati čak 22 lažno pozitivna nalaza u uzorku spomenute veličine.

Pretpostavimo nekoliko scenarija rezultata budućeg ispitivanja. Na primjer, u uzorku se može pojaviti 2, 11, 22 ili 33 ispitanika čiji će serološki nalaz biti pozitivan, što odgovara udjelima od približno 0.2%, 1%, 2% i 5% ukupnog broja ispitanika. Pretpostavimo također da će primijenjeni serološki test imati specifičnost koja iznosi 99%, 98% i 90%, te osjetljivost koja (radi jednostavnosti) u svakom slučaju iznosi 100%. Pretpostavimo i da je osjetljivost testa prethodno utvrđena na uzorku od 100 provjereno pozitivnih nalaza, a njegova specifičnost na uzorku od 300 provjereno negativnih nalaza.

Na slici 2. su prikazani ishodi opisanih scenarija, odnosno posteriorna vjerojatnost brojnosti stvarno zaraženih osoba kada se uzme u obzir razinu pouzdanosti serološkog testa i veličinu uzorka3. Iz priloženog je vidljivo je da je procjena brojnosti zaraženih u populaciji uvijek umanjena u odnosu na broj pozitivnih nalaza u uzorku. Što je manja specifičnost testa, odnosno što je više lažno pozitivnih nalaza, procjenu brojnosti stvarno zaraženih potrebno je više umanjiti kako bi se dobilo realniju sliku.

Različiti scenariji očekivanog rezultata serološkog ispitivanja opće populacije u Hrvatskoj. Krivuljom je prikazana je raspodjela posteriorne vjerojatnosti procjene srednje vrijednosti, a brojčano je navedena srednja vrijednost i 95% kredibilni interval procjene.

Slika 2: Različiti scenariji očekivanog rezultata serološkog ispitivanja opće populacije u Hrvatskoj. Krivuljom je prikazana je raspodjela posteriorne vjerojatnosti procjene srednje vrijednosti, a brojčano je navedena srednja vrijednost i 95% kredibilni interval procjene.

Prilagodba rezultata dobivenih neposredno na uzorku podrazumijeva propagaciju nesigurnosti koja je prisutna pri procjeni pouzdanosti serološkog testa, nesigurnosti koja proizlazi iz primjene testa, uz uvažavanje nesigurnosti koja proizlazi iz veličine uzorka opće populacije. Pouzdanost konačne procjene je široka, pa i u slučajevima kada se koristi test relativno visoke specifičnosti. Velik raspon procjene može učiniti rezultat cjelokupnog istraživanja prilično neupotrebljivim. Na primjer, pojavi li se u uzorku 5% pozitivnih nalaza, a korišten je serološki test koji ima specifičnost od 98%, što je utvrđeno analizom 300 pouzdano negativnih nalaza, rezultat bi uputio na zaključak da u općoj populaciji ima između između 0.6% i 4.8% zaraženih, odnosno približno između 23 i 196 tisuća osoba. Drugim riječima, zaključili bismo da zaraženih vjerojatno ima očekivano malo ili da ih možda ima više od očekivanog, zavisno o prethodnim pretpostavkama koje imamo o toj veličini, no odgovor bi u oba slučaja bio neprecizan i nedovoljan da razriješi oklade čije razrješenje zavisi o preciznijoj procjeni.

Nesigurnost rezultata očituje se na još jedan znakovit način. Od dvanaest prikazanih scenarija, kredibilni interval procjene u samo dva scenarija isključuje pretpostavku da zaraženih u populaciji uopće nema. Znamo da potvrđenih slučajeva ima oko dvije tisuće, no procjena na temelju ovih simuliranih rezultata serološkog ispitivanja je toliko neprecizna da se to ne može potvrditi bez dodatne pažnje istraživača. Informaciju o broju pouzdano potvrđenih slučajeva može se i mora ugraditi u prethodnu vjerojatnost analitičkih parametara, no ovdje je ispuštena radi bolje ilustracije mogućeg raspona nesigurnosti. Pored toga, iako imamo informaciju o donjoj granici brojnosti zaraženih, nedostaje nam čvrsta informacija o vjerojatnoj gornjoj granici, a time značaj prikazane neodređenosti ostaje i dalje prisutan.

Imajući u vidu ova ograničenja, svrhovitost provođenja serološkog ispitivanja kakvo je najavljeno je upitna. Već i sada znamo, odnosno pretpostavljamo, da zaraženih ima više od dvije tisuće, a vrlo vjerojatno manje od 5% ukupne populacije. Sredstva koja se namjerava utrošiti na neodređenu empirijsku potvrdu te neodređene pretpostavke možda bi bilo smislenije upotrijebiti u korisniju svrhu. Naravno, ne može se isključiti mogućnost da rezultat iznenadi. Serološko ispitivanje možda uputi da je zaraženo više od 10% opće populacije, a u tom slučaju morat ćemo mijenjati mnoge pretpostavke o obilježjima ove epidemije poput stupnja uspješnosti epidemiologa da pronađu i potvrde slučajeve zaraze, udjela asimptomatskih slučajeva među zaraženima, brzine širenja virusa, smrtnosti od bolesti koju virus izaziva, itd.

Reprezentativnost uzorka i analitička poststratifikacija

U slučaju iznenađujućeg rezultata serološkog ispitivanja opće populacije, a prije potresne promjene svega što mislimo da znamo o zarazi SARS-CoV-2 virusom, potrebno je obratiti pažnju na reprezentativnost uzorka iz kojeg se izvelo rezultate. Prema dosadašnjim najavama, “uzorak će biti stratificiran po dobi i spolu koliko god je to moguće” (K. Capak, 22. travnja), što vjerojatno znači da će se slučajan izbor ispitanika nastojati izvršiti prema navedenim obilježjima. No što je s ostalim obilježjima? Regionalna raspodjela broja potvrđenih slučajeva zaraze u Hrvatskoj nije jednakomjerna. Zahvaćanje uzorkom iznadprosječnog broja ispitanika iz područja gdje se virus vjerojatno širio u većoj mjeri precijenit će procjenu njegove raširenosti u općoj populaciji, a zahvati li se više ispitanika nego bi trebalo iz područja gdje je zaraza bila manje raširena, procjena raširenosti u općoj populaciji bit će podcijenjena.

Moguće je pretpostaviti postojanje još nekih obilježja koja mogu utjecati na pristranost rezultata i potrebno ih je kontrolirati pri uzorkovanju i analizi rezultata. Na primjer, vjerojatno je da su značajan izvor zaraze u Hrvatskoj osobe zaražene tijekom provođenja zimskog odmora u susjednim državama, a one vjerojatno pripadaju prihodovno boljestojećem dijelu opće populacije. Značajan izvor zaraze su i osobe koje su radile u inozemstvu, zdravstveni radnici, starije osobe u institucionalnom smještaju i još neke skupine koje bi valjalo prepoznati kako bi se izbjeglo njihovu nadzastupljenost u uzorku. Virus se više širio prema njima bliskim osobama nego prema slučajnim prolaznicima, pa je poželjno uzeti u obzir i posrednu povezanost kako bi se u što većoj mjeri poništilo očekivane pristranosti.

Postoji još jedan mogući izvor pristranosti pri uzorkovanju, a koji je povezan s medijskim predstavljanjem serološkog testiranja kao prigodne dijagnostičke metode za one koji više nego drugi žele saznati jesu li osobno bili zaraženi ili nisu. Ispitanici koji će sudjelovati u istraživanju bit će dobrovoljci, a mogućnost da saznaju svoj nalaz vjerojatno će privući upravo one koji to žele znati. To bi mogle biti, na primjer, osobe koje su u prethodnom razdoblju preboljele respiratornu infekciju, a među njima će očekivano biti nadzastupljene osobe koje su preboljele upravo zarazu SARS-CoV-2 virusom. Pri načinu odabira ispitanika, a posebno pri oglašavanju mogućnosti da ispitanici saznaju svoje osobne nalaze, moralo bi se uvažiti opasnost da dođe do dodatnih pristranosti konačne procjene raširenosti zaraze u općoj populaciji.

Odabir i izvedba uzorka sigurno neće biti savršeni i vjerojatno će biti primijenjena određena analitička poststratifikacija uzorka, odnosno prilagodba rezultata stvarnoj ili pretpostavljenoj zastupljenosti ključnih skupina u općoj populaciji. Ovaj analitički postupak se može provesti na različite načine, više ili manje kvalitetno, uvažavajući različita kritična obilježja i stoga je prije suda o procjeni raširenosti zaraze nužno znati što je točno učinjeno pri njenu izvođenju. Posljedice razlika u načinu poststratifikacijske prilagodbe mogu biti znatne, tim više što je očekivani broj zaraženih relativno malen.

Zaključak

Medijsko prenošenje rezultata najavljenog serološkog ispitivanja opće populacije najvjerojatnije će se svesti na senzacionalno navođenje brojeva poput “Sto tisuća zaraženih u Hrvatskoj!”, bez potrebnog problematiziranja kvalitete procjene i nesigurnosti koju ona nužno sadržava. Takav se scenarij vjerojatno neće moći izbjeći ni objavom detaljnih informacija o pouzdanosti serološkog testa, postupku uzorkovanja, korištenim statističkim metodama i drugim detaljima bez kojih nije moguće potpuno sagledati smisao i značaj istaknutih brojeva. Ipak, način objave rezultata ukazat će žele li oni koji ga objavljuju biti transparentni i nepristrani ili ih imaju namjeru koristiti u ovu ili onu prigodnu svrhu. Objava rezultata na konferenciji za medije koja nije popraćena istovremenom objavom svih značajnih istraživačkih postupaka upućivat će da je posrijedi ovo drugo.

U analitičkom pogledu je izuzetno važno voditi računa da se cjelovito obuhvati nesigurnost koja izvire iz različitih istraživačkih postupaka na kojima se temelji završnu procjenu brojnosti zaraženih. Ona u ovom slučaju bitno zavisi ne samo o veličini i reprezentativnosti uzorka, već i o pouzdanosti serološkog testa, pa čak i o pouzdanosti procjene pouzdanosti tog testa. Propusti li se valjano uzeti u obzir očekivane izvore nesigurnosti i pristranosti, objavljena procjena broja zaraženih mogla biti naizgled preciznija nego što je stvarno slučaj i pristrana u neodredivom smjeru. Imajući u vidu vjerojatni značaj rezultata ovog ispitivanja za političko određivanje epidemioloških mjera koje utječu na širi društveni život, poželjno je učiniti najviše da se izbjegne očekivane pogreške i neodređenosti. Uzimajući u obzir opisana ograničenja, učiniti najviše možda znači učiniti ništa, odnosno odustati od provođenja ispitivanja koje ne može dati prihvatljivo određen i nepristran odgovor.


  1. Asimptomatskih slučajeva zaraze zasigurno ima i među dosad potvrđenim slučajevima, no njihov udjel u Hrvatskoj nije poznat, a vjerojatnost da su potvrđeni je općenito manja nego kod simptomatskih slučajeva, pa je njihov udjel zanemaren pri procjeni.

  2. Računalni kod za provođenje ove simulacije je dostupan ovdje.

  3. Autor modelskog koda korištenog u ovoj analizi, a koji je naknadno prilagođen obilježjima serološkog ispitivanja u Hrvatskoj, je Ethan Steinberg i izvorno je objavljen ovdje.