De gerapporteerde Coronavirus-cijfers nader bekeken

Analyses van de zaaknummers met betrekking tot landmaten

Disclaimer: Towards Data Science is een middelgrote publicatie, voornamelijk gebaseerd op de studie van data science en machine learning. Wij zijn geen gezondheidswerkers of epidemiologen en de meningen in dit artikel mogen niet worden geïnterpreteerd als professioneel advies. Klik hier voor meer informatie over de pandemie van het coronavirus.

Binnen enkele maanden heeft het coronavirus (COVID-19) zich over de hele wereld verspreid, wat heeft geleid tot een de facto wereldwijde pandemie. In veel landen en regio's groeien de bevestigde gevallen nog steeds exponentieel. Na de dagelijks bevestigde bevestigde aantallen gevallen maak ik me grote zorgen over hoe het virus het leven, de markten en de wereldeconomie van mensen beïnvloedt. Oorspronkelijk afkomstig uit Peking, China, blijft de herinnering aan de SARS-uitbraak in 2003 nieuw. Ik was echter verbaasd toen ik ontdekte dat zoveel mensen in het Westen zo onverschillig staan ​​voor de ernst van COVID-19: "Het is maar een griep", "het treft alleen ouderen", "mediapropaganda", "kudde-immuniteit" ... Die hoogten van het grote publiek houden me 's nachts wakker.

Misschien zijn sommige mensen niet onder de indruk van het gerapporteerde aantal gevallen en denken dat de meeste geïnfecteerde gevallen ver weg zijn aan de andere kant van de wereld. Ik ben het er inderdaad mee eens dat de bevestigde zaaknummers abstract zijn. Hier heb ik een aantal plots gemaakt om die cijfers in perspectief te plaatsen.

Voorbehoud: het model is slechts zo goed als de bron van de gegevens. Alle bevestigde gevallen van COVID-19 worden geleverd door het Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE), dat officieel gerapporteerde cijfers van de WHO en regeringen over de hele wereld heeft samengesteld. Er is ongetwijfeld onderrapportage uit de meeste landen vanwege het gebrek aan diagnostische tests, het gebrek aan transparantie van de regeringen en mensen die de test niet afleggen vanwege onwetendheid.

Alle onderstaande cijfers zijn gebaseerd op bevestigde COVID-19-gevallen op 15 maart 2020.

Gecumuleerde gevallen op regioniveau

De meest getroffen landen / regio's door gecumuleerde bevestigde COVID-19-gevallen

Veel visualisaties (zoals deze) tonen alleen statistieken op landniveau. Van het plot op regioniveau kunnen we verschillende provincies van China en staten in de VS scheiden. Hubei, ooit het epicentrum van COVID-19, samen met bijna alle andere provincies in China, is afgevlakt in het aantal bevestigde gevallen. Iran, Zuid-Korea, Italië en vele Europese landen overtroffen vele Guangdong, de op één na zwaarst getroffen Chinese provincie.

Passend bij de exponentiële groei

Laten we vervolgens eens kijken hoe snel COVID-19 zich binnen regio's verspreidde. Ik heb de cumulatieve bevestigde gevallen voorzien van een exponentiële functie, y = exp (a + bx). Hier heb ik gewoon kleinste kwadraat (OLS) gebruikt om de parameters a en b te bepalen, de helling b komt overeen met de steilheid van de exponentiële curve.

In werkelijkheid volgt bijna niets de exponentiële groei voor onbepaalde tijd. De eerste uitbraak van een besmettelijke ziekte kan echter worden gemodelleerd met een exponentiële functie. Voor verschillende regio's paste ik het gecumuleerde aantal bevestigde COVID-19-gevallen toe tijdens deze beginperiode, gedefinieerd door 50 gevallen te hebben gedurende ten minste 5 tot 10 dagen. Ik sorteerde de aangebrachte hellingen (b) op basis van exponentiële functies en vond een opvallende lijst van landen met groeipercentages groter dan Hubei rond de afsluiting op 23 januari, waaronder Iran, Finland, Portugal, Italië, Zuid-Korea, Denemarken, Slovenië en Spanje , waarvan velen de exponentiële groei nu doormaken (vanaf 15 maart). Bovendien stonden de staat New York en Washington in de VS ook op de 15 en 19 plaats onder de snelst verspreide regio's ter wereld.

Snelst verspreide regio's / landen. Legenda geeft b aan in de exponentiële functie en de periode die wordt gebruikt om in de groeicurve te passen.

Aan de andere kant kunnen we ook de regio's en landen ontdekken met de langzaamste verspreiding van COVID-19. De top 20 bevindt zich bijna uitsluitend in Azië, waarvan er vele afgelegen en minder bevolkte provincies in China zijn, zoals Ningxia, Binnen-Mongolië en Xinjiang. Merk op dat COVID-19-gevallen sinds half februari in Singapore en Japan bestaan, maar zich veel langzamer hebben verspreid, waarschijnlijk als gevolg van de vroege en effectieve implementatie van sociale distantiëring.

Langzaamst verspreide regio's / landen.

Normaliseren naar populatie

Een manier om het aantal geïnfecteerde mensen in perspectief te plaatsen, is door het te normaliseren ten opzichte van de bevolkingsomvang van de regio of het land. Hieronder plot ik de top 20 regio's / landen met het grootste percentage van de bevolking dat besmet is met COVID-19. San Marino, een door Italië omgeven enclave-microstaat, stond op de eerste plaats in COVID-19-dichtheid per bevolking. Andere landen met een lage bevolking, zoals IJsland, staan ​​ook bovenaan de lijst.

Normaliseer naar gebied

Een andere manier om het aantal geïnfecteerde mensen te begrijpen, is door te normaliseren tegen het gebied van de regio / het land om de dichtheid van de gevallen in termen van geografie af te leiden. Nogmaals, San Marino staat bovenaan de lijst vanwege het kleine gebied. Veel steden en stadstaten behoren ook tot de top: Macau, Singapore en Washington DC.

Normaliseer naar ziekenhuiscapaciteit

Een effectievere manier om het aantal gevallen van COVID-19 in perspectief te plaatsen, is door de belasting ervan voor ziekenhuizen in de regio's te kwantificeren. Dit kan door normalisatie tegen de ziekenhuiscapaciteit, die wordt gemeten aan de hand van het geschatte aantal ziekenhuisbedden.

De huidige met COVID-19 geïnfecteerde patiënten zijn voldoende om 72% van de ziekenhuisbedden in San Marino, die slechts één ziekenhuis heeft, te bezetten. Andere landen met een zeer hoge last zijn onder meer IJsland, Iran, Italië en Qatar, met COVID-19-patiënten die meer dan 10% van de ziekenhuisbedden innemen. Merk op dat dit uitgaat van het beste scenario waarbij patiënten proportioneel worden verdeeld over ziekenhuizen, zodat ze niet naar hetzelfde ziekenhuis overstromen.

Men moet ook rekening houden met het aantal bedden op de ICU en het aantal beschikbare mechanische ventilatoren, die essentieel zijn om die patiënten met ernstige symptomen te redden. Volgens de American Hospital Association zijn bedden in ICD goed voor ~ 5% van alle ziekenhuisbedden in de VS. Ervan uitgaande dat al die patiënten ICU-verblijf nodig zouden hebben, worden de ~ 10% ziekenhuisbedden een enge ~ 200% ICU-capaciteit.

Ziekenhuislast bijgewerkt op basis van bevestigde gevallen tot 21 maart

Ik kon ziekenhuisbedden voor staten in de VS schatten met behulp van gegevens van hier. Zoals u op de plot kunt zien, hebben de bevestigde gevallen in San Marino het aantal ziekenhuisbedden al overschreden. De ziekenhuislast van Italië is gestegen tot ~ 23%. Drie staten in de VS, New York, Washington en New Jersey staan ​​ook in de top 20, met 16%, 12% en 4% alle ziekenhuisbedden die mogelijk bezet zijn door bevestigde COVID-19-gevallen, ervan uitgaande dat ze allemaal in het ziekenhuis moeten worden opgenomen.

Codes:

https://github.com/wangz10/covid_19_analyses