2020-02-03 19:32:51 +0000 2020-02-03 19:32:51 +0000
28
28

Czy COVID-19 ma wskaźnik śmiertelności na poziomie 41%?

Według danych dotyczących Johns Hopkins Coronavirus Tracker , na dzień 3 lutego 2020 r. na świecie było 17491 potwierdzonych przypadków COVID-19, 536 odzyskanych i 362 zgonów. Z moich nieeksperckich obliczeń wynika, że wskaźnik śmiertelności wynosi:

(Nd / (Nd + Nr)) * 100 = 41%

gdzie:

Nd to całkowita liczba zgonów, Nr to całkowita liczba pełnych wyzdrowień.

Pozostawia to 16593 osoby nadal cierpiące na tę chorobę, które nie wyzdrowiały ani nie zmarły.

Jest to wyraźny kontrast w stosunku do publicznie rozpowszechnionej wartości ~2% śmiertelności, więc czy popełniłem błąd w moich obliczeniach lub założeniach, czy też COVID-19 jest o wiele bardziej niebezpieczny niż powszechnie się twierdzi?

  • [ Po pomocnej dyskusji w komentarzach, “wskaźnik śmiertelności” nie jest właściwym terminem, który powinienem tutaj użyć, zamiast tego powinienem powiedzieć “Wskaźnik śmiertelności w przypadku”.]**

Odpowiedzi (4)

39
39
39
2020-02-04 16:36:16 +0000

Definicja śmiertelności, którą podałeś, nie pasuje do żadnej praktycznej definicji, którą znam. * Kiedy ludzie mówią o współczynniku śmiertelności choroby, to co zwykle mają na myśli to współczynnik śmiertelności przypadków lub współczynnik zgonów do przypadków , który jest po prostu zdefiniowany jako Nd / Ni, gdzie Nd jest liczbą zgonów przypisanych do choroby w danym okresie czasu, a Ni jest całkowitą liczbą nowych przypadków choroby zaobserwowanych w tym samym okresie czasu. Zgodnie z tą definicją, obecny współczynnik śmiertelności przypadków 2019-nCov według przytoczonych przez Ciebie danych wynosi 362 / 17491 ≈ 2,07%.

(Wydaje się, że tracker został zaktualizowany od czasu, gdy zadałeś swoje pytanie, i obecnie wymienia łącznie 20679 potwierdzonych przypadków i 427 zgonów, dla współczynnika CFR wynoszącego 427 / 20679 ≈ 2,06%).

≈ 2,06%). Jako teoretyczna definicja współczynnika śmiertelności w długim okresie, kiedy wszyscy zakażeni pacjenci albo umarli, albo wyzdrowieli, może to mieć pewien sens. Ale wtedy staje się to równoważne zwykłej definicji współczynnika śmiertelności przypadków.


Aby porównać to z twoją definicją “współczynnika śmiertelności” (jako Nd / (Nd + Nr), gdzie Nr jest liczbą osób, które wyzdrowiały z choroby), musimy zacząć od zauważenia, że nie ma jednej uniwersalnej i jednoznacznej definicji tego, co oznacza “wyzdrowienie z choroby”. Powszechnie używane definicje to coś w rodzaju “brak objawów przez X dni” i/lub “wiremia poniżej N cząsteczek na mL przez X dni” lub po prostu “kiedy tylko lekarz ogłosi, że jesteś znowu zdrowy i wypuści cię ze szpitala”.

Teraz, powiedzmy, że używamy (nieco) obiektywnej definicji wyzdrowienia, takiej jak “brak wykrywalnych objawów przez dwa dni”. Pierwszą obserwacją jest to, że każda epidemia zaobserwowana po raz pierwszy mniej niż dwa dni temu miałaby, zgodnie z twoją definicją, nieuchronnie 100% wskaźnik śmiertelności po prostu dlatego, że żadna z osób zarażonych do tej pory nie miałaby czasu, aby być uznana za definitywnie wyleczoną. (To jest przy założeniu, że przynajmniej jedna osoba zmarła z powodu infekcji; w przeciwnym razie zarówno licznik jak i mianownik wynosiłby zero, a zatem wskaźnik byłby nieokreślony).

Ponadto, nawet po tym, jak niektóre z najwcześniejszych przypadków były wolne od objawów wystarczająco długo, aby można je było uznać za wyleczone, Twoja definicja nadal dawałaby wysoce zawyżone oszacowanie “prawdziwego” długoterminowego współczynnika śmiertelności podczas wczesnej fazy epidemii, kiedy liczba nowych przypadków dziennie nadal wzrasta. Dzieje się tak dlatego, że w przypadku większości chorób zakaźnych zgony następują zazwyczaj w momencie, gdy choroba jest w najcięższym stanie, podczas gdy ci, którzy przeżyją chorobę, doświadczają stopniowego zmniejszania się objawów w miarę, jak ich systemowi odpornościowemu udaje się zatrzymać i odwrócić postęp infekcji.


Dla ilustracyjnego przykładu rozważmy hipotetyczną chorobę o teoretycznym 1% długoterminowym średnim CFR - to znaczy, że dokładnie 1% wszystkich (rozpoznawalnie) zakażonych pacjentów umrze z powodu tej choroby. Załóżmy dalej, że choroba ta zazwyczaj potrzebuje dwóch dni, aby przejść od początkowego pojawienia się rozpoznawalnych symptomów do stanu maksymalnego nasilenia, czyli do momentu, w którym następuje większość zgonów. Po tym czasie, zakładając, że pacjent przeżyje, objawy stopniowo zmniejszają się w ciągu kolejnych trzech dni. Ponieważ remisja jest możliwa (ale rzadka), lekarze zazwyczaj uznają, że pacjent wyzdrowiał dopiero wtedy, gdy nie wykazywał żadnych objawów przez co najmniej dwa dni. Tak więc typowy przypadek przebiegałby następująco:

początek objawów → narastanie objawów (2 dni) → szczytowe nasilenie → zmniejszanie się objawów (3 dni) → brak objawów → obserwacja (2 dni) → oficjalnie wyzdrowienie (całkowity czas: ok. 7 dni od początku)

lub, w przypadku 1% pacjentów, dla których choroba jest śmiertelna:

początek objawów → narastanie objawów (2 dni) → śmierć (całkowity czas: ok. 2 dni od początku choroby)

Załóżmy teraz, że w początkowym okresie epidemii, kiedy infekcja jeszcze rozprzestrzenia się wykładniczo, liczba nowych zachorowań wzrasta 10-krotnie co trzy dni. Tak więc, w tym okresie, liczba nowych przypadków, wyzdrowień i zgonów na dzień może rosnąć w przybliżeniu w następujący sposób (zakładając na potrzeby tego przykładu, że dokładnie 1%, zaokrąglony w dół, pacjentów zdiagnozowanych każdego dnia umrze dwa dni później):

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
  1 | 1 | 1 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  2 | 2 | 3 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  3 | 5 | 8 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  4 | 10 | 18 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  5 | 20 | 38 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  6 | 50 | 88 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  7 | 100 | 188 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  8 | 200 | 388 | 1 | 1 | 0 | 0 | 0.00% | 0.0% |
  9 | 500 | 888 | 2 | 3 | 1 | 1 | 0.11% | 25.0% |
 10 | 1000 | 1888 | 5 | 8 | 2 | 3 | 0.16% | 27.3% |
 11 | 2000 | 3888 | 10 | 18 | 5 | 8 | 0.21% | 30.8% |
 12 | 5000 | 8888 | 20 | 38 | 10 | 18 | 0.20% | 32.1% |

Jak widać z powyższej tabeli, naiwne obliczanie współczynnika śmiertelności jako (całkowita liczba zgonów) / (całkowita liczba przypadków) podczas tego wykładniczego okresu wzrostu zaniża prawdziwy długoterminowy CFR o czynnik (w tym przypadku) około 5 z powodu dwudniowego opóźnienia między infekcją a śmiercią. Z drugiej strony, użycie twojego wzoru (całkowita liczba zgonów) / (całkowita liczba zgonów + wyzdrowienie) zawyżyłoby prawdziwy CFR o czynnik około 30!

Tymczasem, załóżmy, że po pierwszych 12 dniach, wzrost epidemii nasyca się do 10,000 nowych przypadków dziennie. Teraz całkowity liczby będą wyglądały następująco:

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
 13 | 10000 | 18888 | 50 | 88 | 20 | 38 | 0.20% | 30.2% |
 14 | 10000 | 28888 | 99 | 187 | 50 | 88 | 0.30% | 32.0% |
 15 | 10000 | 38888 | 198 | 385 | 100 | 188 | 0.48% | 32.8% |
 16 | 10000 | 48888 | 495 | 880 | 100 | 288 | 0.59% | 24.7% |
 17 | 10000 | 58888 | 990 | 1870 | 100 | 388 | 0.66% | 17.2% |
 18 | 10000 | 68888 | 1980 | 3850 | 100 | 488 | 0.71% | 11.2% |
 19 | 10000 | 78888 | 4950 | 8800 | 100 | 588 | 0.74% | 6.3% |
 20 | 10000 | 88888 | 9900 | 18700 | 100 | 688 | 0.77% | 3.5% |
 21 | 10000 | 98888 | 9900 | 28600 | 100 | 788 | 0.80% | 2.7% |

Jak widać, obie miary śmiertelności w końcu zaczynają się zbiegać w miarę spowalniania wzrostu epidemii. W rzeczywistości, w dłuższej perspektywie, gdy większość pacjentów albo wyzdrowieje albo umrze, obie te miary zbiegają się do “prawdziwego” długoterminowego wskaźnika śmiertelności wynoszącego 1%. Ale do tego czasu, epidemia będzie już w zasadzie zakończona.

Istnieją różne sposoby, aby uzyskać bardziej dokładne oszacowanie długoterminowego współczynnika śmiertelności, nawet we wczesnej fazie wykładniczego wzrostu epidemii. Jedną z takich metod byłoby przyjrzenie się wynikom pojedynczej kohorty pacjentów zdiagnozowanych w tym samym czasie. Dla naszej hipotetycznej epidemii przykładowej, patrząc np. tylko na 1000 pacjentów zdiagnozowanych w dniu 10, moglibyśmy uzyskać dokładne oszacowanie CFR do dnia 12 po prostu dzieląc 10 zgonów w obrębie tej kohorty przez całkowitą liczbę pacjentów w kohorcie. Ponadto, obserwacja wielu kohort dałaby nam całkiem dobre pojęcie o tym, jak długo po diagnozie musielibyśmy czekać, zanim szacowany współczynnik śmiertelności przypadków dla każdej kohorty zbliży się do swojej ostatecznej prawdziwej wartości.

Niestety przeprowadzenie tego rodzaju analizy kohortowej dla 2019-nCov wymagałoby bardziej szczegółowych informacji, niż zapewnia tracker, do którego się odwołałeś. Nawet arkusz kalkulacyjny szereg czasowy , do którego odsyła tracker, nie dostarcza bezpośrednio tak szczegółowych danych kohortowych, chociaż może być możliwe uzyskanie lepszych szacunków na jego podstawie poprzez przyjęcie pewnych mniej lub bardziej rozsądnych założeń dotyczących typowego postępu choroby.


Dodatek: Wydaje się, że kilka wstępnych badań kohortowych tego rodzaju, które opisuję powyżej, zostało już opublikowanych dla 2019-nCoV.

W szczególności, “A novel coronavirus outbreak of global health concern” przez Wang et al. i “Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China” przez Huang et al. _, oba opublikowane 24 stycznia w _The Lancet, zauważają, że spośród pierwszych 41 pacjentów zdiagnozowanych z 2019-nCoV przed 2 stycznia 2020 r. w Wuhan, sześciu zmarło (a 28 zostało wypisanych, pozostawiając siedmiu hospitalizowanych) do 22 stycznia, co daje wskaźnik śmiertelności przypadków 14,6% w tej kohorcie.

Jednakże, zalecają oni traktowanie tej liczby z należytą ostrożnością, zwracając uwagę na kilka powodów (oprócz niewielkiej liczby zbadanych przypadków), dla których może ona nie odzwierciedlać w pełni ostatecznego długoterminowego CFR:

Jednakże, oba te [CFR] szacunki [14. 6% z kohorty 41 pacjentów i 2,9% z wszystkich 835 przypadków potwierdzonych w czasie pisania] _powinny być traktowane z dużą ostrożnością, ponieważ nie wszyscy pacjenci zakończyli chorobę (tj. wyzdrowieli lub zmarli), a prawdziwa liczba zakażeń i pełne spektrum choroby są nieznane. Co ważne, w nowo powstających ogniskach infekcji wirusowych stosunek przypadków do śmiertelności jest często zawyżony we wczesnych stadiach, ponieważ wykrywanie przypadków jest silnie ukierunkowane na cięższe przypadki. W miarę udostępniania dalszych danych na temat spektrum łagodnych lub bezobjawowych infekcji, których jeden przypadek został udokumentowany przez Chan i współpracowników, współczynnik śmiertelności prawdopodobnie będzie się zmniejszał. _”

Istnieje również późniejsza praca zatytułowana “Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan, China: a descriptive study” autorstwa Chen et al., opublikowana 30 stycznia, która bada kohortę 99 pacjentów zdiagnozowanych między 1 stycznia a 20 stycznia i zgłasza CFR 11% w tej kohorcie. Jednakże, badanie to dotyczyło tylko tych pacjentów do 25 stycznia, do tego czasu ponad połowa z nich (57 z 99) nadal pozostawała hospitalizowana.

19
19
19
2020-02-03 20:17:53 +0000

Równanie, którego używasz dla śmiertelności, jest naprawdę użyteczne tylko w bardzo długim okresie czasu dla znanej choroby, kiedy większość przypadków ustąpiła.

Nie jest to zbyt pouczające w krótkim okresie czasu, kiedy zdecydowana większość przypadków to ani zgony, ani wyzdrowienia.

W tej chwili, ogromna większość zdiagnozowanych osób ma łagodną chorobę i jest bardzo mało prawdopodobne, że umrą, ale potrzeba dużo czasu, aby można je było zaliczyć do kategorii “wyleczonych”. Dodatkowo, wiele z tych osób, które zmarły, jest szczególnie wrażliwych. Z WHO:

Podobnie jak w przypadku innych chorób układu oddechowego, zakażenie wirusem 2019-nCoV może powodować łagodne objawy, w tym katar, ból gardła, kaszel i gorączkę. U niektórych osób mogą one być poważniejsze i mogą prowadzić do zapalenia płuc lub trudności w oddychaniu. Rzadziej choroba ta może być śmiertelna. Osoby starsze oraz osoby z istniejącymi wcześniej schorzeniami (takimi jak cukrzyca i choroby serca) wydają się być bardziej podatne na zachorowanie na ciężką postać wirusa.

Szacunki dotyczące śmiertelności, które można zobaczyć w wiadomościach, mogą być oparte na zgonach/przypadkach lub są oparte na porównaniach ekspertów z przeszłymi epidemicznymi szczepami koronawirusów i wiedzy na temat typowego przebiegu choroby.

Dodatkowo, nie wiemy jak dokładne są te liczby, szczególnie w przypadku przypadków. Może być o wiele więcej łagodnych przypadków, które nie są zgłaszane.

Nie będzie dobrych szacunków rzeczywistej śmiertelności dopóki nie upłynie więcej czasu, a nawet w tym przypadku jest mało prawdopodobne, że pojedyncza liczba będzie bardzo pouczająca. Zamiast tego, ryzyko będzie się różnić w zależności od wieku i innych czynników. Dobre źródła informacji, takie jak WHO, nie podają wskaźników śmiertelności: podają jedynie przypadki zachorowań i zgonów w tym czasie.

Niektóre dobre źródła dalszych informacji: https://www.who.int/emergencies/diseases/novel-coronavirus-2019 https://www.cdc.gov/coronavirus/2019-nCoV/summary.html https://www.nhs.uk/conditions/wuhan-novel-coronavirus/ .

11
11
11
2020-02-04 15:34:55 +0000

Chciałbym się zgłosić z wyjaśnieniem co dokładnie jest złe z kalkulacją zaproponowaną w pytaniu, a nie tylko powiedzieć “to jest zła formuła”. Zrozumienie “whys” tego błędu jest ważne. Postaram się więc odpowiedzieć na twoje pytanie z matematycznego punktu widzenia.

TL;DR: Główną przyczyną błędu jest to, że powrót do zdrowia trwa znacznie dłużej niż śmierć.

(Nd / (Nd + Nr)) * 100 = 41% gdzie: Nd to całkowita liczba zgonów, Nr to całkowita liczba pełnych odzysków.

Ta formuła (i logika za nią) jest poprawna tak długo jak Nd i Nr odnoszą się do ** tej samej stałej grupy ludzi**. Oznacza to, że gdybyśmy wybrali N zainfekowanych osób, czekali na wszystkie aby osiągnąć stan końcowy (wyzdrowienie lub śmierć), i umieścili te Nr i Nd w powyższym wzorze - wtedy tak, dawałoby to statystyczny wskaźnik śmiertelności w tej grupie.

Jednak obecne liczenia wyników wyzdrowienia/śmierci nie odnoszą się do _ tej samej grupy. Nd w każdym raporcie WHO odnosi się do grupy wszystkich osób zainfekowanych do tej pory od początku epidemii. Jednak ostateczny wynik _ wszystkich osób w tej grupie nie jest jeszcze znany. Dziennik Nr odnosi się tylko do podgrupy wszystkich osób zakażonych (z wyłączeniem osób niewiadomych), patrz? Więc nie możesz wziąć Nd i Nr z raportu WHO i umieścić te liczby w tym wzorze - to byłyby jabłka i pomarańcze…

Aby zilustrować ten punkt, rozważ rażąco uproszczoną sytuację wyimaginowaną: istnieje choroba, która może prowadzić do śmierci trzeciego dnia, podczas gdy reszta zarażonych w pełni wyzdrowieje 15 dnia. W tym przypadku Nd w oficjalnym raporcie obejmowałby wszystkie osoby zakażone 3 dni temu i wcześniej, podczas gdy Nr obejmowałby wszystkie osoby zakażone 15 dni temu i wcześniej. Biorąc pod uwagę wysoki przepływ nowych potwierdzonych przypadków nadchodzących każdego dnia, różnica między tymi dwiema grupami jest ogromna: to wszystkie te osoby zainfekowane w ciągu 12 dni!

W naszym prawdziwym przypadku różnica jest znacznie większa niż Nr i Nd łącznie, co oznacza błąd z ignorowania tej różnicy czyni obliczenia całkowicie bezużyteczne. (Cóż, jest to użyteczne jako absolutna górna granica, ale nie więcej).

3
3
3
2020-02-06 10:30:02 +0000

Zgodnie z wcześniejszymi odpowiedziami, w tej wczesnej fazie 2019-nCoV, Nd/(Nd+Nr) jest przeszacowaniem, a Nd/Nc jest niedoszacowaniem.

Ponieważ obecnie dyskutowany wskaźnik pokrywa się z niedoszacowanym Nd/Nc, masz rację, że 2019-nCoV jest bardziej “niebezpieczny” niż się powszechnie twierdzi. Użyłem cudzysłowu, bo niebezpieczny to dziwny termin.

Zauważając, że Nd/Nc równa się Nd/(Nd+Nr) po zakończeniu epidemii, lepszym oszacowaniem byłoby śledzenie tych dwóch ilorazów w czasie i ekstrapolowanie ich krzywych do punktu, w którym się spotykają. To nadal byłby nieobiektywny estymator, ale mniej niż którykolwiek z nich na własną rękę. Zgaduję, że istnieją bardziej wyrafinowane estymatory z mniejszą tendencyjnością, i zamieściłem to pytanie tutaj: Jakie jest wyrafinowane oszacowanie współczynnika śmiertelności 2019-nCoV?