Matroids Matheplanet Forum Index
Moderiert von matroid
Matroids Matheplanet Forum Index » Aktuelles und Interessantes » Größe Mittelwertunterschiede Drosten-Kontroverse
Druckversion
Druckversion
Antworten
Antworten
Autor
Kein bestimmter Bereich Größe Mittelwertunterschiede Drosten-Kontroverse
DanielBerlin
Neu Letzter Besuch: im letzten Quartal
Dabei seit: 29.05.2020
Mitteilungen: 1
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2020-05-29


Hallo, ich habe als Nicht-Mathematiker eine kurze Frage zur Ende April veröffentlichten Studie von Christian Drosten „An analysis of SARS-CoV-2 viral load by patient age“ (alle Links unten), die insbesondere in den letzten Tagen in den Massenmedien kontrovers diskutiert wurde. Es wurde mittlerweile von verschiedenen Statistik-Experten herausgearbeitet, dass die Rohdaten der Studie im Gegensatz zur Annahme von Christian Drosten sehr wohl einen statistisch signifikanten Unterschied der Viruslast der Kinder und der Erwachsenen zeigen. Meine Frage zielt nicht auf das Thema Signifikanz, sondern auf etwas anderes: Ist es auch eindeutig, dass die Viruslast der Kinder dieser Studie wesentlich (!) geringer ist als die Viruslast der Erwachsenen dieser Studie? Ein signifikanter Unterschied ist ja nicht immer gleichbedeutend mit einem großen Unterschied. Kann man sicher sagen, dass zum Beispiel die Kindergartenkinder dieser Studie weniger als die Hälfte der Viruslast der untersuchten Erwachsenen haben? Meine Frage zielt nur auf die Rohdaten/auf die von der Studie untersuchten Personen und nicht auf die Frage der Generalisierbarkeit dieser Daten auf die allgemeine Bevölkerung. Mir geht es um die Größe des Unterschiedes der Mittelwerte der Gruppen Kindergarten/Kinder und Erwachsene. Braucht man die Rohdaten der Studie, um die eben gestellte Frage beantworten zu können, oder lässt sich diese Frage auch auf der Grundlage der bisherigen Veröffentlichungen beantworten?

In der Studie werden die Mittelwerte für den Basis-10-Logarithmus der Viruslast angegeben: „The mean (…) are shown for the base-10 logarithm of viral load“. In einem anderen Artikel heißt es: „Results are expressed as the log10 of estimated number of viral particles per ml“. Die Kindergarten-Kinder haben den Mittelwert 4,4, die Erwachsenen den Mittelwert 5,2. Ich frage mich, ob dieser Unterschied klein oder groß, unbedeutend oder bedeutend ist? Die Werte 4,4 und 5,2 klingen für sich genommen nicht nach einem Riesenunterschied, sondern eher nahe beieinanderliegend . Aber es geht ja auch um den Basis-10-Logarithmus.

Herr Drosten erweckt in Interviews immer noch den Eindruck, als wenn das zentrale Ergebnis seiner Studie eigentlich stimmen würde, nur der Signifikanz-Test sei nicht optimal gewesen. Stimmt das, dass die Viruskonzentration der untersuchten Kinder und Erwachsenen ungefähr gleich ist, oder ist das eine Nebelkerze? Sollte es so sein, dass die untersuchten Kindergarten-Kinder wesentlich weniger Viruslast hatten als die untersuchten Erwachsenen, dann hätte Christian Drosten die Studie längst für falsch erklären und sie zurückziehen müssen.

Vielen Dank im Voraus!

Noch einige ergänzende Informationen aus verschiedenen Papern:

Leonhard Held schreibt in seinem Paper „A discussion and reanalysis of the results reported in Jones et al. (2020)“:

„The authors argue convincingly that the non-normal distribution of the outcome does not allow application of standard parametric statistical procedures for the original data. However, a test for trend is still possible based on the mean log10 viral loads (and standard errors) reported in Table 2 of the paper (assuming normality of the means as justified by the central limit theorem). I have conducted such an analysis using meta-regression techniques and the results show some evidence for an increase of mean log10 viral load with age group. The estimated linear relationship is shown as a red line in Figure 1 and 2. The p-values of the test for trend are 0.047 and 0.015 for categorization C1 and C2, respectively. Both slope estimates are positive, suggesting a positive association between age and viral load. The increase in mean log10 viral load for one age group category increase is estimated to be 0.045 in categorization C1, which corresponds to a 10.8% increase in viral load per 10 year increase in age (95% CI from 0.1% to 22.6%). This range seems to cover clinically relevant differences between age groups.“

„A reanalysis of summary data with a test for trend suggests that there is moderate, but not overwhelming evidence for increasing viral load with increasing age.“

Dominik Liebl schreibt in seinem Paper „OPEN REVIEW OF THE MANUSCRIPT: AN ANALYSIS OF SARS-COV-2 VIRAL LOAD …“:

„The mean viral load of the age-group Kindergarten is by 86% lower than the mean viral load of the age-group Mature.“

„3.1. Unnecessary log-transformation. The authors transform the original data using a logarithmic transform to base 10. The non-parametric, rank-based tests used in Jones et al. (2020), however, are invariant to such a logarithm transformation. Thus, the data could also be analyzed on the original scale. This would simplify the interpretation of the significant differences in the virus loads.“

„3.2. On the magnitude of the significant difference. Table 1 shows the means of the two significantly different groups of categorization C2 as reported in Table 2 of Jones et al. (2020), but back-transformed to their original scale (viral copies per mL). The mean viral load of the age-group Kindergarten is by 86% lower than the mean viral load of the age-group Mature.3“
Fußnote 3: 86.1348% = (10 5.229369 – 10 4.371295)/10 5.229369

„Remark. Since non-parametric, rank-based tests procedures are used to analyse the data, one should present the medians - not the means. Moreover, the unnecessary logarithmic data-transformation of the data complicates a proper assessment of the differences in the means (see Jensens’s inequality).“


David Curtis schreibt in seinem Paper „Children have lower SARS-CoV-2 viral loads than adults“:

„Given the measurements on the log scale, the best estimate of the magnitude of this difference is that it represents an approximately threefold difference in measured concentrations between children and adults with detectable viral RNA. However one should bear in mind that some subjects may have had viral concentrations below the detectable level and one can note that a smaller proportion of children had detectable virus than adults.“

Kevin McConway und David Spiegelhalter schreiben in ihrem Paper „Is SARS-CoV-2 viral load lower in young children than adults? Jones et al provide evidence that it is (in spite of their claims to the contrary).“:

„It has been widely reported as implying that viral loads in children are similar to adults, and yet the data in the article show children between 1 and 10 having on average 27% (conservative 95% interval 8% to 91%) of the viral load of adults aged over 20.“

Quellen:
Jones u. a.: An analysis of SARS-CoV-2 viral load by patient age

Held: A discussion and reanalysis of the results reported in Jones et al. (2020)

Liebl: OPEN REVIEW OF THE MANUSCRIPT: AN ANALYSIS OF SARS-COV-2 VIRAL LOAD BY PATIENT AGE BY TERRY C. JONES, BARBARA MUHLEMANN, TALITHA ¨ VEITH, MARTA ZUCHOWSKI, JORG HOFMANN, ANGELA ¨ STEIN, ANKE EDELMANN, VICTOR MAX CORMAN, AND CHRISTIAN DROSTEN

Curtis: Children have lower SARS-CoV-2 viral loads than adults

McConway u. a.: Is SARS-CoV-2 viral load lower in young children than adults? Jones et al provide evidence that it is (in spite of their claims to the contrary).
@d_spiegel/is-sars-cov-2-viral-load-lower-in-young-children-than-adults-8b4116d28353



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Folgende Antworten hat der Fragesteller vermutlich noch nicht gesehen.
Er/sie war noch nicht wieder auf dem Matheplaneten
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 6423
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2020-05-30


Vorweg: Auf dem Gebiet der Virologie bin ich interessierter Laie. Ich bin kein "Statistik-Experte", habe aber die typischen Statistik-Kenntnisse eines studierten Mathematikers.

Du schreibst, dass "verschiedene Statistik-Experten" etwas herausgearbeitet hätten. Worauf basiert die Einstufung als Experte?

Ich frage deshalb, weil eine gewisse Expertise hier durchaus von Bedeutung ist. Die Fragestellung ist nämlich nicht ganz einfach.

Ursache ist die breite Streuung der ermittelten Viruslast über sieben, acht(!) Dekaden hinweg.
Nach meiner - wie gesagt laienhaften - Vorstellung haben wir hier die Überlagerung von zwei Effekten. Das eine ist eine eventuell vorhandene unterschiedliche "Kapazität" für Viren. Sagen wir mal Person A hat bei ansonsten völlig gleichen Bedingungen eine doppelt so hohe Konzentration an Viren in sich, wie Person B.
Hinzukommt aber ein zufälliger Testzeitpunkt. A teste ich in einem sehr frühen Stadium, zu dem sich die Viren nur wenig vermehrt haben. B teste ich zufällig später, wenn die Viren sich massiv vermehrt haben. Dann hat B zum Zeitpunkt des Tests eine viel höhere Zahl an Viren in sich, obwohl A eigentlich "doppelt so stark" belastet ist.
Vielleicht macht das schon klar, warum man nicht einfach die Virenlast der Patienten nehmen und mitteln kann und die Gruppe, bei der mehr raus kommt, ist stärker betroffen.

Jetzt muss ich leider etwas mathematisch werden.
Der häufigste Fall, wie Zufallsgrößen verteilt sind ist die "Normalverteilung". Bei der Normalverteilung liegen die meisten Werte in der Nähe des Mittelwertes. Es gibt Abweichungen nach oben und unten, die aber symmetrisch verteilt sind und kleinere Abweichungen sind wahrscheinlicher als große.
Viele statistische Tests basieren auf der Voraussetzung, dass man es (annähernd) mit einer normalverteilten Zufallsgröße zu tun hat.
Die ermittelte Viruslast ist definitiv nicht normalverteilt. Wenn man sich Bild 1 in Jones et al anschaut, ist das offensichtlich.
Man muss eine logarithmische Achse wählen, um das übersichtlich darzustellen. Bei einer normalen Achse und einer Gruppeneinteilung von $0\cdot10^{10}, 1\cdot10^{10}, …, 10\cdot10^{10}$ hätte man 95% der Messwerte ganz links im ersten Block und die restlichen 5% darüber verteilt. Das ist offensichtlich keine Normalverteilung.
Die Autoren stellen sich die Frage, ob vielleicht der logarithmierte Wert der Viren-Last normalverteilt ist. Das ist leider auch nicht der Fall.
Die Verteilung ist schon wesentlich näher an einer Normalverteilung, aber eben noch nicht nah genug.
Damit fallen leider viele Tests aus, die auf diese Voraussetzung angewiesen sind.
Herr Curtis verwendet in seiner Analyse "Welch’s t test".
Laut Wikipedia funktioniert der Test nicht gut, "wenn mindestens eine der Verteilungen nicht-normal ist, die Fallzahlen klein und stark unterschiedlich (n ≠ m) sind."
Die Verteilungen sind nicht-normal, die Fallzahlen für die Gruppe der Kinder sind klein und unterscheiden sich stark von der Fallzahl der Erwachsenen. Für mich klingt das so, als wäre der Welch-Test keine gute Wahl.

Herr Liebl scheint da mehr Statistik-Expertise mitzubringen.
Wenn er allerdings schreibt, das Logarithmieren wäre unnötig, dann leuchtet mir das nicht ein. Für die Durchführung eines Nicht-Parametrischen Tests, ist das Logarithmieren unnötig. Aber für die Darstellung und für die Frage, ob die Daten vielleicht Logarithmisch-Normalverteilt sind, sehe ich keine echte Alternative zum Logarithmieren.

Jetzt hast Du geschrieben, dass Dich das Thema Signifikanz nicht interessiert. Es ist aber nicht unerheblich, um die Aussage der Studie richtig einzuordnen.
Sehen wir es mal so:
Da kommt jemand und sagt, dass die Viruslast bei Kindern viel geringer sei als bei Erwachsenen und man daher Kindergärten wiedereröffnen kann [obwohl relativ klar ist, dass es Kindern deutlich schwerer fällt, Abstands- und Hygieneregeln einzuhalten].
Dann wird eine Messung gemacht und man stellt zwar eine geringere Last fest, aber das kann auch Zufall sein. Bei der Einteilung C1 überlappen sich alle Konfidenzintervalle!
Jetzt gibt es den Begriff der Signifikanz -- hier wird bewertet, ob die beobachteten Unterschiede auch rein zufällig auftreten könnten (mit einer gewissen Wahrscheinlichkeit). Die Daten werden auf Signifikanz getestet und 59 von 60 Tests zeigen keine signifikanten Unterschiede.
Genau das schreiben die Autoren dann auch und der logische Schluss daraus: "Es kann sein, dass Kinder genauso ansteckend sind, wie Erwachsene."
Das ist mit der Signifikanz wie vor Gericht. Die vorliegenden Beweise reichen nicht aus, damit man von der Schuld komplett überzeugt ist.
Es spricht einiges dafür, dass es so ist, aber es könnte auch Zufall sein.
Fehlende Signifikanz heißt oft "Die Faktenlage ist zu dünn. Müsste man genauer untersuchen."
Wenn weitere, ausführlichere Untersuchungen signifikante Abweichungen belegen, dann heißt das nicht, dass die früheren Untersuchungen "falsch" waren. Wenn die "neuen" Beweise für eine Verurteilungen ausreichen, die "alten" aber noch nicht, dann sind die alten Beweise deswegen ja auch nicht falsch.

Jetzt kommt noch eine weitere Schwierigkeit hinzu. Die Menge der Viren in einer Probe ist zwar ein Indiz dafür, wie ansteckend jemand ist, aber das ist längst nicht alles. Kinder könnten bei gleicher Virenlast wesentlich ansteckender sein, weil sie sich anders verhalten.
Von daher finde ich die 86%-Rechnung von Herrn Liebl zwar rein rechnerisch nachvollziehbar (wobei mich da mal das Konfidenzintervall interessiert hätte), aber welche Auswirkung auf die Ansteckungsrate das hat, das liegt weit außerhalb seiner Expertise. Zehn Zyankalikapseln sind auch nicht tödlicher als eine.

Nachtrag:
Auf Basis meines laienhaften Verständnisses würde ich anzweifeln, dass die absolute (unlogarithmierte) Virenlast überhaupt ein geeignetes Maß für die Bewertung der Ansteckungsgefahr ist.
Im Körper findet ein Wettlauf statt. Die Viren vermehren sich (nahezu) exponentiell, während der menschliche Organismus versucht, geeignete Abwehrmaßnahmen zu finden, ehe die Viren wichtige Körperfunktionen lahmlegen. Die Zahl der Viren nimmt dabei in wenigen Tagen um acht, wahrscheinlich (unter der Nachweisschwelle) sogar um noch mehr Zehnerpotenzen zu.
In dem Fall eine(!) Zehnerpotenz "Vorsprung" zu haben, weil die Virenlast der Person B, bei der ich mich angesteckt habe nur 10% der Virenlast einer anderen Person A beträgt, ist sicher ein Vorteil, aber es ist ein kleiner Vorteil. Das könnte z.B. heißen, dass die Virenzahl für mich nach neun Tagen kritisch wird und nicht schon nach acht.
Die Aussage "Person B hat 90% weniger Virenlast als Person A" klingt so, als wäre der Kontakt zu B völlig ungefährlich. Übersetzt heißt das aber vielleicht: Bei Person A hat mein Körper acht Tage Zeit, zu reagieren, bei B sind es neun Tage.
Oder je nach Sichtweise: Person A ist neun Tage lang hoch ansteckend, Person B nur acht. Der Vorteil ist also alles andere als groß.

Wie gesagt, ich bin kein Virologe, ob der Mechanismus so funktioniert, weiß ich nicht sicher und die genannten Zahlen sind nur beispielhaft, um das Prinzip zu verdeutlichen. Aber bevor man sich aus dem Fenster lehnt, und aus "86% weniger Virenlast" ein "deutlich geringeres Infektionsrisiko" ableitet, sollte man sich schon mal an einen Experten für Infektionsrisiken wenden.
Was einige Medien und "Meinungsvertreter" nicht verstehen, oder verstehen wollen, die hier stattfindende Diskussion ist Teil des normalen wissenschaftlichen Austauschs. Mediziner und Virologen erheben Daten, werten sie aus und stellen sie zur Verfügung. Experten für Statistik schauen sich das an, schlagen vielleicht verbesserte Auswertungsmethoden vor, Pandemie-Experten bewerten daraufhin den Gesamtzusammenhang neu und kommen zu anderen Einschätzungen oder eben auch nicht.
(Natur-)Wissenschaft ist ein ständiger _Verbesserungsprozess_. Man schaue sich mal die Entwicklung der Atommodelle an.
Die Tatsache der kontinuierlichen Weiterentwicklung der wissenschaftlichen Erkenntnisse als "Beweis" dafür zu nehmen, dass die meisten Wissenschaftler (insbesondere die, deren Ergebnisse nicht zur eigenen Meinung passen) "inkompetent" sind, sonst würden sie ja gleich die endgültigen Wahrheiten veröffentlichen -- rangiert irgendwo zwischen ahnungslos und bösartig.

Was ich persönlich als verantwortungslos empfinde:
Dominik Liebl ist Professor für Statistik. Er müsste es eigentlich besser wissen. Er nimmt die Zahlen für Kindergartenkinder und Ältere und berechnet daraus eine um 86% geringere Virenlast und diese Zahl wird dann verbreitet. Dass die Zahlen für Kindergartenkinder (und allgemein für Personen unter 20) in der Studie hohen statistischen Unsicherheiten unterliegen, weil die Fallzahlen einfach gering sind, fällt unter den Tisch.
Hätte er statt der Kindergartenkinder die Grundschüler genommen, so hätte mit der selben Argumentationslogik sein Ergebnis lauten müssen, dass Grundschüler eine höhere(!) Virenlast haben als Erwachsene.
Kevin McConway und David Spiegelhalter (zunächst hatte ich das fälchlicherweise David Curtis zugeordnet) geben bei einem ähnlichen Vergleich (Kinder von 1 bis 11 vs. Erwachsene über 20) ein Konfidenzintervall an 8% bis 91%. Das Ergebnis liegt also irgendwo zwischen "um Faktor 12" geringer und "praktisch gleichgroß".
Leonhard Held kommt zu einem ähnlichen Ergebnis. Die Zunahme der Virenlast pro Lebensjahrzehnt liegt irgendwo zwischen 0 und 20%.
Beide Ergebnisse sind konsistent zur Aussage: "Es könnte sein, dass Kinder genauso infektiös sind, wie Erwachsene."

Dass Herr Liebl sich die dickste Rosine aus dem Kuchen pickt und die 86% ohne Angabe von Unsicherheitsbereichen kommuniziert, hat einen tendenziösen Beigeschmack. Ich halte ihm zu Gute, dass er klar kommuniziert, dass er die medizinische Relevanz dieses Unterschieds nicht bewerten kann. Ich bin allerdings nicht sehr optimistisch, dass die Leute, die auf die 86% verweisen, auch diesen Satz mitzitieren.



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
dlchnr
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 20.04.2013
Mitteilungen: 173
Aus: Aalen, DE
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, eingetragen 2020-05-30


👍👍👍👍👍👍👍



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Martin_Gal
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 29.05.2019
Mitteilungen: 28
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, eingetragen 2020-05-30


2020-05-30 02:48 - Kitaktus in Beitrag No. 1 schreibt:
Du schreibst, dass "verschiedene Statistik-Experten" etwas herausgearbeitet hätten. Worauf basiert die Einstufung als Experte?

Einer der Experten war David Spiegelhalter. Ich meine, dass die Einstufung David Spiegelhalters als Statistik-Experte unstrittig sein sollte (ebenso wie die Einstufung Christian Drostens als Virologie-Experten unstrittig sein sollte).



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 6423
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, eingetragen 2020-05-30


2020-05-30 21:33 - Martin_Gal in Beitrag No. 3 schreibt:
2020-05-30 02:48 - Kitaktus in Beitrag No. 1 schreibt:
Du schreibst, dass "verschiedene Statistik-Experten" etwas herausgearbeitet hätten. Worauf basiert die Einstufung als Experte?

Einer der Experten war David Spiegelhalter. Ich meine, dass die Einstufung David Spiegelhalters als Statistik-Experte unstrittig sein sollte ...

Diese Analyse fand ich - bezogen auf die statistische Auswertung - auch besser als bspw. den Artikel von Prof. Liebl.



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2020 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]