Fit a Function

Here is the link to a great blog post about Derek Lowe

The nice thing about Derek’s talk was that it was really delivered from the other side of the fence, that of an accomplished and practicing medicinal chemist. Thus he wisely did not dwell too much on all the details that can go wrong in modeling: since the audience mainly consisted of modelers presumably they knew these already (No, we still can’t model water well. Stop annoying us!). Instead he offered a more impressionistic and general perspective informed by experience.
Why von Neumann’s elephants? Derek was referring to a great piece by Freeman Dyson (who I have had the privilege of having lunch with a few times) published in Nature a few years back in which Dyson reminisced about a meeting with Enrico Fermi in Chicago. Dyson had taken the Greyhound bus from Cornell to tell Fermi about his latest results concerning meson-proton scattering. Fermi took one look at Dyson’s graph and basically demolished the thinking that had permeated Dyson and his students’ research for several years.

Yes, you can fit an elephant by just four parameters.

I think the elephant goes back to the 2010 paper by Mayer and the Dyson/Fermi meeting to a 2004 paper by Dyson.

I can not not resist to add here another reference here after reading all the COVID-19 modelling: the Hand 2006 paper which says

A great many tools have been developed for supervised classification, ranging from early methods such as linear discriminant analysis through to modern developments such as neural networks and support vector machines. A large number of comparative studies have been conducted in attempts to establish the relative superiority of these methods. This paper argues that these comparisons often fail to take into account important aspects of real problems, so that the apparent superiority of more sophisticated methods may be something of an illusion.

 

CC-BY-NC Science Surf accessed 30.11.2025

Heinsberg und Tirschenreuth aus den Schlagzeilen, dafür Greiz, Coesfeld, Steinburg und Neuburg

Heute verschwindet Heinsberg und Tirschenreuth von der Corona Karte, wenn man die neue Definition “Neuinfektionen der letzten 7 Tage” nimmt. Ein grosser Erfolg der Massnahmen vor Ort.

powered by Advanced iFrame

Neu im Club dafür sind Greiz (Familienfeiern), die drei Schlachtereien Pforzheim Müller Fleisch, Coesfeld Westfleisch und Bad Bramstedt Vion, Esslingen war es eine Beerdigung, Neuburg eine Asylunterkunft, Rosenheim und Traunstein sind Altfälle von den Starkbierfesten.

RKI Situationsbericht von heute

 

CC-BY-NC Science Surf accessed 30.11.2025

The epidemiology controversy explained

It is not easy to understand the major controversy in epidemiology right now. But there is great piece at Boston Review “Model versus Evidence”

In one camp are infectious disease epidemiologists, who work very closely with institutions of public health. They have used a multitude of models to create virtual worlds in which sim viruses wash over sim populations. … A notable detractor from this view is Stanford’s John Ioannidis … This talk of “biased evidence” and “evidence-based interventions” is characteristic of the evidence-based medicine (EBM) community, a close relative of clinical epidemiology. … Public health epidemiologists and clinical epidemiologists have overlapping methods and expertise; they all seek to improve health by studying populations. Yet to some extent, public health epidemiology and clinical epidemiology are distinct traditions in health care, competing philosophies of scientific knowledge. Public health epidemiology, including infectious disease epidemiology, tends to embrace theory and diversity of data; it is methodologically liberal and pragmatic. Clinical epidemiology, by contrast, tends to champion evidence and quality of data; it is comparatively more methodologically conservative and skeptical.

I agree, they are more orthodox and not able to overcome the scepticism in their genes and therefore unable to cope with an emergent situation.

 

 

CC-BY-NC Science Surf accessed 30.11.2025

The Gangelt Study

The Gangelt study that surfaced this morning is interesting as it includes now  some sound statistics using GEE models to account for household clustering (in a previous interview the lead author denied the value of statistical models). The PDF is only available an internal university server without any doi number and timestamp – not even a “preprint” at all.

Maybe I am a bit disappointed as it remains basically a cross-sectional analysis, without any virus phylogeny, ct values and without any description if and how containment measurements were followed under lock-down conditions. Although being performed at a hotspot, PCR results are not particular exciting. 439/12597=3.4% as measured by official surveillance and 33/919=3.6% as measured by the authors.

The claim to fame (besides some annoying reports about the accompanying PR campaign that made it even into Science magazine) are those 15% antibody positive results. Everything in this paper depends on the IgG antibody specificity to Sars-Cov2. It is reported

as of April 7, 2020, validated in cooperation with the Institute of Virology of the Charité in Berlin, and the Erasmus MC in Rotterdam, Euroimmun, Lübeck, Germany). The data sheet (April 7, 2020) reports cross-reactivities with anti-SARS-CoV-1-IgG-antibodies, but not with MERS-CoV-, HCoV-229E-, HCoV-NL63-, HCoV-HKU1- or HCoV-OC43-IgG antibodies.

Interestingly this data sheet was produced only after the examination. I could neither obtain it per email nor is it available on the manufacturer’s website.  I also do not understand why Drosten criticized Streeck for this assay. Wasn’t he involved in the validation?

Here is how the authors checked their own methods

which is a bit weak regarding current pre-test standards, neither in terms of selection of samples, numbers and reporting. The press briefing even adds more confusion

as this reference is not cited in the preprint. I assume it is the  Lassaunière comparison (medRxiv preprint) that showed a specificity of 96% only which is n o t  s o good with the low prevalence expected.

posted April 10 (downloaded May 5) https://www.medrxiv.org/content/10.1101/2020.04.09.20056325v1

A further study on medRxiv reported a specificity of 99% using a “well-defined specificity panel of 147 serum and plasma samples” without any further description. Seroconversion data would also been helpful from Gangelt – why are those N=9 in the figure below not being retested after 2 weeks?

In the absence of any hard data the results remains questionable although it shouldn’t be impossible to design and validate a reliable test where even ultra-sensitive assays have been already published.
Why haven’t the neutralisation tests been incorporated?

Lets step into the results.

“PCRreported” overlaps with “PCRnew” as expected while I would like to see also the match of PCRnew with PCRreported negative results.

4.5.2020 downloaded from https://www.ukbonn.de/C12582D3002FD21D/vwLookupDownloads/Streeck_et_al_Infection_fatality_rate_of_SARS_CoV_2_infection2.pdf
Unfortunately all consecutive plots stratify for infection rate only (combining IgG+ and PCR+) but do not show if the significant difference between carnival / no carnival is due to IgG+. Did IgG+ probands suffer from more symptoms? Why do the co-morbidities not show up here as in many other studies? Why is there such a low household secondary infection rate although the initial transmission is so high?
The contact persons outside of the household are ignored. Unfortunately, the paper also does not show the data promised in a previous interview, for example data on drug use, seating arrangement at the festival, infection chain and association with school closing at the end of January. Will that be published only as salami sliced?
Compared to the April 9 report, based on 500 study participants there are also major discrepancies
– the number of inhabitants in Gangelt increased by 68 for whatever reason
– Forsa is no more mentioned in the acknowledgment
the percentage of PCR+ individuals was previously given as 2% but is now reported to be 3.6%. Either the first figure was completely wrong, or the additional 419 individuals must have contributed a phenomenal 5,5% PCR+ rate.

– the preliminary case fatality CFR was 0.37% based on 7 individuals. This figure remained unchanged even when moving to infection fatality IFR that should be lower as the denominator increased with more infections. Patients also continued to die after the end of the observation period, making the IFR estimate unreliable if not expanded by the 14-21 day usual symptom to death interval.

I tried to validate those 7 deaths reported in the manuscript for Gangelt until March 30. RKI reports 55 in the district Heinsberg until March 30. Did most of them really happen outside Gangelt?

According to the official statistics of the state department we may expect 11 deaths per month in Gangelt. So with the 7 reported cases we should find 18 cases by the end of March. According to the website https://www.aachen-gedenkt.de there are, however, 21 obituaries found in Gangelt eg 3 more than expected. Maybe there are some errors in my re-analysis as the obituaries do not always give the last address or not each death results in an obituary but we can assume that there was at least an excess of 10 and not only of 7 cases until March 30. For a final estimate we need to add at least 1 more case who died after the end of study. My estimate therefore is at least 11 and not just 7 cases.
– Why have the death certificates not been verified in a paper that has even “infection fatality rate” in the title?
– Why are there no virus tests in the victims?

There are few more but less important issues
– it does not make sense in Figure 5 for 1 person to be infected by 1 person
– the prevalence of 107 lung diseases in table 1 is wrong with the given percentage
– the “officially reported cases for this community 3.1%” in the abstract contradicts Fig 1A which gives 439/12597 or 3.5%
– a non responder survey is missing in particular as previously PCR+ individuals were underrepresented. Although not directly reported in the paper, I calculate the response to 407/600=67.8% which is acceptable but not top class.
Taken together, it seems that the study leaves us with a lot of open questions. What is the functional relevance of this particular Ig G+? Is there any Ig G+ reinfection? What do the N=20 in the diagram 2C mean – chronic carrier, false positives, re-infected patients?
The new FAZ headline published in parallel is clearly unwarranted as hotspot data can not be extrapolated.
15% of 81 Million infected? Only now I get the argument: the authors increase their infection rate from 15% to 20% due to some non-participation, then use the IFR based on 7 cases, relate it to the number of German inhabitants to obtain the number of infected ones in Germany. Breathtaking!
Commentary: While I think, it is fine to post a preprint ahead of a publication, this is not even a preprint, it is just a copy of a manuscript on a university server. Using this copy to legitimate a FAZ headline, means that the information released here can no more retracted. It will influence politics, it will influence the live of millions of people. It also means: peer opinion is not relevant for somebody who talks to the press without any peer comment. Streeck hat been warned after publishing the interim report while circumventing again standard procedures in science, means this is a misuse of science as pretext.

 

6.5.2020  UPDATE

Two fun facts – the person in table 1 was probably so drunken that s/he does not even remember carnival ;-) The press briefing reporter obviously did not understand the difference of essay and assay :-)
Drosten about the study in his podcast “a little bit too high”, “would have analyzed in a different way”, “no raw data” …
Berens about the wrong confidence interval …
Streeck mixes “CFR” and “IFR” at 3:03 …
lockdown to control until vaccine “not feasible” 22:27  and argues for “viral low dose”

Sahm / FAZ complained about the confidence interval.

The current IFR in the USA is not 0.36% but 1.3% (95% CI: 0.6% to 2.1%) with county-specific rates varied from 0.5% to 3.6% according to Basu 2020. With  a correct figure of 11 deaths out of 15/100 * 12.000 in Gangelt, the IFR is 0,61% and compatible with the lower end of the US distribution,

 

11.5.2020 UPDATE

mortality figure Heinsberg / Gangelt

LEFT FIGURE Cumulative number of covid19 death in the district of Heinsberg according to RKI data shows a sharp increase of deaths in March. Cumulative number of all death in Gangelt according to an own analysis of all obituaries from January to April 2020 as reported in the local newspaper for Gangelt  in the RIGHT FIGURE. The thin straight line indicates the 18 year average death count in Gangelt according to official NRW statistics 2000-2018 (with on average of 11 deaths per month). Vertical lines give the examination period of the Gangelt study. Death rate is obtained by obituaries using “Gangelt” in the announcement. Without official data confirming the home address of the case fatalities in Gangelt, the number of deaths obtained by obituaries could have been slightly overestimated as sometimes the home address is given by the funeral office only; on the other hand cases without any obituary would have left to an underestimate. Taken together the right plot shows an excess of 10 deaths on April 4. If we add another death after the observation period, there are 11 deaths instead of 7. Data available on request.
screenshot of my local obituary database

According to official RKI data about 15% of all Covid-19 related deaths in the district occurred in Gangelt although only 5% of the population of the Heinsberg district is living there.

The average all cause death in Gangelt doubled in March when compared to years 2000-2018.

Summary: The excess number of deaths in Gangelt by the end of the study is much higher than reported in the manuscript.

 

CC-BY-NC Science Surf accessed 30.11.2025

Eine Million Corona Grafiken

Es ist schon phänomenal wieviel Millionen Diagramme und Grafiken jeden Tag erzeugt und konsumiert werden.

Ausser dem was ich in der letzten Woche für einen Artikel in dem “Gesundheitswesen” produziert habe, ist meine wichtigste Grafik wohl der Verlauf der R(t) Werte in Deutschland.

Sie zeigt unmissverständlich, ganz ohne big data, dass ein bestimmter Wertes zu einem bestimmten Zeitpunkt (und womöglich ein Streit über die richtige Berechnung) sich eigentlich erübrigt.

Obwohl die Pandemie weltweit abläuft, ist sie doch ein regionales Geschehen, das regional eingegrenzt werden muss. Jedes regionale Aufflammen kann – bei fehlender Immunität – jederzeit wieder zu einem Grossfeuer werden.

 

 

 

 

CC-BY-NC Science Surf accessed 30.11.2025

Fragensammlung Corona

Welche Rolle haben die Starkbierfeste und Wahlen in Bayern bei Ausbruch gespielt?

Welche Personengruppe/Gewerbe infiziert im Augenblick gerade die meisten anderen Menschen?

Wieviele (nicht ausgewählte) Personen haben die Erkrankung bereits durchgemacht?

Wieviele Kinder? Sind Kinder weniger ansteckend als bei sonstigen Viruserkrankungen?

Gibt es Near Field Tracing Apps ohne massive Datenschutzprobleme?

Kann man die Gesundheitsämter mit besserer Software ausrüsten?

Kann man die Zeit für den Crispr Schnelltest unter 40 Minuten drücken?

Gibt es eine Hintergrund-Immunität durch verwandte Corona Viren?

Gibt es Kreuzreaktionen, die zu schwererem Verlauf führen?

Gibt es genetische Varianten oder altersabhängige Genmethylierung von ACE2, TMPRSS2 oder Cathepsin L oder diversen Interleukinen, die den klinischen Verlauf negativ beeinflussen?

Wie ist die Kinetik von SarsCoV2 und ACE2 Rezeptorbindung?

Ist rekombinantes lösliches ACE2 ein therapeutisches Prinzip? Wirken TMPRSS2 Hemmer?

Was löst die neurologischen Symptome wie Guillain-Barré und Anosmie aus? Warum ist der pO2 oft so niedrig ohne Atemnot?

Was bedingt den Übergang von L und H Typ der Pneumonie?

Gibt es eine lokale pulmonale Hypertonie und Rechts-Links Shunt zB durch Angiotensinogen II Freisetzung?

Warum ist Heparin so gefährlich?

Was ist besser, Tot- oder Lebendimpfstoff?

DNA, RNA oder Protein basierter Impfstoff?

Wie begegnet man am besten fake news?

 

CC-BY-NC Science Surf accessed 30.11.2025

Corona and vitamin D – astroturf

Vitamin D is a remedy for everything, at least for some people. Right now, there are now already 44 papers that describe an association to corona infection. I have read only a few of them – 100% astroturf.

Media query 18/4/2020 at the new NIH interface https://icite.od.nih.gov/covid19/search/#search:searchId=5e9a955c690d75486c676e67

 

CC-BY-NC Science Surf accessed 30.11.2025

Wie man die Testkapazität in Deutschland verdoppeln könnte

Leider sagt das RKI bis heute nicht wie lange, ein Patient infektiös ist.
Wenn ein Amt so etwas während einer Pandemie nicht weiss, warum stellen sie dann nicht einen Expertenrat zusammen? Und wenn ein externer Experte dass nicht weiss, warum vergibt man dann nicht einen Forschungsauftrag zu der Frage?

Aktuell wird der Großteil der Testkapazität in den Gesundheitsämtern an wiederholte “frei”-Messungen von Patienten verwendet. Nach Ende einer eher großzügigen Quarantäne wäre es wichtiger, die Neuansteckungen zu erfassen, die immer noch aus Kapazitätsgründen abgewiesen werden. Ähnlich konfus sind im Augenblick auch die “Gesund”meldungen der Landkreise.

Auch wären gepoolte Messungen sinnvoll, die schon lange etabliert sind.

 

CC-BY-NC Science Surf accessed 30.11.2025

Was sie gesagt haben ist so wirr, dass ich nicht mal sagen kann, ob es Unsinn ist oder nicht

Das Pauli Zitat ist wunderbar (“What you said was so confused that I could not tell whether it was nonsense or not”) !

Anders als mit Pauli kann man aber auch den neuesten Ioannides Artikel nicht kommentieren, der das absolute Risiko der Mortalität am Beginn der Pandemie rechnet. Es ist so ähnlich, als würde man das Mortalitätsrisiko der Appendizitis am Diagnosetag für die nächsten 24 Stunden berechnen. Das wäre dann auch nur 5% und würde ernsthaft in Frage stellen, ob Blinddarm Operationen wirklich sinnvoll sind denn eine Operation hat ja schliesslich auch Nebenwirkungen (Infektion, Nachblutung, Thrombose). Allerdings würde dieser Denkfehler vielen Menschen das Leben kosten.

Ich sehe hier nicht so sehr das Ende von EBM ( der “evidence-based medicine”) aber sehr wohl das Limit und die Unfähigkeit mit neuen und dynamischen Sachverhalt umzugehen.

 

3.5.2020 2. Anlauf Versionsvergleich

https://draftable.com/compare/EypQweFxGwmY

 

CC-BY-NC Science Surf accessed 30.11.2025

Faktencheck “eventuelle Dunkelziffer”

Christian Drosten meinte gestern auf Twitter an seine 232K Follower über “eine eventuelle Dunkelziffer”: “Hier sollten wir zum gegenwärtigen frühen Zeitpunkt der Epidemie nicht allzuviel erwarten.” Drosten räumt ja sonst immer sympathisch ein, wenn er etwas nicht weiss. Leider macht er das nicht immer bei epidemiologischen Fragen…

Schauen wir uns die Fakten an.

Den Begriff Dunkelziffer gibt es eigentlich nicht in der Epidemiologie, ich vermute der Begriff soll das ascertainment bias oder selection bias beschreiben. Auf Deutsch also etwas, was man nicht weiss. Der Zusatz “eventuell” stellt jedenfalls die “Dunkelziffer” in Frage.

DLF-Wissenschaftsredakteur Volkart Wildermuth hat den Sachstand zusammengefasst

Forscherinnen und Forscher der Columbia Universität kommen in einer Simulation zu dramatischen Dunkelziffern. Sie haben die Ausbreitung des Coronavirus mit einem Pandemie-Simulationsprogramm nachgespielt. Die Daten für ihre Berechnungen stammten aus der frühen Phase der Epidemie in China, als es noch keine Kontaktbeschränkungen gab. Demnach kamen auf jeden nachweislich Infizierten etwa sieben unentdeckte Fälle, schreiben die Autoren im Fachmagazin “Science” […]

Das Robert-Koch-Institut geht zwar ebenfalls von einer Dunkelziffer aus. Präsident Wieler sagte, die gebe es bei jeder Infektionskrankheit. Es gebe aber keinen Anlass, von einer besonders hohen Dunkelziffer auszugehen, weil in Deutschland sehr früh am Anfang der Coronakrise mit Tests begonnen worden sei und generell sehr viel getestet werde. Der RKI-Präsident betonte aber, dass nach aktuellem Stand die Hälfte der Infizierten tatsächlich auch an der Krankheit Covid-19 erkrankt. „Die anderen Hälfte sehen wir gar nicht.“

Die Autoren des Science Artikels vermuten, das 86% aller Infektionen unbekannt blieben, Wieler geht von 50%. Ich gehe nach Hochrechnung auf Landkreisebene über die Ärztedichte ebenfalls von 50% bis 90% aus.

Und von der Bestimmung sei nicht “allzuviel zu erwarten”? Obwohl sie die Basis jedes SEIR Modells ist, mit dem S=susceptible, E=exposed, I=infected, R=recovered berechnet wird? Wenn die Dunkelziffer, einmal angenommen bei 90% liegen sollte, dann würden 83 Millionen Deutschen im Augenblick nicht 100.000 Infizierten gegenüber stehen, sondern 1 Million. Ein gewaltiger Unterschied, der eine völlig andere Einschätzung bedeuten würde (die Hotspot Rechnungen in Bergamo und New York sind nochmal eine ganze andere Frage – die meisten Experten gehen hier von self-enforcing loops und tipping points aus).

Es ist zudem wenig hilfreich, den Wert von epidemiologischen Studien zu bezweifeln, wo es immer große Anstrengungen kostet, Teilnehmer von Studien zu überzeugen. Und was meint Drosten mit frühem Zeitpunkt der Pandemie? In Deutschland trat der erste Fall am 28.1. auf, Wieler sagte am 27.2. die Deutschen sollten zu Hause bleiben, Kekulé am 17.3. dass wir die exponentielle Phase erreicht haben. Gestern war der 8.4. also mehr als drei Wochen nach Beginn der exponentiellen Phase? Oder geht Drosten von einem mehrjährigen Verlauf aus?

Fazit: Es gibt eine Dunkelziffer, die nach aktueller Schätzung mindestens bei 50%, eher Richtung 90% liegt. Da die Verläufe in den einzelnen Landkreisen sehr unterschiedlich sind, brauchen wir repräsentative Bevölkerungsstudien in allen Altersgruppen.

Der Blindflug geht also weiter.

PS. Noch zwei Plots zur Dunkelziffer von Viruserkrankungen bei Kindern. Kinder werden aktuell kaum getestet, weder on demand noch bei der extra angelegten Studie in München. Wie wird man die Schulöffnung nach den Osterferien begründen? Bauchgefühl? Druck aus der Wirtschaft? Und woran wird man merken, dass die Schulöffnung doch zu früh kam ( so wie in St Louis 1917  )?

Quelle RKI abgerufen am 9.4.2020 Lagebericht 8.4.2020, S.4. https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Situationsberichte/2020-04-08-de.pdf?__blob=publicationFile Kinder werden bisher kaum getestet, obwohl sie am ehesten asymptomatische Virusträger sind.

Die Gruppe Kinder bis 14 Jahre ist bei sonstigen Viruserkrankungen immer am häufigsten betroffen. Sollte COVID-19 sich so viel anders ausbreiten?

Quelle RKI abgerufen am 9.4.2020 Bericht zur Epidemiologie der Influenza in Deutschland Saison 2017/18 2017, S. 28, https://influenza.rki.de/Saisonberichte/2017.pdf KInder im Alter 5-14 Jahre haben die höchste Rate an positiven Influenza Tests.

Die bayrische Staatsregierung äussert sich jedenfalls euphorisch zu der mit Polizeischutz durchgeführten und von Mercedes gesponsorten Studie aus “gebündelter wissenschaftlicher Kompetenz” (Söder).

PS. 14% sind angeblich immun in Gangelt laut der gerade gelaufenen Pressekonferenz (ich hoffe der Antikörper von Streeck ist spezifisch) während wir bisher von 0,5% in dem Landkreis ausgingen.  Der Link zu dem Report war  auf land.nrw ist leider tot.

 

CC-BY-NC Science Surf accessed 30.11.2025

Wunderwaffe?

“Silver bullet” ist eigentlich übersetzt Wunderwaffe oder Königsweg. Ob die Corona-Epidemie zum Wegbereiter einer Klimawende wird? Mehre Twitter Beiträge heute verlinken auf einen medium Artikel von Brad Zarnett ” Das Problem ist nicht Plastik, nicht die Abholzung, nicht das Auslöschen einer Spezies oder der  Biodiversität, es ist die Art und Weise wie wir unser Zusammenleben gestalten, wie wir Geschäfte machen und wie wir den Fortschritt messen”

https://twitter.com/BradZarnett/status/1245320838963920896

Something changed recently when I saw a map comparing the air over China before and after the country went into lockdown in an attempt to contain the COVID-19 Coronavirus. Slowly over the course of a week, I began to see the issue of climate change in a whole new light. … The path towards a stable climate will need to run through some kind of economic collapse. It will have nothing to do with a more sustainable business model or more progressive government action — both of those approaches have failed. Let’s face it — people just don’t feel the urgency to change how they live their lives and government is too weak and/or corrupt to lead the way.

 

CC-BY-NC Science Surf accessed 30.11.2025