Warum die Teilnehmerzahlen so niedrig sind in deutschen Studien

Responsezahlen sind für Epidemiologen entscheidend, wenn es um Repräsentativität und Verallgemeinerung von Schlussfolgerungen geht. Denn mit sinkender Response verändern sich nicht nur massiv Risikokonstellationen, auch werden Krankheitshäufigkeiten falsch geschätzt. Mit niedriger Response sind üblicherweise mehr Kranke in dem Untersuchungskollektiv (weil sie mehr Zeit haben und sich vielleicht auch mehr von einer Studie erwarten). Es fehlen dann aber die gesunden Probanden, an denen man protektive Faktoren studieren könnte. Mit niedriger Response sind gewöhnlich auch Frauen überrepräsentiert, oft auch Arbeitslose und bildungsfernere Schichten. Die einzelnen Faktoren haben zwar keine direkte Beziehung, in Kombination verzerren sie aber Studienergebnisse bis zur Unkenntlichkeit. In der Literatur ist dies auch als selection bias bekannt. Leider gibt es keine guten statistisches Verfahren, um für den selection bias zu korrigieren. Wie sollte das auch gehen? Daten können hier kaum extrapoliert werden. Wann ein solcher Selektionsbias einsetzt, kann man nicht eindeutig sagen. Mit 90% Teilnehmerate ist man auf der sicheren Seite, unter 50% wird es kritisch und irgendwann dann sinnlos. 75% Response sind in der Epidemiologie  Standard, in der Marktforschung begnügt man sich auch mit weniger. Der Qualitätsmaßstab in der Epidemiologie liegt aber wegen der Relevanz deutlich höher. In der Vorbereitung
der Scobel Sendung habe ich mir die Unterlagen der Nationalen Kohorte angesehen – ein ambitioniertes Projekt mit angestrebt 200.000 Teilnehmern bundesweit. Wegen des hohen Ressourcenbedarfs sind solche Projekt umstritten, da viele Wissenschaftler glauben, das Geld würde besser direkt in fachbezogene Studien gesteckt. Das stimmt aber nur vordergründig, denn protektive Faktoren, egal ob aus Umwelt oder Genetik, kann man in fachbezogenen Studien kaum identifizieren. Und weil Prävention eben meist doch besser als Therapie ist, macht es wissenschaftlich Sinn, große bevölkerungsbezogene Studien durchzuführen. Leider zeigt die Pilotphase der Nationale Kohorte nun aber doch, daß die Teilnahmerate mit 17%-23% sehr niedrig ausfällt. Die Autoren schreiben in der Einleitung ihres Artikels

The willingness of individuals to take part in epidemiological studies depends on several factors. Among these are monetary and non-monetary incentives, interesting and short questionnaires, as well as different follow-up procedures.

Nachdem es aus nachvollziehbaren Gründen kein Honorar für die Teilnahme an epidemiologischen Studien gibt, bleiben eigentlich nur ideelle Gründe an einer Studie teilzunehmen: intrinsische Motivation, oder auch individuelle  Kosten-Nutzung Überlegungen. Die Länge des Fragebogens, Dauer der Untersuchung oder Followup Prozeduren sind dabei wohl eher nachgeordnet bei der primären Entscheidung an einer Studie teilzunehmen. In der Veröffentlichung werden jedenfalls diverse Einflußfaktoren auf die Response untersucht, so etwa die persönliche Ansprache, Rekrutierungsstrategie und regionale Charakteristika wie Stadtgröße.  Das sind sicher relevante Faktoren, greift als Erklärungsansatz  jedoch zu kurz, denn die geringe Zahl der Responder kann ja gerade nicht erklären, warum die Response so niedrig ist. Was hier fehlt, ist eine Non-responder Analyse. Man müsste also Teilnehmer fragen, die nicht an der Studie teilnehmen wollen. Dabei vermute ich die Probleme auch nicht bei der Rekrutierungsstrategie, sondern eher in dem Durchführungsmodus wie er in diversen online Dokumenten beschrieben ist, zum Beispiel die Zustimmungsregelung:

dass Proben und Daten an Stellen außerhalb des Vereins „Nationale Kohorte e.V.“ allenfalls in pseudonymisierter Form, d.h. ohne Mitteilung von personenidentifizierenden Daten weitergeben werden, sodass sie für den Empfänger lediglich in anonymisierter Form vorliegen

Dieses Thema haben wurde auch kurz in der Scobel Sendung angesprochen.. Leider es aber so, daß es in der Postgenomphase praktisch keine Anonymität mehr gibt. Eine Nonresponder Studie müsste also unbedingt klären, ob dieser Passus zur mangelnden Teilnahmebereitschaft so vieler Probanden geführt hat. Es sind aber noch mehr Stellen in dem Kleingedruckten, die man entsprechend überprüfen könnte

dass ihre Daten und Bioproben langfristig gespeichert und gelagert und für zukünftige Forschungsfragen genutzt werden. In Zukunft können Fragen auftreten, welche den Einsatz neuer Methoden oder die Ausweitung der ursprünglichen Forschungsvorschläge bedingen, bspw. aufgrund neuer Techniken oder wachsenden Wissens bzw. neuer Erkenntnisse, die zum Zeitpunkt der Rekrutierung noch nicht definiert oder noch unbekannt waren. Die Einwilligung der Teilnehmer umfasst auch eine Nutzung ihrer Daten und Materialien für diese Zwecke.

Die Formulierung steht in Widerspruch zu der Transparenzforderung, die der Deutsche Ethikrat aufgestellt hat (zusätzliches umfangreiches und exzellentes Material bei der Anhörung im April 2011). Es gibt dazu auch empirisches Material z.B. aus dem Jahr 2009 und auch nach einer Studie im Jahr 2010  wollen 75% der Deutschen jedesmal neu  informiert werden, wenn eine neue Unterschung ihrer aufbewahrten Proben ansteht (diskutiert in Herbert Gottweis/Jane Kaye “Biobanks for Europe. A challenge for governance”, 2012; Daten sind entnommen von Geoge Gaskell et. al, Europeans and biotechnology, 2010). Deutschland liegt dabei an 4. Stelle in Europa, was den Informationswunsch angeht. Es mag hier nun Zufall sein, daß 75% der Teilnehmer nicht an der Studie teilnehmen wollen und ebenso 75%  über jeden Schritt informiert werden wollen. Zumindest vor 20 Jahren wäre es noch schwierig gewesen, Probanden über jeden weiteren Schritt zu informieren.  Heute sollte das aber kein Problem mehr sein, wenn man sich unseren Implementierungvorschlag ansieht.

Die Antwort auf die Frage, warum die Teilnehmerzahlen so niedrig sind in deutschen Studien,  bleibt leider spekulativ, während eine relativ einfache Non-Responder Studie die Antwort geben könnte. Wie die Autoren allerdings zu der Schlußfolgerung kommen

With respect to the overall response for the NaKo, the results are encouraging.

kann ich nicht recht nachvollziehen, ebenso wie die Folgerung

Increasing the awareness of the study seems to be very important.

Gerade die Aufmerksamkeit ist doch hoch. Die Startphase der UK Biobank war mit 10% auch nicht berauschend und liegt jetzt nur noch bei 5.5%.  Damit kommen wir wieder zum Startfrage, warum die Responseraten so wichtig sind.
Seit neuestem wird nämlich ein Selektionsbias von den  Betreibern der UK Biobank bestritten, mit Sicherheit nicht aus theoretischen sondern aus pragmatischen Gründen um die Studie weiter zu führen. Swanson 2012 kommentiert dazu jedoch folgerichtig

The warning given by Berkson should be noted: if selective probabilities operate independently to draw individuals to a sample, these diseases might seem to be associated when they are not. He showed that “the ratio of multiple diagnoses to single diagnoses in the [sample] will always be greater than in the population; for two diagnoses the ratio will be about twice that of the general population, for three diagnoses about three times, and so forth” and that “the spurious correlations referred to are not a consequence of any assumptions regarding biological forces, or the direct selection of correlated probabilities, but are the result of merely ordinary compounding of independent probabilities”.