Wie kann man wissenschaftliche Publikationen richtig einschätzen und interpretieren? Wir erklären, worauf man achten kann, und bringen die Kriterien dazu.
In vielen Artikeln und Blogs, die online verfügbar sind, finden sich Verweise auf wissenschaftliche Schlussfolgerungen mit Formulierungen wie "veröffentlicht in einer wissenschaftlichen Zeitschrift", "veröffentlicht in einem internationalen Journal" oder "veröffentlicht in einem von Experten begutachteten Journal". In der wissenschaftlichen Gemeinschaft ist bekannt, dass nicht alle wissenschaftlichen Daten "gute Daten" sind; und nur, weil etwas "veröffentlicht" ist, bedeutet das nicht, dass man dem Inhalt vertrauen kann.
In der Forschung ist es leider oft so, dass es kaum eine Studie gibt, die so schlecht ist, dass sie sich nicht irgendwo publizieren lässt. Wenn die Arbeit für ein renommiertes Journal nicht genügt, lässt sich in der Regel ein anderes mit weniger strengen qualitativen Auflagen finden, in dem der Artikel erscheint. Ob es sich nun um akademische Forscher handelt, die versuchen, unter dem Druck des "publish-or-perish"-Prinzips zu überleben (entweder, man publiziert und erhält Geld, oder man muss die Forschungen einstellen), oder um Aktivisten und Organisationen, die ihre Agenda in die Öffentlichkeit tragen, oder um einen "harmlosen" Studenten, der versucht, ein paar Publikationen in seinem Lebenslauf unterzubringen - unzuverlässige Veröffentlichungen können aus verschiedenen Quellen stammen.
Dies macht es äusserst schwierig, fundierte Entscheidungen auf der Grundlage wissenschaftlicher Daten zu treffen. Im Folgenden finden Sie einige Hinweise, die Ihnen helfen können, die Zuverlässigkeit der Veröffentlichung zu beurteilen, die Studie zu interpretieren und kritisch zu überlegen, ob die Daten vertrauenswürdig sind.
Wenn es darum geht, eine wissenschaftliche Veröffentlichung kritisch zu bewerten, lassen sich zwei Aspekte analysieren: die Quelle der Arbeit und die Qualität der Studie. Zur Quelle gehört, wo die Arbeit veröffentlicht ist und wer die Studie durchgeführt hat. Die Qualität der Studie umfasst das Studiendesign, den Stichprobenumfang, die Dauer, die statistische Signifikanz usw.
1) Peer-Review oder nicht: In wissenschaftlichen Arbeiten bringt man der Leserschaft oft komplexe Konzepte näher. Nicht nur, dass es für den "Normalbürger" unmöglich ist, die Gültigkeit solcher Konzepte zu verstehen; auch wissenschaftliche Forscher, die nicht in diesem speziellen Bereich arbeiten, sind nicht in der Lage, die Gültigkeit der Behauptungen zu bestätigen. Daher gibt es in vielen wissenschaftlichen Zeitschriften erst eine Veröffentlichung einer Arbeit, nachdem man diese durch "Peers" überprüft hat. Bei den "Peers" handelt es sich um Wissenschaftler, die in einem ähnlichen Forschungsbereich tätig sind und sich mit dem spezifischen wissenschaftlichen Gebiet, das in der Arbeit im Fokus steht, auskennen. Es geht dabei um eine "Qualitätskontrolle", bei der man nur wissenschaftlich fundierte Arbeiten aussucht. Deshalb ist es bei der Auswahl von wissenschaftlichen Arbeiten wichtig, zu prüfen, ob man es mit einer "peer-reviewed"-Veröffentlichung zu tun hat. Auf den Websites der Zeitschriften sind diese Informationen zu finden.
2) Qualität der Zeitschrift: Nicht alle von Fachleuten begutachteten Zeitschriften sind von gleicher "Qualität". Einige Zeitschriften sind seriöser und zuverlässiger als andere. Der "Impact-Faktor" (engl. Impact Factor) ist ein Mass für die Zuverlässigkeit der Zeitschrift. Der Impact-Faktor misst, wie oft sich die in dieser Zeitschrift veröffentlichten Arbeiten in anderen Publikationen als Zitat wiederfinden. Allgemein gilt: Je höher der Impact-Faktor, desto zuverlässiger die Zeitschrift. Allerdings steht der Impact-Faktor in der wissenschaftlichen Gemeinschaft auch wegen seiner zahlreichen Einschränkungen in der Kritik.
Obwohl der Impact-Faktor ein einfaches Mittel ist, um die Qualität einer Zeitschrift zu bewerten, sollte man als LeserIn Artikel in Zeitschriften mit geringerem Impact-Faktor nicht allein auf der Grundlage dieser Zahl ignorieren.
3) Interessenkonflikte der Autoren: Wenn jemand eine Forschungsarbeit über die Vorteile von pflanzlichen Fleischersatzprodukten veröffentlicht - und gleichzeitig mit einem Unternehmen verbunden ist, das diese Erzeugnisse herstellt, kann die Forschung von Geschäftsinteressen beeinflusst sein. Ähnlich verhält es sich, wenn eine Studie über den ökologischen Landbau durch einen Öko-Anbauverband finanziert ist: Es ist wahrscheinlich, dass man die Forschung "eingerichtet" hat, um eine Agenda zu unterstützen, welche die finanzierende Einrichtung fördert. Daher ist es wichtig, die Autoren und ihre Zugehörigkeit zu überprüfen. Diese Angaben sind in der Regel unter dem Titel der Arbeit zu finden. Die meisten Arbeiten enthalten auch einen Abschnitt "Interessenkonflikte" und "Finanzierung", in dem die Autoren angeben müssen, ob ein Interessenkonflikt besteht und wie man die Studie finanziert hat. Allerdings gibt es auch Schlupflöcher – so könnte eine grössere Firma eine andere (nicht in direktem Zusammenhang stehende) Firma mittels Transaktionen dazu bewegen, eine Studie zu finanzieren, die für sie von Interesse ist.
4) Fragestellung: Eine gute wissenschaftliche Studie beginnt mit einer Fragestellung, die sich in der Regel auf Voruntersuchungen stützt. Diese Frage muss objektiv sein und es sollte eine Möglichkeit geben, sie zu überprüfen. Sobald die Frage definiert ist, stellen die Wissenschaftler eine Hypothese auf. Die Hypothese ist eine Vorhersage darüber, wie die Antwort auf die Frage lauten könnte, und kann in zwei Alternativen auftreten: Nullhypothese (H0) und Alternativhypothese (H1).
In einer von uns gezeigten Studie zielen die Autoren beispielsweise darauf ab, die Frage zu beantworten: Verringert der Verzehr von Walnüssen das Risiko einer koronaren Herzkrankheit?
Um diese Frage zu beantworten, definierten die Wissenschaftler einige Variablen wie LDL-Cholesterin, HDL-Cholesterin und Triglyceride, die sich als Mass für die kardiovaskuläre Gesundheit verwenden lassen. Die Nullhypothese (H0) lautet: Der Walnusskonsum hat keinen Einfluss auf die Messgrössen für die kardiovaskuläre Gesundheit wie LDL-Cholesterin, HDL-Cholesterin und Triglyceride. Die Alternativhypothese (H1) lautet: Der Verzehr von Walnüssen wirkt sich positiv auf die genannten Messgrössen aus (LDL-Cholesterin, HDL-Cholesterin und Triglyzeride) - und somit auf die Messung der kardiovaskulären Gesundheit.
Als Nächstes legen die Autoren den Versuchsplan, die Stichprobengrösse, die Dauer der Studie, die Häufigkeit der Datenerhebung und die Methoden der Datenanalyse fest (mehr dazu weiter unten). Sobald die Daten zur Verfügung stehen und man sie analysiert hat, liegt es in der Verantwortung der Forscher, die Daten zu interpretieren, Schlussfolgerungen abzuleiten und zu bestimmen, ob die Nullhypothese oder die Alternativhypothese bewiesen ist.
Bei der Durchsicht einer wissenschaftlichen Publikation ist es wichtig, darauf zu achten, ob die Hintergrundinformationen (in der Einleitung und in der Diskussion) ein ausgewogenes Bild der vorhandenen Informationen vermitteln und alle Beweise und Argumente berücksichtigen. Wenn die Hintergrundinformationen einseitig sind und von einer bestimmten "Denkschule" beeinflusst zu sein scheinen, könnte dies ein Hinweis darauf sein, dass die Forscher Daten zur Unterstützung einer vorgegebenen Schlussfolgerung ableiten wollten.
Ob mit oder ohne Peer-Review, nur weil eine wissenschaftliche Arbeit veröffentlicht ist, heisst das nicht, dass es sich um gute Daten handelt. Der Leser muss die Studie kritisch prüfen und eine fundierte Entscheidung treffen, ob er den Schlussfolgerungen trauen kann oder nicht. Es ist jedoch nicht einfach, sich im wissenschaftlichen Fachjargon zurechtzufinden. Hier sind einige Hinweise, die helfen sollen, den Jargon zu entschlüsseln und zu verstehen, wie die wissenschaftlichen Studien und ihre Daten aussehen.
Studienart: Wissenschaftliche Studien verwenden unterschiedliche Versuchspläne (klinische Studien, randomisierte Kontrollstudien, Beobachtungsstudien, Kohortenstudien usw.) und all diese Begriffe können verwirrend sein. Im Folgenden finden Sie eine vereinfachte Erklärung dieser Begriffe.
Stichprobengrösse: Die in einer Studie verwendete Stichprobengrösse, also die Anzahl der untersuchten TeilnehmerInnen/Versuchsorganismen, bestimmt die Genauigkeit und Aussagekraft der Daten sowie die Schlussfolgerungen. Obwohl grössere Stichproben zu einer grösseren statistischen Aussagekraft führen können, müssen Forscher bei der Entscheidung über die Stichprobengrösse auch die Durchführbarkeit und Sinnhaftigkeit des Experiments berücksichtigen. Gleichzeitig ist es unwahrscheinlich, dass Daten, die man bei sehr wenigen Personen erhoben hat, die Auswirkungen auf die Gesamtbevölkerung korrekt wiedergeben. Statistiker verbringen viele Stunden damit, den für eine Studie erforderlichen Mindeststichprobenumfang zu berechnen.
Dauer: Die Dauer von experimentellen/interventionellen Studien kann variieren. In der Regel gibt es keine spezifische Methode zur Berechnung der Dauer einer Studie. Es ist jedoch wichtig, die Forschungsfrage kritisch zu bewerten und die praktischen Auswirkungen der vorgeschlagenen Interventionen zu bestimmen. Wenn die Forscher beispielsweise den gesundheitlichen Nutzen eines Nahrungsergänzungsmittels untersuchen, ist es unwahrscheinlich, dass die Verabreichung des Mittels über einen Zeitraum von 7 bis 10 Tagen eine dauerhafte Wirkung auf die Gesundheit hat. Untersuchen die Forscher hingegen die Wirksamkeit eines Antibiotikums, dann kann eine 7- bis 10-tägige Studie wahrscheinlich konkrete Ergebnisse liefern, da der Effekt der Antibiotika schnell eintritt.
Was ist der p-Wert?
Was ist ein Konfidenzintervall?
Primärforschung vs. Sekundärforschung
Systematische Überprüfung vs. Meta-Analyse
In vitro, in vivo, in silico
Mark Twain sagte einmal: Es gibt drei Arten von Lügen: Lügen, verdammte Lügen und Statistiken. In einem Artikel der Fakultät der Wharton School der University of Pennsylvania hat man den Missbrauch von Statistiken wie folgt zusammengefasst: Die Aussagekraft einer statistischen Analyse ist nur so gut wie ihre einzelnen Bestandteile.2 Unabhängig davon, ob es sich um eine Voreingenommenheit handelt oder um die "Notwendigkeit", eine bestimmte Schlussfolgerung zu ziehen, sind Forscher dafür bekannt, das Publikum durch Statistiken in die Irre zu führen. Interessengesteuerte (nicht objektive) Stichproben, unvollständige Daten, die ausschliessliche Analyse derjenigen Variablen, die vorgegebene Schlussfolgerungen unterstützen, fehlerhafte Korrelationen und ausgefallene (aber irreführende) Diagramme sind nur einige Möglichkeiten, wie Statistiken uns blenden können3.
Ein Beispiel dafür ist eine "umstrittene Statistik" zur Förderung von kommerziellen Interessen. Eine solche Verwendung von statistischen Daten ist die Behauptung der Firma Coca-Cola, dass der Konsum von 3 Dosen Enviga pro Tag, einem von Coca-Cola vertriebenen grünen Tee, zu einer Gewichtsabnahme führt. Die Analyse der Behauptungen ergab jedoch, dass man 35 Tage lang ständig Enviga konsumieren müsste, also 105 Dosen zu einem Preis von etwa 146 Dollar, um auch nur ein Pfund möglichen Gewichtsverlust zu erzielen.4 Eine Meta-Analyse von Erhebungen über wissenschaftliches Fehlverhalten ergab, dass bis zu 33,7 % der befragten Wissenschaftler fragwürdige Forschungspraktiken zugaben, einschliesslich der Fälschung und Verfälschung von Daten. Dieser Anteil lag bei 72 %, wenn man die Befragten danach gefragt hat, ob ihre Kollegen wissenschaftliches Fehlverhalten an den Tag legten.5 Diese Zahlen sind in der Tat besorgniserregend und machen es für den Durchschnittsbürger schwierig, Schlussfolgerungen aus wissenschaftlichen Berichten zu ziehen.
Daher ist es wichtig, bei der Überprüfung von wissenschaftlichen Daten stets skeptisch und kritisch zu sein. Der gesunde Menschenverstand ist wahrscheinlich unser bester 'Schutz' gegen schlechte Daten. Wir müssen die Daten und Versuchsmethoden kritisch analysieren, den Hintergrund des Forschers untersuchen, uns über etwaige Interessen und Interessenkonflikte im Klaren sein und eine fundierte Entscheidung darüber treffen, ob wir den Daten vertrauen können oder nicht.
Dazu kommt, dass die Wirtschaft die allermeisten Studien veranlasst und/oder finanziert, oft mit klarem Ziel. Stimmt das Resultat, kommt das gross in die Medien, die es dann als reine Echokammern vervielfachen. Schliesslich nehmen das auch zahlreiche ErnährungsberaterInnen kritiklos auf.
Kommentare