Artikel Kopfzeile:
Lebensmittelstudien
Darum solltest du nicht jeder Ernährungsstudie glauben
Lebensmittelstudien sind in vielerlei Hinsicht fehleranfällig. Das führt zu kuriosen, teils widersprüchlichen Ernährungsempfehlungen.
Sprungmarken des Artikels:
Inhalt
- Darum geht‘s: Die meisten Lebensmittelstudien sind nicht haltbar
- Die Macht der Schlagzeilen
- Viele Einzelstudien sind methodisch falsch designt
- Studien werden mitunter falsch interpretiert
- Menschen sind mehr als die Summe ihrer Zellen
- Forscher:innen sind auch nur Menschen
- Und jetzt? So findest du vertrauenswürdige Ernährungsempfehlungen
- Darum geht‘s: Die meisten Lebensmittelstudien sind nicht haltbar
- Die Macht der Schlagzeilen
- Viele Einzelstudien sind methodisch falsch designt
- Studien werden mitunter falsch interpretiert
- Menschen sind mehr als die Summe ihrer Zellen
- Forscher:innen sind auch nur Menschen
- Und jetzt? So findest du vertrauenswürdige Ernährungsempfehlungen
Artikel Abschnitt: Darum geht‘s:
Darum geht‘s:
Die meisten Lebensmittelstudien sind nicht haltbar
Im Jahr 2012 veröffentlichten die US-Wissenschaftler Jonathan Schoenfeld und John Ioannidis eine Metaanalyse, deren Titel allein schon Bände spricht: "Ist alles, was wir essen, mit Krebs verbunden?" Hierfür suchten sie sich aus diversen Kochbuchrezepten 50 Allerweltszutaten und durchsuchten einschlägige Datenbanken nach Einzelstudien, die zu diesen Zutaten durchgeführt worden waren. Für 80 Prozent fanden sie wissenschaftliche Studien, die diesen Lebensmitteln krebsfördernde oder krebshemmende Wirkungen zusprachen. Die meisten Studien wiesen jedoch methodische Fehler auf oder ließen schlicht die publizierte Schlussfolgerung nicht zu.
Das Fazit: Nicht die Lebensmittel sind das Problem, sondern die Studien und wie sie durchgeführt sowie interpretiert werden. Warum ist das so?
Artikel Abschnitt: Die Macht der Schlagzeilen
Die Macht der Schlagzeilen
Vielfach übernehmen Medien ungeprüft Pressemeldungen über Studienergebnisse. Eine scheinbar sensationelle Falschmeldung verbreitet sich dann wie ein Lauffeuer. Denn natürlich lassen sich Schlagzeilen wie "Kaffeegenuss lässt Brüste schrumpfen" besser verkaufen als "Eine bestimmte Variante des Gens CYP1A2 tritt bei weiblichen Kaffeevieltrinkern in Kombination mit einem geringeren Brustvolumen auf".
Ob zum Beispiel Tofu das Brustkrebsrisiko verringert, das erklären wir hier.
Eine selektive Berichterstattung verzerrt das öffentliche Bild
Die Ergebnisse der Studie wurden nicht nur falsch, sondern auch unvollständig wiedergegeben. Denn schließlich hatte eine zweite Frauengruppe ja größere Brüste. Dieses selektive Heraussuchen von Schlussfolgerungen nennt sich Subgruppenanalyse oder Rosinenpicken (Cherry picking) und kommt bei Forschenden und Journalist:innen gleichermaßen vor. Die eigentliche Aussage wird dadurch verzerrt.
Was es mit dem schlechten Ruf von Glutamat auf sich hat, das erklären wir hier.
Hinzu kommt, dass in der Regel gar nichts veröffentlicht wird, wenn bei einer Studie keine signifikanten Ergebnisse festgestellt werden – oder es wird nicht darüber berichtet. Schlagzeilen wie "Eine Studie zeigt: Warmer Grießbrei ist lecker, macht aber weder krank noch gesund“ verkaufen sich eben nicht gut.
Ein weiteres Manko der schwedischen Studie war die geringe Anzahl an teilnehmenden Frauen. Das führt uns zu einem zweiten Schwachpunkt von Lebensmittelstudien.
Artikel Abschnitt: Viele Einzelstudien sind methodisch falsch designt
Viele Einzelstudien sind methodisch falsch designt
Response Bias – die Antworttendenz
Für Lebensmittelstudien werden die Studienteilnehmer:innen oft zu ihren Lebens- und Ernährungsgewohnheiten befragt. Menschen tendieren in einer solchen Situation dazu, Antworten zu geben, von denen sie annehmen, dass ihr Gegenüber sie erwartet. Zudem erinnern sie sich nicht immer an alle Details in der Vergangenheit.
Selection Bias – die Stichprobenverzerrung
Die Auswahl der Proband:innen muss zufällig erfolgen. Dabei sind Faktoren wie Alter, Geschlecht, Sozialstatus, kultureller Hintergrund oder Gesundheitszustand relevant. Suche ich aber zum Beispiel Studienteilnehmer:innen über das Internet, spreche ich automatisch vermehrt medienaffine und jüngere Menschen an. Die Studiengruppe ist dann nicht repräsentativ.
Anzahl der Teilnehmenden und Beobachtungszeit
Die Größe einer Probandengruppe und die Zeit der Beobachtung hängt ab von dem zu erwartenden Effekt. Bei Lebensmitteln ist dieser in der Regel sehr klein. Dementsprechend groß muss die Anzahl der Studienteilnehmer:innen sein, um einen zufälligen Befund auszuschließen. Die Proband:innen müssen im optimalen Fall viele Monate oder Jahre beobachtet werden. Wenn also eine Studie mit 20 Männern nach nur zwei Wochen Beobachtung feststellt, dass der Konsum von Walnüssen den Blutdruck senkt, darf das getrost infrage gestellt werden.
Artikel Abschnitt: Studien werden mitunter falsch interpretiert
Studien werden mitunter falsch interpretiert
Signifikanz und der p-Wert
Ist in Studien von signifikanten Ergebnissen die Rede, geht es meist um den sogenannten p-Wert. Der beschreibt die Wahrscheinlichkeit, mit welcher das Testergebnis von einem zufälligen Befund abweicht. Je kleiner der Wert – der immer zwischen 0 und 1 liegt –, umso wahrscheinlicher. Bei einem p-Wert von 0,01 etwa würde ein Prozent der Ereignisse zufällig auftreten. Ermittelt wird der p-Wert mit der Hilfe statistischer Tests. Schauen wir noch einmal auf die zuvor angesprochene Metastudie von Schoenfeld und Ioannidis: 75 Prozent der potenziell Krebs-assoziierten Kochzutaten zeigten nur eine sehr schwache oder sogar keine statistische Signifikanz. Derartige Ergebnisse sind wissenschaftlich nur bedingt belastbar.
Ursache und Wirkung: Korrelation oder Kausalität?
Ein besonders anschauliches Beispiel wurde im Jahr 2004 von Thomas Höfer und Kolleginnen vom Bundesinstitut für Risikobewertung (BfR) veröffentlicht: Sie stellten einerseits fest, dass die Storchenpopulation in Berlin und Brandenburg seit 1990 stetig zunahm. Im gleichen Zeitraum stieg andererseits die Geburtenrate in Berlin, genauer die Anzahl der Babys, die außerhalb von Krankenhäusern zur Welt kamen. Ganz offensichtlich korrelieren die Anstiege, zeigen also einen lokalen, zeitlichen Zusammenhang.
Dennoch leuchtet ein, dass diese als "Theory of the Stork" bekannte Theorie keine kausale Abhängigkeit aufweist. Grund für solche Scheinkorrelationen sind fehlerhaft ausgewertete Daten.
Ebenso kritisch müssen Lebensmittelstudien betrachtet werden. Lebt eine Gruppe wirklich länger, weil sie in den letzten 15 Jahren dreimal pro Woche fünf Äpfel gegessen hat? Oder hat diese Gruppe etwa zusätzlich regelmäßig Sport getrieben? Dies führt uns zum nächsten Punkt.
Artikel Abschnitt: Menschen sind mehr als die Summe ihrer Zellen
Menschen sind mehr als die Summe ihrer Zellen
Für eine verwertbare Lebensmittelstudie wären wie in Medikamentenstudien zwei Gruppen von optimalerweise mehreren Hundert Proband:innen nötig, die sich exakt gleich ernähren. Alle müssten gleich viel Sport treiben oder spazieren gehen, rauchen oder nicht rauchen. Die eine Gruppe erhielte dann zusätzlich ein Nahrungsmittel A, die andere ein Nahrungsmittel B. Weil der zu erwartende Effekt gering ist, müsste die Studie zudem über viele Jahre laufen.
In der groß angelegten EPIC-Studie (European Prospective Investigation into Cancer and Nutrition) werden seit 1992 über 500.000 Männer und Frauen in Europa gesundheitlich überwacht, mit einem Blick auf Ernährung und Verhalten. Eine solche Langzeitstudie ist sicherlich schon besser als kurzfristige Einzelstudien, die Frage nach möglichen Kausalitäten bleibt jedoch. Denn nach wie vor spielen viele Faktoren im Leben der Menschen eine Rolle. Menschen essen nie nur ein einzelnes Nahrungsmittel.
Bleiben wir beim Kaffee. Stammt das Koffein aus einem schwarzen Espresso auf nüchternen Magen oder aus einer zuckerhaltigen Cola zusammen mit Burger und Pommes? Für eine Aussage über die Wirkung von Koffein macht dies einen großen Unterschied.
Artikel Abschnitt: Forscher:innen sind auch nur Menschen
Forscher:innen sind auch nur Menschen
Datenfälschungen kommen öfter vor
Hier ein paar Messwerte gelöscht, dort einige etwas verändert, und schon zeigt die Studie den gewünschten Effekt. Bekanntes Beispiel ist der Kardiologe Dipak Das, der in den 1990er-Jahren viel über Resveratrol forschte. Diesem Bestandteil des Rotweins wird eine herzschützende Wirkung nachgesagt. Dipak Das wurden Fälschungen in mehr als 20 Publikationen nachgewiesen.
Gründe für bewusste Täuschung mag es viele geben. Einer ist sicherlich das Wissenschaftssystem an sich, das Forschende durch Publikationszwang und erfolgsgebundene Eigenfinanzierungen unter massiven Druck setzt. "Publish or Perish" – "Veröffentlichen oder Untergehen" ist unter Wissenschaftler:innen eine geflügeltes Wort.
Firmen nehmen Einfluss
Die oben erwähnte Walnuss-Studie wurde unter anderem von der "California Walnut Commission" finanziert. Interessenverbände und Firmen versuchen auf diese Art und Weise, Einfluss auf Forschungsergebnisse zu nehmen. Hier lohnt sich der kritische Blick ins Kleingedruckte.
Artikel Abschnitt: Und jetzt? So findest du vertrauenswürdige Ernährungsempfehlungen
Und jetzt? So findest du vertrauenswürdige Ernährungsempfehlungen
Metaanalysen sind zuverlässiger als Einzelstudien
Metaanalysen werten viele Einzelstudien zu einem Thema aus und fassen die Ergebnisse zu einem Gesamturteil zusammen. Sie hinterfragen Studiendesigns, überprüfen Methoden zur Datenanalyse und haben automatisch eine hohe Fallzahl zur Verfügung. Wenn eine solche Analyse korrekt durchgeführt wurde, ist das Ergebnis zuverlässiger als die Einzelstudien und kann damit die sogenannte empirische Evidenz erhöhen.
Übrigens: In einer 2019 veröffentlichten Metastudie konnte kein krebserzeugender Effekt von Kaffee festgestellt werden.
Ob Kaffee trotzdem ungesund ist, das erklären wir hier.
Und welche Lebensmittel wirklich bedenklich sind, erklären wir hier:
So ungesund ist Palmöl.
Darauf musst du beim Olivenöl achten.
Warum Titandioxid nicht in Lebensmittel gehört.
Über den/die AutorIn:
Quellenangaben zum Artikel:
Social Sharing:
Artikel Überschrift:
Als Ernährungswissenschaftlerin danke ich euch für diesen sehr guten Beitrag!! Einzig den Punkt zu absichtlich gefälschten Studienergebnissen sehe ich kritisch. Viel häufiger und relevanter ist doch die schlechte Publizierbarkeit von negativen Studienergebnissen.
Vielen Dank für deine Rückmeldung. Ja, da hast du Recht, der Umgang mit „negativen“ bzw. nicht der Erwartung entsprechenden Forschungsergebnissen ist auch ein sehr wichtiges Thema!
Als Mensch, der in diesem Bereich als Wissenschaftlerin arbeitet, danke ich für diesen guten Beitrag.
Es sollte erwähnt werden, dass auch die DGE ihre Empfehlungen auf Studien stützt, welche die hier erwähnten Mängel haben. Auch hier muss sehr kritisch betrachtet werden, woher deren Empfehlungen und wie die zustande kommen. Ich finde es erstaunlich, wie wenige der vielen Empfehlungen zu gesunder Ernährung tatsächlich wissenschaftlich fundiert sind,… Weiterlesen »
Wow – sehr gut und übersichtlich dargestellter Artikel! Die Auseinandersetzung mit Wissenschaftsmethodik bzw. Studiendesign ist meiner Meinung nach einer der wichtigsten und dennoch maßlos unterschätzten Aspekte, mit denen man sich heutzutage beschäftigen könnte! Ich entwickle in meiner Promotion (Chemiedidaktik Uni Münster) ein Unterrichtskonzept, mit dem Schülerinnen und Schüler im naturwissenschaftlichen… Weiterlesen »
Danke. 🙂 Im Endeffekt ist das genau unser Job. 🙂