Es war einmal.. .. eine Zelle und sie wurde nimmermehr gesehen?
LJ_16_07
LJ_16_07
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Es</strong>say<br />
ren – was in einigen Fällen zu ernsthaften<br />
Fehldarstellungen der Daten führte (10).<br />
Fest steht, dass in Biologie <strong>und</strong> Medizin<br />
die methodische <strong>und</strong> statistische Ausbildung<br />
in der Doktorandenphase deutlich<br />
mehr Aufmerksamkeit bekommen muss<br />
– angefangen bei der klassischen Deskriptiven<br />
<strong>und</strong> Inferenzstatistik bis hin zu <strong>eine</strong>r<br />
Einführung in die Bayes-Statistik. Die meisten<br />
Originalarbeiten in<br />
den Neurowissenschaften<br />
setzen irgend<strong>eine</strong><br />
Form von Statistik ein, so<br />
dass deren Verständnis von entscheidender<br />
Bedeutung ist, um die Literatur verstehend<br />
zu lesen, beschriebene Effekte adäquat zu<br />
bewerten <strong>und</strong> sich Klarheit über die eigenen<br />
Ergebnisse zu verschaffen. <strong>Es</strong> kann daher<br />
nur helfen, Statistik als akademische<br />
Kern-Fertigkeit anzusehen, <strong>und</strong> nicht nur<br />
als Soft Skill wie etwa Antragschreiben,<br />
Management oder Präsentation.<br />
Dummerweise erfordert das Lernen von<br />
Methodik <strong>und</strong> Statistik, zusätzlich zum Erlernen<br />
der experimentellen Techniken des<br />
jeweiligen Feldes sowie dem Entwickeln<br />
von Arbeitshypothesen, schlichtweg Zeit<br />
<strong>und</strong> kann nicht immer in ein Master-Studium<br />
oder die frühe Doktorandenphase eingepasst<br />
werden. Jedoch kann <strong>eine</strong> unzureichende<br />
statistische Ausbildung – wie etwa<br />
ein zweitägiger Workshop in irgend<strong>eine</strong>m<br />
statistischen Programm, mit dem man H<strong>und</strong>erte<br />
von bivariaten Korrelationen durchklicken<br />
<strong>und</strong> erzeugen kann, ohne etwa das<br />
multiple Testproblem tatsächlich zu verstehen<br />
–, das Falsch-Positive-Problem am Ende<br />
sogar stärker verschlimmern als gar k<strong>eine</strong><br />
statistische Ausbildung. Denn schließlich<br />
ruft man im letzteren Fall in<br />
aller Regel <strong>eine</strong>n erfahrenen<br />
Statistiker um Hilfe.<br />
Allerdings muss es auch<br />
nicht zwingend die beste<br />
Lösung sein, das „Problem“<br />
an Statistiker outzusourcen <strong>und</strong> sich von<br />
diesen beispielsweise bei den Power-Analysen<br />
helfen zu lassen. Schließlich arbeiten<br />
Statistiker in aller Regel nicht im Labor.<br />
Folglich können <strong>sie</strong> um Rat gefragt werden<br />
oder nicht, <strong>sie</strong> können angehört werden<br />
oder auch nicht – aber <strong>sie</strong> können ganz sicher<br />
nicht <strong>eine</strong>n PI überstimmen, wenn die<br />
betreffenden Ergebnisse z<strong>war</strong> allzu schön,<br />
aber wahrscheinlich falsch sind.<br />
Alternativ könnte <strong>eine</strong> direkte statistische<br />
Beratung natürlich während des<br />
Review-Prozesses <strong>eine</strong>r Zeitschrift stattfinden.<br />
Allerdings ist leider unwahrscheinlich,<br />
dass Zeitschriften für Dienstleistungen bezahlen,<br />
die ansonsten <strong>eine</strong>r der Gutachter<br />
oftmals umsonst liefert. Zumal <strong>sie</strong> diese<br />
womöglich dazu zwingen würden, mehr<br />
Laborjournal<br />
7-8/2016<br />
„K<strong>eine</strong> Ausbildung ist besser<br />
als <strong>eine</strong> schlechte.“<br />
„Strengere Schwellen<br />
würden überzeugendere<br />
Daten liefern.“<br />
wirklich solide <strong>und</strong> weniger „spannende“<br />
Ergebnisse zu publizieren.<br />
Wie also können wir letztlich wahre<br />
Signale gegenüber dem belanglosen Rauschen<br />
in Forschungspublikationen verstärken?<br />
Natürlich durch <strong>eine</strong> bessere Ausbildung<br />
<strong>und</strong> mehr Verständnis in Statistik,<br />
durch höhere statistische Power in den<br />
Untersuchungen, indem wir zweifelhafte<br />
Arbeiten nicht zitieren,<br />
indem wir Doktoranden<br />
<strong>eine</strong>n t-Test wenigstens<br />
<strong>einmal</strong> von Hand machen<br />
lassen, indem wir Konfidenz- <strong>und</strong><br />
Vertrauensintervalle mit veröffentlichen,...<br />
<strong>und</strong> <strong>und</strong> <strong>und</strong>. Allerdings kann es Jahre,<br />
wenn nicht Jahrzehnte dauern, bis die<br />
Mehrheit endlich den bequemen Weg verlässt,<br />
auf dem Wissenschaft innerhalb des<br />
derzeitigen Belohnungssystems betrieben<br />
wird. Schließlich juckt es ja nicht, wenn<br />
man „Lärm“ erzeugt – solange man dafür<br />
belohnt wird.<br />
Dabei hat zumindest <strong>eine</strong> neue Analyse<br />
prinzipiell gezeigt, dass es gar nicht<br />
schwer sein muss, das derzeitige „Falsch-Positiv“-System<br />
zu verändern. Wir müssen<br />
einfach nur strikter sein.<br />
Valen Johnson von der Texas A & M University<br />
entwickelte <strong>eine</strong>n Weg, klassische<br />
p-Wert-Tests (auch als frequentistischer<br />
Ansatz bezeichnet, da der Fokus auf der<br />
Wahrscheinlichkeit <strong>eine</strong>s gegebenen Testergebnisses<br />
liegt) mit Bayes’schen Faktoren<br />
zu vergleichen. Dabei stellte er fest,<br />
dass ein p-Wert von etwa 0,05 <strong>eine</strong>m Bayes-Faktor<br />
zwischen 3 <strong>und</strong> 5 entspricht (11)<br />
– was in der Regel als schwacher Hinweis<br />
dafür an<strong>gesehen</strong> wird, dass <strong>eine</strong> gegebene<br />
Hypothese stärker als <strong>eine</strong><br />
andere gestützt wird. Auch<br />
Johnson <strong>sie</strong>ht darin das<br />
Hauptproblem dafür, dass<br />
man viele unreproduzierbare<br />
Ergebnisse erhält – <strong>und</strong><br />
folgert, dass man es zuerst durch das Anlegen<br />
strengerer statistischer Schwellen lösen<br />
könnte, wie beispielsweise p