Cohen's Effektstärken als Mass der Bewertung praktischer ... - SGSM
Cohen's Effektstärken als Mass der Bewertung praktischer ... - SGSM
Cohen's Effektstärken als Mass der Bewertung praktischer ... - SGSM
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Cohen’s <strong>Effektstärken</strong> <strong>als</strong> <strong>Mass</strong> <strong>der</strong> <strong>Bewertung</strong> von <strong>praktischer</strong> Relevanz – Implikationen für die Praxis<br />
chätzung <strong>der</strong> praktischen Relevanz von signifikanten Effekten<br />
dessen Bedeutsamkeit und Relevanz im Kontext <strong>der</strong> Fragestellung Im Rahmen von Metaanalysen können mit <strong>der</strong> Berechnung <strong>der</strong><br />
aus. Pointiert ausgedrückt: Signifikante Ergebnisse müssen auch <strong>Effektstärken</strong> die Ergebnisse von einzelnen Primärstudien bspw.<br />
praktische Bedeutsamkeit praktisch bedeutsam o<strong>der</strong> Relevanz sein (Bortz von signifikanten & Döring, 2006). Effekten So im würde Sinne wohl <strong>der</strong> Einschätzung zur Wirkungsweise des einer Behandlung, eines Trainings o<strong>der</strong> Medi-<br />
zung lten Outcomes <strong>der</strong> praktischen niemand wird eine Relevanz im neue Allgemeinen von Trainingsmethode signifikanten über das Effekten dimensionslose – obwohl signifikant Maß <strong>der</strong> einer Effektstärke kamentation o<strong>der</strong> in Beziehung zu einan<strong>der</strong> gesetzt werden, indem die<br />
bisherigen Trainingsmethode überlegen – zur Anwendung bringen, <strong>Effektstärken</strong> verglichen werden (Hall & Rosenthal, 1995; Hunter<br />
ktgrösse vorgenommen,<br />
wenn sich die<br />
da<br />
erzielten<br />
die Effektstärke<br />
Effekte<br />
kaum<br />
<strong>als</strong> nicht<br />
von<br />
praktisch<br />
<strong>der</strong> Stichprobengröße<br />
relevant zeigen<br />
n beeinflusst<br />
& Schmidt,<br />
wird<br />
2004; Rustenbach, 2003). Letztendlich können so durch<br />
tische<br />
zung <strong>der</strong><br />
Bedeutsamkeit<br />
praktischen<br />
o<strong>der</strong><br />
würden (Drinkwater, Relevanz<br />
Relevanz<br />
von<br />
von<br />
2008). signifikanten<br />
signifikanten<br />
Effekten<br />
Effekten im Sinne <strong>der</strong> Einschätzung des<br />
tz & Döring, 2006; Leonhart, 2004). Die weiterführenden Ausführungen beziehen die sich <strong>Effektstärken</strong> auf einzelne Studien zu einem gleichen Thema, bei-<br />
Outcomes wird im Allgemeinen über das dimensionslose Maß <strong>der</strong> Effektstärke spielsweise o<strong>der</strong> Behandlungskonzepte bei chronischer Dysfunktion <strong>der</strong><br />
andsmasse bei Gruppenunterschieden, <strong>Effektstärken</strong> <strong>als</strong> Zusammenhangsmasse werden<br />
össe tische vorgenommen, Bedeutsamkeit da o<strong>der</strong> die Relevanz Effektstärke von signifikanten kaum von <strong>der</strong> Effekten Stichprobengröße im Sinne <strong>der</strong> n Einschätzung beeinflusst<br />
Tibialissehne<br />
wird des (Leumann et al., 2007) bewertet und globale Aussagen<br />
folgend ausgeklammert. Abschätzung <strong>der</strong> praktischen Relevanz von signifikanten Effekten zu einem Forschungsgegenstand getroffen werden (Bortz & Döring,<br />
Outcomes Döring, 2006; wird Leonhart, im Allgemeinen 2004). Die über weiterführenden das dimensionslose Ausführungen Maß <strong>der</strong> beziehen Effektstärke sich o<strong>der</strong><br />
2006). auf Hinzu kommt, dass Mo<strong>der</strong>atorvariablen wie Geschlecht, Al-<br />
smasse sse vorgenommen, bei Die Gruppenunterschieden, praktische da die Effektstärke Bedeutsamkeit <strong>Effektstärken</strong> kaum o<strong>der</strong> von Relevanz <strong>der</strong> <strong>als</strong> Stichprobengröße Zusammenhangsmasse von signifikanten n beeinflusst ter, werden wird Compliance usw. und <strong>der</strong>en Einfluss auf einen globalen Effekt<br />
Effektstärke Effekten d in <strong>der</strong> im Population Sinne <strong>der</strong> normiert Einschätzung im einfachsten des erzielten Fall Outcomes die Unterschiede wird zwischen abgeschätzt den werden können (Hall & Rosenthal, 1995; Morris, 2008;<br />
end Döring, ausgeklammert. 2006; Leonhart, 2004). Die weiterführenden Ausführungen beziehen sich auf<br />
hängigen experimentellen<br />
im Allgemeinen<br />
Gruppen<br />
über das<br />
(auch<br />
dimensionslose<br />
Experimentalgruppe<br />
<strong>Mass</strong> <strong>der</strong><br />
[EG]<br />
Effektstärke<br />
und Kontrollgruppe<br />
Peterson<br />
[KG])<br />
et al., 2004; Rhea, 2004a; Rhea et al., 2003).<br />
masse bei o<strong>der</strong> Gruppenunterschieden, Effektgrösse vorgenommen, <strong>Effektstärken</strong> da die Effektstärke <strong>als</strong> Zusammenhangsmasse kaum von <strong>der</strong> werden Die einfache Berechnung <strong>der</strong> Effektstärke d sowie <strong>der</strong>en prak-<br />
ie Streuung Stichprobengrösse <strong>der</strong> Testwerte (t-Test n für beeinflusst unabhängige wird Stichproben) (Bortz & Döring, nach <strong>der</strong> 2006; Formel: Letische <strong>Bewertung</strong> soll anhand eines Beispiels verdeutlicht werden<br />
end ktstärke ausgeklammert. d in onhart, <strong>der</strong> Population 2004). Die normiert weiterführenden im einfachsten Ausführungen Fall die Unterschiede beziehen sich zwischen (vgl. den Drinkwater, 2008): Durch die Einführung eines neuartigen<br />
gigen experimentellen auf Abstandsmasse Gruppen (auch bei Gruppenunterschieden, Experimentalgruppe [EG] <strong>Effektstärken</strong> und Kontrollgruppe <strong>als</strong> Sprinttrainings [KG]) wurde die 100-m-Sprintzeit signifikant um 0.05 s<br />
Zusammenhangsmasse werden nachfolgend ( μ A − μB<br />
) ausgeklammert. verbessert (Prä-Post-Differenz = 0.05 s). Wie ist nun diese si-<br />
treuung ktstärke <strong>der</strong> d in Testwerte <strong>der</strong> Population<br />
Die Effektstärke (t-Test für normiert unabhängige im deinfachsten<br />
=<br />
d in <strong>der</strong> Population Stichproben) Fall die Unterschiede zwischen den<br />
σ normiert nach <strong>der</strong> im Formel: einfachsten gnifikante Zeitverbesserung durch das neuartige Sprinttraining<br />
gigen experimentellen Fall die Unterschiede Gruppen (auch zwischen Experimentalgruppe den unabhängigen [EG] und experimentel- Kontrollgruppe zu [KG]) interpretieren? Soll die neuartige Trainingsmethode eingeführt<br />
treuung <strong>der</strong> len Testwerte Gruppen (t-Test (auch für Experimentalgruppe unabhängige Stichproben) [EG] nach und <strong>der</strong> Kontrollgruppe<br />
Formel: werden? Zur Beantwortung dieser Fragen werden zwei Szenarien<br />
eht sich [KG]) die auf <strong>Effektstärken</strong>schätzung die Streuung <strong>der</strong> Testwerte<br />
( μ A −<br />
(t-Test<br />
μB<br />
)<br />
d = auf die für Stichprobenkennwerte unabhängige Stich- <strong>der</strong> skizziert: beiden<br />
proben) nach <strong>der</strong> Formel: σ<br />
1. Die Teilnehmer einer Breitensportveranstaltung (Sportabzei-<br />
rimentalgruppen bzw. Treatmentgruppe und Kontrollgruppe wird d, wenn die<br />
( μ chen) haben eine mittlere 100-m-Zeit von 13.04 s (SD = 2.02)<br />
A − μB<br />
)<br />
dardabweichungen <strong>der</strong> beiden Gruppen annähernd d = homogen sind, nach Cohen (1969) berechnet: und verbessern sich um 0.05 s. Die Berechung <strong>der</strong> Effektstärke<br />
sich die <strong>Effektstärken</strong>schätzung auf σdie<br />
Stichprobenkennwerte <strong>der</strong> beiden d ergibt 13.04 – 12.99/2.02 = 0.025.<br />
entalgruppen Bezieht bzw. sich Treatmentgruppe die <strong>Effektstärken</strong>schätzung und Kontrollgruppe auf die Stichprobenkenn- wird d, wenn 2. Die die durchschnittliche Finalzeit im 100-m-Sprint <strong>der</strong> Männer bei<br />
sich die<br />
werte<br />
<strong>Effektstärken</strong>schätzung<br />
<strong>der</strong> beiden Experimentalgruppen<br />
auf<br />
( X EG die<br />
−bzw.<br />
X KG Stichprobenkennwerte<br />
) Treatmentgruppe und den Olympischen Spielen 2008 betrug 9.92 s (SD = 0.11) und<br />
abweichungen Kontrollgruppe <strong>der</strong> beiden Gruppen wird d, annähernd d =<br />
wenn die homogen Standardabweichungen sind, nach Cohen <strong>der</strong> (1969) beiden berechnet: <strong>der</strong> beiden<br />
s<br />
verbessert sich um 0.05 s. Die Effektstärke d berechnet sich auf<br />
entalgruppen Gruppen bzw. annähernd Treatmentgruppe homogen sind, und nach Kontrollgruppe Cohen (1969) berechnet: wird d, wenn 9.92 die – 9.87/0.11 = 0.45.<br />
abweichungen <strong>der</strong> beiden Gruppen annähernd homogen sind, nach Cohen (1969) berechnet:<br />
Aus <strong>der</strong> beispielhaften <strong>Effektstärken</strong>berechnung lässt sich somit<br />
X EG X KG<br />
glich <strong>der</strong> zu verwendenden Streuung ( − )<br />
d = im Nenner <strong>der</strong> Formel werden unterschiedliche ableiten, dass die Effektstärke d bei den Finalteilnehmern deutlich<br />
s<br />
grösser ist <strong>als</strong> bei den Teilnehmern <strong>der</strong> Breitensportveranstaltung<br />
fehlungen<br />
Bezüglich<br />
ausgesprochen<br />
<strong>der</strong> zu<br />
(Leonhart,<br />
verwendenden<br />
2004).<br />
Streuung<br />
Glass<br />
im Nenner<br />
et al.<br />
<strong>der</strong><br />
(1981)<br />
Formel<br />
bevorzugen<br />
und die<br />
die<br />
Einführung <strong>der</strong> neuen Trainingsmethode bei Weltklas-<br />
( X EG − X KG )<br />
dardabweichung werden <strong>der</strong> unterschiedliche Kontrollgruppe s dEmpfehlungen<br />
= = sKG. Bortz und ausgesprochen Döring (2006) (Leonhart, berechnen die se-Sprintern, gemeinsame im Gegensatz zu durchschnittlich Trainierten, eine<br />
h <strong>der</strong> zu 2004). verwendenden Glass et al. Streuung (1981) bevorzugen im Nenner s die <strong>der</strong> Standardabweichung Formel werden unterschiedliche<br />
<strong>der</strong> praktische Relevanz besitzt. Wie die Effektstärke inhaltlich quan-<br />
ung aus EG und KG nach <strong>der</strong> Formel:<br />
ungen ausgesprochen<br />
Kontrollgruppe<br />
(Leonhart,<br />
s = sKG. Bortz<br />
2004).<br />
und<br />
Glass<br />
Döring<br />
et<br />
(2006)<br />
al.<br />
berechnen<br />
(1981) bevorzugen<br />
die titativ<br />
die<br />
zu bewerten ist, wird nachfolgend erörtert.<br />
gemeinsame Streuung aus EG und KG nach <strong>der</strong> Formel:<br />
h abweichung <strong>der</strong> zu <strong>der</strong> verwendenden Kontrollgruppe Streuung s = sKG. im Bortz Nenner und Döring <strong>der</strong> Formel (2006) berechnen werden unterschiedliche<br />
die gemeinsame<br />
2 2<br />
ungen ges aus und EG Olkin und ausgesprochen KG (1985) nach zeigten, <strong>der</strong> (Leonhart, Formel: dass eine 2004). sEG<br />
Glass sKG<br />
<strong>Bewertung</strong> <strong>der</strong> praktischen Bedeutsamkeit<br />
s Standardisierung<br />
+<br />
=<br />
et <strong>der</strong> al. Mittelwertsdifferenzen (1981) bevorzugen anhand die einer<br />
2<br />
abweichung olten Standardabweichung <strong>der</strong> Kontrollgruppe<br />
Hedges und Olkin bei<strong>der</strong> s = sKG. Bortz und Döring (2006) berechnen die gemeinsame<br />
(1985) Gruppen zeigten, die dass Schätzung eine Standardisierung<br />
<strong>der</strong> Effektstärke optimiert Die <strong>Bewertung</strong> (vgl. von <strong>praktischer</strong> Bedeutsamkeit – wie sie im Sprint-<br />
tenbach, aus EG und 2003). <strong>der</strong> KG Mittelwertsdifferenzen Die nach gepoolte <strong>der</strong> Formel: Standardabweichung 2anhand<br />
2 einer sgepoolt gepoolten berechnet Standardab- sich dabei nach beispiel Leonhart exemplarisch verdeutlicht wurde – hat eine lange Tradi-<br />
weichung bei<strong>der</strong> Gruppen<br />
s<br />
die EG +<br />
Schätzung<br />
sKG<br />
s =<br />
<strong>der</strong> Effektstärke optition und geht auf die Untersuchungen von Cohen (1969) zurück.<br />
4, S. 243): miert (vgl. Rustenbach, 2003). 2Die<br />
gepoolte Standardabweichung Die seitdem auf Konvention festgelegte Effektstärkeklassifizierung<br />
sgepoolt berechnet sich dabei nach 2 Leonhart 2<br />
s<br />
(2004, S. 243): weist dabei folgende Werte aus: kleiner Effekt d = 0.20, mittlerer<br />
EG + sKG<br />
s =<br />
Effekt d = 0.50 und grosser Effekt d = 0.80 (Cohen, 1969, S. 38;<br />
2 2<br />
2<br />
(n<br />
1992, S. 157). Allgemein werden <strong>Effektstärken</strong> > 0.50 <strong>als</strong> gross<br />
1 −1)s1<br />
+ (n 2 −1)s<br />
2<br />
sgepoolt =<br />
n<br />
interpretiert. <strong>Effektstärken</strong> von 0.50–0.30 <strong>als</strong> mo<strong>der</strong>at und Effekt-<br />
1 + n 2 −2<br />
stärken von 0.30–0.10 <strong>als</strong> klein bzw. < 0.10 <strong>als</strong> trivial (Bortz &<br />
Anhand <strong>der</strong> einzelnen Formeln lässt sich somit die Effektstärke Döring, 2006, S. 606). Die von Cohen (1969, 1992) vorgeschlagene<br />
zuverlässig für die Intervention bzw. das Treatment beispielsweise Klassifikation stellt jedoch nur eine erste Orientierungshilfe dar.<br />
and <strong>der</strong> einzelnen einer physiotherapeutischen Formeln lässt sich somit Behandlung, die Effektstärke einer zuverlässig Medikation, für einer die Intervention Somit wäre bzw. die Effektstärke – die Wirkungsweise des neuartigen<br />
durchgeführten Operation o<strong>der</strong> eines Trainings usw. im Prä- Sprinttrainings – bei Freizeitsportlern <strong>als</strong> trivialer Effekt, ohne<br />
Treatment Post-Testdesign beispielsweise einer bzw. Prä-Post-Kontrollgruppendesign physiotherapeutischen Behandlung, berechnen. einer Medikation, praktische einer Bedeutsamkeit, zu interpretieren. Da die Effektstärke<br />
hgeführten Darüber Operation hinaus o<strong>der</strong> weist eines Rhea Trainings (2004a, etc. S. 918) im darauf Prä-Post-Testdesign hin, dass die bzw. bei Prä-Post- den Weltklasse-Sprintern bei d = 0.45 liegt, ist ein mo<strong>der</strong>ater<br />
Berechnung und Angabe <strong>der</strong> Effektstärke im Rahmen von Inter- bzw. mittlerer Effekt, mit mittlerer <strong>praktischer</strong> Bedeutung bzw.<br />
trollgruppendesignventionsmassnahmen berechnen. Darüber zahlreiche hinaus Vorteile weist Rhea bietet: (2004a, S. 918) darauf hin, Relevanz dass die festzustellen.<br />
chnung und 1. Angabe Die Effektstärke <strong>der</strong> Effektstärke repräsentiert im Rahmen eine von standardisierte Interventionsmaßnahmen Grösse zur zahlreiche Vorteile<br />
Einschätzung und Interpretation von Verän<strong>der</strong>ungen von ein-<br />
et: zelnen o<strong>der</strong> mehreren Gruppen (z.B. hat sich die Effektstärke <strong>Bewertung</strong> <strong>der</strong> praktischen Bedeutsamkeit im Kontext einer<br />
vergrössert o<strong>der</strong> ist sie gleich geblieben).<br />
Forschungsdomäne<br />
1. Die 2. Effektstärke Die Effektstärke repräsentiert erlaubt eine den Vergleich standardisierte verschiedener Größe zur Trai- Einschätzung und<br />
nings-/Interventions- bzw. Behandlungsmethoden innerhalb Aktuelle Metaanalysen u.a. von Fröhlich und Giessing (2008),<br />
Interpretation<br />
einer Studie<br />
von Verän<strong>der</strong>ungen<br />
(z.B. lässt sich<br />
von<br />
VO2max<br />
einzelnen<br />
durch<br />
o<strong>der</strong><br />
ein<br />
mehreren<br />
High Intensity<br />
Gruppen (z.<br />
Fröhlich<br />
B. hat sich<br />
und Schmidtbleicher (2008), Fröhlich et al. (2008),<br />
die Effektstärke Training genauso vergrößert gut o<strong>der</strong> verbessern ist sie gleich wie geblieben). durch ein aerobes Grund- Peterson et al. (2004), Rhea (2004b), Rhea et al. (2003), Rhea<br />
lagenausdauertraining).<br />
und Al<strong>der</strong>man (2004) konnten zeigen, dass die <strong>Effektstärken</strong><br />
2. Die Effektstärke erlaubt den Vergleich verschiedener Trainings-/Interventions- bzw.<br />
3. Die Effektstärke ist leicht zu berechnen und zeigt somit den beispielsweise im Bereich <strong>der</strong> Krafttrainingsforschung einerseits<br />
Behandlungsmethoden Einfluss einer einzelnen innerhalb Studie einer Studie für die (z. B. Theorie lässt sich und VO2max Praxis durch vom ein Trainingszustand High <strong>der</strong> Probanden in <strong>der</strong> dichotomen Katego-<br />
auf.<br />
rie «trainiert» vs. «untrainiert» abhängen (Tab. 1) und an<strong>der</strong>er-<br />
Intensity Training genauso gut verbessern wie durch ein aerobes<br />
Grundlagenausdauertraining).<br />
3. Die Effektstärke ist leicht zu berechnen und zeigt somit den Einfluss einer einzelnen<br />
Studie für die Theorie und Praxis auf.<br />
141