Om tolkning af trivariate analyser med Gamma
Om tolkning af trivariate analyser med Gamma
Om tolkning af trivariate analyser med Gamma
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
Bemærkninger vedrørende tabelanalyse <strong>med</strong><br />
<strong>Gamma</strong><br />
Henrik Lolle, november 2003<br />
Når man foretager kontrol for tredjevariabel i en krydstabelanalyse <strong>med</strong> <strong>Gamma</strong> korrelationskoefficient,<br />
er der en del aspekter, man skal være opmærksom på. Herunder diskuterer jeg nogle <strong>af</strong><br />
disse gennem en besvarelse <strong>af</strong> tre spørgsmål.<br />
Hvordan kan man vide, om der er tale om interaktion?<br />
Spørgsmålet drejer sig om at kunne konkludere, hvorvidt de ’lokale’ <strong>Gamma</strong>-værdier i de<br />
kontrollerede del-tabeller er så markant forskellige fra hinanden, at man kan sige, at <strong>Gamma</strong>værdierne<br />
i populationen også er forskellige. Med andre ord: sammenhængen eller dens styrke<br />
<strong>af</strong>hænger <strong>af</strong> værdien på kontrolvariablen. Både statistiske og substantielle/teoretiske argumenter<br />
indgår i en overvejelse her<strong>af</strong>.<br />
Estimaterne <strong>af</strong> de lokale <strong>Gamma</strong>-værdier vil i praksis aldrig være nøjagtig ens.<br />
Spørgsmålet er så at finde ud <strong>af</strong>, om de forskelle, der ses, kan skyldes tilfældigheder. Der findes<br />
ganske vist metoder, hvor<strong>med</strong> man rent statistisk kan foretage sådanne test vedrørende forskel i<br />
<strong>Gamma</strong>-værdier. Disse test ligger imidlertid ud over pensum (og de benyttes i øvrigt heller ikke<br />
særligt ofte). Så her må I foretage vurderingen lidt mindre formelt statistisk, uden dog helt at<br />
glemme statistikken. Til hver <strong>Gamma</strong>-værdi er der knyttet en standardfejl (lige til højre for <strong>Gamma</strong>værdien<br />
i udskriften), og denne siger jo noget om usikkerheden i estimeringen <strong>af</strong> <strong>Gamma</strong> 1 . Bl.a. kan<br />
man lave et 95 pct. sikkerhedsinterval herud fra. Umiddelbart skulle man måske synes, at i de<br />
tilfælde hvor sådanne intervaller ikke ’rager’ ind over hinanden, kan man statistisk konkludere, at<br />
<strong>Gamma</strong>-værdierne er forskellige i populationen. En sådan test er imidlertid ikke helt fin i kanten<br />
statistisk set, fordi den i mange tilfælde ikke er stærk nok til at kunne konkludere forskel, hvor der<br />
rent faktisk er det. Uden at gå dybere ind i de statistiske detaljer vil jeg blot tilføje, at denne metode<br />
kan I jo bruge som en rettesnor, sammen <strong>med</strong> de mere substantielle overvejelser, jævnfør nedenfor.<br />
De substantielle overvejelser går ud på at se på, dels hvor store forskelle der egentlig<br />
er tale om, altså ikke blot den mere statistisk betonede vurdering i forhold til standardfejlene, dels<br />
om man rent teoretisk eller via dagligdags viden er istand til at forstå en interaktion <strong>af</strong> den type,<br />
1 Husk i øvrigt i den forbindelse Agresti & Finlays bemærkning (s. 279 øverst) om, at man som grov rettesnor kan<br />
kræve, at der til en krydstabel skal kunne dannes mindst 50 konkordante og 50 diskordante par, førend man kan stole på<br />
signifikansberegningerne til <strong>Gamma</strong> korrelationskoefficienten. Ved kontrol (især <strong>med</strong> kontrolvariabel <strong>med</strong> mange<br />
kategorier) stiger risikoen derfor for, at der ikke <strong>med</strong> de ’sædvanlige’ metoder kan beregnes statistisk signifikansniveau<br />
til de lokale <strong>Gamma</strong>-værdier. En vej ud <strong>af</strong> et problem <strong>af</strong> den karakter er at rekode kontrolvariablen til færre kategorier.<br />
1
som ses fra <strong>Gamma</strong>-værdierne og tabellerne. Forestil jer, at I f.eks. finder følgende: 1) der er en<br />
enkelt <strong>Gamma</strong>-værdi, der skiller sig markant ud fra de øvrige (lad os sige, at en <strong>Gamma</strong>-værdi<br />
ligger på omkring 0,40, mens de øvrige ligger på omkring 0,20; 2) I forhold til de tilknyttede<br />
standardfejl vurderer I, at det statistisk set ser ud til, at den ene <strong>Gamma</strong> er større end de øvrige i<br />
populationen. Inden I konkluderer, at der så må være interaktion, bør I imidlertid rent logisk<br />
(teoretisk eller via dagligdagsviden) kunne forstå eller forestille jer denne interaktion – dvs. de<br />
mekanismer der ligger til grund for den. Hvis I ikke kan begribe interaktionen på denne facon, skal<br />
statistikken tale et meget tydeligt sprog, inden I drager konklusionen om forskel/interaktion.<br />
Forestil jer nu en anden situation. F.eks. at der ses et fint mønster <strong>med</strong> stigende lokale<br />
<strong>Gamma</strong>-værdier <strong>med</strong> stigende værdi på kontrolvariablen, men samtidig at I ikke kan gennemskue<br />
blot tilnærmelsesvist, om der statistisk set er forskel mellem nogen <strong>af</strong> disse lokale <strong>Gamma</strong>’er.<br />
Forestil jer endvidere, at I har en teoretisk velbegrundet hypotese om netop sådan et mønster for<br />
interaktionen. I sådan en situation ville man givet vis tage de empiriske resultater (altså tabellerne<br />
og de lokale <strong>Gamma</strong>’er) som udtryk for en støtte <strong>af</strong> hypotesen, på trods <strong>af</strong> at statistikken måske ikke<br />
helt kan bekræfte den. Det gælder altså i enhver situation, hvor statistikken ikke er meget<br />
overbevisende, at man bør lade konklusionen ske på baggrund <strong>af</strong> substantielle overvejelser tillige.<br />
Hvornår er den partielle <strong>Gamma</strong> statistisk signifikant forskellig fra nul i<br />
populationen?<br />
Hvis I via SPSS syntax får beregnet en partiel <strong>Gamma</strong> i forbindelse <strong>med</strong> kontrol <strong>af</strong> en<br />
sammenhæng, bliver der ikke hertil knyttet signifikansberegning. Der findes en anden måde at<br />
beregne partiel <strong>Gamma</strong> på, hvortil der kan beregnes signifikansniveau, men dette ligger ude over<br />
pensum. Afgørelsen bliver i jeres tilfælde et ’slag på tasken’, og de informationer, som I har til<br />
rådighed, og som kan gøre det til andet end et helt tilfældigt gæt, er den partielle <strong>Gamma</strong>’s størrelse<br />
i forhold til den bivariate (eller ’Zero order <strong>Gamma</strong>’), signifikansniveauet for den bivariate, samt de<br />
enkelte signifikansniveauer (p-værdier) for de lokale <strong>Gamma</strong>’er.<br />
Hvis f.eks. samtlige lokale <strong>Gamma</strong>’er er statistisk signifikante, og hvis samtlige lokale<br />
<strong>Gamma</strong>’er har samme fortegn, vil den partielle <strong>Gamma</strong> også være statistisk signifikant. Og hvis<br />
f.eks. den bivariate <strong>Gamma</strong> er statistisk signifikant forskellig fra nul, samtidig <strong>med</strong> at den partielle<br />
<strong>Gamma</strong> er <strong>af</strong> nogenlunde samme størrelsesorden som den bivariate, så vil man konkludere, at den<br />
partielle <strong>Gamma</strong> er statistisk signifikant – også selvom en eller flere <strong>af</strong> de lokale <strong>Gamma</strong>’er ikke er<br />
det.<br />
Hvis den partielle <strong>Gamma</strong> derimod er markant forskellig fra den bivariate, samtidig<br />
<strong>med</strong> at ikke alle de lokale <strong>Gamma</strong>’er er signifikante, må man vurdere på lidt anden vis, og<br />
vurderingen bliver lidt mere usikker. Hvis f.eks. den partielle <strong>Gamma</strong> er nede på 0,10 eller mindre,<br />
er der under alle omstændigheder tale om en meget svag sammenhæng, hvorfor man kan hæfte sig<br />
ved det istedet for. Er den partielle <strong>Gamma</strong> imidlertid <strong>af</strong> en anseelig størrelse, f.eks. over 0,10, og<br />
alligevel markant mindre end den bivariate, kan man prøve at kaste et samlet blik på de lokale<br />
<strong>Gamma</strong>’ers signifikansniveauer. Her er det imidlertid meget vigtigt ikke at lade sig snyde. Antallet<br />
<strong>af</strong> observationer i de enkelte del-tabeller er jo betydeligt mindre end i den samlede bivariate tabel,<br />
2
og færre observationer vil alt andet lige give et ringere signifikansniveau. Derfor skal man under<br />
ingen omstændigheder sammenligne de lokale signifikansniveauer <strong>med</strong> signifikansniveauet i den<br />
bivariate situation. Man skal derfor heller ikke nødvendigvis konkludere, at den partielle <strong>Gamma</strong> er<br />
insignifikant, selvom samtlige de lokale p-værdier er større end 0,05. Har man f.eks. tre lokale<br />
<strong>Gamma</strong>’er, der hver især har en p-værdi på mellem 0,05 og 0,1, vil man sikkert kunne konkludere,<br />
at den partielle <strong>Gamma</strong> er signifikant på 0,05 niveau. Men I kan altså ikke <strong>med</strong> jeres pensum som<br />
grundlag formelt statistisk bedømme signifikansniveauet for den partielle <strong>Gamma</strong>. Ovennævnte<br />
diskussion kan måske alligevel hjælpe i en forsigtig vurdering.<br />
Hvornår er den partielle <strong>Gamma</strong> statistisk signifikant forskellig fra den<br />
bivariate?<br />
Ganske kort: Det spørgsmål kan ikke besvares ordenligt. David de Vaus skriver nederst side 302, at<br />
man kan sammenligne sikkerhedsintervallerne fra henholdsvis den bivariate og den partielle<br />
<strong>Gamma</strong>. Nu ligger landet jo sådan, at I ikke får opgivet signifikansniveau for den partielle <strong>Gamma</strong>,<br />
men selvom I kunne få opgivet dette, ville en sådan test ikke være formelt i orden. For det første<br />
fordi sammenligning <strong>af</strong> sikkerhedsintervaller (jævnfør sammenligningen <strong>af</strong> de lokale <strong>Gamma</strong>’er)<br />
ikke er den korrekte metode til bedømmelse <strong>af</strong> forskel i det hele taget. For det andet fordi der i det<br />
hele taget ikke findes nogen nem måde at teste for forskel mellem en bivariat og en partiel<br />
koefficient 2 . Det bliver derfor en ren subjektiv vurdering <strong>af</strong> disse værdiers forskel. Men som<br />
tommelfingerregel kan I f.eks. sige, at ændres <strong>Gamma</strong>-værdien fra den bivariate til den partielle<br />
<strong>med</strong> 25 pct. eller mere, kan man begynde at snakke om, at kontrollen har øvet indflydelse. Dvs. at<br />
hvis eksempelvis en <strong>Gamma</strong> går fra 0,30 i det bivariate tilfælde til en partiel <strong>Gamma</strong> på 0,23 eller<br />
derunder, vil man kunne sige, at en større eller mindre del <strong>af</strong> sammenhængen kan forklares ved<br />
kontrolvariablen. Og det samme ville være tilfældet ved en ændring fra 0,50 til 0,38 eller mindre.<br />
Men igen: det er og bliver en subjektiv vurdering, som der ingen faste regler er for.<br />
2 Se f.eks. Kreiner, Svend (1999): Statistisk problemløsning. Præmisser, teknik og analyse. Jurist- og<br />
Økonomforbundets Forlag, s. 369<br />
3