26.07.2013 Views

Kvantitativ analyse med SPSS

Kvantitativ analyse med SPSS

Kvantitativ analyse med SPSS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Kvantitativ</strong> <strong>analyse</strong> <strong>med</strong> <strong>SPSS</strong>


Terje Andreas Eikemo & Tommy Høyvarde Clausen (red.)<br />

<strong>Kvantitativ</strong> <strong>analyse</strong> <strong>med</strong> <strong>SPSS</strong><br />

En praktisk innføring i kvantitative <strong>analyse</strong>teknikker


© Tapir Akademisk Forlag, Trondheim 2007<br />

ISBN 978-82-519-2178-7<br />

Det må ikke kopieres fra denne boka ut over det som er tillatt<br />

etter bestemmelser i «Lov om opphavsrett til åndsverk», og<br />

avtaler om kopiering inngått <strong>med</strong> Kopinor.<br />

Grafisk formgivning og tilrettelegging: Ingrid Venås<br />

Omslag: Tapir Akademisk Forlag<br />

Papir: 90 g G-print<br />

Trykk: Tapir Uttrykk<br />

Innbinding: Grafisk Produksjonsservice AS<br />

Tapir Akademisk Forlag har som målsetting å bidra til å utvikle og utgi<br />

gode læremidler og alle typer faglitteratur. Vi representerer et bredt fagspekter,<br />

og gir ut ca. 70 nye titler i året. Vi har basis i undervisnings- og forskningsmiljøet<br />

i Trondheim, men vi har forfattere fra fagmiljøer i hele landet.<br />

Våre viktigste produktområder er:<br />

• Læremidler for høyere utdanning<br />

• Fagbøker for profesjonsmarkedet<br />

• Sakprosa for det regionale allmennmarkedet (regional kultur, historie og natur)<br />

Tapir Akademisk Forlag<br />

7005 TRONDHEIM<br />

Tlf.: 73 59 32 10<br />

Faks: 73 59 32 04<br />

E-post: forlag@tapir.no<br />

www.tapirforlag.no


Innhold<br />

FORORD ..............................................................................................................................9<br />

INNLEDNING....................................................................................................................11<br />

DEL 1 ..................................................................................................................................15<br />

HVA DU BØR LÆRE DEG FØRST .........................................................................................15<br />

1 FØR VI SETTER I GANG ......................................................................................16<br />

1.1 <strong>SPSS</strong>..................................................................................................................17<br />

1.2 EUROPEAN SOCIAL SURVEY ..............................................................................17<br />

1.3 DATAMATRISEN.................................................................................................20<br />

1.4 MÅLENIVÅ.........................................................................................................20<br />

1.5 KOMMANDOER I <strong>SPSS</strong>.......................................................................................22<br />

1.6 VEKTING............................................................................................................22<br />

LITTERATUR.....................................................................................................................24<br />

2 FORBEREDELSE AV DATA.................................................................................26<br />

2.1 NYE VARIABELNAVN .........................................................................................27<br />

2.2 OMKODING AV DIKOTOME VARIABLER ..............................................................27<br />

2.3 OMKODING AV NOMINALSKALAVARIABLER ......................................................29<br />

2.4 OMKODING AV ORDINALSKALAVARIABLER .......................................................32<br />

2.5 OMKODING AV VARIABEL PÅ INTERVALLNIVÅ...................................................36<br />

2.6 KATEGORISERING AV KONTINUERLIGE VARIABLER ...........................................36<br />

2.7 KONSTRUERE SKALAVARIABEL .........................................................................38<br />

2.8 KOMBINERE VERDIER FRA FLERE VARIABLER ....................................................39<br />

2.9 SLETTING OG FILTRERING ..................................................................................41<br />

2.10 DELE OPP DATASETTET ETTER ULIKE VERDIER PÅ EN VARIABEL........................43<br />

2.11 OMKODING TIL SOSIALE KLASSER......................................................................43<br />

2.12 OPPRETTE ARBEIDSFIL .......................................................................................45<br />

APPENDIKS.......................................................................................................................46<br />

LITTERATUR.....................................................................................................................51


3 FRA KORRELASJON TIL LINEÆR REGRESJON ..........................................52<br />

3.1 KORRELASJONSTESTER I <strong>SPSS</strong> ..........................................................................53<br />

3.2 BIVARIAT REGRESJON........................................................................................55<br />

3.3 MULTIVARIAT REGRESJON.................................................................................59<br />

4 KVADRATLEDD OG SAMSPILL I LINEÆR REGRESJONSANALYSE ......64<br />

4.1 LINEÆR REGRESJONSANALYSE MED KVADRATLEDD..........................................65<br />

4.2 LINEÆR REGRESJONSANALYSE MED SAMSPILL ..................................................68<br />

4.3 REGRESJON MED ANDREGRADSLEDD OG SAMSPILL............................................70<br />

4.4 BETINGET EFFEKTPLOTT ....................................................................................73<br />

4.5 MAKSIMALE POSITIVE OG NEGATIVE EFFEKTER.................................................78<br />

5 LOGISTISK REGRESJON.....................................................................................82<br />

5.1 LOGISK REGRESJON?..........................................................................................83<br />

5.2 FORBEREDELSE TIL LOGISTISK REGRESJON ........................................................85<br />

5.3 VÅR FØRSTE LOGISTISKE REGRESJONSMODELL..................................................87<br />

5.4 TOLKNING AV ANALYSERESULTATER ................................................................90<br />

5.5 PROSENTVIS ENDRING I ODDS ............................................................................92<br />

5.6 BEREGNING AV SANNSYNLIGHETER...................................................................94<br />

5.7 BETINGET EFFEKTPLOTT ....................................................................................96<br />

5.8 LOGIT, ANTILOGARITME, ODDS, ODDSRATIO OG SANNSYNLIGHETER… .............99<br />

5.9 HVORDAN BEST PRESENTERE RESULTATENE?..................................................101<br />

5.10 RASKERE DUMMYKODING I LOGISTISK REGRESJON..........................................105<br />

5.11 DUMMYKODING I LOGISTISK REGRESJON UTEN REFERERANSEKATEGORI.........106<br />

LITTERATUR...................................................................................................................110<br />

6 TESTER AV FORUTSETNINGER FOR LINEÆR OG LOGISTISK<br />

REGRESJONSANALYSE.....................................................................................112<br />

6.1 RESIDUALENE SKAL VÆRE NORMALFORDELTE (GJELDER BARE OLS)..............113<br />

6.2 VI SKAL HA FRAVÆR AV HETEROSKEDASTISITET (GJELDER BARE OLS) ..........118<br />

6.3 FORUTSETNING OM FRAVÆR AV AUTOKORRELASJON (GJELDER BARE OLS)....124<br />

6.4 DET SKAL VÆRE FRAVÆR AV MULTIKOLLINEARITET (GJELDER BÅDE OLS OG<br />

LOGIT) ............................................................................................................125


6.5 DET SKAL IKKE VÆRE DISKRIMINERINGSPROBLEM (GJELDER BARE LOGIT)......129<br />

6.6 IKKE-LINEARITET I PARAMETERNE (GJELDER BÅDE OLS OG LOGIT) ................130<br />

6.7 FRAVÆR AV INNFLYTELSESRIKE ENHETER (GJELDER BÅDE OLS OG LOGIT)....133<br />

LITTERATUR...................................................................................................................142<br />

DEL 2 ................................................................................................................................145<br />

NÅR “VANLIG” REGRESJONSANALYSE IKKE ER NOK…...................................................145<br />

7 MULTINOMISK OG ORDINAL LOGISTISK REGRESJON.........................146<br />

7.1 MODELL MED ÉN UAVHENGIG VARIABEL.........................................................151<br />

7.2 EN STOR MODELL MED SAMTLIGE UAVHENGIGE VARIABLER ...........................153<br />

7.3 BETINGET SANNSYNLIGHETSPLOTT..................................................................160<br />

7.4 PRESENTASJON AV RESULTATER......................................................................162<br />

7.5 ORDINAL LOGISTISK REGRESJON SOM ALTERNATIV VED AVHENGIGE VARIABLER<br />

PÅ ORDINALNIVÅ.............................................................................................164<br />

7.6 SAMMENLIKNING AV RESULTATER FRA MULTINOMISK OG ORDINAL LOGISTISK<br />

REGRESJON......................................................................................................168<br />

LITTERATUR...................................................................................................................170<br />

8 FLERNIVÅANALYSE ..........................................................................................172<br />

8.1 FLERNIVÅDATA OG FLERNIVÅANALYSE...........................................................173<br />

8.2 FLERNIVÅANALYSE EKSEMPLIFISERT I <strong>SPSS</strong> ...................................................175<br />

8.3 INTRODUKSJON AV VARIABLER PÅ NIVÅ-2.......................................................185<br />

8.4 “RANDOM SLOPE”-MODELLER .........................................................................188<br />

8.5 KRYSSNIVÅ-INTERAKSJONER (CROSS-LEVEL INTERACTIONS)..........................191<br />

8.6 FLERNIVÅANALYSE MED TRE NIVÅER ..............................................................193<br />

APPENDIKS 1: KODING AV DEN AVHENGIGE VARIABELEN..............................................195<br />

APPENDIKS 2: KODING AV GDP1000 OG EAST_EU VARIABLER......................................198<br />

APPENDIKS 3: SYNTAKSEN FOR KODING AV REGION VARIABELEN .................................200<br />

LITTERATUR...................................................................................................................201<br />

9 OVERLEVELSESANALYSE ...............................................................................202<br />

9.1 HVORFOR MÅ VI BRUKE OVERLEVELSESANALYSE?..........................................204<br />

9.2 FORUTSETNINGER FOR ANALYSER MED SENSURERTE DATA.............................205


9.3 OVERLEVELSESFUNKSJONEN ...........................................................................206<br />

9.4 HASARDFUNKSJONEN ......................................................................................207<br />

9.5 COX PROPORSJONALE HASARDMODELL ...........................................................207<br />

9.6 PARTIELL LIKELIHOOD ESTIMERING AV PARAMETER Β.....................................208<br />

9.7 MODELLERING I <strong>SPSS</strong> .....................................................................................208<br />

9.8 TESTING AV PH-FORUTSETNINGER ..................................................................214<br />

LITTERATUR...................................................................................................................218<br />

10 FAKTORANALYSE ..............................................................................................220<br />

10.1 KRITERIER FOR Å BRUKE FAKTORANALYSE .....................................................222<br />

10.2 BEGRENSNINGER VED BRUK AV FAKTORANALYSE...........................................223<br />

10.3 GJENNOMFØRING AV FAKTORANALYSE I <strong>SPSS</strong>................................................223<br />

LITTERATUR...................................................................................................................234<br />

11 LOGARITMISKE TRANSFORMERTE VARIABLER I<br />

REGRESJONSANALYSE.....................................................................................236<br />

11.1 TOLKNING OG PRAKTISK ANVENDELSE I REGRESJONSANALYSE.......................238<br />

LITTERATUR...................................................................................................................246<br />

APPENDIKS: SYNTAKSKOMMANDOER ............................................................................247<br />

12 TO STEGS MINSTE KVADRATERS REGRESJON........................................248<br />

12.1 UTELATTE FORKLARINGSVARIABLER ..............................................................249<br />

12.2 TO STEGS MINSTE KVADRATERS REGRESJON....................................................255<br />

12.3 AVSLUTTENDE KOMMENTAR ...........................................................................269<br />

LITTERATUR...................................................................................................................271<br />

13 SELEKTERTE DATA ...........................................................................................272<br />

13.1 HVA ER SELEKTERTE DATA? ............................................................................273<br />

13.2 HVIS VERDI PÅ AVHENGIG VARIABEL IKKE OBSERVERES FOR ALLE ........................274<br />

13.3 NÅR VI HAR UOBSERVERT HETEROGENITET .....................................................284<br />

13.4 AVSLUTTENDE KOMMENTAR ...........................................................................291<br />

APPENDIKS.....................................................................................................................292<br />

LITTERATUR...................................................................................................................296


DEL 3 ................................................................................................................................299<br />

TEORETISKE BETRAKNINGER PÅ BRUK AV STATISTIKK...................................................299<br />

14 HVA KREVES FOR Å BLI DYKTIG TIL Å BRUKE STATISTIKK? ...........300<br />

14.1 PÅSTANDS- OG FORTROLIGHETSKUNNSKAP .....................................................301<br />

14.2 REFLEKTERENDE OPPSUMMERING ...................................................................309<br />

LITTERATUR...................................................................................................................310<br />

15 ET FARLIG REDSKAP? ......................................................................................312<br />

15.1 ET MEKTIG VÅPEN............................................................................................314<br />

15.2 “EGENTLIG”.....................................................................................................316<br />

15.3 ÅRSAK .............................................................................................................319<br />

15.4 DET STAT(IST)ISKE ØYEBLIKK..........................................................................321<br />

15.5 NACHSPIELDISKUSJONEN.................................................................................323<br />

LITTERATUR...................................................................................................................324<br />

OM FORFATTERNE......................................................................................................325<br />

STIKKORDSLISTE ........................................................................................................327


Forord<br />

Denne boken er basert på undervisningsnotater i forbindelse <strong>med</strong> statistikkundervisning<br />

for mastergradsstudenter ved Norges Teknisk – Naturvitenskapelige<br />

Universitet (NTNU). Hensikten <strong>med</strong> notatene var å gjøre dem tilgjengelig for<br />

studenter som etterspurte litteraturkilder som kunne hjelpe dem i praktiske <strong>analyse</strong>arbeider,<br />

og det var aldri meningen at dette skulle publiseres. De hyggelige tilbakemeldingene<br />

fra studentene gjorde at jeg fikk lyst til å gjøre notatene tilgjengelig for<br />

enda flere. Det var studentene som gav meg inspirasjonen, men det var ikke før jeg<br />

diskuterte planene <strong>med</strong> min tidligere studiekollega og <strong>med</strong>redaktør, Tommy<br />

Clausen, at idé ble til handling. Vi fant ut at vi ville skrive en omfattende bok på<br />

norsk, som kunne ta for seg både grunnleggende og mer avanserte statistiske<br />

metoder, noe vi selv har savnet i norsk metodelitteratur. Prosjektet vokste i omfang<br />

og utviklet seg etter hvert til å bli et samarbeid mellom åtte yngre forskere fra<br />

NTNU og Universitetet i Oslo. Alle har bakgrunn som samfunnsvitere innenfor<br />

fagområdene sosiologi, statsvitenskap eller pedagogikk. De fleste av oss er også i<br />

innspurten på doktorgradsarbeider, og alle <strong>med</strong>forfattere skal takkes for sine<br />

statistiske bidrag i en travel forskningshverdag. Det er imidlertid flere som skal<br />

takkes. Først og fremst Erling Berge og Arild Blekesaune som har vært til stor<br />

hjelp gjennom sine konstruktive tilbakemeldinger på bokmanuskriptet. Vi har også<br />

satt stor pris på assistansen fra Tapir Akedemisk Forlag ved Vebjørn Andreassen<br />

som har vært positiv til prosjektet helt fra begynnelsen. Halvard Buhaug var<br />

undertegnedes tidligere statistikklærer ved NTNU og hans undervisningsnotater har<br />

vært til god hjelp for mine egne. Han skal derfor ha stor takk for alle gode råd både<br />

i forbindelse <strong>med</strong> min egen undervisning og statistiske skolering. Til slutt sender<br />

jeg også en stor takk til alle mastergradsstudentene ved NTNU for flott samarbeid i<br />

undervisningsperioden. Jeg håper boken vil være til stor hjelp for dem og andre<br />

samfunnsvitere både under og etter studietiden, og vil sette stor pris på tips til nye<br />

kapitler i eventuelle senere utgaver av denne boken.<br />

Terje Andreas Eikemo


Innledning<br />

Å bli god på metode krever en del egeninnsats, men også gode hjelpemidler. Hvis<br />

du har tenkt å gjennomføre en kvantitativ <strong>analyse</strong> av et datasett i forbindelse <strong>med</strong><br />

studier eller jobb, så vil du ha stor praktisk nytte av denne boken. Boken er skrevet<br />

<strong>med</strong> det formål å gi studenter og andre en praktisk innføring i et utvalg regresjons<strong>analyse</strong>teknikker<br />

i <strong>SPSS</strong> (Statistical Package for Social Sciences) <strong>med</strong> bruk av data<br />

fra ESS (European Social Survey). Vi har bygget på egne erfaringer, som både<br />

studenter og yngre forskere, og skrevet en bok som forsøker å gi enkle og intuitive<br />

forklaringer på hva regresjons<strong>analyse</strong> er, og hvordan man selv kan gjennomføre en<br />

slik <strong>analyse</strong> i <strong>SPSS</strong>. Derfor vil du finne færre “greske bokstaver” i denne boken<br />

sammenlignet <strong>med</strong> andre bøker innen samme sjanger, og vi har også forsøkt å<br />

bruke et lett og uformelt språk. Vår bok har i stedet en praktisk tilnærming der vi<br />

gir leseren en forståelse av “hva som skjer” ved å bruke eksempler som forklares<br />

grundig. Vår erfaring tilsier at det er et gap mellom den teoretiske virkeligheten<br />

som mange lærebøker i kvantitativ metode forutsetter, og den praktiske virkeligheten<br />

som samfunnsvitere ofte møter når man skal <strong>analyse</strong>re sine data. Derfor går<br />

vi grundig til verks og viser hvilke trinn man må gå igjennom før man kan foreta en<br />

regresjons<strong>analyse</strong>; fra omkoding av variabler til tolkning av regresjonskoeffisienter.<br />

Dette er hovedinnholdet i bokens første del. I andre del av boken vil<br />

vi gi en praktisk innføring i et utvalg “avanserte” regresjons<strong>analyse</strong>teknikker. Som<br />

hovedfagsstudenter og doktorgradsstipendiater har vi erfart at mange norske lærebøker<br />

i kvantitativ metode ikke tar for seg de mer avanserte regresjons<strong>analyse</strong>teknikkene<br />

som man ofte får bruk for i mastergradsavhandlinger, eller<br />

senere i egen forskning eller utredningsarbeid. Dette fører ofte til mye frustrasjon<br />

og unødige forsinkelser i studieprogresjonen. I denne boken har vi derfor plukket<br />

ut noen av de mer “avanserte” regresjons<strong>analyse</strong>teknikkene som er lite<br />

dokumentert og eksemplifisert, spesielt på norsk og i statistikkprogrammet <strong>SPSS</strong>.<br />

Vi synes også det er viktig at samfunnsvitere som gjør statistiske <strong>analyse</strong>r<br />

reflekterer over denne rollen og ansvaret som følger <strong>med</strong>. Den tredje og siste delen<br />

av boken er derfor et teoretisk bidrag som diskuterer tallenes makt og hvordan vi<br />

bør forholde oss til dem. Alle kapitler har blitt lest av erfarne norske forskere innen<br />

kvantitativ metode, men eventuelle feil og mangler vil likevel være forfatternes<br />

ansvar. Boken har en egen webside der feil og mangler kan sendes inn<br />

(http://www.statistikkforum.no), og der forfatterne kan kontaktes via e-post.<br />

Eventuelle feil og mangler vil også publiseres her. Det er vårt håp og ønske at vi<br />

gjennom denne boken gjør det enkelt å tilegne seg kunnskap om hvordan ulike<br />

kvantitative <strong>analyse</strong>teknikker kan gjennomføres i <strong>SPSS</strong>, og hvordan disse<br />

<strong>analyse</strong>ne kan tolkes.<br />

Vi skal nå gi en ganske kortfattet kapitteloversikt. Boken har tre deler, hvorav<br />

den første tar for seg det du bør lære deg først. I denne delen blir vi aller først


edre kjent <strong>med</strong> <strong>SPSS</strong> (kapittel 1) før vi deretter lærer oss å forberede rådata til<br />

ulike <strong>analyse</strong>formål (kapittel 2). I kapittel 3 starter vi <strong>med</strong> de enkleste <strong>analyse</strong>formene<br />

(korrelasjoner, bivariat og multivariat regresjon), og i kapittel 4 gis en<br />

innføring i hvordan samspill og ikke-lineære sammenhenger kan inkluderes i<br />

modellene våre. Videre gir kapittel 5 en grundig praktisk innføring i hvordan<br />

logistisk regresjons<strong>analyse</strong> kan gjennomføres ved hjelp av <strong>SPSS</strong>, mens kapittel 6<br />

tar for seg <strong>analyse</strong>problemer og løsningsforslag i lineær og logistisk regresjons<strong>analyse</strong>.<br />

I bokens andre del møter vi litt mer avanserte <strong>analyse</strong>former, og strukturen er<br />

derfor ikke like kronologisk som i del 1. Dette betyr at de statistiske <strong>analyse</strong>ne er<br />

flerdimensjonale. Kapittel 7 omfatter det som kalles multinomisk og ordinal<br />

(logistisk) regresjon, og er en slags videreføring av kapittel 5 om logistisk<br />

regresjon. Forskjellen ligger i at vi benytter flere verdier på den avhengige<br />

variabelen sammenlignet <strong>med</strong> logistisk regresjon, hvor den avhengige variabelen<br />

bare har to verdier. I kapittel 8 presenterer vi flernivåanalayse, hvor hovedpoenget<br />

er å finne variasjoner ikke bare mellom individer, men også mellom regioner og<br />

land. Kapittel 9 omhandler såkalt overlevelses<strong>analyse</strong>, hvor vi får en innføring i<br />

hvordan vi kan måle hvor lenge et individ overlever før en gitt hendelse inntreffer.<br />

I kapittel 10 stifter vi nærmere bekjentskap <strong>med</strong> faktor<strong>analyse</strong>. Hensikten her er å<br />

finne ut om det ligger et underliggende mønster i respondentenes besvarelser.<br />

Kapittel 11 omhandler logaritmiske transformasjoner. Når man leser forskningsartikler,<br />

ser man ganske ofte at forfatteren oppgir å ha foretatt en logaritmisk<br />

transformasjon av enten avhengig og/eller uavhengig variabel. I dette kapitlet skal<br />

vi derfor lære oss hvordan slike <strong>analyse</strong>r skal forstås. To stegs minste kvadraters<br />

regresjon presenteres deretter i kapittel 12. Her skal vi forklare hvordan utelatelse<br />

av relevante forklaringsvariabler kan føre til at det oppstår en korrelasjon mellom<br />

feilleddet og en – eller flere – av de uavhengige variablene i en regresjonsligning. I<br />

kapittel 13 gir vi en kort innføring i hva selekterte data er, og hvilke statistiske<br />

problemer slike data <strong>med</strong>fører.<br />

Kapittel 14 og 15 utgjør bokens tredje og siste del. Dette er en teoretisk del som<br />

diskuterer hvilken rolle fortrolighetskunnskapen spiller i statistikken (kapittel 14),<br />

samt hvilke farer man må være oppmerksom på ved <strong>analyse</strong> av tallmateriale<br />

(kapittel 15).


DEL 1<br />

av Terje Andreas Eikemo<br />

Hva du bør lære deg først<br />

I denne delen av boken skal vi aller først gjøre oss kjent <strong>med</strong><br />

de enkleste og mest sentrale statistiske kommandoene i pro-<br />

gramvaren <strong>SPSS</strong>, samt se på hvordan vi kan forberede data-<br />

grunnlaget vårt (European Social Survey, ESS), slik at vi kan få<br />

svar på de spørsmålene vi ønsker å belyse. Deretter skal vi gå<br />

i gang <strong>med</strong> korrelasjonstester, bivariat, lineær- og logistisk re-<br />

gresjon. Lineær- og logistisk regresjon er antakeligvis de mest<br />

brukte kvantitative <strong>analyse</strong>teknikkene i sam-funnsvitenskapen,<br />

og det er viktig å lære seg prinsippene her før man går videre<br />

<strong>med</strong> mer avanserte former for <strong>analyse</strong>. Vi skal også gå nærmere<br />

inn på hvordan man kan bedømme i hvilken grad forutsetnin-<br />

gene for lineær- og logistisk regresjons<strong>analyse</strong> er oppfylt, og<br />

hva man kan gjøre når forutsetningene brytes, og panikken beg-<br />

ynner å bre seg.


1 Før vi setter i gang


1.1 <strong>SPSS</strong><br />

I denne boken skal vi bruke statistikkprogramvaren <strong>SPSS</strong> til å utføre <strong>analyse</strong>ne for<br />

oss. <strong>SPSS</strong> er en forkortelse av Statistical Package for the Social Sciences, og er et<br />

omfattende statistisk datahåndterings- og data<strong>analyse</strong>verktøy og er ett av de eldste<br />

og mest brukte programvarene innenfor statistisk <strong>analyse</strong>. <strong>SPSS</strong> er ofte det første<br />

statistikkprogrammet studenter konfronteres <strong>med</strong>, og det er ikke tilfeldig. Universitetene<br />

i Norge har lisensavtaler <strong>med</strong> <strong>SPSS</strong>, og programmet er svært brukervennlig.<br />

Derfor er det naturlig både for mange studenter, og der<strong>med</strong> også for oss, å<br />

ta i bruk <strong>SPSS</strong>. <strong>SPSS</strong> oppdateres stadig, og forfatterne av denne boken har benyttet<br />

versjon 12.0 eller nyere. Men la det likevel være sagt først som sist: <strong>SPSS</strong> er ikke<br />

det eneste programvarealternativet for deg som vil gjøre kvantitative data<strong>analyse</strong>r.<br />

Vi har derfor laget en oversikt over noen av programmene som kan utfylle eller<br />

erstatte flere av funksjonene i <strong>SPSS</strong>. Ikke alle har tilgang til lisensavtaler, og noen<br />

har også spesielle behov som gjør at andre programvarer kunne vært et mer<br />

naturlig alternativ. Vi synes derfor det er viktig at leseren gjøres oppmerksom på<br />

noen av alternativene til <strong>SPSS</strong>. I tabell 1.1 har vi derfor laget en liste over et utvalg<br />

alternativer, oppgitt nettlenker, samt gitt en kort beskrivelse av programvaren.<br />

1.2 European Social Survey<br />

Datamaterialet vi skal bruke i denne håndboken, er den foreløpige siste versjonen<br />

(2004) av surveyundersøkelsen European Social Survey (heretter: ESS). ESS er en<br />

europeisk surveyundersøkelse som muliggjør systematiske studier av holdninger og<br />

verdier sett opp mot sosioøkonomiske og politiske problemstillinger i et europeisk<br />

perspektiv. Vi finner ESS nyttig av minst tre årsaker. For det første er ESS en god<br />

survey å benytte for den som vil studere endringer over tid, selv om det foreløpig<br />

kun er gjort undersøkelser i 2002 og 2004, og de samme respondentene ikke kan<br />

koples mot hverandre i de ulike periodene (ikke paneldata). For det andre er ESS et<br />

spesielt godt materiale for den som vil sammenligne effekter mellom regioner og<br />

land. Validiteten av komparative studier begrenses ofte av at landenes effekter ikke<br />

er utregnet fra samme sted til samme tid. I ESS er samme spørsmål stilt i alle land<br />

og regioner i samme periode. For det tredje er data og dokumentasjon fra ESS<br />

allment tilgjengelig på internett (http://www.ess.nsd.uib.no). Det eneste du trenger<br />

å gjøre for å få tilgang, er å registrere deg <strong>med</strong> navn, e-post-adresse, institusjon og<br />

land. I første omgang benytter vi den norske delen av undersøkelsen. I kapitlet om<br />

flernivå<strong>analyse</strong> vil vi derimot vise hvordan vi kan behandle den internasjonale<br />

datafilen.


Tabell 1.1 Et utvalg alternativer til <strong>SPSS</strong><br />

KAPITTEL 1: Før vi setter i gang<br />

Programvare Informasjonslink Kort beskrivelse av programvaren<br />

Gauss<br />

http://www.aptech.com/gauss.html<br />

18<br />

Program som løser svært store<br />

og kompliserte optimaliserings-<br />

og data<strong>analyse</strong>problemer. Basert<br />

på programmeringsspråket<br />

gauss.<br />

GIS www.gis.com Program for behandling av<br />

stedfestet informasjon.<br />

Visualiserer resultater i kart.<br />

Grapher http://www.goldensoftware.com/<br />

products/grapher/grapher.shtml<br />

Program for presentasjon og<br />

visualisering av data.<br />

JMP http://www.jmp.com/ Brukervennlig og omfattende<br />

statistikkprogram. Svært god på<br />

interaktiv grafisk visualisering og<br />

presentasjon.<br />

Microsoft Excel http://www.microsoft.com/norge/office/<br />

excel/prodinfo/overview.mspx<br />

Minitab http://www.bath.ac.uk/bucs/<br />

software/statistics/minitab.shtml<br />

Regne og <strong>analyse</strong>program for<br />

utarbeidelse av statistiske<br />

<strong>analyse</strong>r. Spesielt godt egnet til<br />

grafiske framstillinger.<br />

Interaktivt statistikkprogram som<br />

<strong>analyse</strong>rer små og middels store<br />

datasett.<br />

NSDstat www.nsd.uib.no Program for <strong>analyse</strong> og<br />

presentasjon av samfunnsfaglige<br />

data. Programmet<br />

systematiserer, henter fram og<br />

presenterer informasjon fra<br />

datasamlinger.<br />

Originlab http://www.originlab.com/ Program for presentasjon og<br />

visualisering av data.<br />

R http://mirrors.sunsite.dk/cran/ Statistikkprogram som har store<br />

likheter <strong>med</strong> S-plus. Gratis<br />

programvare. Også tilgjengelig<br />

for linux.<br />

SAS http://www.sas.com/technologies/<br />

analytics/index.html<br />

Sigmaplot http://www.alfasoft.no/produkter/<br />

sigmaplot/sigmaplot.htm<br />

Statistikkprogram som er mye<br />

benyttet innen naturvitenskap,<br />

teknologi og <strong>med</strong>isin.<br />

Program for presentasjon og<br />

visualisering av data.


European Social Survey<br />

Programvare Informasjonslink Kort beskrivelse av programvaren<br />

S-Plus http://www.insightful.com/<br />

support/documentation.asp<br />

19<br />

Omfattende statistikkprogram<br />

som er spesielt godt tilrettelagt<br />

for grafisk bruk. Støttes også av<br />

linux.<br />

Stata www.stata.com Har stort utvalg av statistiske<br />

metoder og er svært kraftig på<br />

databearbeiding.<br />

Statistica http://www.statsoft.com/ Statistikkprogram som er mye<br />

brukt innen <strong>med</strong>isin, psykologi og<br />

matematikk.<br />

Surfer http://www.goldensoftware.com/products/<br />

surfer/surfer.shtml<br />

Program for presentasjon og<br />

visualisering av data. Spesielt<br />

godt egnet for kartpresentasjoner.<br />

Systat http://www.systat.com/products/Systat/ Inneholder alle grunnleggende<br />

statistiske metoder og <strong>analyse</strong>r.<br />

Svært gode<br />

visualiseringsmetoder.<br />

Hvis du skulle være i tvil om hvilke programmer som er tilgjengelige ved ditt<br />

universitet, kan du ta en kikk på disse linkene:<br />

Tabell 1.2 Tilgjengelige lisensavtaler ved universitetene i Norge<br />

Universitetet i Oslo http://www.usit.uio.no/it/statistikk/stat-ressurser.html<br />

NTNU http://www.ntnu.no/itea.info/programvare/progtilbud.html<br />

Universitetet i Tromsø http://uit.no/orakel/lisenser/<br />

Universitetet i Bergen http://www.uib.no/IT/prog/statmat/<br />

Det er også verdt å merke seg at det finnes flere gode supplementer til denne<br />

boken. Heldigvis er det flere som har skrevet praktiske innføringsbøker i kvantitativ<br />

metode på norsk, og vi vil gjerne trekke fram Asbjørn Johannessen m.fl.<br />

(2006), Karl Georg Øhrn (2005) og Christer Thrane (2003) for fine bidrag. For en<br />

mer teoretisk innføring har Kristen Ringdal (2001), Ole-Jørgen Skog (2003),<br />

Sigmund Grønmo (2004) og Ottar Hellevik (2001) skrevet hver sin “bibel” i samfunnsvitenskapelige<br />

metode.


1.3 Datamatrisen<br />

KAPITTEL 1: Før vi setter i gang<br />

La oss nå gå litt forsiktig i gang og bli kjent <strong>med</strong> datamatrisen i datavinduet (Data<br />

View). Dette er det første vi ser når vi åpner filen. Datamatrisen består av<br />

variabler, enheter og verdier. Variablene gjengir spørsmålene i undersøkelsen.<br />

Disse er markert i grått og er listet opp vannrett øverst i matrisen. Variabelnavnene<br />

har som regel forkortede symboler, og mer utfyllende navn kommer til syne<br />

dersom musepekeren plasseres over variablene. Ytterligere informasjon får vi<br />

dersom vi trykker på knappen Variables på verktøylinjen (markert <strong>med</strong> spørsmålstegn).<br />

Enhetene er listet loddrett på venstre side i matrisen og står oppført i<br />

stigende rekkefølge fra 1 til 1760. Hver enhet representerer én person, noe som<br />

betyr at totalt 1760 personer deltok i den norske undersøkelsen fra 2004. Verdiene<br />

er tallene i det hvite rutenettet mellom variablene og enhetene. Disse representerer<br />

svarene respondentene (enhetene) gav på spørsmålene (variablene). Fram til nå har<br />

vi studert datavinduet. Vi skal nå se nærmere på variabelvinduet (Variable View)<br />

som vi får opp dersom vi klikker på den lille fliken nederst til venstre. Her finner vi<br />

mer informasjon om variablene, som er sortert loddrett, og variablenes kjennetegn,<br />

som står oppført vannrett. Bruk gjerne litt tid på å forstå logikken <strong>med</strong> henholdsvis<br />

data- og variabelvinduet.<br />

1.4 Målenivå<br />

Ett av kjennetegnene som står oppført i variabelvinduet, er variablenes målenivå<br />

(Measure). Målenivået er ikke alltid riktig definert i <strong>SPSS</strong>, men vi skal uansett<br />

lære oss å definere det selv. Det er viktig å lære seg forskjellene mellom de ulike<br />

målenivåene, da dette vil være være <strong>med</strong> å bestemme både hvordan variabelen skal<br />

operasjonaliseres, og hvilken type <strong>analyse</strong> vi bør velge (dersom det er snakk om<br />

den avhengige variabelen). Nominalnivået klassifiseres gjennom gjensidig utelukkende<br />

grupper, som for eksempel kjønn og geografisk tilknytning. Disse<br />

gruppene kan <strong>med</strong> andre ord ikke rangeres på en skala. Ordinalnivåvariabler er<br />

også gjensidig utelukkende, men det kan være mulig å snakke om en slags<br />

rangering. For eksempel liten interesse mot større interesse, eller lite deltakelse mot<br />

mye deltakelse. Imidlertid kan det noen ganger være vanskelig å avgjøre om vi bør<br />

beholde ordinalskalavariabler skalert i <strong>analyse</strong>n vår (alternativet ville vært å utføre<br />

dummykoding, som vi skal illustrere i kapittel 2). Da må vi være rimelig sikre på at<br />

avstanden mellom de lave verdiene (for eksempel avstanden mellom verdi 1 og 2)<br />

tilsvarer den samme avstanden mellom de høye verdiene (for eksempel avstanden<br />

mellom verdi 9 og 10 på den samme variabelen). La oss se på et eksempel på en<br />

ordinalskalavariabel som ikke har like stor avstand mellom verdiene: Vi kan si at<br />

avstanden mellom 1 og 2 tilsvarer noenlunde avstanden mellom 9 og 10 på en<br />

holdningsskalavariabel fra 1 til 10, men vi kan ikke si at avstanden mellom 1<br />

20


Målenivå<br />

(grunnskole) og 2 (vgs) tilsvarer avstanden mellom 3 (høyskole) og 4 (universitet)<br />

dersom vi ser på en utdanningsnivåvariabel. Her ser vi at enhetene er rangert i<br />

forhold til hverandre, selv om avstanden er diffus. Ved alle tvilstilfeller vil det<br />

være din egen argumentasjon som er utslagsgivende for hvordan variabelen bør<br />

tolkes og operasjonaliseres. Variabler på intervallnivå refererer til tall som står i et<br />

klart relativt forhold til hverandre, men det finnes ikke et klart definert nullpunkt.<br />

Typiske eksempler på slike variabler er temperaturer og intelligenstester. Siste<br />

målenivå vi tar <strong>med</strong>, er forholdstallsnivå. Slike variabler har samme kjennetegn<br />

som intervallvariabler, <strong>med</strong> det unntaket av vi har et klart nullpunkt. Antall år en<br />

person har vært i utdanningssystemet (her er det altså ikke snakk om utdanningsnivå),<br />

inntekt og alder er eksempler her. Dette betyr at det er meningsfullt å operere<br />

<strong>med</strong> forholdstallsrater: dobbelt så gammel er et meningsfullt utsagn, dobbelt så<br />

varm er ikke meningsfullt på samme måte (hvis det ikke er klart at vi benytter<br />

Kelvinskalaen). Derfor kan vi si at skillet mellom intervallskalavariabler og forholdstallsvariabler<br />

er bestemt av måleskalen som benyttes, og ikke av det substansielle<br />

innholdet i variabelen. Se ellers hvordan du kan definere variablenes<br />

målenivåer ved hjelp av tabell 1.3 på neste side.<br />

Tabell 1.3 Hvordan definere variabelens målenivå<br />

Har variabelen mer enn 2 kategorier?<br />

<br />

Er avstanden mellom alle kategorier lik? JA NEI Variabelen er dikotom<br />

<br />

JA NEI Kan kategoriene settes i rekkefølge?<br />

<br />

Variabelen er kontinuerlig JA NEI Variabelen er på nominalnivå<br />

<br />

Har variabelen et nullpunkt? Variabelen er på ordinalnivå<br />

<br />

JA NEI Variabelen er på forholdstallsnivå<br />

<br />

Variabelen er på intervallnivå<br />

21


1.5 Kommandoer i <strong>SPSS</strong><br />

KAPITTEL 1: Før vi setter i gang<br />

Det er viktig at leseren av denne boken er klar over hvordan ulike operasjoner, som<br />

for eksempel omkodinger og <strong>analyse</strong> av data kan utføres i <strong>SPSS</strong>. Dette kan nemlig<br />

gjøres på to forskjellige måter; enten ved å benytte kommandoene øverst i<br />

verktøylinjen eller ved hjelp av syntaksen. Verktøylinjen er selvforklarende og<br />

krever kun at du klikker deg inn på riktig meny. Syntaksen, derimot, er et<br />

kommandoprogram som kan utføre de samme kommandoene som i verktøylinjen,<br />

men det er en viktig forskjell: I syntaksen kan du lagre kommandoene dine, og du<br />

vil derfor være i stand til å se hvordan du har gått fram i ettertid. Har du derfor<br />

gjort en feil, så vil du kunne lokalisere denne i syntaksen. Dessuten kan du lett<br />

utføre lagrede kommandoer på nytt, for eksempel hvis du skulle ha vært så uheldig<br />

å slette data. I denne boken kommer vi til å bruke både verktøylinjen og syntaksen,<br />

litt om hverandre. Men når lengre kommandoer skal utføres, bruker vi som regel<br />

syntaksen. Vi anbefaler at du gjør deg fortrolig <strong>med</strong> bruken av syntaksen så tidlig<br />

som mulig. Det vil spare deg for mye tid! Syntaks-kommandovinduet åpner du ved<br />

å trykke deg inn på File New Syntax. Det er i hovedsak to måter å føre inn<br />

kommandoer på. Hvis du husker kommandoen skriver du den ganske enkelt inn i<br />

syntakskommandovinduet, men hvis du ikke kan den er paste-funksjonen et fint<br />

alternativ. Når du “bestiller” <strong>analyse</strong>ne dine, kan du alltid velge å kjøre ut<br />

kommandoene ved å trykke på OK, eller ved å trykke på Paste-knappen som<br />

automatisk omformer ”bestillingen” til en nedskrevet kommando som dukker opp i<br />

syntaksvinduet. I delkapittel 2.9 viser vi et eksempel på dette.<br />

1.6 Vekting<br />

Alle har ikke hatt like stor sjanse til å delta i spørreundersøkelsen som ESS baseres<br />

på. På bakgrunn av den varierende seleksjonssannsynligheten vil noen typer<br />

regioner og husholdninger være underrepresentert i studien, mens andre er overrepresentert.<br />

Overrepresentasjon oppstår gjerne hvis veldig mange fra samme<br />

husholdning intervjues. Som regel blir skjevhetene beskjedne, men de kan justeres<br />

ved at svarene til bestemte respondenter tillegges mer eller mindre vekt; derav<br />

begrepet vekting. Designvektvariabelen dweight er laget til dette formålet. Vi har<br />

ikke vektet <strong>analyse</strong>ne i denne boken, fordi våre <strong>analyse</strong>r bare er eksempler på<br />

fremgangsmåter. Hvis du derimot skal skrive forskningsartikler, så kreves det at<br />

resultatene er så nøyaktige som mulig og følgelig anbefaler vi at du vekter<br />

resultatene dine. Dette gjelder alle typer <strong>analyse</strong>r; fra frekvens- og prosentuerte<br />

tabeller til korrelasjons- og regresjons<strong>analyse</strong>r. Du vekter ved å gå inn i menyen<br />

Data Weight Cases. Marker deretter variabelen dweight i vinduet som kommer<br />

opp og trykk på Weight Cases By. Trykk deretter på pilen som fører over<br />

vektevariabelen til boksen Frequency Variable. Nå trykker du på OK og alle<br />

22


Vekting<br />

<strong>analyse</strong>r du gjør vil vektes. Du vil få bekreftet av vektingen er aktivert ved at<br />

Weight On står nede til høyre i <strong>SPSS</strong>-vinduet. Selv om landene som er <strong>med</strong> i ESSundersøkelsen<br />

har svært ulike populasjonsstørrelser, så er utvalgsstørrelsen omtrent<br />

den samme for alle. Hvis ikke dette justeres, så vil små land overrepresenteres på<br />

bekostning av store. Derfor finnes det også en annen vekt i datasettet som heter<br />

pweight. Dette er en populasjonsstørrelsevekt som bare skal brukes hvis du<br />

<strong>analyse</strong>r to eller flere land samtidig. Vekten skal derimot ikke brukes hvis du<br />

<strong>analyse</strong>rer landene i separate <strong>analyse</strong>r, hvor det ikke referes til et gjennomsnitt.<br />

Vekten aktiviseres ved å benytte samme fremgangsmåte som for designvekten. En<br />

viktig tilleggsopplysning er at populasjons-størrelsevekten alltid skal brukes i<br />

kombinasjon <strong>med</strong> designvekten. Dette gjøres ved å konstruere en ny vekt ved å<br />

gange sammen dweight og pweight. Dette får du til ved å gå inn i menyen<br />

Transform Compute. Skriv inn et variabelnavn i Target Variable-boksen (for<br />

eksempel dpweight) før du noterer pweight*dweigh i Numeric Expressionrubrikken.<br />

Alternativt kan du bruke syntakskommandovinduet:<br />

*Konstruksjon av kombinert vektevariabel <strong>med</strong> basis i dweight og pweight.<br />

compute dpweight = dweight*pweight.<br />

23


Litteratur<br />

KAPITTEL 1: Før vi setter i gang<br />

Grønmo, S. (2004): Samfunnsvitenskapelige metoder, Bergen: Fagbokforlaget.<br />

Hellevik, O. (2002): Forskningsmetode i sosiologi og statsvitenskap, Oslo:<br />

Universitetsforlaget.<br />

Johannessen, A., P. A. Tufte og L. Kristoffersen (2006): Introduksjon til<br />

samfunnsvitenskapelig metode, Oslo: Abstrakt forlag, 3. utg.<br />

Ringdal, K. (2001): Enhet og Mangfold, Bergen: Fagbokforlaget.<br />

Skog, O. (2003): Å forklare sosiale fenomener, Oslo: Gyldendal Akademisk, 2. utg.<br />

Thrane, C. (2003): Regresjons<strong>analyse</strong> i praksis, Kristiansand S: Høyskoleforlaget.<br />

Øhrn, K. G. (2005): Hvordan lykkes <strong>med</strong> metode og statistikk i samfunnsfag?: en<br />

hjelpebok <strong>med</strong> løsninger av eksamensoppgaver, Oslo: Universitetsforlaget, 2.utg.<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!