Kvantitativ analyse med SPSS

Kvantitativ analyse med SPSS

Terje Andreas Eikemo & Tommy Høyvarde Clausen (red.) 

Kvantitativ analyse med SPSS 

En praktisk innføring i kvantitative analyseteknikker

© Tapir Akademisk Forlag, Trondheim 2007 

ISBN 978-82-519-2178-7 

Det må ikke kopieres fra denne boka ut over det som er tillatt 

etter bestemmelser i «Lov om opphavsrett til åndsverk», og 

avtaler om kopiering inngått med Kopinor. 

Grafisk formgivning og tilrettelegging: Ingrid Venås 

Omslag: Tapir Akademisk Forlag 

Papir: 90 g G-print 

Trykk: Tapir Uttrykk 

Innbinding: Grafisk Produksjonsservice AS 

Tapir Akademisk Forlag har som målsetting å bidra til å utvikle og utgi 

gode læremidler og alle typer faglitteratur. Vi representerer et bredt fagspekter, 

og gir ut ca. 70 nye titler i året. Vi har basis i undervisnings- og forskningsmiljøet 

i Trondheim, men vi har forfattere fra fagmiljøer i hele landet. 

Våre viktigste produktområder er: 

• Læremidler for høyere utdanning 

• Fagbøker for profesjonsmarkedet 

• Sakprosa for det regionale allmennmarkedet (regional kultur, historie og natur) 

Tapir Akademisk Forlag 

7005 TRONDHEIM 

Tlf.: 73 59 32 10 

Faks: 73 59 32 04 

E-post: forlag@tapir.no 

www.tapirforlag.no

Innhold 

FORORD ..............................................................................................................................9 

INNLEDNING....................................................................................................................11 

DEL 1 ..................................................................................................................................15 

HVA DU BØR LÆRE DEG FØRST .........................................................................................15 

1 FØR VI SETTER I GANG ......................................................................................16 

1.1 SPSS..................................................................................................................17 

1.2 EUROPEAN SOCIAL SURVEY ..............................................................................17 

1.3 DATAMATRISEN.................................................................................................20 

1.4 MÅLENIVÅ.........................................................................................................20 

1.5 KOMMANDOER I SPSS.......................................................................................22 

1.6 VEKTING............................................................................................................22 

LITTERATUR.....................................................................................................................24 

2 FORBEREDELSE AV DATA.................................................................................26 

2.1 NYE VARIABELNAVN .........................................................................................27 

2.2 OMKODING AV DIKOTOME VARIABLER ..............................................................27 

2.3 OMKODING AV NOMINALSKALAVARIABLER ......................................................29 

2.4 OMKODING AV ORDINALSKALAVARIABLER .......................................................32 

2.5 OMKODING AV VARIABEL PÅ INTERVALLNIVÅ...................................................36 

2.6 KATEGORISERING AV KONTINUERLIGE VARIABLER ...........................................36 

2.7 KONSTRUERE SKALAVARIABEL .........................................................................38 

2.8 KOMBINERE VERDIER FRA FLERE VARIABLER ....................................................39 

2.9 SLETTING OG FILTRERING ..................................................................................41 

2.10 DELE OPP DATASETTET ETTER ULIKE VERDIER PÅ EN VARIABEL........................43 

2.11 OMKODING TIL SOSIALE KLASSER......................................................................43 

2.12 OPPRETTE ARBEIDSFIL .......................................................................................45 

APPENDIKS.......................................................................................................................46 

LITTERATUR.....................................................................................................................51

3 FRA KORRELASJON TIL LINEÆR REGRESJON ..........................................52 

3.1 KORRELASJONSTESTER I SPSS ..........................................................................53 

3.2 BIVARIAT REGRESJON........................................................................................55 

3.3 MULTIVARIAT REGRESJON.................................................................................59 

4 KVADRATLEDD OG SAMSPILL I LINEÆR REGRESJONSANALYSE ......64 

4.1 LINEÆR REGRESJONSANALYSE MED KVADRATLEDD..........................................65 

4.2 LINEÆR REGRESJONSANALYSE MED SAMSPILL ..................................................68 

4.3 REGRESJON MED ANDREGRADSLEDD OG SAMSPILL............................................70 

4.4 BETINGET EFFEKTPLOTT ....................................................................................73 

4.5 MAKSIMALE POSITIVE OG NEGATIVE EFFEKTER.................................................78 

5 LOGISTISK REGRESJON.....................................................................................82 

5.1 LOGISK REGRESJON?..........................................................................................83 

5.2 FORBEREDELSE TIL LOGISTISK REGRESJON ........................................................85 

5.3 VÅR FØRSTE LOGISTISKE REGRESJONSMODELL..................................................87 

5.4 TOLKNING AV ANALYSERESULTATER ................................................................90 

5.5 PROSENTVIS ENDRING I ODDS ............................................................................92 

5.6 BEREGNING AV SANNSYNLIGHETER...................................................................94 

5.7 BETINGET EFFEKTPLOTT ....................................................................................96 

5.8 LOGIT, ANTILOGARITME, ODDS, ODDSRATIO OG SANNSYNLIGHETER… .............99 

5.9 HVORDAN BEST PRESENTERE RESULTATENE?..................................................101 

5.10 RASKERE DUMMYKODING I LOGISTISK REGRESJON..........................................105 

5.11 DUMMYKODING I LOGISTISK REGRESJON UTEN REFERERANSEKATEGORI.........106 

LITTERATUR...................................................................................................................110 

6 TESTER AV FORUTSETNINGER FOR LINEÆR OG LOGISTISK 

REGRESJONSANALYSE.....................................................................................112 

6.1 RESIDUALENE SKAL VÆRE NORMALFORDELTE (GJELDER BARE OLS)..............113 

6.2 VI SKAL HA FRAVÆR AV HETEROSKEDASTISITET (GJELDER BARE OLS) ..........118 

6.3 FORUTSETNING OM FRAVÆR AV AUTOKORRELASJON (GJELDER BARE OLS)....124 

6.4 DET SKAL VÆRE FRAVÆR AV MULTIKOLLINEARITET (GJELDER BÅDE OLS OG 

LOGIT) ............................................................................................................125

6.5 DET SKAL IKKE VÆRE DISKRIMINERINGSPROBLEM (GJELDER BARE LOGIT)......129 

6.6 IKKE-LINEARITET I PARAMETERNE (GJELDER BÅDE OLS OG LOGIT) ................130 

6.7 FRAVÆR AV INNFLYTELSESRIKE ENHETER (GJELDER BÅDE OLS OG LOGIT)....133 

LITTERATUR...................................................................................................................142 

DEL 2 ................................................................................................................................145 

NÅR “VANLIG” REGRESJONSANALYSE IKKE ER NOK…...................................................145 

7 MULTINOMISK OG ORDINAL LOGISTISK REGRESJON.........................146 

7.1 MODELL MED ÉN UAVHENGIG VARIABEL.........................................................151 

7.2 EN STOR MODELL MED SAMTLIGE UAVHENGIGE VARIABLER ...........................153 

7.3 BETINGET SANNSYNLIGHETSPLOTT..................................................................160 

7.4 PRESENTASJON AV RESULTATER......................................................................162 

7.5 ORDINAL LOGISTISK REGRESJON SOM ALTERNATIV VED AVHENGIGE VARIABLER 

PÅ ORDINALNIVÅ.............................................................................................164 

7.6 SAMMENLIKNING AV RESULTATER FRA MULTINOMISK OG ORDINAL LOGISTISK 

REGRESJON......................................................................................................168 

LITTERATUR...................................................................................................................170 

8 FLERNIVÅANALYSE ..........................................................................................172 

8.1 FLERNIVÅDATA OG FLERNIVÅANALYSE...........................................................173 

8.2 FLERNIVÅANALYSE EKSEMPLIFISERT I SPSS ...................................................175 

8.3 INTRODUKSJON AV VARIABLER PÅ NIVÅ-2.......................................................185 

8.4 “RANDOM SLOPE”-MODELLER .........................................................................188 

8.5 KRYSSNIVÅ-INTERAKSJONER (CROSS-LEVEL INTERACTIONS)..........................191 

8.6 FLERNIVÅANALYSE MED TRE NIVÅER ..............................................................193 

APPENDIKS 1: KODING AV DEN AVHENGIGE VARIABELEN..............................................195 

APPENDIKS 2: KODING AV GDP1000 OG EAST_EU VARIABLER......................................198 

APPENDIKS 3: SYNTAKSEN FOR KODING AV REGION VARIABELEN .................................200 

LITTERATUR...................................................................................................................201 

9 OVERLEVELSESANALYSE ...............................................................................202 

9.1 HVORFOR MÅ VI BRUKE OVERLEVELSESANALYSE?..........................................204 

9.2 FORUTSETNINGER FOR ANALYSER MED SENSURERTE DATA.............................205

9.3 OVERLEVELSESFUNKSJONEN ...........................................................................206 

9.4 HASARDFUNKSJONEN ......................................................................................207 

9.5 COX PROPORSJONALE HASARDMODELL ...........................................................207 

9.6 PARTIELL LIKELIHOOD ESTIMERING AV PARAMETER Β.....................................208 

9.7 MODELLERING I SPSS .....................................................................................208 

9.8 TESTING AV PH-FORUTSETNINGER ..................................................................214 

LITTERATUR...................................................................................................................218 

10 FAKTORANALYSE ..............................................................................................220 

10.1 KRITERIER FOR Å BRUKE FAKTORANALYSE .....................................................222 

10.2 BEGRENSNINGER VED BRUK AV FAKTORANALYSE...........................................223 

10.3 GJENNOMFØRING AV FAKTORANALYSE I SPSS................................................223 

LITTERATUR...................................................................................................................234 

11 LOGARITMISKE TRANSFORMERTE VARIABLER I 

REGRESJONSANALYSE.....................................................................................236 

11.1 TOLKNING OG PRAKTISK ANVENDELSE I REGRESJONSANALYSE.......................238 

LITTERATUR...................................................................................................................246 

APPENDIKS: SYNTAKSKOMMANDOER ............................................................................247 

12 TO STEGS MINSTE KVADRATERS REGRESJON........................................248 

12.1 UTELATTE FORKLARINGSVARIABLER ..............................................................249 

12.2 TO STEGS MINSTE KVADRATERS REGRESJON....................................................255 

12.3 AVSLUTTENDE KOMMENTAR ...........................................................................269 

LITTERATUR...................................................................................................................271 

13 SELEKTERTE DATA ...........................................................................................272 

13.1 HVA ER SELEKTERTE DATA? ............................................................................273 

13.2 HVIS VERDI PÅ AVHENGIG VARIABEL IKKE OBSERVERES FOR ALLE ........................274 

13.3 NÅR VI HAR UOBSERVERT HETEROGENITET .....................................................284 

13.4 AVSLUTTENDE KOMMENTAR ...........................................................................291 

APPENDIKS.....................................................................................................................292 

LITTERATUR...................................................................................................................296

DEL 3 ................................................................................................................................299 

TEORETISKE BETRAKNINGER PÅ BRUK AV STATISTIKK...................................................299 

14 HVA KREVES FOR Å BLI DYKTIG TIL Å BRUKE STATISTIKK? ...........300 

14.1 PÅSTANDS- OG FORTROLIGHETSKUNNSKAP .....................................................301 

14.2 REFLEKTERENDE OPPSUMMERING ...................................................................309 

LITTERATUR...................................................................................................................310 

15 ET FARLIG REDSKAP? ......................................................................................312 

15.1 ET MEKTIG VÅPEN............................................................................................314 

15.2 “EGENTLIG”.....................................................................................................316 

15.3 ÅRSAK .............................................................................................................319 

15.4 DET STAT(IST)ISKE ØYEBLIKK..........................................................................321 

15.5 NACHSPIELDISKUSJONEN.................................................................................323 

LITTERATUR...................................................................................................................324 

OM FORFATTERNE......................................................................................................325 

STIKKORDSLISTE ........................................................................................................327

Forord 

Denne boken er basert på undervisningsnotater i forbindelse med statistikkundervisning 

for mastergradsstudenter ved Norges Teknisk – Naturvitenskapelige 

Universitet (NTNU). Hensikten med notatene var å gjøre dem tilgjengelig for 

studenter som etterspurte litteraturkilder som kunne hjelpe dem i praktiske analysearbeider, 

og det var aldri meningen at dette skulle publiseres. De hyggelige tilbakemeldingene 

fra studentene gjorde at jeg fikk lyst til å gjøre notatene tilgjengelig for 

enda flere. Det var studentene som gav meg inspirasjonen, men det var ikke før jeg 

diskuterte planene med min tidligere studiekollega og medredaktør, Tommy 

Clausen, at idé ble til handling. Vi fant ut at vi ville skrive en omfattende bok på 

norsk, som kunne ta for seg både grunnleggende og mer avanserte statistiske 

metoder, noe vi selv har savnet i norsk metodelitteratur. Prosjektet vokste i omfang 

og utviklet seg etter hvert til å bli et samarbeid mellom åtte yngre forskere fra 

NTNU og Universitetet i Oslo. Alle har bakgrunn som samfunnsvitere innenfor 

fagområdene sosiologi, statsvitenskap eller pedagogikk. De fleste av oss er også i 

innspurten på doktorgradsarbeider, og alle medforfattere skal takkes for sine 

statistiske bidrag i en travel forskningshverdag. Det er imidlertid flere som skal 

takkes. Først og fremst Erling Berge og Arild Blekesaune som har vært til stor 

hjelp gjennom sine konstruktive tilbakemeldinger på bokmanuskriptet. Vi har også 

satt stor pris på assistansen fra Tapir Akedemisk Forlag ved Vebjørn Andreassen 

som har vært positiv til prosjektet helt fra begynnelsen. Halvard Buhaug var 

undertegnedes tidligere statistikklærer ved NTNU og hans undervisningsnotater har 

vært til god hjelp for mine egne. Han skal derfor ha stor takk for alle gode råd både 

i forbindelse med min egen undervisning og statistiske skolering. Til slutt sender 

jeg også en stor takk til alle mastergradsstudentene ved NTNU for flott samarbeid i 

undervisningsperioden. Jeg håper boken vil være til stor hjelp for dem og andre 

samfunnsvitere både under og etter studietiden, og vil sette stor pris på tips til nye 

kapitler i eventuelle senere utgaver av denne boken. 

Terje Andreas Eikemo

Innledning 

Å bli god på metode krever en del egeninnsats, men også gode hjelpemidler. Hvis 

du har tenkt å gjennomføre en kvantitativ analyse av et datasett i forbindelse med 

studier eller jobb, så vil du ha stor praktisk nytte av denne boken. Boken er skrevet 

med det formål å gi studenter og andre en praktisk innføring i et utvalg regresjonsanalyseteknikker 

i SPSS (Statistical Package for Social Sciences) med bruk av data 

fra ESS (European Social Survey). Vi har bygget på egne erfaringer, som både 

studenter og yngre forskere, og skrevet en bok som forsøker å gi enkle og intuitive 

forklaringer på hva regresjonsanalyse er, og hvordan man selv kan gjennomføre en 

slik analyse i SPSS. Derfor vil du finne færre “greske bokstaver” i denne boken 

sammenlignet med andre bøker innen samme sjanger, og vi har også forsøkt å 

bruke et lett og uformelt språk. Vår bok har i stedet en praktisk tilnærming der vi 

gir leseren en forståelse av “hva som skjer” ved å bruke eksempler som forklares 

grundig. Vår erfaring tilsier at det er et gap mellom den teoretiske virkeligheten 

som mange lærebøker i kvantitativ metode forutsetter, og den praktiske virkeligheten 

som samfunnsvitere ofte møter når man skal analysere sine data. Derfor går 

vi grundig til verks og viser hvilke trinn man må gå igjennom før man kan foreta en 

regresjonsanalyse; fra omkoding av variabler til tolkning av regresjonskoeffisienter. 

Dette er hovedinnholdet i bokens første del. I andre del av boken vil 

vi gi en praktisk innføring i et utvalg “avanserte” regresjonsanalyseteknikker. Som 

hovedfagsstudenter og doktorgradsstipendiater har vi erfart at mange norske lærebøker 

i kvantitativ metode ikke tar for seg de mer avanserte regresjonsanalyseteknikkene 

som man ofte får bruk for i mastergradsavhandlinger, eller 

senere i egen forskning eller utredningsarbeid. Dette fører ofte til mye frustrasjon 

og unødige forsinkelser i studieprogresjonen. I denne boken har vi derfor plukket 

ut noen av de mer “avanserte” regresjonsanalyseteknikkene som er lite 

dokumentert og eksemplifisert, spesielt på norsk og i statistikkprogrammet SPSS. 

Vi synes også det er viktig at samfunnsvitere som gjør statistiske analyser 

reflekterer over denne rollen og ansvaret som følger med. Den tredje og siste delen 

av boken er derfor et teoretisk bidrag som diskuterer tallenes makt og hvordan vi 

bør forholde oss til dem. Alle kapitler har blitt lest av erfarne norske forskere innen 

kvantitativ metode, men eventuelle feil og mangler vil likevel være forfatternes 

ansvar. Boken har en egen webside der feil og mangler kan sendes inn 

(http://www.statistikkforum.no), og der forfatterne kan kontaktes via e-post. 

Eventuelle feil og mangler vil også publiseres her. Det er vårt håp og ønske at vi 

gjennom denne boken gjør det enkelt å tilegne seg kunnskap om hvordan ulike 

kvantitative analyseteknikker kan gjennomføres i SPSS, og hvordan disse 

analysene kan tolkes. 

Vi skal nå gi en ganske kortfattet kapitteloversikt. Boken har tre deler, hvorav 

den første tar for seg det du bør lære deg først. I denne delen blir vi aller først

edre kjent med SPSS (kapittel 1) før vi deretter lærer oss å forberede rådata til 

ulike analyseformål (kapittel 2). I kapittel 3 starter vi med de enkleste analyseformene 

(korrelasjoner, bivariat og multivariat regresjon), og i kapittel 4 gis en 

innføring i hvordan samspill og ikke-lineære sammenhenger kan inkluderes i 

modellene våre. Videre gir kapittel 5 en grundig praktisk innføring i hvordan 

logistisk regresjonsanalyse kan gjennomføres ved hjelp av SPSS, mens kapittel 6 

tar for seg analyseproblemer og løsningsforslag i lineær og logistisk regresjonsanalyse. 

I bokens andre del møter vi litt mer avanserte analyseformer, og strukturen er 

derfor ikke like kronologisk som i del 1. Dette betyr at de statistiske analysene er 

flerdimensjonale. Kapittel 7 omfatter det som kalles multinomisk og ordinal 

(logistisk) regresjon, og er en slags videreføring av kapittel 5 om logistisk 

regresjon. Forskjellen ligger i at vi benytter flere verdier på den avhengige 

variabelen sammenlignet med logistisk regresjon, hvor den avhengige variabelen 

bare har to verdier. I kapittel 8 presenterer vi flernivåanalayse, hvor hovedpoenget 

er å finne variasjoner ikke bare mellom individer, men også mellom regioner og 

land. Kapittel 9 omhandler såkalt overlevelsesanalyse, hvor vi får en innføring i 

hvordan vi kan måle hvor lenge et individ overlever før en gitt hendelse inntreffer. 

I kapittel 10 stifter vi nærmere bekjentskap med faktoranalyse. Hensikten her er å 

finne ut om det ligger et underliggende mønster i respondentenes besvarelser. 

Kapittel 11 omhandler logaritmiske transformasjoner. Når man leser forskningsartikler, 

ser man ganske ofte at forfatteren oppgir å ha foretatt en logaritmisk 

transformasjon av enten avhengig og/eller uavhengig variabel. I dette kapitlet skal 

vi derfor lære oss hvordan slike analyser skal forstås. To stegs minste kvadraters 

regresjon presenteres deretter i kapittel 12. Her skal vi forklare hvordan utelatelse 

av relevante forklaringsvariabler kan føre til at det oppstår en korrelasjon mellom 

feilleddet og en – eller flere – av de uavhengige variablene i en regresjonsligning. I 

kapittel 13 gir vi en kort innføring i hva selekterte data er, og hvilke statistiske 

problemer slike data medfører. 

Kapittel 14 og 15 utgjør bokens tredje og siste del. Dette er en teoretisk del som 

diskuterer hvilken rolle fortrolighetskunnskapen spiller i statistikken (kapittel 14), 

samt hvilke farer man må være oppmerksom på ved analyse av tallmateriale 

(kapittel 15).

DEL 1 

av Terje Andreas Eikemo 

Hva du bør lære deg først 

I denne delen av boken skal vi aller først gjøre oss kjent med 

de enkleste og mest sentrale statistiske kommandoene i pro- 

gramvaren SPSS, samt se på hvordan vi kan forberede data- 

grunnlaget vårt (European Social Survey, ESS), slik at vi kan få 

svar på de spørsmålene vi ønsker å belyse. Deretter skal vi gå 

i gang med korrelasjonstester, bivariat, lineær- og logistisk re- 

gresjon. Lineær- og logistisk regresjon er antakeligvis de mest 

brukte kvantitative analyseteknikkene i sam-funnsvitenskapen, 

og det er viktig å lære seg prinsippene her før man går videre 

med mer avanserte former for analyse. Vi skal også gå nærmere 

inn på hvordan man kan bedømme i hvilken grad forutsetnin- 

gene for lineær- og logistisk regresjonsanalyse er oppfylt, og 

hva man kan gjøre når forutsetningene brytes, og panikken beg- 

ynner å bre seg.

1 Før vi setter i gang

1.1 SPSS 

I denne boken skal vi bruke statistikkprogramvaren SPSS til å utføre analysene for 

oss. SPSS er en forkortelse av Statistical Package for the Social Sciences, og er et 

omfattende statistisk datahåndterings- og dataanalyseverktøy og er ett av de eldste 

og mest brukte programvarene innenfor statistisk analyse. SPSS er ofte det første 

statistikkprogrammet studenter konfronteres med, og det er ikke tilfeldig. Universitetene 

i Norge har lisensavtaler med SPSS, og programmet er svært brukervennlig. 

Derfor er det naturlig både for mange studenter, og dermed også for oss, å 

ta i bruk SPSS. SPSS oppdateres stadig, og forfatterne av denne boken har benyttet 

versjon 12.0 eller nyere. Men la det likevel være sagt først som sist: SPSS er ikke 

det eneste programvarealternativet for deg som vil gjøre kvantitative dataanalyser. 

Vi har derfor laget en oversikt over noen av programmene som kan utfylle eller 

erstatte flere av funksjonene i SPSS. Ikke alle har tilgang til lisensavtaler, og noen 

har også spesielle behov som gjør at andre programvarer kunne vært et mer 

naturlig alternativ. Vi synes derfor det er viktig at leseren gjøres oppmerksom på 

noen av alternativene til SPSS. I tabell 1.1 har vi derfor laget en liste over et utvalg 

alternativer, oppgitt nettlenker, samt gitt en kort beskrivelse av programvaren. 

1.2 European Social Survey 

Datamaterialet vi skal bruke i denne håndboken, er den foreløpige siste versjonen 

(2004) av surveyundersøkelsen European Social Survey (heretter: ESS). ESS er en 

europeisk surveyundersøkelse som muliggjør systematiske studier av holdninger og 

verdier sett opp mot sosioøkonomiske og politiske problemstillinger i et europeisk 

perspektiv. Vi finner ESS nyttig av minst tre årsaker. For det første er ESS en god 

survey å benytte for den som vil studere endringer over tid, selv om det foreløpig 

kun er gjort undersøkelser i 2002 og 2004, og de samme respondentene ikke kan 

koples mot hverandre i de ulike periodene (ikke paneldata). For det andre er ESS et 

spesielt godt materiale for den som vil sammenligne effekter mellom regioner og 

land. Validiteten av komparative studier begrenses ofte av at landenes effekter ikke 

er utregnet fra samme sted til samme tid. I ESS er samme spørsmål stilt i alle land 

og regioner i samme periode. For det tredje er data og dokumentasjon fra ESS 

allment tilgjengelig på internett (http://www.ess.nsd.uib.no). Det eneste du trenger 

å gjøre for å få tilgang, er å registrere deg med navn, e-post-adresse, institusjon og 

land. I første omgang benytter vi den norske delen av undersøkelsen. I kapitlet om 

flernivåanalyse vil vi derimot vise hvordan vi kan behandle den internasjonale 

datafilen.

Tabell 1.1 Et utvalg alternativer til SPSS 

KAPITTEL 1: Før vi setter i gang 

Programvare Informasjonslink Kort beskrivelse av programvaren 

Gauss 

http://www.aptech.com/gauss.html 

18 

Program som løser svært store 

og kompliserte optimaliserings- 

og dataanalyseproblemer. Basert 

på programmeringsspråket 

gauss. 

GIS www.gis.com Program for behandling av 

stedfestet informasjon. 

Visualiserer resultater i kart. 

Grapher http://www.goldensoftware.com/ 

products/grapher/grapher.shtml 

Program for presentasjon og 

visualisering av data. 

JMP http://www.jmp.com/ Brukervennlig og omfattende 

statistikkprogram. Svært god på 

interaktiv grafisk visualisering og 

presentasjon. 

Microsoft Excel http://www.microsoft.com/norge/office/ 

excel/prodinfo/overview.mspx 

Minitab http://www.bath.ac.uk/bucs/ 

software/statistics/minitab.shtml 

Regne og analyseprogram for 

utarbeidelse av statistiske 

analyser. Spesielt godt egnet til 

grafiske framstillinger. 

Interaktivt statistikkprogram som 

analyserer små og middels store 

datasett. 

NSDstat www.nsd.uib.no Program for analyse og 

presentasjon av samfunnsfaglige 

data. Programmet 

systematiserer, henter fram og 

presenterer informasjon fra 

datasamlinger. 

Originlab http://www.originlab.com/ Program for presentasjon og 

visualisering av data. 

R http://mirrors.sunsite.dk/cran/ Statistikkprogram som har store 

likheter med S-plus. Gratis 

programvare. Også tilgjengelig 

for linux. 

SAS http://www.sas.com/technologies/ 

analytics/index.html 

Sigmaplot http://www.alfasoft.no/produkter/ 

sigmaplot/sigmaplot.htm 

Statistikkprogram som er mye 

benyttet innen naturvitenskap, 

teknologi og medisin. 


visualisering av data.

European Social Survey 

Programvare Informasjonslink Kort beskrivelse av programvaren 

S-Plus http://www.insightful.com/ 

support/documentation.asp 

19 

Omfattende statistikkprogram 

som er spesielt godt tilrettelagt 

for grafisk bruk. Støttes også av 

linux. 

Stata www.stata.com Har stort utvalg av statistiske 

metoder og er svært kraftig på 

databearbeiding. 

Statistica http://www.statsoft.com/ Statistikkprogram som er mye 

brukt innen medisin, psykologi og 

matematikk. 

Surfer http://www.goldensoftware.com/products/ 

surfer/surfer.shtml 


visualisering av data. Spesielt 

godt egnet for kartpresentasjoner. 

Systat http://www.systat.com/products/Systat/ Inneholder alle grunnleggende 

statistiske metoder og analyser. 

Svært gode 

visualiseringsmetoder. 

Hvis du skulle være i tvil om hvilke programmer som er tilgjengelige ved ditt 

universitet, kan du ta en kikk på disse linkene: 

Tabell 1.2 Tilgjengelige lisensavtaler ved universitetene i Norge 

Universitetet i Oslo http://www.usit.uio.no/it/statistikk/stat-ressurser.html 

NTNU http://www.ntnu.no/itea.info/programvare/progtilbud.html 

Universitetet i Tromsø http://uit.no/orakel/lisenser/ 

Universitetet i Bergen http://www.uib.no/IT/prog/statmat/ 

Det er også verdt å merke seg at det finnes flere gode supplementer til denne 

boken. Heldigvis er det flere som har skrevet praktiske innføringsbøker i kvantitativ 

metode på norsk, og vi vil gjerne trekke fram Asbjørn Johannessen m.fl. 

(2006), Karl Georg Øhrn (2005) og Christer Thrane (2003) for fine bidrag. For en 

mer teoretisk innføring har Kristen Ringdal (2001), Ole-Jørgen Skog (2003), 

Sigmund Grønmo (2004) og Ottar Hellevik (2001) skrevet hver sin “bibel” i samfunnsvitenskapelige 

metode.

1.3 Datamatrisen 


La oss nå gå litt forsiktig i gang og bli kjent med datamatrisen i datavinduet (Data 

View). Dette er det første vi ser når vi åpner filen. Datamatrisen består av 

variabler, enheter og verdier. Variablene gjengir spørsmålene i undersøkelsen. 

Disse er markert i grått og er listet opp vannrett øverst i matrisen. Variabelnavnene 

har som regel forkortede symboler, og mer utfyllende navn kommer til syne 

dersom musepekeren plasseres over variablene. Ytterligere informasjon får vi 

dersom vi trykker på knappen Variables på verktøylinjen (markert med spørsmålstegn). 

Enhetene er listet loddrett på venstre side i matrisen og står oppført i 

stigende rekkefølge fra 1 til 1760. Hver enhet representerer én person, noe som 

betyr at totalt 1760 personer deltok i den norske undersøkelsen fra 2004. Verdiene 

er tallene i det hvite rutenettet mellom variablene og enhetene. Disse representerer 

svarene respondentene (enhetene) gav på spørsmålene (variablene). Fram til nå har 

vi studert datavinduet. Vi skal nå se nærmere på variabelvinduet (Variable View) 

som vi får opp dersom vi klikker på den lille fliken nederst til venstre. Her finner vi 

mer informasjon om variablene, som er sortert loddrett, og variablenes kjennetegn, 

som står oppført vannrett. Bruk gjerne litt tid på å forstå logikken med henholdsvis 

data- og variabelvinduet. 

1.4 Målenivå 

Ett av kjennetegnene som står oppført i variabelvinduet, er variablenes målenivå 

(Measure). Målenivået er ikke alltid riktig definert i SPSS, men vi skal uansett 

lære oss å definere det selv. Det er viktig å lære seg forskjellene mellom de ulike 

målenivåene, da dette vil være være med å bestemme både hvordan variabelen skal 

operasjonaliseres, og hvilken type analyse vi bør velge (dersom det er snakk om 

den avhengige variabelen). Nominalnivået klassifiseres gjennom gjensidig utelukkende 

grupper, som for eksempel kjønn og geografisk tilknytning. Disse 

gruppene kan med andre ord ikke rangeres på en skala. Ordinalnivåvariabler er 

også gjensidig utelukkende, men det kan være mulig å snakke om en slags 

rangering. For eksempel liten interesse mot større interesse, eller lite deltakelse mot 

mye deltakelse. Imidlertid kan det noen ganger være vanskelig å avgjøre om vi bør 

beholde ordinalskalavariabler skalert i analysen vår (alternativet ville vært å utføre 

dummykoding, som vi skal illustrere i kapittel 2). Da må vi være rimelig sikre på at 

avstanden mellom de lave verdiene (for eksempel avstanden mellom verdi 1 og 2) 

tilsvarer den samme avstanden mellom de høye verdiene (for eksempel avstanden 

mellom verdi 9 og 10 på den samme variabelen). La oss se på et eksempel på en 

ordinalskalavariabel som ikke har like stor avstand mellom verdiene: Vi kan si at 

avstanden mellom 1 og 2 tilsvarer noenlunde avstanden mellom 9 og 10 på en 

holdningsskalavariabel fra 1 til 10, men vi kan ikke si at avstanden mellom 1 

20

Målenivå 

(grunnskole) og 2 (vgs) tilsvarer avstanden mellom 3 (høyskole) og 4 (universitet) 

dersom vi ser på en utdanningsnivåvariabel. Her ser vi at enhetene er rangert i 

forhold til hverandre, selv om avstanden er diffus. Ved alle tvilstilfeller vil det 

være din egen argumentasjon som er utslagsgivende for hvordan variabelen bør 

tolkes og operasjonaliseres. Variabler på intervallnivå refererer til tall som står i et 

klart relativt forhold til hverandre, men det finnes ikke et klart definert nullpunkt. 

Typiske eksempler på slike variabler er temperaturer og intelligenstester. Siste 

målenivå vi tar med, er forholdstallsnivå. Slike variabler har samme kjennetegn 

som intervallvariabler, med det unntaket av vi har et klart nullpunkt. Antall år en 

person har vært i utdanningssystemet (her er det altså ikke snakk om utdanningsnivå), 

inntekt og alder er eksempler her. Dette betyr at det er meningsfullt å operere 

med forholdstallsrater: dobbelt så gammel er et meningsfullt utsagn, dobbelt så 

varm er ikke meningsfullt på samme måte (hvis det ikke er klart at vi benytter 

Kelvinskalaen). Derfor kan vi si at skillet mellom intervallskalavariabler og forholdstallsvariabler 

er bestemt av måleskalen som benyttes, og ikke av det substansielle 

innholdet i variabelen. Se ellers hvordan du kan definere variablenes 

målenivåer ved hjelp av tabell 1.3 på neste side. 

Tabell 1.3 Hvordan definere variabelens målenivå 

Har variabelen mer enn 2 kategorier? 

 

Er avstanden mellom alle kategorier lik? JA NEI Variabelen er dikotom 

 

JA NEI Kan kategoriene settes i rekkefølge? 

 

Variabelen er kontinuerlig JA NEI Variabelen er på nominalnivå 

 

Har variabelen et nullpunkt? Variabelen er på ordinalnivå 

 

JA NEI Variabelen er på forholdstallsnivå 

 

Variabelen er på intervallnivå 

21

1.5 Kommandoer i SPSS 


Det er viktig at leseren av denne boken er klar over hvordan ulike operasjoner, som 

for eksempel omkodinger og analyse av data kan utføres i SPSS. Dette kan nemlig 

gjøres på to forskjellige måter; enten ved å benytte kommandoene øverst i 

verktøylinjen eller ved hjelp av syntaksen. Verktøylinjen er selvforklarende og 

krever kun at du klikker deg inn på riktig meny. Syntaksen, derimot, er et 

kommandoprogram som kan utføre de samme kommandoene som i verktøylinjen, 

men det er en viktig forskjell: I syntaksen kan du lagre kommandoene dine, og du 

vil derfor være i stand til å se hvordan du har gått fram i ettertid. Har du derfor 

gjort en feil, så vil du kunne lokalisere denne i syntaksen. Dessuten kan du lett 

utføre lagrede kommandoer på nytt, for eksempel hvis du skulle ha vært så uheldig 

å slette data. I denne boken kommer vi til å bruke både verktøylinjen og syntaksen, 

litt om hverandre. Men når lengre kommandoer skal utføres, bruker vi som regel 

syntaksen. Vi anbefaler at du gjør deg fortrolig med bruken av syntaksen så tidlig 

som mulig. Det vil spare deg for mye tid! Syntaks-kommandovinduet åpner du ved 

å trykke deg inn på File New Syntax. Det er i hovedsak to måter å føre inn 

kommandoer på. Hvis du husker kommandoen skriver du den ganske enkelt inn i 

syntakskommandovinduet, men hvis du ikke kan den er paste-funksjonen et fint 

alternativ. Når du “bestiller” analysene dine, kan du alltid velge å kjøre ut 

kommandoene ved å trykke på OK, eller ved å trykke på Paste-knappen som 

automatisk omformer ”bestillingen” til en nedskrevet kommando som dukker opp i 

syntaksvinduet. I delkapittel 2.9 viser vi et eksempel på dette. 

1.6 Vekting 

Alle har ikke hatt like stor sjanse til å delta i spørreundersøkelsen som ESS baseres 

på. På bakgrunn av den varierende seleksjonssannsynligheten vil noen typer 

regioner og husholdninger være underrepresentert i studien, mens andre er overrepresentert. 

Overrepresentasjon oppstår gjerne hvis veldig mange fra samme 

husholdning intervjues. Som regel blir skjevhetene beskjedne, men de kan justeres 

ved at svarene til bestemte respondenter tillegges mer eller mindre vekt; derav 

begrepet vekting. Designvektvariabelen dweight er laget til dette formålet. Vi har 

ikke vektet analysene i denne boken, fordi våre analyser bare er eksempler på 

fremgangsmåter. Hvis du derimot skal skrive forskningsartikler, så kreves det at 

resultatene er så nøyaktige som mulig og følgelig anbefaler vi at du vekter 

resultatene dine. Dette gjelder alle typer analyser; fra frekvens- og prosentuerte 

tabeller til korrelasjons- og regresjonsanalyser. Du vekter ved å gå inn i menyen 

Data Weight Cases. Marker deretter variabelen dweight i vinduet som kommer 

opp og trykk på Weight Cases By. Trykk deretter på pilen som fører over 

vektevariabelen til boksen Frequency Variable. Nå trykker du på OK og alle 

22

Vekting 

analyser du gjør vil vektes. Du vil få bekreftet av vektingen er aktivert ved at 

Weight On står nede til høyre i SPSS-vinduet. Selv om landene som er med i ESSundersøkelsen 

har svært ulike populasjonsstørrelser, så er utvalgsstørrelsen omtrent 

den samme for alle. Hvis ikke dette justeres, så vil små land overrepresenteres på 

bekostning av store. Derfor finnes det også en annen vekt i datasettet som heter 

pweight. Dette er en populasjonsstørrelsevekt som bare skal brukes hvis du 

analyser to eller flere land samtidig. Vekten skal derimot ikke brukes hvis du 

analyserer landene i separate analyser, hvor det ikke referes til et gjennomsnitt. 

Vekten aktiviseres ved å benytte samme fremgangsmåte som for designvekten. En 

viktig tilleggsopplysning er at populasjons-størrelsevekten alltid skal brukes i 

kombinasjon med designvekten. Dette gjøres ved å konstruere en ny vekt ved å 

gange sammen dweight og pweight. Dette får du til ved å gå inn i menyen 

Transform Compute. Skriv inn et variabelnavn i Target Variable-boksen (for 

eksempel dpweight) før du noterer pweight*dweigh i Numeric Expressionrubrikken. 

Alternativt kan du bruke syntakskommandovinduet: 

*Konstruksjon av kombinert vektevariabel med basis i dweight og pweight. 

compute dpweight = dweight*pweight. 

23

Litteratur 


Grønmo, S. (2004): Samfunnsvitenskapelige metoder, Bergen: Fagbokforlaget. 

Hellevik, O. (2002): Forskningsmetode i sosiologi og statsvitenskap, Oslo: 

Universitetsforlaget. 

Johannessen, A., P. A. Tufte og L. Kristoffersen (2006): Introduksjon til 

samfunnsvitenskapelig metode, Oslo: Abstrakt forlag, 3. utg. 

Ringdal, K. (2001): Enhet og Mangfold, Bergen: Fagbokforlaget. 

Skog, O. (2003): Å forklare sosiale fenomener, Oslo: Gyldendal Akademisk, 2. utg. 

Thrane, C. (2003): Regresjonsanalyse i praksis, Kristiansand S: Høyskoleforlaget. 

Øhrn, K. G. (2005): Hvordan lykkes med metode og statistikk i samfunnsfag?: en 

hjelpebok med løsninger av eksamensoppgaver, Oslo: Universitetsforlaget, 2.utg. 

24

Kvantitativ analyse med SPSS

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?