29.07.2013 Views

Noter og Formler.pdf - sociologisk-notesblok

Noter og Formler.pdf - sociologisk-notesblok

Noter og Formler.pdf - sociologisk-notesblok

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Data problemer<br />

Indtil videre har vi antaget, at MLR.2 altid er opfyldt<br />

Vi har antaget, at data stammer fra en tilfældig stikprøve<br />

Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis:<br />

- Manglende observationer: Tilfældigt eller ej?<br />

- Ikke-tilfældig dataudvælgelse: Ex<strong>og</strong>ent eller end<strong>og</strong>ent.<br />

Manglende observationer:<br />

- Manglende observationer vil reducere antallet af brugbare observationer i analysen<br />

- Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observatio-<br />

nerne mangler<br />

- Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater<br />

Ikke-tilfældig dataudvælgelse:<br />

Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt):<br />

- Eks<strong>og</strong>en dataudvælgelse<br />

- End<strong>og</strong>en dataudvælgelse<br />

- Stratificeret dataudvælgelse<br />

Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anled-<br />

ning til bias.<br />

Eks<strong>og</strong>en dataudvælgelse:<br />

- Dataudvælgelse baseret på værdien af en af de forklarende variabler<br />

- Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler)<br />

stadig give middelrette <strong>og</strong> konsistente OLS etimater<br />

- Generelt: Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS<br />

estimaterne er middelrette <strong>og</strong> konsistente<br />

End<strong>og</strong>en dataudvælgelse:<br />

- Dataudvælgelse baseret på den afhængige variabel (eller variabler, der er korrelerede dermed).<br />

- OLS estimator er ikke middelret <strong>og</strong> ikke konsistent.<br />

Stratificeret dataudvælgelse:<br />

- Populationen er delt i grupper (disjunkte grupper som udgør hele populationen)<br />

- N<strong>og</strong>le grupper er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen<br />

- OLS er middelret <strong>og</strong> konsistent, hvis gruppeopdelingen er baseret på eks<strong>og</strong>ene variabler<br />

22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!