04.09.2013 Views

Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen

Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen

Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

kunn<strong>en</strong> kiez<strong>en</strong> voor e<strong>en</strong> iets gebruiksvri<strong>en</strong>delijkere indeling, bv. e<strong>en</strong> classificatie<br />

als “zeer goed” of “nieuwe dubbele beglazing” met de technische beschrijving erbij<br />

wat hieronder verstaan wordt.<br />

3.2.1 Ontbrek<strong>en</strong>de waard<strong>en</strong> <strong>en</strong> imputatie<br />

De dataset bevat voor vele variabel<strong>en</strong> ontbrek<strong>en</strong>de waard<strong>en</strong>. Indi<strong>en</strong> we voor elke<br />

observatie waarvoor e<strong>en</strong> variabele ontbrek<strong>en</strong>de waard<strong>en</strong> bevat, zoud<strong>en</strong> weglat<strong>en</strong><br />

uit de regressieanalyse halveert het aantal observaties. Indi<strong>en</strong> we bijvoorbeeld de<br />

variabele aantal person<strong>en</strong> , die overig<strong>en</strong>s niet van nut is in ons model, zoud<strong>en</strong><br />

opnem<strong>en</strong> in onze regressieanalyse, verliez<strong>en</strong> we meer dan 50% van de initiële<br />

dataset. Deze variabele wordt dan ook weggelat<strong>en</strong> uit de regressieanalyse. Wat<br />

betreft de andere variabel<strong>en</strong> ontbrek<strong>en</strong> minder waard<strong>en</strong>. Het probleem was/is<br />

voornamelijk dat voor e<strong>en</strong> groot aantal variabel<strong>en</strong> voor <strong>en</strong>kele observaties<br />

waard<strong>en</strong> ontbrek<strong>en</strong>. T<strong>en</strong>einde dit probleem teg<strong>en</strong> te gaan hebb<strong>en</strong> we e<strong>en</strong> techniek<br />

gebruikt om waard<strong>en</strong> te imputer<strong>en</strong>, wat erop neerkomt dat de meest waarschijnlijke<br />

waarde de ontbrek<strong>en</strong>de waarde vervangt. Aan de hand van waard<strong>en</strong> voor andere<br />

variabel<strong>en</strong> kan immers meestal e<strong>en</strong> goede inschatting mak<strong>en</strong> van de waarde van<br />

de ontbrek<strong>en</strong>de variabel<strong>en</strong>, aangezi<strong>en</strong> de verschill<strong>en</strong>de woningk<strong>en</strong>merk<strong>en</strong> vaak<br />

nauw sam<strong>en</strong>hang<strong>en</strong>. E<strong>en</strong> huis met e<strong>en</strong> goed geïsoleerde vloer bijvoorbeeld zal<br />

veelal ook e<strong>en</strong> goed geïsoleerd dak <strong>en</strong> gevel hebb<strong>en</strong>. Indi<strong>en</strong> dergelijke imputatie<br />

niet mogelijk was, hebb<strong>en</strong> we de waarde geïmputeerd die het meest voorkwam in<br />

de dataset. Voor sommige variabel<strong>en</strong> was het niet mogelijk om e<strong>en</strong> gepaste<br />

waarde te imputer<strong>en</strong> <strong>en</strong> werd(<strong>en</strong>) de betreff<strong>en</strong>de observatie(s) verwijderd. Dit was<br />

het geval voor bijvoorbeeld de datum van ingebruikname. Deze verwerking van de<br />

ruwe data was tijdrov<strong>en</strong>d, maar noodzakelijk.<br />

3.3 Andere bronn<strong>en</strong><br />

Naast VMSW-data mak<strong>en</strong> we ook gebruik van andere gegev<strong>en</strong>sbronn<strong>en</strong>.<br />

3.3.1 Statistische sector informatie<br />

Om het locatie-effect te berek<strong>en</strong><strong>en</strong> kunn<strong>en</strong> we gebruik mak<strong>en</strong> van de liggings- <strong>en</strong><br />

omgevingsvariabel<strong>en</strong> in de VMSW dataset. De omgevingsvariabel<strong>en</strong> beperk<strong>en</strong><br />

zich echter voornamelijk tot de meest directe omgeving <strong>en</strong> buurt (buurtpark,<br />

architectoraal karakter <strong>en</strong> uitzicht, …). De liggingsvariabel<strong>en</strong> m.b.t bereikbaarheid<br />

<strong>en</strong> voorzi<strong>en</strong>ing<strong>en</strong> zijn eerder ruw gemet<strong>en</strong> (< 2km., 5 km.). Om meer<br />

ligging- <strong>en</strong> omgevingsvariabel<strong>en</strong> te incorporer<strong>en</strong> in het model, <strong>en</strong> tev<strong>en</strong>s<br />

variabel<strong>en</strong> die veelal op e<strong>en</strong> continue schaal gemet<strong>en</strong> zijn, baser<strong>en</strong> we ons op<br />

beschikbare statistische sectorinformatie, voornamelijk gegev<strong>en</strong>s van de Socio-<br />

Economische Enquête (SEE 2001).<br />

Op basis van GIS-kaart<strong>en</strong> kan nog meer statistische sector informatie gecreëerd<br />

word<strong>en</strong>. Er is zeker ruimte om meer beschikbare informatie in ons model te<br />

verwerk<strong>en</strong>. Om ruimtelijke data in het model te verwerk<strong>en</strong> dringt zich echter e<strong>en</strong><br />

speciale verwerking van data op. Tobler’s (1970) “First law of geography” zegt dat<br />

“Everything is related to everything else, but near things are more related than<br />

distant things”. Zonder dieper in te gaan op de techniciteit van dergelijke ruimtelijke<br />

analyses, waarvan spatial econometrics e<strong>en</strong> relatief nieuwe vorm is, vermeld<strong>en</strong> we<br />

hier <strong>en</strong>kel dat we e<strong>en</strong> eerste poging gedaan hebb<strong>en</strong> om afstand te modeller<strong>en</strong> in<br />

ons model.<br />

18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!