Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen
Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen
Huurprijzen en richthuurprijzen. Deel III ... - Steunpunt wonen
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
kunn<strong>en</strong> kiez<strong>en</strong> voor e<strong>en</strong> iets gebruiksvri<strong>en</strong>delijkere indeling, bv. e<strong>en</strong> classificatie<br />
als “zeer goed” of “nieuwe dubbele beglazing” met de technische beschrijving erbij<br />
wat hieronder verstaan wordt.<br />
3.2.1 Ontbrek<strong>en</strong>de waard<strong>en</strong> <strong>en</strong> imputatie<br />
De dataset bevat voor vele variabel<strong>en</strong> ontbrek<strong>en</strong>de waard<strong>en</strong>. Indi<strong>en</strong> we voor elke<br />
observatie waarvoor e<strong>en</strong> variabele ontbrek<strong>en</strong>de waard<strong>en</strong> bevat, zoud<strong>en</strong> weglat<strong>en</strong><br />
uit de regressieanalyse halveert het aantal observaties. Indi<strong>en</strong> we bijvoorbeeld de<br />
variabele aantal person<strong>en</strong> , die overig<strong>en</strong>s niet van nut is in ons model, zoud<strong>en</strong><br />
opnem<strong>en</strong> in onze regressieanalyse, verliez<strong>en</strong> we meer dan 50% van de initiële<br />
dataset. Deze variabele wordt dan ook weggelat<strong>en</strong> uit de regressieanalyse. Wat<br />
betreft de andere variabel<strong>en</strong> ontbrek<strong>en</strong> minder waard<strong>en</strong>. Het probleem was/is<br />
voornamelijk dat voor e<strong>en</strong> groot aantal variabel<strong>en</strong> voor <strong>en</strong>kele observaties<br />
waard<strong>en</strong> ontbrek<strong>en</strong>. T<strong>en</strong>einde dit probleem teg<strong>en</strong> te gaan hebb<strong>en</strong> we e<strong>en</strong> techniek<br />
gebruikt om waard<strong>en</strong> te imputer<strong>en</strong>, wat erop neerkomt dat de meest waarschijnlijke<br />
waarde de ontbrek<strong>en</strong>de waarde vervangt. Aan de hand van waard<strong>en</strong> voor andere<br />
variabel<strong>en</strong> kan immers meestal e<strong>en</strong> goede inschatting mak<strong>en</strong> van de waarde van<br />
de ontbrek<strong>en</strong>de variabel<strong>en</strong>, aangezi<strong>en</strong> de verschill<strong>en</strong>de woningk<strong>en</strong>merk<strong>en</strong> vaak<br />
nauw sam<strong>en</strong>hang<strong>en</strong>. E<strong>en</strong> huis met e<strong>en</strong> goed geïsoleerde vloer bijvoorbeeld zal<br />
veelal ook e<strong>en</strong> goed geïsoleerd dak <strong>en</strong> gevel hebb<strong>en</strong>. Indi<strong>en</strong> dergelijke imputatie<br />
niet mogelijk was, hebb<strong>en</strong> we de waarde geïmputeerd die het meest voorkwam in<br />
de dataset. Voor sommige variabel<strong>en</strong> was het niet mogelijk om e<strong>en</strong> gepaste<br />
waarde te imputer<strong>en</strong> <strong>en</strong> werd(<strong>en</strong>) de betreff<strong>en</strong>de observatie(s) verwijderd. Dit was<br />
het geval voor bijvoorbeeld de datum van ingebruikname. Deze verwerking van de<br />
ruwe data was tijdrov<strong>en</strong>d, maar noodzakelijk.<br />
3.3 Andere bronn<strong>en</strong><br />
Naast VMSW-data mak<strong>en</strong> we ook gebruik van andere gegev<strong>en</strong>sbronn<strong>en</strong>.<br />
3.3.1 Statistische sector informatie<br />
Om het locatie-effect te berek<strong>en</strong><strong>en</strong> kunn<strong>en</strong> we gebruik mak<strong>en</strong> van de liggings- <strong>en</strong><br />
omgevingsvariabel<strong>en</strong> in de VMSW dataset. De omgevingsvariabel<strong>en</strong> beperk<strong>en</strong><br />
zich echter voornamelijk tot de meest directe omgeving <strong>en</strong> buurt (buurtpark,<br />
architectoraal karakter <strong>en</strong> uitzicht, …). De liggingsvariabel<strong>en</strong> m.b.t bereikbaarheid<br />
<strong>en</strong> voorzi<strong>en</strong>ing<strong>en</strong> zijn eerder ruw gemet<strong>en</strong> (< 2km., 5 km.). Om meer<br />
ligging- <strong>en</strong> omgevingsvariabel<strong>en</strong> te incorporer<strong>en</strong> in het model, <strong>en</strong> tev<strong>en</strong>s<br />
variabel<strong>en</strong> die veelal op e<strong>en</strong> continue schaal gemet<strong>en</strong> zijn, baser<strong>en</strong> we ons op<br />
beschikbare statistische sectorinformatie, voornamelijk gegev<strong>en</strong>s van de Socio-<br />
Economische Enquête (SEE 2001).<br />
Op basis van GIS-kaart<strong>en</strong> kan nog meer statistische sector informatie gecreëerd<br />
word<strong>en</strong>. Er is zeker ruimte om meer beschikbare informatie in ons model te<br />
verwerk<strong>en</strong>. Om ruimtelijke data in het model te verwerk<strong>en</strong> dringt zich echter e<strong>en</strong><br />
speciale verwerking van data op. Tobler’s (1970) “First law of geography” zegt dat<br />
“Everything is related to everything else, but near things are more related than<br />
distant things”. Zonder dieper in te gaan op de techniciteit van dergelijke ruimtelijke<br />
analyses, waarvan spatial econometrics e<strong>en</strong> relatief nieuwe vorm is, vermeld<strong>en</strong> we<br />
hier <strong>en</strong>kel dat we e<strong>en</strong> eerste poging gedaan hebb<strong>en</strong> om afstand te modeller<strong>en</strong> in<br />
ons model.<br />
18