Innovatie-inspanningen van Vlaamse ondernemingen : een ... - IWT
Innovatie-inspanningen van Vlaamse ondernemingen : een ... - IWT
Innovatie-inspanningen van Vlaamse ondernemingen : een ... - IWT
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
HOOFDSTUK 3 > Methodologie <strong>van</strong> de CIS-3-enquête<br />
DWTC-steekproef komen er 617 schriftelijke<br />
antwoorden en 686 CAPI-antwoorden. Zie<br />
bijlage 1, tabellen 5 en 6. Op de <strong>IWT</strong>-steekproef<br />
komen er 801 schriftelijke antwoorden<br />
en 887 CAPI-antwoorden. Zie bijlage 1,<br />
tabellen 7 en 8.<br />
Na het herbekijken op <strong>een</strong> latere datum <strong>van</strong><br />
het bedrijfsregister (wanneer gegevens<br />
beschikbaar zijn die bij de eerste compilatie<br />
<strong>van</strong> het bedrijfsregister niet beschikbaar<br />
waren) wordt vastgesteld dat <strong>een</strong> aantal<br />
bedrijven onterecht zijn weggelaten en <strong>een</strong><br />
aantal bedrijven onrechtmatig opgenomen.<br />
De populatie wordt herzien, zie bijlage 1,<br />
tabel 9, en als gevolg daar<strong>van</strong> wordt ook de<br />
steekproef herzien. Zie bijlage 1, tabel 10.<br />
De definitieve respons voor de <strong>IWT</strong>-steekproef<br />
komt daarmee te liggen op 684 schriftelijke<br />
(25.1%) antwoorden en 803 CAPI-antwoorden<br />
(29,5 %). Zie bijlage 1, tabellen 11 en 12.<br />
Een eerste analyse <strong>van</strong> deze respons laat toe<br />
om enkele conclusies te trekken over de<br />
samenstelling <strong>van</strong> beide responsgroepen.<br />
Beide zijn ongeveer even groot maar zijn<br />
toch verschillend verdeeld over de grootteklassen.<br />
Grote bedrijven zijn oververtegenwoordigd<br />
in de steekproef, maar in de mailing<br />
zijn de allergrootste nog dubbel zo<br />
sterk aanwezig dan in de CAPI. In de CAPI<br />
zitten over het algem<strong>een</strong> meer kleinere<br />
bedrijven. Dat kan doen veronderstellen dat<br />
het antwoordgedrag in de CAPI dichter<br />
staat bij dat <strong>van</strong> de populatie.<br />
Er zijn ook belangrijke verschillen in sectorverdeling.<br />
De respons mailing is relatief veel<br />
minder vertegenwoordigd in de dienstensector<br />
en sterk oververtegenwoordigd in<br />
metaal, metallurgie, machinebouw en precisie-instrumenten.<br />
Maar anderzijds zijn er in<br />
de respons mailing weer relatief minder<br />
<strong>ondernemingen</strong> aanwezig uit de sectoren<br />
chemie, elektrische machines, IT-hardware,<br />
voeding, textiel en automotive. In de<br />
respons CAPI is er dus ook <strong>een</strong> sterke invloed<br />
<strong>van</strong> antwoorden uit technologische sectoren.<br />
Door de herweging <strong>van</strong> deze resultaten<br />
naar sector en grootte kan <strong>een</strong> deel <strong>van</strong> die<br />
vertekeningen ongedaan gemaakt worden,<br />
maar andere mogelijke vertekeningen tus-<br />
20<br />
><br />
sen types <strong>van</strong> <strong>ondernemingen</strong> worden hierdoor<br />
niet gecorrigeerd. Herweging betekent<br />
dat <strong>een</strong> wegingsfactor wordt berekend voor<br />
elke cel <strong>van</strong> de matrix door het aantal<br />
bedrijven in de populatie te delen door het<br />
aantal bedrijven in de respons. Vervolgens<br />
wordt elk antwoord in de respons met die<br />
wegingsfactor vermenigvuldigd.<br />
3.5 KWALITEIT VAN DE DATA<br />
EN DATACLEANING<br />
Het verzamelen <strong>van</strong> data via om<strong>van</strong>grijk survey-<br />
en CAPI-onderzoek, en het vervolgens<br />
verwerken <strong>van</strong> deze data, is <strong>een</strong> niet-triviaal<br />
probleem, dat onderhevig is aan diverse factoren<br />
die <strong>een</strong> invloed hebben op de uiteindelijke<br />
kwaliteit <strong>van</strong> deze data. In brede<br />
context slaat datakwaliteit onder andere op:<br />
a) de rele<strong>van</strong>tie <strong>van</strong> de toegepaste statistische<br />
concepten; b) de accuraatheid <strong>van</strong> de<br />
data; c) het tijdig beschikbaar stellen <strong>van</strong> de<br />
gegevens; d) de toegankelijkheid <strong>van</strong> de<br />
gegevens en het beschikbaar zijn <strong>van</strong> toelichting;<br />
e) de vergelijkbaarheid <strong>van</strong> de data;<br />
f) de samenhang; en g) de volledigheid.<br />
Ten behoeve <strong>van</strong> de bruikbaarheid en kwaliteit<br />
<strong>van</strong> de gebruikte gegevens voor de initiële<br />
exploratie <strong>van</strong> de resultaten, werd op<br />
onderhavige CIS-3 dataset <strong>een</strong> cleaningprocedure<br />
toegepast. Gezien de brede definitie<br />
<strong>van</strong> datakwaliteit, dient hierbij opgemerkt<br />
te worden dat de toegepaste cleaningprocedure<br />
enkel slaat op de evaluatie, controle en<br />
eventuele aanpassing <strong>van</strong> de data nadat de<br />
data entry reeds had plaatsgevonden. Alle<br />
voorafgaande fasen <strong>van</strong> de dataverzameling<br />
in het onderzoek, gaande <strong>van</strong> het definiëren<br />
<strong>van</strong> de gebruikte concepten, het opstellen<br />
<strong>van</strong> de vragenlijst, de afname en het<br />
ingeven <strong>van</strong> de data, waren in deze cleaningfase<br />
reeds achter de rug en werden als<br />
dusdanig als gegeven beschouwd.<br />
Bijna gelijktijdig met de hier toegepaste<br />
cleaning, is ook <strong>een</strong> cleaning uitgevoerd<br />
door de DWTC voor de data <strong>van</strong> de respons<br />
mailing, en dit op basis <strong>van</strong> de Eurostat-procedure<br />
via <strong>een</strong> ter beschikking gesteld SASprogramma<br />
(black box). Voordeel <strong>van</strong> de<br />
cleaning via deze Eurostat-methode, is wellicht<br />
dat ze meer aandacht heeft voor inter-