Meningen over taal Frankrijk, België en Nederland - Marc van ...
Meningen over taal Frankrijk, België en Nederland - Marc van ...
Meningen over taal Frankrijk, België en Nederland - Marc van ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
8 3.2. Google<br />
ook belangrijker is in de Franse discussies dan in de <strong>Nederland</strong>se <strong>en</strong> Vlaamse.<br />
De Standaard staat (verrass<strong>en</strong>d g<strong>en</strong>oeg) in bijna alle opzicht<strong>en</strong> aan de kant<br />
<strong>van</strong> de NRC.<br />
3.2 Google<br />
Vervolg<strong>en</strong>s richt<strong>en</strong> we onze blik op het veel grotere corpus Internet, zoals<br />
we dit kunn<strong>en</strong> b<strong>en</strong>ader<strong>en</strong> met behulp <strong>van</strong> de zoekmachine Google. Volg<strong>en</strong>s<br />
e<strong>en</strong> rec<strong>en</strong>te schatting, indiceert Google ongeveer 3 biljard <strong>Nederland</strong>se woord<strong>en</strong><br />
(<strong>van</strong> Oost<strong>en</strong>dorp, 2005); het aantal Franse woord<strong>en</strong> is onbek<strong>en</strong>d (maar<br />
waarschijnlijk groter).<br />
De zog<strong>en</strong>oemde Google API 14 maakt automatische zoektocht<strong>en</strong> op grote<br />
schaal mogelijk; er hoev<strong>en</strong> hiervoor niet eindeloos zoekterm<strong>en</strong> te word<strong>en</strong><br />
ingetikt in het v<strong>en</strong>ster <strong>van</strong> de webbrowser, maar de computer kan Google<br />
rechtstreeks b<strong>en</strong>ader<strong>en</strong> zonder dat de browser zelfs maar op<strong>en</strong> hoeft te staan.<br />
Met behulp <strong>van</strong> e<strong>en</strong> script zocht<strong>en</strong> we weer op de begripp<strong>en</strong> <strong>taal</strong>beleid,<br />
internationale <strong>taal</strong>, wereld<strong>taal</strong> in het Frans <strong>en</strong> het <strong>Nederland</strong>s, maar in dit geval<br />
combineerd<strong>en</strong> we dit met de nam<strong>en</strong> <strong>van</strong> individuele tal<strong>en</strong>, <strong>en</strong> woord<strong>en</strong><br />
zoals grondwet, om het corpus niet onhanteerbaar groot te mak<strong>en</strong>. We sorteerd<strong>en</strong><br />
de pagina’s naar land aan de hand <strong>van</strong> de uitgang <strong>van</strong> de domeinnaam<br />
(nl=<strong>Nederland</strong>, be=<strong>België</strong>, fr=<strong>Frankrijk</strong>); e<strong>en</strong> nadeel hier<strong>van</strong> is natuurlijk dat<br />
websites met e<strong>en</strong> ext<strong>en</strong>sie als com of org afviel<strong>en</strong>.<br />
De onderstaande tabel geeft weer de resultat<strong>en</strong> voor de vraag hoe vaak<br />
e<strong>en</strong> bepaalde <strong>taal</strong> in verband werd gebracht met e<strong>en</strong> <strong>van</strong> onze zoekterm<strong>en</strong>:<br />
14 http://www.google.com/apis/