31.08.2013 Views

Meningen over taal Frankrijk, België en Nederland - Marc van ...

Meningen over taal Frankrijk, België en Nederland - Marc van ...

Meningen over taal Frankrijk, België en Nederland - Marc van ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

8 3.2. Google<br />

ook belangrijker is in de Franse discussies dan in de <strong>Nederland</strong>se <strong>en</strong> Vlaamse.<br />

De Standaard staat (verrass<strong>en</strong>d g<strong>en</strong>oeg) in bijna alle opzicht<strong>en</strong> aan de kant<br />

<strong>van</strong> de NRC.<br />

3.2 Google<br />

Vervolg<strong>en</strong>s richt<strong>en</strong> we onze blik op het veel grotere corpus Internet, zoals<br />

we dit kunn<strong>en</strong> b<strong>en</strong>ader<strong>en</strong> met behulp <strong>van</strong> de zoekmachine Google. Volg<strong>en</strong>s<br />

e<strong>en</strong> rec<strong>en</strong>te schatting, indiceert Google ongeveer 3 biljard <strong>Nederland</strong>se woord<strong>en</strong><br />

(<strong>van</strong> Oost<strong>en</strong>dorp, 2005); het aantal Franse woord<strong>en</strong> is onbek<strong>en</strong>d (maar<br />

waarschijnlijk groter).<br />

De zog<strong>en</strong>oemde Google API 14 maakt automatische zoektocht<strong>en</strong> op grote<br />

schaal mogelijk; er hoev<strong>en</strong> hiervoor niet eindeloos zoekterm<strong>en</strong> te word<strong>en</strong><br />

ingetikt in het v<strong>en</strong>ster <strong>van</strong> de webbrowser, maar de computer kan Google<br />

rechtstreeks b<strong>en</strong>ader<strong>en</strong> zonder dat de browser zelfs maar op<strong>en</strong> hoeft te staan.<br />

Met behulp <strong>van</strong> e<strong>en</strong> script zocht<strong>en</strong> we weer op de begripp<strong>en</strong> <strong>taal</strong>beleid,<br />

internationale <strong>taal</strong>, wereld<strong>taal</strong> in het Frans <strong>en</strong> het <strong>Nederland</strong>s, maar in dit geval<br />

combineerd<strong>en</strong> we dit met de nam<strong>en</strong> <strong>van</strong> individuele tal<strong>en</strong>, <strong>en</strong> woord<strong>en</strong><br />

zoals grondwet, om het corpus niet onhanteerbaar groot te mak<strong>en</strong>. We sorteerd<strong>en</strong><br />

de pagina’s naar land aan de hand <strong>van</strong> de uitgang <strong>van</strong> de domeinnaam<br />

(nl=<strong>Nederland</strong>, be=<strong>België</strong>, fr=<strong>Frankrijk</strong>); e<strong>en</strong> nadeel hier<strong>van</strong> is natuurlijk dat<br />

websites met e<strong>en</strong> ext<strong>en</strong>sie als com of org afviel<strong>en</strong>.<br />

De onderstaande tabel geeft weer de resultat<strong>en</strong> voor de vraag hoe vaak<br />

e<strong>en</strong> bepaalde <strong>taal</strong> in verband werd gebracht met e<strong>en</strong> <strong>van</strong> onze zoekterm<strong>en</strong>:<br />

14 http://www.google.com/apis/

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!