05.12.2012 Views

Dialectvariatie, dialectafstanden en dialectindelingen. Een formele ...

Dialectvariatie, dialectafstanden en dialectindelingen. Een formele ...

Dialectvariatie, dialectafstanden en dialectindelingen. Een formele ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

De analyse van uitspraakverschill<strong>en</strong> in Nederlandse <strong>en</strong> Friese taalvariëteit<strong>en</strong><br />

Wilbert Heeringa, John Nerbonne, Peter Kleiweg<br />

1. Inleiding<br />

Schibbolets verrad<strong>en</strong> de geografische herkomst van dialectsprekers. Iemand die de “slot-n” in e<strong>en</strong><br />

woord als zitt<strong>en</strong> uitspreekt, komt vermoedelijk uit het noordoost<strong>en</strong> van Nederland of het<br />

noordwest<strong>en</strong> van België. Iemand die de “zachte g” uitspreekt in e<strong>en</strong> woord als acht<strong>en</strong>tachtig woont<br />

waarschijnlijk erg<strong>en</strong>s t<strong>en</strong> zuid<strong>en</strong> van de grote rivier<strong>en</strong>. Lange tijd werd<strong>en</strong> dialect<strong>en</strong> gekarakteriseerd<br />

door dergelijke eig<strong>en</strong>schapp<strong>en</strong>, vaak ook (zoals de beide voorbeeld<strong>en</strong> lat<strong>en</strong> zi<strong>en</strong>) door<br />

eig<strong>en</strong>schapp<strong>en</strong> die e<strong>en</strong> verschil repres<strong>en</strong>ter<strong>en</strong> t<strong>en</strong> opzichte van het Standaardnederlands. Deze<br />

eig<strong>en</strong>schapp<strong>en</strong> werd<strong>en</strong> ook gevisualiseerd door e<strong>en</strong> lijn op e<strong>en</strong> kaart. Aan de <strong>en</strong>e kant van de lijn lag<br />

dan bijvoorbeeld het gebied waar zitt<strong>en</strong> wordt uitgesprok<strong>en</strong> als zitt(e)n (met slot-n), <strong>en</strong> aan de<br />

andere kant het gebied waar hetzelfde woord als zitte (zonder slot-n) wordt uitgesprok<strong>en</strong>. Zo'n lijn<br />

heet e<strong>en</strong> isoglosse.<br />

Echter in rec<strong>en</strong>t computationeel onderzoek wordt niet zozeer gefocust op e<strong>en</strong> beperkte verzameling<br />

van selectief – <strong>en</strong> daarmee subjectief – gekoz<strong>en</strong> losse taalkundige verschijnsel<strong>en</strong> die weergegev<strong>en</strong><br />

word<strong>en</strong> als isogloss<strong>en</strong>, maar veel meer op de aggregatie van verschijnsel<strong>en</strong>: e<strong>en</strong> groot aantal aselect<br />

gekoz<strong>en</strong> verschijnsel<strong>en</strong> – honderd<strong>en</strong> <strong>en</strong> soms wel duiz<strong>en</strong>d<strong>en</strong> - word<strong>en</strong> sam<strong>en</strong>g<strong>en</strong>om<strong>en</strong> oftewel<br />

geaggregeerd, <strong>en</strong> door analyse van het aggregaat wordt e<strong>en</strong> variatiepatroon gevond<strong>en</strong>. 1<br />

In deze bijdrage gaan we eerst taalkundige afstand<strong>en</strong> met<strong>en</strong> tuss<strong>en</strong> dialect<strong>en</strong> op basis van e<strong>en</strong> aantal<br />

bek<strong>en</strong>de isogloss<strong>en</strong>, dat wil zegg<strong>en</strong> isogloss<strong>en</strong> waar de dialectsprekers zelf zich bewust van zijn <strong>en</strong><br />

die in de literatuur veelvoudig word<strong>en</strong> g<strong>en</strong>oemd. Door het met<strong>en</strong> van afstand<strong>en</strong> wordt mete<strong>en</strong><br />

duidelijk dat bijvoorbeeld het Groningse dialect van Roodeschool meer verwant is met het Dr<strong>en</strong>tse<br />

dialect van Beil<strong>en</strong> dan met de Friese taalvariëteit zoals gesprok<strong>en</strong> in Grouw. Op basis van die<br />

afstand<strong>en</strong> mak<strong>en</strong> we e<strong>en</strong> indeling in dialectgroep<strong>en</strong>. Vervolg<strong>en</strong>s gaan we uitspraakafstand<strong>en</strong> met<strong>en</strong><br />

op basis van de aggregatie van e<strong>en</strong> groot aantal verschijnsel<strong>en</strong>. De verschijnsel<strong>en</strong> in de aggregaat<br />

zijn min of meer willekeurig gekoz<strong>en</strong> <strong>en</strong> hebb<strong>en</strong> daarmee het karakter van e<strong>en</strong> steekproef. De<br />

gemet<strong>en</strong> afstand<strong>en</strong> zijn dus objectief. Ook op basis van deze afstand<strong>en</strong> mak<strong>en</strong> we e<strong>en</strong> indeling in<br />

dialectgroep<strong>en</strong>. Vervolg<strong>en</strong>s gaan we beide indeling<strong>en</strong> met elkaar vergelijk<strong>en</strong>. Is er e<strong>en</strong> groot<br />

verschil tuss<strong>en</strong> de isogloss<strong>en</strong>indeling <strong>en</strong> de geaggregeerde indeling? Als dat zo is, moet<strong>en</strong> we<br />

concluder<strong>en</strong> dat e<strong>en</strong> indeling op basis van e<strong>en</strong> beperkte verzameling van selectief gekoz<strong>en</strong><br />

isogloss<strong>en</strong> ge<strong>en</strong> objectief beeld geeft, ook al gaat het om bek<strong>en</strong>de isogloss<strong>en</strong>. De conclusie is dan<br />

dat de aggregatie van e<strong>en</strong> groot aantal verschijnsel<strong>en</strong> noodzakelijk is, wil m<strong>en</strong> e<strong>en</strong> eerlijk beeld<br />

gev<strong>en</strong>.<br />

<strong>Dialectvariatie</strong>, <strong>dialectafstand<strong>en</strong></strong> <strong>en</strong> dialectindeling<strong>en</strong> zijn geografisch gerelateerd. Om te kom<strong>en</strong> tot<br />

de beantwoording van onze onderzoeksvraag mak<strong>en</strong> we daarom gebruik van e<strong>en</strong> GIS-pakket:<br />

RuG/L04. Dit pakket is vrij beschikbaar op het wereldwijde web <strong>en</strong> wordt internationaal door<br />

meerdere onderzoeksgroep<strong>en</strong> met succes toegepast. Het pakket kan gratis gelad<strong>en</strong> word<strong>en</strong> via<br />

http://www.let.rug.nl/~kleiweg/L04/.<br />

In paragraaf 2 besprek<strong>en</strong> we eerst de gegev<strong>en</strong>sbron die de basis voor alle meting<strong>en</strong> <strong>en</strong> resultat<strong>en</strong> in<br />

deze bijdrage vormt. Vervolg<strong>en</strong>s besprek<strong>en</strong> we in paragraaf 3 de isogloss<strong>en</strong>, <strong>en</strong> de manier waarop<br />

op basis van isogloss<strong>en</strong> afstand<strong>en</strong> tuss<strong>en</strong> variëteit<strong>en</strong> gemet<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong>. Paragraaf 4 bespreekt<br />

hoe geaggregeerde afstand<strong>en</strong> met de Lev<strong>en</strong>shtein-afstand gemet<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong>. In paragraaf 5<br />

besprek<strong>en</strong> we twee classificatietechniek<strong>en</strong>. In paragraaf 6 vergelijk<strong>en</strong> we de resultat<strong>en</strong> op basis van<br />

isogloss<strong>en</strong> met de geaggregeerde afstand<strong>en</strong>, <strong>en</strong> bepal<strong>en</strong> de repres<strong>en</strong>tativiteit van e<strong>en</strong> neg<strong>en</strong>tal<br />

isogloss<strong>en</strong>. In paragraaf 7 eindig<strong>en</strong> we met <strong>en</strong>kele conclusies.


2. Gegev<strong>en</strong>sbron<br />

De gegev<strong>en</strong>sbron die we in deze bijdrage gebruik<strong>en</strong> is de Reeks Nederlandse Dialectatlass<strong>en</strong><br />

(RND). De 16 del<strong>en</strong> waaruit deze atlass<strong>en</strong>reeks bestaat, versch<strong>en</strong><strong>en</strong> tuss<strong>en</strong> 1925 <strong>en</strong> 1982 onder<br />

redactie van E. Blancquaert <strong>en</strong> W. Pée. 2 In de atlass<strong>en</strong> vind<strong>en</strong> we transcripties van dialect<strong>en</strong> in<br />

Nederland, Noord-België, het uiterste noordwest<strong>en</strong> van Frankrijk <strong>en</strong> de Duitse graafschap<br />

B<strong>en</strong>theim. Het atlasproject werd opgestart door Blancquaert. To<strong>en</strong> Blancquaert overleed, nam Pée<br />

de leiding over. Onder zijn leiding is het project ook voltooid. In totaal hebb<strong>en</strong> 16 veldwerkers het<br />

materiaal in de atlass<strong>en</strong> verzameld. Soms war<strong>en</strong> meerdere veldwerkers bij e<strong>en</strong> deel betrokk<strong>en</strong>, <strong>en</strong><br />

sommige veldwerkers hebb<strong>en</strong> aan meerdere del<strong>en</strong> meegewerkt.<br />

2.1 Woord<strong>en</strong><br />

In de RND wordt voor ieder dialect e<strong>en</strong> vertaling gegev<strong>en</strong> van e<strong>en</strong> reeks van 139 zinn<strong>en</strong>. Deze<br />

vertaling<strong>en</strong> zijn gegev<strong>en</strong> in fonetisch schrift. De vrag<strong>en</strong>lijst was bedoeld was als e<strong>en</strong> reeks van<br />

zinn<strong>en</strong> bestaande uit woord<strong>en</strong> die variatie in bepaalde klank<strong>en</strong> illustrer<strong>en</strong>. 3 Er was bijvoorbeeld voor<br />

gezorgd dat mogelijke ontwikkeling<strong>en</strong> in Oudgermaanse klinkers, diftong<strong>en</strong> <strong>en</strong> medeklinkers in de<br />

transcripties zoud<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong> teruggevond<strong>en</strong>. Morfologische <strong>en</strong> syntactische variatie zou<br />

ev<strong>en</strong>e<strong>en</strong>s door de zinn<strong>en</strong> word<strong>en</strong> gerepres<strong>en</strong>teerd.<br />

Uit de 139 zinn<strong>en</strong> hebb<strong>en</strong> we min of meer willekeurig 125 woord<strong>en</strong> gekoz<strong>en</strong>. Het zou te veel tijd<br />

kost<strong>en</strong> om de complete tekst<strong>en</strong> te digitaliser<strong>en</strong>. De woord<strong>en</strong> die we geselecteerd hebb<strong>en</strong><br />

repres<strong>en</strong>ter<strong>en</strong> zo ongeveer alle klinkers (monoftong<strong>en</strong> <strong>en</strong> diftong<strong>en</strong>) <strong>en</strong> medeklinkers. De 125<br />

woord<strong>en</strong> mog<strong>en</strong> beschouwd word<strong>en</strong> als e<strong>en</strong> repres<strong>en</strong>tatieve steekproef. Bij het digitaliser<strong>en</strong> werd<br />

erop gelet dat alle variant<strong>en</strong> van e<strong>en</strong> woord dezelfde betek<strong>en</strong>is hadd<strong>en</strong>. Lexicale variatie was wèl<br />

toegestaan, 4 maar de mogelijkheid om dit te verwerk<strong>en</strong> zull<strong>en</strong> we in deze bijdrage verder niet<br />

besprek<strong>en</strong>.<br />

2.2 Variëteit<strong>en</strong><br />

De RND bevat transcripties van in totaal 1956 Nederlandse dialect<strong>en</strong>. Ook hier geldt dat het te veel<br />

tijd zou gaan kost<strong>en</strong> om de transcripties van alle dialect<strong>en</strong> te digitaliser<strong>en</strong>. Daarom maakt<strong>en</strong> we e<strong>en</strong><br />

selectie van 360 dialect<strong>en</strong>. De 360 dialectplaats<strong>en</strong> vorm<strong>en</strong> over het algeme<strong>en</strong> e<strong>en</strong> regelmatig net.<br />

Dit net is weergegev<strong>en</strong> in Figuur 1.<br />

In Friesland kan m<strong>en</strong> onderscheid mak<strong>en</strong> tuss<strong>en</strong> Friese dialect<strong>en</strong> <strong>en</strong> Friese m<strong>en</strong>gdialect<strong>en</strong>. In het<br />

grootste deel van de provincie wordt Fries gesprok<strong>en</strong>, maar op Ameland, in Het Bildt <strong>en</strong> in<br />

Stellingwerf wordt e<strong>en</strong> m<strong>en</strong>gdialect gesprok<strong>en</strong>. In e<strong>en</strong> groot aantal sted<strong>en</strong> wordt ev<strong>en</strong>e<strong>en</strong>s e<strong>en</strong><br />

m<strong>en</strong>gdialect gesprok<strong>en</strong>. Deze sted<strong>en</strong> vorm<strong>en</strong> taaleiland<strong>en</strong> in het Friese dialectcontinuüm. We<br />

begonn<strong>en</strong> met het opzett<strong>en</strong> van e<strong>en</strong> regelmatig net van dialect<strong>en</strong> die behor<strong>en</strong> tot het Friese<br />

dialectcontinuüm, <strong>en</strong> voegd<strong>en</strong> daar vervolg<strong>en</strong>s de taaleiland<strong>en</strong> aan toe. In Figuur 1 zijn de<br />

taaleiland<strong>en</strong> weergegev<strong>en</strong> als witte ruitjes.<br />

In de RND word<strong>en</strong> voor Tjalleberd, Donkerbroek <strong>en</strong> Appelscha twee transcripties gegev<strong>en</strong>. To<strong>en</strong> in<br />

Tjalleberd de RND-opnames gemaakt werd<strong>en</strong>, sprak<strong>en</strong> de meeste m<strong>en</strong>s<strong>en</strong> daar Fries, maar e<strong>en</strong> klein<br />

deel sprak het `Gietersk', e<strong>en</strong> dialect dat geïntroduceerd werd door ve<strong>en</strong>arbeiders uit Giethoorn <strong>en</strong><br />

omstrek<strong>en</strong>. Ev<strong>en</strong>als Tjalleberd, ligt ook Donkerbroek in het Friese dialectcontinüum. Behalve Fries<br />

werd in deze plaats ook e<strong>en</strong> Stellingwerfs dialect gesprok<strong>en</strong>. Appelscha ligt in het Stellingwerfs


dialectgebied. Net als in Donkerbroek werd in deze plaats zowel e<strong>en</strong> Fries als e<strong>en</strong> Stellingwerfs<br />

dialect gesprok<strong>en</strong>. Het Friese dialect in deze plaats werd geïntroduceerd door ve<strong>en</strong>arbeiders die<br />

afkomstig war<strong>en</strong> uit het Friese dialectgebied. Tjalleberd, Donkerbroek <strong>en</strong> Appelscha zijn in Figuur<br />

1 aangegev<strong>en</strong> met grijze ruitjes.<br />

Figuur 1. Verdeling van de 357 plaats<strong>en</strong>, corresponder<strong>en</strong>d met 360 verschill<strong>en</strong>de variëteit<strong>en</strong>. Witte<br />

ruitjes repres<strong>en</strong>ter<strong>en</strong> taaleiland<strong>en</strong> (Friese sted<strong>en</strong>), <strong>en</strong> grijze ruitjes plaats<strong>en</strong> waar twee dialect<strong>en</strong><br />

word<strong>en</strong> gesprok<strong>en</strong>. Daarbij geldt e<strong>en</strong> van de twee dialect<strong>en</strong> als e<strong>en</strong> taaleiland. Het betreft Tjalleberd<br />

(meest linkse ruitje), Donkerbroek (middelste ruitje) <strong>en</strong> Appelscha (meest rechtse ruitje). De kleine<br />

cirkeltjes repres<strong>en</strong>ter<strong>en</strong> Urk (rechtsbov<strong>en</strong>) <strong>en</strong> Monnick<strong>en</strong>werf op Mark<strong>en</strong> (linksonder).<br />

3. Isogloss<strong>en</strong><br />

E<strong>en</strong> isoglosse is e<strong>en</strong> lijn op e<strong>en</strong> kaart die variatie met betrekking tot e<strong>en</strong> taalkundig verschijnsel<br />

repres<strong>en</strong>teert, zodanig dat e<strong>en</strong> gebied met de <strong>en</strong>e vorm afgegr<strong>en</strong>sd wordt van e<strong>en</strong> gebied met e<strong>en</strong><br />

andere vorm. In de inleiding noemd<strong>en</strong> we als de slot-n-isoglosse die het noordoost<strong>en</strong> <strong>en</strong> het<br />

zuidwest<strong>en</strong> van het Nederlandse taalgebied (met de uitspraak zitt(e)n) afgr<strong>en</strong>st van de rest van het<br />

Nederlandse taalgebied (uitspraak zitte). Bij het gebruik van isogloss<strong>en</strong> zijn er twee vrag<strong>en</strong> waarop<br />

niet gemakkelijk e<strong>en</strong> antwoord gegev<strong>en</strong> kan word<strong>en</strong>, namelijk: 1) welke isogloss<strong>en</strong> kiez<strong>en</strong> we? <strong>en</strong><br />

2) hoe belangrijk is elk van de isogloss<strong>en</strong>?<br />

3.1 Keuze van isogloss<strong>en</strong><br />

In 1941 versche<strong>en</strong> e<strong>en</strong> isogloss<strong>en</strong>kaart van Weijn<strong>en</strong>. 5 Op deze kaart zijn 45 isogloss<strong>en</strong> getek<strong>en</strong>d. In<br />

teg<strong>en</strong>stelling tot oudere kaart<strong>en</strong> laat e<strong>en</strong> isogloss<strong>en</strong>kaart beter zi<strong>en</strong> hoe belangrijk gr<strong>en</strong>z<strong>en</strong> zijn: e<strong>en</strong><br />

brede str<strong>en</strong>g van isogloss<strong>en</strong> repres<strong>en</strong>teert e<strong>en</strong> belangrijke gr<strong>en</strong>s, maar e<strong>en</strong> gr<strong>en</strong>s van maar één<br />

<strong>en</strong>kele isoglosse is veel minder belangrijk. In 1958 versche<strong>en</strong> opnieuw e<strong>en</strong> kaart van Weijn<strong>en</strong>. 6 De<br />

indeling op deze kaart is gebaseerd op 18 isofon<strong>en</strong> <strong>en</strong> isomorf<strong>en</strong>. E<strong>en</strong> andere isogloss<strong>en</strong>kaart<br />

versche<strong>en</strong> in 1970 van de hand van Gooss<strong>en</strong>s. 7 Gooss<strong>en</strong>s bekeek de Nederlandse dialect<strong>en</strong> vanuit<br />

Duits perspectief.


Het mooie van isogloss<strong>en</strong>kaart<strong>en</strong> is dat de resultat<strong>en</strong> verifieerbaar zijn. Maar het blijft wel<br />

onduidelijk hoe de ontwerper de keuze van de verschijnsel<strong>en</strong> gemotiveerd heeft. Voor elk van de<br />

drie kaart<strong>en</strong> is de keuze van de isogloss<strong>en</strong> weer anders, met als gevolg dat elke kaart e<strong>en</strong> andere<br />

indeling laat zi<strong>en</strong>.<br />

3.2 Het belang van elk van de isogloss<strong>en</strong><br />

De vraag welke isogloss<strong>en</strong> het meest belangrijk zijn is niet e<strong>en</strong>voudig te beantwoord<strong>en</strong>.<br />

Dialectolog<strong>en</strong> hebb<strong>en</strong> e<strong>en</strong> voorkeur voor isogloss<strong>en</strong> die geheel of gedeeltelijk sam<strong>en</strong>vall<strong>en</strong> zodat bij<br />

het op elkaar stapel<strong>en</strong> van isogloss<strong>en</strong>kaart<strong>en</strong> isogloss<strong>en</strong>bundels ontstaan, <strong>en</strong> daardoor e<strong>en</strong> heldere<br />

verdeling in gebied<strong>en</strong>. 8 In Van randstad tot landrand schreef Jo Daan onder andere: 9<br />

“De taalkundige kan alle isogloss<strong>en</strong> vaststell<strong>en</strong> <strong>en</strong> hun dichtheid <strong>en</strong> richting volg<strong>en</strong>s<br />

statistische method<strong>en</strong> vergelijk<strong>en</strong>. Maar in zijn objectiviteit zal het hem ontgaan welke<br />

isogloss<strong>en</strong> belangrijk, welke onbelangrijk zijn, hij krijgt ge<strong>en</strong> inzicht in de relevantie van de<br />

isogloss<strong>en</strong> als dialektscheiding.” (blz. 9)<br />

De auteur onderscheidt echter twee hoofdk<strong>en</strong>merk<strong>en</strong>: “het al of niet uitsprek<strong>en</strong> van de slot-n <strong>en</strong> de<br />

jij/gij-gr<strong>en</strong>s.” (blz. 32). Ze merkt daarbij op dat het gebied waar dialectsprekers gij gebruik<strong>en</strong>,<br />

ongeveer overe<strong>en</strong>komt met het gebied waar de zachte g wordt uitgesprok<strong>en</strong>.<br />

In ons RND-materiaal is de slot-n-isoglosse sterk verteg<strong>en</strong>woordigd, namelijk in maar liefst 23<br />

woord<strong>en</strong>. In Figuur 2a wordt de geografische verdeling van dope versus doopm of dop<strong>en</strong><br />

weergegev<strong>en</strong>. Het jij/gij-onderscheid vind<strong>en</strong> we – uiteraard – in precies één woord. De verdeling is<br />

te vind<strong>en</strong> in Figuur 2g. Op de kaart zi<strong>en</strong> we ook e<strong>en</strong> derde vorm, namelijk ie. Gij, jij <strong>en</strong> ie zijn<br />

uitspraakvariant<strong>en</strong> van elkaar. In de grijze gebied<strong>en</strong> op de kaart vind<strong>en</strong> we ge<strong>en</strong> uitspraakvariant<strong>en</strong><br />

van de drie g<strong>en</strong>oemde vorm<strong>en</strong>. In deze gebied<strong>en</strong> zegt m<strong>en</strong> meestal doe of doo of dou. Zoals gezegd<br />

valt de jij/gij-gr<strong>en</strong>s ongeveer sam<strong>en</strong> met de gr<strong>en</strong>s tuss<strong>en</strong> de harde g <strong>en</strong> de zachte g. In het RNDmateriaal<br />

kan dit onderscheid helaas niet word<strong>en</strong> teruggevond<strong>en</strong>, omdat de veldwerkers bij het<br />

noter<strong>en</strong> van de uitspraak ge<strong>en</strong> onderscheid<strong>en</strong> tek<strong>en</strong>s gebruik<strong>en</strong> voor de beide g's.<br />

Naast deze twee hoofdisogloss<strong>en</strong> hebb<strong>en</strong> we in Figuur 2 nog zev<strong>en</strong> andere isogloss<strong>en</strong> opg<strong>en</strong>om<strong>en</strong>.<br />

Omdat we in deze bijdrage onderzoek do<strong>en</strong> naar uitspraakvariatie, zijn het uitsluit<strong>en</strong>d isogloss<strong>en</strong> die<br />

de uitspraak betreff<strong>en</strong>. De gekoz<strong>en</strong> woord<strong>en</strong> die de isogloss<strong>en</strong> repres<strong>en</strong>ter<strong>en</strong>, variër<strong>en</strong> lexicaal niet<br />

of nauwelijks. We hebb<strong>en</strong> de isogloss<strong>en</strong> gekoz<strong>en</strong> op basis van het RND-materiaal, <strong>en</strong> dan met name<br />

die isogloss<strong>en</strong> die e<strong>en</strong> tamelijk duidelijke verdeling in gebied<strong>en</strong> suggerer<strong>en</strong>. Zoals we in paragraaf 2<br />

schrev<strong>en</strong>, hebb<strong>en</strong> meerdere veldwerkers meegewerkt. Die noteerd<strong>en</strong> de uitspraak van woord<strong>en</strong> niet<br />

altijd op precies dezelfde manier. De isogloss<strong>en</strong> in Figuur 2 betreff<strong>en</strong> taalverschijnsel<strong>en</strong> die<br />

(vrijwel) volledig resist<strong>en</strong>t zijn teg<strong>en</strong> veldwerkersverschill<strong>en</strong>.<br />

De isogloss<strong>en</strong> op de kaart<strong>en</strong> b), c) <strong>en</strong> d) zijn ook te vind<strong>en</strong> op de uitvouwbare kaart achterin<br />

Nederlandse Dialectkunde van Weijn<strong>en</strong> uit 1958 <strong>en</strong> 1966 10 . Weijn<strong>en</strong> geeft ook e<strong>en</strong> kaart die vrijwel<br />

hetzelfde patroon heeft als kaart f. Op die kaart wordt de uitspraakvariatie in de klinker in lief<br />

weergegev<strong>en</strong>. Langs de oostgr<strong>en</strong>s - het gebied waar goed als goud of good wordt uitgesprok<strong>en</strong> – is<br />

de uitspraak leef, lijf of laif. Kaart e. vind<strong>en</strong> we, zij het in iets andere vorm, ook in Language, e<strong>en</strong><br />

inleiding geschrev<strong>en</strong> door Bloomfield (uitgave 1933 <strong>en</strong> 1935 of rec<strong>en</strong>ter). 11 De kaart in Language is<br />

afgeleid van e<strong>en</strong> kaart van G. G. Kloeke waarop niet alle<strong>en</strong> de uitspraak van de klinker in huis,<br />

maar ook die in muis wordt weergegev<strong>en</strong>. Op kaart i) vind<strong>en</strong> we de bek<strong>en</strong>de Uerdinger lijn, e<strong>en</strong><br />

isoglosse die dialect<strong>en</strong> die de ich-vorm gebruik<strong>en</strong> scheidt van dialect<strong>en</strong> die de ik-vorm gebruik<strong>en</strong>.<br />

3.3 Geaggregeerde isogloss<strong>en</strong>afstand<strong>en</strong>


Door het sam<strong>en</strong>nem<strong>en</strong> van de islogloss<strong>en</strong> kunn<strong>en</strong> we geaggregeerde afstand<strong>en</strong> met<strong>en</strong>. Het met<strong>en</strong><br />

van geaggregeerde taalkundige afstand<strong>en</strong> tuss<strong>en</strong> dialect<strong>en</strong> werd voor het eerst gedaan door Jean<br />

Séguy in het begin van de zev<strong>en</strong>tiger jar<strong>en</strong> van de twintigste eeuw. 12 Jean Séguy was directeur van<br />

de Atlas linguistique de la Gascogne. Sam<strong>en</strong> met nog e<strong>en</strong> aantal medewerkers publiceerde hij e<strong>en</strong><br />

zesdelige atlass<strong>en</strong>reeks. Séguy wilde de kaart<strong>en</strong> in deze atlass<strong>en</strong> op e<strong>en</strong> objectievere manier<br />

analyser<strong>en</strong> dan mogelijk was met de traditionele analytische method<strong>en</strong>. Séguy <strong>en</strong> zijn<br />

onderzoeksteam ded<strong>en</strong> dit door voor elk tweetal naburige dialectplaats<strong>en</strong> het aantal items te tell<strong>en</strong><br />

waarvoor de naast elkaar geleg<strong>en</strong> dialectplaats<strong>en</strong> verschill<strong>en</strong>d war<strong>en</strong>. Dat aantal verschill<strong>en</strong> werd<br />

uitgedrukt in e<strong>en</strong> perc<strong>en</strong>tage, <strong>en</strong> dat perc<strong>en</strong>tage repres<strong>en</strong>teerde vervolg<strong>en</strong>s de taalkundige afstand<br />

tuss<strong>en</strong> beide dialectplaats<strong>en</strong>. 13<br />

We kunn<strong>en</strong> de methodologie van Séguy gemakkelijk toepass<strong>en</strong> op onze data. E<strong>en</strong> voorbeeld vind<strong>en</strong><br />

we in Tabel 1. In de tabel zi<strong>en</strong> we hoe de afstand tuss<strong>en</strong> het Fries zoals gesprok<strong>en</strong> in Grouw <strong>en</strong> het<br />

dialect van Haarlem op basis van onze neg<strong>en</strong> isogloss<strong>en</strong> wordt berek<strong>en</strong>d.<br />

isoglosse Grouw Haarlem afstand<br />

a) dope dope 0<br />

b) droog droog 0<br />

c) weest geweest 1<br />

d) riep rijp 1<br />

e) hoes huis 1<br />

f) goed goed 0<br />

g) jij ? ?<br />

h) skool school 1<br />

i) ik ik 0<br />

4<br />

Tabel 1. Berek<strong>en</strong>ing van de afstand tuss<strong>en</strong> Fries zoals gesprok<strong>en</strong> in Grouw <strong>en</strong> het dialect van<br />

Haarlem op basis van neg<strong>en</strong> isogloss<strong>en</strong>.<br />

Voor isoglosse g) kunn<strong>en</strong> we niet bepal<strong>en</strong> of Grouw <strong>en</strong> Haarlem hetzelfde zijn. In Grouw wordt<br />

ge<strong>en</strong> uitspraakvariant van gij, jij of ie gebruikt. We del<strong>en</strong> nu het aantal isogloss<strong>en</strong> waardoor Grouw<br />

<strong>en</strong> Haarlem word<strong>en</strong> gescheid<strong>en</strong> door het totale aantal isogloss<strong>en</strong> dat we kond<strong>en</strong> verdisconter<strong>en</strong>: 4<br />

gedeeld door 8 is 0.5. Verm<strong>en</strong>igvuldig<strong>en</strong> we dit met 100, dan krijg<strong>en</strong> we e<strong>en</strong> afstand van 50%.<br />

We hebb<strong>en</strong> afstand<strong>en</strong> gemet<strong>en</strong> voor alle plaats-par<strong>en</strong>. Het met<strong>en</strong> van de afstand<strong>en</strong> is goed mogelijk<br />

met het GIS-pakket RuG/L04. De basis is e<strong>en</strong> database van 360 dialectplaats<strong>en</strong>, waarbij voor elke<br />

plaats neg<strong>en</strong> isogloss<strong>en</strong>waard<strong>en</strong> gegev<strong>en</strong> zijn. Op basis daarvan meet het systeem de afstand<strong>en</strong><br />

tuss<strong>en</strong> de dialectplaats<strong>en</strong>. Hier zi<strong>en</strong> we mete<strong>en</strong> het unieke van RuG/L04 waardoor het zich<br />

onderscheidt van andere GIS-pakkett<strong>en</strong>. De mogelijkhed<strong>en</strong> van de standaard GIS-programma’s<br />

zoals bijvoorbeeld ArcInfo <strong>en</strong> Grass beperk<strong>en</strong> zich tot de analyse van gegev<strong>en</strong>s die steeds<br />

betrekking hebb<strong>en</strong> op één bepaalde plaats, bijvoorbeeld de bodemvervuiling door koper, de<br />

aanwezigheid van water, <strong>en</strong>z. We sprek<strong>en</strong> dan van monadische varial<strong>en</strong>. In de dialectologie is m<strong>en</strong><br />

echter vooral ook geïnteresseerd in de analyse van dyadische variabel<strong>en</strong>, dus de relaties tuss<strong>en</strong><br />

plaats<strong>en</strong>, in ons geval het aantal isogloss<strong>en</strong> waarin twee plaats<strong>en</strong> van elkaar verschill<strong>en</strong>. Behalve in<br />

de dialectologie is de analyse van dyadische variabel<strong>en</strong> ook gangbaar in de ethnologie <strong>en</strong> de<br />

musicologie. RuG/L04 is e<strong>en</strong> GIS-pakket dat speciaal hiervoor ontworp<strong>en</strong> is.<br />

Vervolg<strong>en</strong>s biedt RuG/L04 de mogelijkheid om de afstand<strong>en</strong> weer te gev<strong>en</strong> op e<strong>en</strong> kaart. Deze kaart<br />

is gegev<strong>en</strong> in Figuur 3a. Hoe donkerder de lijn<strong>en</strong>, hoe kleiner de afstand<strong>en</strong> zijn. Er zijn alle<strong>en</strong><br />

afstand<strong>en</strong> tuss<strong>en</strong> plaats<strong>en</strong> weergegev<strong>en</strong> die niet verder uit elkaar ligg<strong>en</strong> dan 100 km. De verticale<br />

lijn rechtsonder in de figuur geeft deze afstand<strong>en</strong> weer. Op deze manier ontstaat e<strong>en</strong> beeld dat e<strong>en</strong>


verdeling in verschill<strong>en</strong>de gebied<strong>en</strong> suggereert.


a) dope (gro<strong>en</strong>) vs.<br />

doopm/dop<strong>en</strong> (blauw)<br />

b) droog (gro<strong>en</strong> vs. drooge<br />

(blauw)<br />

d) rijp (gro<strong>en</strong>) vs. riep (blauw) e) huis (gro<strong>en</strong>) vs. huus (cyaan)<br />

vs. hoes (blauw)<br />

g) jij (gro<strong>en</strong>) vs. gij (blauw) vs.<br />

ie (cyaan)<br />

h) school (gro<strong>en</strong>) vs. skool<br />

(blauw) vs. sjool (cyaan)<br />

c) geweest (gro<strong>en</strong>) vs. eweest<br />

(cyaan) vs. weest (blauw)<br />

f) goed (gro<strong>en</strong>) vs. goud/good<br />

(blauw)<br />

i) ik (gro<strong>en</strong>) vs. ich (blauw) vs.<br />

isj (cyaan)<br />

Figuur 2. Neg<strong>en</strong> isogloss<strong>en</strong>kaart<strong>en</strong> getek<strong>en</strong>d op basis van gegev<strong>en</strong>s uit de RND voor 360<br />

variëteit<strong>en</strong>. Plaats<strong>en</strong> waarvoor ge<strong>en</strong> gegev<strong>en</strong>s beschikbaar war<strong>en</strong> zijn in de kaart<strong>en</strong> grijs gekleurd.<br />

Elke isoglosse suggereert weer e<strong>en</strong> andere indeling.


4 Meting van uitspraakverschill<strong>en</strong> met de Lev<strong>en</strong>shtein-afstand<br />

In paragraaf 3 eindigd<strong>en</strong> we met de meting<strong>en</strong> van geaggregeerde isogloss<strong>en</strong>afstand<strong>en</strong> zoals dit<br />

begin zev<strong>en</strong>tiger jar<strong>en</strong> van de twintigste eeuw door Jean Séguy werd geïntroduceerd. De neg<strong>en</strong><br />

isogloss<strong>en</strong> hadd<strong>en</strong> we handmatig in het ons materiaal opgezocht <strong>en</strong> gecodeerd. In paragraaf 2 zag<strong>en</strong><br />

we dat ons materiaal bestaat uit 125 woorduitspraaktranscripties voor elk van 360 variëteit<strong>en</strong>. In dit<br />

materiaal zitt<strong>en</strong> honderd<strong>en</strong> islogloss<strong>en</strong> verborg<strong>en</strong>, <strong>en</strong> met e<strong>en</strong> handmatige analyse kunn<strong>en</strong> ev<strong>en</strong>tueel<br />

al die islogloss<strong>en</strong> opgezocht <strong>en</strong> gecodeerd kunn<strong>en</strong> word<strong>en</strong>.Het behoeft ge<strong>en</strong> betoog dat dit e<strong>en</strong><br />

bijzonder tijdrov<strong>en</strong>de klus zou word<strong>en</strong>. Dé oplossing bij uitstek om dit te automatiser<strong>en</strong> is de<br />

Lev<strong>en</strong>shtein-afstand. Met de Lev<strong>en</strong>shtein-afstand word<strong>en</strong> geaggregeerde afstand<strong>en</strong> gemet<strong>en</strong> waarin<br />

alle informatie die in de transcripties aanwezig is, verwerkt is.<br />

In 1995 gebruikte Kessler de Lev<strong>en</strong>shtein-afstand als instrum<strong>en</strong>t voor het met<strong>en</strong> van taalkundige<br />

afstand<strong>en</strong> tuss<strong>en</strong> Ierse dialect<strong>en</strong>. 14 De Lev<strong>en</strong>shtein-afstand is gelijk aan de minimale kost<strong>en</strong> die<br />

nodig zijn om de <strong>en</strong>e reeks symbol<strong>en</strong> te verander<strong>en</strong> in de andere. In het e<strong>en</strong>voudigste geval zijn drie<br />

operaties mogelijk: e<strong>en</strong> elem<strong>en</strong>t toevoeg<strong>en</strong>, e<strong>en</strong> elem<strong>en</strong>t vervang<strong>en</strong> door e<strong>en</strong> ander elem<strong>en</strong>t, of e<strong>en</strong><br />

elem<strong>en</strong>t verwijder<strong>en</strong>. Bij vergelijking van taal- <strong>en</strong> dialectvariëteit<strong>en</strong> word<strong>en</strong> fonetische transcripties<br />

van woorduitsprak<strong>en</strong> met elkaar vergelek<strong>en</strong>. Bij de bepaling van de Lev<strong>en</strong>shtein-afstand tuss<strong>en</strong><br />

twee fonetische transcripties kunn<strong>en</strong> fonetische segm<strong>en</strong>t<strong>en</strong> word<strong>en</strong> toegevoegd, vervang<strong>en</strong> of<br />

verwijderd.<br />

Kesslers aanpak bleek succesvol <strong>en</strong> werd ook toegepast op Nederlandse dialect<strong>en</strong>, 15 Sardische<br />

dialect<strong>en</strong>, 16 Noorse dialect<strong>en</strong>, 17 <strong>en</strong> Duitse dialect<strong>en</strong>. 18 In ons onderzoek gebruik<strong>en</strong> we ev<strong>en</strong>e<strong>en</strong>s de<br />

Lev<strong>en</strong>shtein-afstand. We met<strong>en</strong> daarbij uitsluit<strong>en</strong>d uitspraakverschill<strong>en</strong>. Uitspraakverschill<strong>en</strong><br />

omvatt<strong>en</strong> zowel fonetische als morfologische verschill<strong>en</strong>.<br />

4.1 De Lev<strong>en</strong>shtein-afstand<br />

Zoals we hierbov<strong>en</strong> al meldd<strong>en</strong>, introducer<strong>en</strong> we in deze paragraaf e<strong>en</strong> simpele versie van de<br />

Lev<strong>en</strong>shtein-afstand om het principe beter te kunn<strong>en</strong> uitlegg<strong>en</strong>. We gaan er daarbij gemakshalve<br />

van uit dat klank<strong>en</strong> óf hetzelfde óf verschill<strong>en</strong>d zijn. We schrev<strong>en</strong> hierbov<strong>en</strong> al dat de Lev<strong>en</strong>shteinafstand<br />

gelijk is aan het minimale aantal operaties dat nodig is om de <strong>en</strong>e reeks (van fonetische<br />

segm<strong>en</strong>t<strong>en</strong>) te verander<strong>en</strong> in de andere reeks. We illustrer<strong>en</strong> dit aan de hand van e<strong>en</strong> voorbeeld. In<br />

het Fries zoals gesprok<strong>en</strong> in de plaats Grouw wordt melk uitgesprok<strong>en</strong> als [�����]. In het dialect<br />

van Haarlem wordt hetzelfde woord uitgesprok<strong>en</strong> als [�����]. 19 Tabel 2 laat zi<strong>en</strong> hoe je de <strong>en</strong>e<br />

uitspraak zou kunn<strong>en</strong> verander<strong>en</strong> in de andere.<br />

����� verwijder � 1<br />

���� vervang ��������� 1<br />

���� voeg toe � 1<br />

�����<br />

Tabel 2. De uitspraak [�����] voor melk kan word<strong>en</strong> veranderd in de uitspraak [�����] door<br />

achtere<strong>en</strong>volg<strong>en</strong>s de [�] te verwijder<strong>en</strong>, de [�� door e<strong>en</strong> [�] te vervang<strong>en</strong>, <strong>en</strong> e<strong>en</strong> [�] toe te voeg<strong>en</strong>, in<br />

totaal drie operaties.<br />

3


In feite kan m<strong>en</strong> op heel veel verschill<strong>en</strong>de manier<strong>en</strong> de <strong>en</strong>e uitspraak verander<strong>en</strong> in de andere. De<br />

kracht van het Lev<strong>en</strong>shtein-algoritme is echter dat deze de operaties zodanig kiest dat de totale<br />

kost<strong>en</strong> zo klein mogelijk blijv<strong>en</strong>.<br />

4.2 Oplijning<br />

De procedure zoals we die hierbov<strong>en</strong> besprak<strong>en</strong> is tamelijk abstract. Het is daarom goed die ook te<br />

beschrijv<strong>en</strong> vanuit e<strong>en</strong> andere gezichtshoek, namelijk die van de oplijning (Engels: alignm<strong>en</strong>t). E<strong>en</strong><br />

oplijning laat zi<strong>en</strong> welk segm<strong>en</strong>t in het <strong>en</strong>e woord correspondeert met welk segm<strong>en</strong>t in het andere<br />

woord, <strong>en</strong> welke segm<strong>en</strong>t<strong>en</strong> in het <strong>en</strong>e woord zijn toegevoegd of verwijderd t<strong>en</strong> opzichte van het<br />

andere woord. De oplijning die we in ons voorbeeld krijg<strong>en</strong>, wordt getoond in Tabel 3.<br />

1 2 3 4 5 6<br />

Grouw � � � � �<br />

Haarlem � � � � �<br />

1 1 1<br />

Tabel 3. Oplijning van de uitspraak voor melk in het Fries van Grouw t<strong>en</strong> opzichte van de uitspraak<br />

van hetzelfde woord in het dialect van Haarlem.<br />

Om ervoor te zorg<strong>en</strong> dat de Lev<strong>en</strong>shtein-afstand is gebaseerd op e<strong>en</strong> oplijning waarin de<br />

lettergrep<strong>en</strong> in het <strong>en</strong>e woord correct t<strong>en</strong> opzichte van de corresponder<strong>en</strong>de lettergrep<strong>en</strong> in het<br />

andere woord zijn opgelijnd, is het belangrijk om niet alle mogelijke segm<strong>en</strong>tcorrespond<strong>en</strong>ties in<br />

e<strong>en</strong> oplijning toe te staan. Onze versie van het Lev<strong>en</strong>shtein-algoritme is zodanig aangepast dat e<strong>en</strong><br />

klinker alle<strong>en</strong> mag corresponder<strong>en</strong> met e<strong>en</strong> klinker <strong>en</strong> e<strong>en</strong> medeklinker alle<strong>en</strong> met e<strong>en</strong> medeklinker.<br />

De [j] <strong>en</strong> de [w] mog<strong>en</strong> ook met e<strong>en</strong> klinker corresponder<strong>en</strong> (of omgekeerd), <strong>en</strong> de [i] <strong>en</strong> de [u] met<br />

e<strong>en</strong> consonant (of omgekeerd). De sjwa mag corresponder<strong>en</strong> met e<strong>en</strong> sonorant. Op die manier<br />

word<strong>en</strong> onwaarschijnlijke correspond<strong>en</strong>ties voorkom<strong>en</strong>.<br />

4.3 Graduele gewicht<strong>en</strong><br />

In de twee vorige paragraf<strong>en</strong> introduceerd<strong>en</strong> we e<strong>en</strong> simpele versie van de Lev<strong>en</strong>shtein-afstand<br />

waarbij klank<strong>en</strong> óf gelijk óf ongelijk aan elkaar zijn. Voor de berek<strong>en</strong>ing<strong>en</strong> verderop in deze<br />

bijdrage gebruik<strong>en</strong> we e<strong>en</strong> verfijndere versie van het algoritme met graduele gewicht<strong>en</strong> voor de drie<br />

operaties. Daarbij wordt rek<strong>en</strong>ing gehoud<strong>en</strong> met de mate van verwantschap tuss<strong>en</strong> klank<strong>en</strong> zodat uit<br />

de verf komt dat bijvoorbeeld de [�] <strong>en</strong> de [�] meer op elkaar lijk<strong>en</strong> dan de [�] <strong>en</strong> de [�]. De<br />

gewicht<strong>en</strong> zijn gebaseerd op akoestische meting<strong>en</strong> tuss<strong>en</strong> samples op de cassette The Sounds of the<br />

International Phonetic Alphabet die uitgegev<strong>en</strong> werd in 1995. Onze meting<strong>en</strong> zijn zuiver fonetisch:<br />

het doet er niet toe of e<strong>en</strong> klankverschil tot e<strong>en</strong> betek<strong>en</strong>isverschil kan leid<strong>en</strong>, bepal<strong>en</strong>d is of er<br />

verschil in klankkleur is. Bijvoorbeeld: in teg<strong>en</strong>stelling tot bijv. de [�] van ‘maan’<strong>en</strong> de [�] van<br />

‘man’ zijn de [�] <strong>en</strong> de [�] in het Nederlands niet betek<strong>en</strong>isonderscheid<strong>en</strong>d, maar het verschil<br />

tuss<strong>en</strong> beide klank<strong>en</strong> wordt door ons wel in rek<strong>en</strong>ing gebracht, ev<strong>en</strong>als dat tuss<strong>en</strong> [�] <strong>en</strong> [�]. 20<br />

4.4 Aggregatie<br />

In de vorige paragraaf besprak<strong>en</strong> we hoe de afstand tuss<strong>en</strong> twee woorduitsprak<strong>en</strong> wordt berek<strong>en</strong>d


als de Lev<strong>en</strong>shtein-afstand. De afstand tuss<strong>en</strong> twee dialect<strong>en</strong> wordt echter niet berek<strong>en</strong>d op basis<br />

van één <strong>en</strong>kel woordpaar, maar op basis van e<strong>en</strong> reeks woordpar<strong>en</strong>, in ons geval 125 woordpar<strong>en</strong><br />

(zie paragraaf 3.1). We illustrer<strong>en</strong> dit aan de hand van e<strong>en</strong> voorbeeld. In dat voorbeeld berek<strong>en</strong><strong>en</strong><br />

we de afstand tuss<strong>en</strong> Grouw <strong>en</strong> Haarlem op basis van zes woord<strong>en</strong>. De berek<strong>en</strong>ing lat<strong>en</strong> we zi<strong>en</strong> in<br />

Tabel 4. 21<br />

item Grouw Haarlem Lev<strong>en</strong>shtein-afstand<br />

drink<strong>en</strong> ������ ������ 0<br />

geroep<strong>en</strong> ���� ������ 4<br />

ladder ������ ����� 2<br />

melk ����� ����� 3<br />

schip ���� ���� 1<br />

werk ���� ����� 2<br />

Tabel 4. Berek<strong>en</strong>ing van de geaggregeerde Lev<strong>en</strong>shtein-afstand tuss<strong>en</strong> het Fries van Grouw <strong>en</strong> het<br />

dialect van Haarlem op basis van zes woordpar<strong>en</strong>.<br />

De laatste kolom geeft Lev<strong>en</strong>shtein-afstand<strong>en</strong>. Deze Lev<strong>en</strong>shtein-afstand<strong>en</strong> aggreger<strong>en</strong> we. De<br />

afstand tuss<strong>en</strong> Grouw <strong>en</strong> Haarlem wordt nu gelijk aan 12 Lev<strong>en</strong>shtein-operaties. Op deze manier<br />

met<strong>en</strong> we afstand<strong>en</strong> tuss<strong>en</strong> alle plaats-par<strong>en</strong>.<br />

In paragraaf 3.3 liet<strong>en</strong> we zi<strong>en</strong> dat met RuG/L04 geaggregeerde isoglos<strong>en</strong>afstand<strong>en</strong> gemet<strong>en</strong><br />

kunn<strong>en</strong> word<strong>en</strong>. Het GIS-pakket biedt daarnaast de mogelijkheid om geaggregeerde Lev<strong>en</strong>sheinafstand<strong>en</strong><br />

te met<strong>en</strong>. Ook deze afstand<strong>en</strong> kunn<strong>en</strong> e<strong>en</strong>voudig op e<strong>en</strong> kaart word<strong>en</strong> weergegev<strong>en</strong>. De<br />

kaart is te vind<strong>en</strong> in Figuur 4a. Hoe donkerder de lijn<strong>en</strong>, hoe kleiner de afstand<strong>en</strong> zijn. Net als in<br />

paragraaf 3 zijn alle<strong>en</strong> afstand<strong>en</strong> tuss<strong>en</strong> plaats<strong>en</strong> weergegev<strong>en</strong> die niet verder uit elkaar ligg<strong>en</strong> dan<br />

100 km.<br />

Vergelijk<strong>en</strong> we nu de kaart met de geaggregeerde isogloss<strong>en</strong>afstand<strong>en</strong> (Figuur 3a) met de kaart<br />

waarin de Lev<strong>en</strong>shtein-afstand<strong>en</strong> zijn weergev<strong>en</strong> (Figuur 4a), dan zi<strong>en</strong> we belangrijke verschill<strong>en</strong>.<br />

In beide kaart<strong>en</strong> zi<strong>en</strong> we bijvoorbeeld in het noordoost<strong>en</strong> twee groep<strong>en</strong>, maar in Figuur 3a strekt de<br />

noordelijke groep zich verder langs de Nederlandse/Duitse gr<strong>en</strong>s zuidwaarts uit. Verder zi<strong>en</strong> we in<br />

Figuur 3a e<strong>en</strong> scherpe gr<strong>en</strong>s tuss<strong>en</strong> <strong>en</strong>erzijds de Hollandse dialect<strong>en</strong> (Noord- <strong>en</strong> Zuid-Holland <strong>en</strong><br />

Utrecht) <strong>en</strong> anderzijds de Brabantse (Noord-Brabant, Antwerp<strong>en</strong>, Vlaams-Brabant) <strong>en</strong> Oost-<br />

Vlaamse dialect<strong>en</strong>. In Figuur 3b vind<strong>en</strong> we deze gr<strong>en</strong>s zó niet terug. Duidelijk komt dus uit de verf<br />

dat de isogloss<strong>en</strong>meting<strong>en</strong> tot e<strong>en</strong> ander beeld leid<strong>en</strong> dat de Lev<strong>en</strong>shtein-afstandsmeting<strong>en</strong>.<br />

5. De classificatie van de variëteit<strong>en</strong><br />

5.1 Clusteranalyse<br />

In de paragraf<strong>en</strong> 3 <strong>en</strong> 4 besprak<strong>en</strong> we hoe we afstand<strong>en</strong> kunn<strong>en</strong> met<strong>en</strong> tuss<strong>en</strong> variëteit<strong>en</strong>. Omdat we<br />

360 dialect<strong>en</strong> hebb<strong>en</strong> (zie paragraaf 2), met<strong>en</strong> we in totaal (360 × 359) / 2 = 64620 afstand<strong>en</strong>! Op<br />

basis van deze afstand<strong>en</strong> kunn<strong>en</strong> we tot e<strong>en</strong> indeling in groep<strong>en</strong> kom<strong>en</strong> door gebruik te mak<strong>en</strong> van<br />

clusteranalyse. De groep<strong>en</strong> het<strong>en</strong> clusters. Clusters kunn<strong>en</strong> bestaan uit subclusters, subclusters uit<br />

subsubclusters, <strong>en</strong>z. Het resultaat is e<strong>en</strong> hiërarchisch gestructureerde boom, waarbij de blader<strong>en</strong> de<br />

dialect<strong>en</strong> zijn. 22 Zo’n boom noem<strong>en</strong> we e<strong>en</strong> d<strong>en</strong>drogram. De takk<strong>en</strong> in het d<strong>en</strong>drogram<br />

repres<strong>en</strong>ter<strong>en</strong> de afstand<strong>en</strong> tuss<strong>en</strong> dialect<strong>en</strong> <strong>en</strong> clusters. De afstand<strong>en</strong> tuss<strong>en</strong> de dialect<strong>en</strong> (de<br />

blader<strong>en</strong>) zoals gesuggereerd door het d<strong>en</strong>drogram, word<strong>en</strong> cof<strong>en</strong>etische afstand<strong>en</strong> g<strong>en</strong>oemd.<br />

12


Er bestaan verschill<strong>en</strong>de clustermethod<strong>en</strong>. In RuG/L04 kunn<strong>en</strong> we kiez<strong>en</strong> uit maar liefst zev<strong>en</strong><br />

verschill<strong>en</strong>de method<strong>en</strong>. Wij gebruikt<strong>en</strong> UPGMA (Unweighted Pair Group Method using<br />

Arithmetic Averages). Het bleek dat de cof<strong>en</strong>etische afstand<strong>en</strong> in de boom die met déze methode<br />

gemaakt werd, de originele afstand<strong>en</strong> – dus de afstand<strong>en</strong> tuss<strong>en</strong> de 360 dialect<strong>en</strong> op basis waarvan<br />

de clusteranalyse werd uitgevoerd – het meest nauwkeurig weerspiegel<strong>en</strong>. 23


a. Isogloss<strong>en</strong>afstand<strong>en</strong>. a. Lev<strong>en</strong>shtein-afstand<strong>en</strong>.<br />

b. De neg<strong>en</strong> natuurlijke groep<strong>en</strong> op basis van<br />

isogloss<strong>en</strong>afstand<strong>en</strong>.<br />

c. Dialectcontinuüm op basis van<br />

isogloss<strong>en</strong>afstand<strong>en</strong>.<br />

Figuur 3. De afstand<strong>en</strong> tuss<strong>en</strong> variëteit<strong>en</strong> zijn<br />

gemet<strong>en</strong> als het aantal isogloss<strong>en</strong> waarin de<br />

variëteit<strong>en</strong> overe<strong>en</strong>kom<strong>en</strong> (a.). Op basis van<br />

deze afstand<strong>en</strong> is clusteranalyse (b.) <strong>en</strong><br />

multidim<strong>en</strong>sionale schaling (c.) uitgevoerd.<br />

b. De elf natuurlijke groep<strong>en</strong> op basis van<br />

Lev<strong>en</strong>shtein-afstand<strong>en</strong>.<br />

c. Dialectcontinuüm op basis van Lev<strong>en</strong>shteinafstand<strong>en</strong>.<br />

Figuur 4. De Lev<strong>en</strong>shtein-afstand<strong>en</strong> tuss<strong>en</strong> de<br />

variëteit<strong>en</strong> (a.). Ook op basis van deze afstand<strong>en</strong><br />

is clusteranalyse (b.) <strong>en</strong> multidim<strong>en</strong>sionale<br />

schaling (c.) uitgevoerd. De verschill<strong>en</strong> met de<br />

kaart<strong>en</strong> in Figuur 3 zijn evid<strong>en</strong>t.


D<strong>en</strong>drogramm<strong>en</strong> zijn binaire bom<strong>en</strong>. Binn<strong>en</strong> e<strong>en</strong> d<strong>en</strong>drogram kunn<strong>en</strong> verschill<strong>en</strong>de niveaus van<br />

gedetailleerdheid word<strong>en</strong> onderscheid<strong>en</strong>. Beperk<strong>en</strong> we ons tot de wortel, dan krijg<strong>en</strong> we e<strong>en</strong><br />

verdeling in twee groep<strong>en</strong>. Gaan we echter iets dieper in de boom, dan blijkt e<strong>en</strong> van de twee<br />

groep<strong>en</strong> op zijn beurt ook weer uit twee groep<strong>en</strong> te bestaan. Op dat diept<strong>en</strong>iveau vind<strong>en</strong> we dus e<strong>en</strong><br />

verdeling in drie groep<strong>en</strong>. Helemaal onderin de boom vind<strong>en</strong> we de blader<strong>en</strong>. Hier vind<strong>en</strong> we e<strong>en</strong><br />

verdeling met het grootste aantal groep<strong>en</strong>, in ons geval 360 groep<strong>en</strong> met elk één variëteit. In de<br />

boom hebb<strong>en</strong> we dus 359 niveaus, van 2 groep<strong>en</strong> t/m 360 groep<strong>en</strong>. Voor elk niveau berek<strong>en</strong><strong>en</strong> we<br />

nu de variantie in de oorspronkelijke afstand<strong>en</strong> die door de cof<strong>en</strong>etische afstand<strong>en</strong> van de<br />

boomstructuur tot op dat niveau verklaard wordt. De variantiewaard<strong>en</strong> word<strong>en</strong> vervolg<strong>en</strong>s in e<strong>en</strong><br />

grafiek uitgezet teg<strong>en</strong> het aantal groep<strong>en</strong> dat door elk van de 359 niveaus onderscheid<strong>en</strong> wordt. In<br />

zo'n grafiek zi<strong>en</strong> we meestal eerst e<strong>en</strong> snelle stijging van de variantie, gevolgd door e<strong>en</strong> knikpunt –<br />

de elleboog – <strong>en</strong> daarna stijgt de grafiek niet of nauwelijks meer.<br />

In figuur 5 vind<strong>en</strong> we e<strong>en</strong> elleboogcurve op basis van zowel de isogloss<strong>en</strong>afstand<strong>en</strong> als de<br />

Lev<strong>en</strong>shtein-afstand<strong>en</strong>. In de elleboogcurve op basis van de isogloss<strong>en</strong>afstand<strong>en</strong> vind<strong>en</strong> we e<strong>en</strong><br />

knikpunt – de elleboog - bij neg<strong>en</strong> groep<strong>en</strong>. Na 9 groep<strong>en</strong> stijgt de curve niet zo sterk meer. We<br />

concluder<strong>en</strong> dat er 9 natuurlijke groep<strong>en</strong> zijn. De groep<strong>en</strong> zijn weergegev<strong>en</strong> in Figuur 3b. De<br />

cof<strong>en</strong>etische afstand<strong>en</strong> in het d<strong>en</strong>drogram tot het niveau van 9 groep<strong>en</strong> verklar<strong>en</strong> 57% van de<br />

variantie in de oorspronkelijke isogloss<strong>en</strong>afstand<strong>en</strong>.<br />

Wanneer we kijk<strong>en</strong> naar de elleboogcurve op basis van Lev<strong>en</strong>shtein-afstand<strong>en</strong>, dan vind<strong>en</strong> we het<br />

knikpunt bij 11 groep<strong>en</strong>. Na 11 groep<strong>en</strong> is er ge<strong>en</strong> sterke stijging meer. Op basis van de<br />

Lev<strong>en</strong>shtein-afstand<strong>en</strong> kunn<strong>en</strong> we dus 11 natuurlijke groep<strong>en</strong> onderscheid<strong>en</strong>. Op de kaart in Figuur<br />

4b word<strong>en</strong> de 11 groep<strong>en</strong> weergegev<strong>en</strong>. De cof<strong>en</strong>etische afstand<strong>en</strong> in het d<strong>en</strong>drogram tot het niveau<br />

van 11 groep<strong>en</strong> verklar<strong>en</strong> 59% van de variantie in de oorspronkelijke gemiddelde Lev<strong>en</strong>shteinafstand<strong>en</strong>.<br />

Figuur 5. Links de elleboogcurve op basis van de isogloss<strong>en</strong>afstand<strong>en</strong>. Na 9 groep<strong>en</strong> stijgt er<br />

grafiek niet zo sterk meer. Rechts de elleboogcurve op basis van Lev<strong>en</strong>shtein-afstand<strong>en</strong>. Na 11<br />

groep<strong>en</strong> is er ge<strong>en</strong> sterke stijging meer.<br />

E<strong>en</strong> andere manier om te bepal<strong>en</strong> wat de belangrijke clusters zijn, is te lett<strong>en</strong> op stabiliteit van<br />

clusters. De stabiliteit van clusters kan bepaald word<strong>en</strong> door middel van clusteranalyse met ruis of<br />

door middel van bootstrapclusteranalyse. Bij clusteranalyse met ruis word<strong>en</strong> de afstand<strong>en</strong> tuss<strong>en</strong> de<br />

variëteit<strong>en</strong> met e<strong>en</strong> willekeurige waarde verhoogd. Deze waarde ligt tuss<strong>en</strong> 0 <strong>en</strong> max, waarbij max<br />

gewoonlijk e<strong>en</strong> halve standaarddeviatie is. De individuele ruiswaard<strong>en</strong> zijn uniform verdeeld tuss<strong>en</strong><br />

0 <strong>en</strong> max. Op basis van deze nieuwe afstand<strong>en</strong> word<strong>en</strong> de variëteit<strong>en</strong> geclusterd. Herhal<strong>en</strong> we dit


ijvoorbeeld honderd keer, dan krijg<strong>en</strong> we honderd d<strong>en</strong>drogramm<strong>en</strong>. Hoe vaker nu e<strong>en</strong> cluster in de<br />

honderd d<strong>en</strong>drogramm<strong>en</strong> voorkomt, hoe stabieler dat cluster is. 24<br />

In ons onderzoek gebruik<strong>en</strong> we 125 woord<strong>en</strong> per variëteit, zodat twee variëteit<strong>en</strong> vergelek<strong>en</strong><br />

word<strong>en</strong> op basis van 125 woordpar<strong>en</strong>. Bij gebruik van bootstrapclusteranalyse word<strong>en</strong> aselect 125<br />

woord<strong>en</strong> gekoz<strong>en</strong>, waarbij hetzelfde woord meerdere ker<strong>en</strong> gekoz<strong>en</strong> kan word<strong>en</strong> <strong>en</strong> andere woord<strong>en</strong><br />

niet gekoz<strong>en</strong> word<strong>en</strong>. Op basis van deze nieuwe selectie van woord<strong>en</strong> word<strong>en</strong> afstand<strong>en</strong> gemet<strong>en</strong> <strong>en</strong><br />

clusteranalyse uitgevoerd. Ook dit herhal<strong>en</strong> we bijvoorbeeld honderd keer, zodat we honderd<br />

d<strong>en</strong>drogramm<strong>en</strong> krijg<strong>en</strong>. Clusters die in (bijna) alle d<strong>en</strong>drogramm<strong>en</strong> terugker<strong>en</strong>, zijn stabiele<br />

clusters. Nerbonne, Kleiweg, Heeringa & Manni hebb<strong>en</strong> in 2008 aangetoond dat het effect van<br />

bootstrapclusteranalyse hetzelfde is als van clusteranalyse met ruis. 25<br />

In RuG/L04 lat<strong>en</strong> de resultat<strong>en</strong> van clusteranalyse zich gemakkelijk omzett<strong>en</strong> naar cartografische<br />

weergave's. Figuur 3b laat de clusterindeling op basis van geaggregeerde isoglos<strong>en</strong>afstand<strong>en</strong> zi<strong>en</strong>,<br />

<strong>en</strong> Figuur 4b toont de indeling op basis van de geaggregeerde Lev<strong>en</strong>sthein-afstand<strong>en</strong>. Vergelijk<strong>en</strong><br />

we nu beide figur<strong>en</strong>, dan vind<strong>en</strong> we belangrijke verschill<strong>en</strong>. Net als bij de vergelijking van Figuur<br />

3a met Figuur 4a in paragraaf 4.4 vind<strong>en</strong> we ook hier e<strong>en</strong> verschil met betrekking tot het verloop<br />

van de gr<strong>en</strong>s die de twee groep<strong>en</strong> in het noordoost<strong>en</strong> van elkaar scheidt. Verder zijn het Oost-<br />

Vlaams <strong>en</strong> het Antwerps/Vlaams-Brabants in Figuur 4b in Figuur 4a niet meer als apart<strong>en</strong> groep<strong>en</strong><br />

onderscheid<strong>en</strong>. Anderzijds vind<strong>en</strong> in in Figuur 4a het Westfries (in de kop van Noord-Holland) als<br />

aparte groep, wat in Figuur 4b niet het geval is.<br />

5.2 Multidim<strong>en</strong>sionale schaling<br />

Met multidim<strong>en</strong>sionale schaling (MDS) kunn<strong>en</strong> de variëteit<strong>en</strong> word<strong>en</strong> geplaatst in e<strong>en</strong><br />

driedim<strong>en</strong>sionele ruimte. 26 Hoe meer twee variëteit<strong>en</strong> op elkaar lijk<strong>en</strong>, hoe dichter ze bij elkaar<br />

word<strong>en</strong> geplaatst. De coördinat<strong>en</strong> in de driedim<strong>en</strong>sionele ruimte kunn<strong>en</strong> word<strong>en</strong> vertaald naar<br />

kleur<strong>en</strong>, bijvoorbeeld de x-coördinaat bepaalt de int<strong>en</strong>siteit van rood, de y-coördinaat de int<strong>en</strong>siteit<br />

van gro<strong>en</strong> <strong>en</strong> de z-coördinaat de int<strong>en</strong>siteit van blauw. Zo krijgt iedere variëteit z’n eig<strong>en</strong> unieke<br />

kleur. Variëteit<strong>en</strong> die veel op elkaar lijk<strong>en</strong>, krijg<strong>en</strong> bijna dezelfde kleur, maar variëteit<strong>en</strong> die heel<br />

verschill<strong>en</strong>d zijn, krijg<strong>en</strong> ook heel verschill<strong>en</strong>de, sterk t<strong>en</strong> opzichte van elkaar contraster<strong>en</strong>de<br />

kleur<strong>en</strong>.<br />

Zowel op basis van de isogloss<strong>en</strong>afstand<strong>en</strong> als op basis van de Lev<strong>en</strong>shtein-afstand<strong>en</strong> hebb<strong>en</strong> we<br />

e<strong>en</strong> driedim<strong>en</strong>sionele MDS toegepast. MDS is standaard opg<strong>en</strong>om<strong>en</strong> in RuG/L04. Op basis van e<strong>en</strong><br />

MDS-analyse biedt RuG/L04 de mogelijkheid om kleur<strong>en</strong>kaart<strong>en</strong> te mak<strong>en</strong> met gebruikmaking van<br />

de techniek die we zojuist beschrev<strong>en</strong>. Ieder dialectpunt krijgt z'n eig<strong>en</strong> unieke kleur, <strong>en</strong> de ruimtes<br />

tuss<strong>en</strong> dialectpunt<strong>en</strong> word<strong>en</strong> ingekleurd door te interpoler<strong>en</strong> vanuit de dialectpunt<strong>en</strong>. Halverwege<br />

e<strong>en</strong> rood <strong>en</strong> e<strong>en</strong> geel dialectpunt zal de kaart dus oranje zijn.<br />

De kleur<strong>en</strong>kaart<strong>en</strong> op basis van de MDS-uitvoer zijn te vind<strong>en</strong> in respectievelijk Figuur 3c <strong>en</strong><br />

Figuur 4c. Omdat we het aantal dim<strong>en</strong>sies in de data (d.w.z. de afstand<strong>en</strong> tuss<strong>en</strong> de variëteit<strong>en</strong>) met<br />

de MDS-techniek reducer<strong>en</strong> tot drie, is het waarschijnlijk dat bepaalde details verlor<strong>en</strong> gaan. Om<br />

e<strong>en</strong> idee te krijg<strong>en</strong> van de mate waarin dat het geval is, berek<strong>en</strong><strong>en</strong> we hoeveel variantie in de<br />

oorspronkelijke afstand<strong>en</strong> verklaard wordt door de drie MDS-dim<strong>en</strong>sies. Voor de<br />

isogloss<strong>en</strong>afstand<strong>en</strong> blijkt dit 85% te zijn <strong>en</strong> voor de gemiddelde Lev<strong>en</strong>shtein-afstand<strong>en</strong> is dit 90%.<br />

Clusteranalyse <strong>en</strong> MDS zijn twee verschill<strong>en</strong>de techniek<strong>en</strong> die elkaar goed aanvull<strong>en</strong>. Vergelijk<strong>en</strong><br />

we de clusteranalysekaart<strong>en</strong> (Figur<strong>en</strong> 3b <strong>en</strong> 4b) met de MDS-kaart<strong>en</strong> (Figur<strong>en</strong> 3c <strong>en</strong> 4c), dan zi<strong>en</strong><br />

we dat de clusteranalysekaart<strong>en</strong> e<strong>en</strong> helderder beeld gev<strong>en</strong>: er is e<strong>en</strong> duidelijke verdeling in<br />

gebied<strong>en</strong>. De MDS-kaart<strong>en</strong> daar<strong>en</strong>teg<strong>en</strong> do<strong>en</strong> meer recht aan het feit dat e<strong>en</strong> dialectlandschap e<strong>en</strong>


continuüm vormt, met meer of minder geleidelijke overgang<strong>en</strong>. Daar waar MDS-kaart<strong>en</strong> e<strong>en</strong> vrij<br />

abrupte overgang lat<strong>en</strong> zi<strong>en</strong>, zal in de clusteranalysekaart<strong>en</strong> e<strong>en</strong> gr<strong>en</strong>s tuss<strong>en</strong> twee gebied<strong>en</strong><br />

gevond<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong>.<br />

6. De repres<strong>en</strong>tativiteit van isogloss<strong>en</strong><br />

In de inleiding steld<strong>en</strong> we de vraag inhoeverre e<strong>en</strong> indeling op basis van islogloss<strong>en</strong> zou verschill<strong>en</strong><br />

van e<strong>en</strong> indeling op basis van de aggregaat van e<strong>en</strong> steekproef van heel veel taalkundige<br />

verschijnsel<strong>en</strong>. In paragraaf 3 introduceerd<strong>en</strong> we neg<strong>en</strong> isogloss<strong>en</strong>, <strong>en</strong> mat<strong>en</strong> afstand<strong>en</strong> tuss<strong>en</strong><br />

variëtiet<strong>en</strong> op basis van deze isogloss<strong>en</strong>. In paragraaf 4 berek<strong>en</strong>d<strong>en</strong> we geaggregeerde Lev<strong>en</strong>shteinafstand<strong>en</strong>.<br />

Daarmee word<strong>en</strong> e<strong>en</strong> heel groot aantal taalkundige verschijnsel<strong>en</strong> voor wat betreft de<br />

uitspraak van woord<strong>en</strong>, verdisconteerd, niet alle<strong>en</strong> verschijnsel<strong>en</strong> die e<strong>en</strong> tamelijk heldere verdeling<br />

in gebied<strong>en</strong> gev<strong>en</strong> (zoals de neg<strong>en</strong> isogloss<strong>en</strong> do<strong>en</strong>), maar ook verschijnsel<strong>en</strong> die e<strong>en</strong> bijzonder<br />

grillig verloop hebb<strong>en</strong>. Nem<strong>en</strong> we het aggregaat van al deze verschijnsel<strong>en</strong>, dan ontstaat e<strong>en</strong> helder<br />

beeld (zie de kaart<strong>en</strong> in de Figur<strong>en</strong> 4b <strong>en</strong> 4c).<br />

In paragraaf 5 vond<strong>en</strong> we dat de indeling op basis van isogloss<strong>en</strong> <strong>en</strong> de indeling op basis van<br />

Lev<strong>en</strong>sheinafstand<strong>en</strong> wez<strong>en</strong>lijk van elkaar verschill<strong>en</strong>. In deze paragraaf will<strong>en</strong> we nog e<strong>en</strong> stap<br />

verder gaan door elk van de neg<strong>en</strong> islogloss<strong>en</strong> afzonderlijk te vergelijk<strong>en</strong> t<strong>en</strong> opzichte van de<br />

geaggregeerde Lev<strong>en</strong>stheinafstand<strong>en</strong>. Op die manier kunn<strong>en</strong> we voor elk van de isogloss<strong>en</strong> bepal<strong>en</strong><br />

hoe repres<strong>en</strong>tatief ze zijn. In de traditionele dialectologie word<strong>en</strong> het al of niet uitsprek<strong>en</strong> van de<br />

“slot-n” (isoglosse a) in paragraaf 3) <strong>en</strong> de uitspraak van de g (isoglosse g) in paragraaf 3) als de<br />

belangrijkste isogloss<strong>en</strong> gezi<strong>en</strong>.<br />

Om nu de repres<strong>en</strong>tativiteit te bepal<strong>en</strong> van de isogloss<strong>en</strong>, berek<strong>en</strong> we afstand<strong>en</strong> tuss<strong>en</strong> de variëteit<strong>en</strong><br />

op basis van elk van elk van de neg<strong>en</strong> isogloss<strong>en</strong> afzonderlijk. Tuss<strong>en</strong> variëteit<strong>en</strong> die gescheid<strong>en</strong><br />

word<strong>en</strong> door de betreff<strong>en</strong>de isogloss<strong>en</strong> is de afstand 1, maar word<strong>en</strong> ze niet gescheid<strong>en</strong> door die<br />

isoglosse, dan is de afstand 0. We krijg<strong>en</strong> nu neg<strong>en</strong> afstandstabell<strong>en</strong>. Daaraan voeg<strong>en</strong> we nog e<strong>en</strong><br />

ti<strong>en</strong>de toe, namelijk de tabel met meting<strong>en</strong> op basis van alle neg<strong>en</strong> isogloss<strong>en</strong> sam<strong>en</strong> (zie het laatste<br />

deel van paragraaf 3). We correler<strong>en</strong> de meting<strong>en</strong> in de tabell<strong>en</strong> nu met de geaggregeerde<br />

Lev<strong>en</strong>shtein-afstand<strong>en</strong>. Wanneer we de correlaties kwadrater<strong>en</strong> <strong>en</strong> verm<strong>en</strong>igvuldig<strong>en</strong> met 100,<br />

krijg<strong>en</strong> we de variantieperc<strong>en</strong>tages. We zi<strong>en</strong> nu hoeveel variantie in de Lev<strong>en</strong>shtein-afstand<strong>en</strong> door<br />

elk van de isogloss<strong>en</strong> <strong>en</strong> de combinatie van de neg<strong>en</strong> isogloss<strong>en</strong> verklaard wordt. De resultat<strong>en</strong><br />

word<strong>en</strong> gegev<strong>en</strong> in Tabel 5. Voor iedere isoglosse wordt ook het aantal dialect<strong>en</strong> gegev<strong>en</strong> waarvoor<br />

de waarde van de isoglosse bek<strong>en</strong>d is.<br />

isoglosse verklaarde aantal<br />

variantie dialect<strong>en</strong><br />

a) bakke vs. bakk(e)n 11% 360<br />

b) droog vs. drooge 6% 354<br />

c) geweest vs. eweest vs. weest 20% 360<br />

d) rijp vs. riep 8% 360<br />

e) huis vs. huus vs. hoes 10% 358<br />

f) goed vs. goud/good 6% 360<br />

g) jij vs. gij vs. ie 26% 271<br />

h) school vs. skool vs. sjool 6% 356<br />

i) ik vs. ich vs. isj 7% 360<br />

alle neg<strong>en</strong> isogloss<strong>en</strong> sam<strong>en</strong> 44% 360<br />

Tabel 5. Repres<strong>en</strong>tativiteit van de isogloss<strong>en</strong> in Figuur 2 in de geaggregeerde Lev<strong>en</strong>shteinafstand<strong>en</strong>.<br />

Voor ieder isoglosse wordt het aantal dialect<strong>en</strong> gegev<strong>en</strong> waarvoor de waarde van de<br />

isoglosse bek<strong>en</strong>d is. In de onderste rij wordt de repres<strong>en</strong>tativiteit gegev<strong>en</strong> van de


isogloss<strong>en</strong>afstand<strong>en</strong> die we gemet<strong>en</strong> hebb<strong>en</strong> in paragraaf 3.<br />

De isogloss<strong>en</strong> g) <strong>en</strong> a) blijk<strong>en</strong> qua repres<strong>en</strong>tativiteit respectievelijk de eerste <strong>en</strong> derde plaats in te<br />

nem<strong>en</strong>. Beide isogloss<strong>en</strong> word<strong>en</strong> dus terecht als hoofdk<strong>en</strong>merk<strong>en</strong> gezi<strong>en</strong>. Isoglosse c) neemt de<br />

tweede plaats in. Het valt dus goed te verdedig<strong>en</strong> om ook deze isoglosse onder de hoofdk<strong>en</strong>merk<strong>en</strong><br />

te rangschikk<strong>en</strong>.<br />

7. Conclusie<br />

In deze bijdrage hebb<strong>en</strong> we neg<strong>en</strong> isogloss<strong>en</strong>kaart<strong>en</strong> bekek<strong>en</strong> <strong>en</strong> geaggregeerde isoglos<strong>en</strong>afstand<strong>en</strong><br />

tuss<strong>en</strong> 360 taal- <strong>en</strong> dialectvariëteit<strong>en</strong> berek<strong>en</strong>d. We hebb<strong>en</strong> ook Lev<strong>en</strong>shtein-afstand<strong>en</strong> berek<strong>en</strong>d.<br />

De Lev<strong>en</strong>shtein-afstand is e<strong>en</strong> e<strong>en</strong>voudige techniek waarbij keuze van isogloss<strong>en</strong> vooraf niet nodig<br />

is, maar alle informatie die in de transcripties van woorduitsprak<strong>en</strong> – in ons geval 125 transcripties<br />

voor elk van 360 variëteit<strong>en</strong> – vervat is, wordt volledig verwerkt. E<strong>en</strong> ontrafeling van het materiaal<br />

in honder<strong>en</strong> aparte isogloss<strong>en</strong> – wat zeer tijdsint<strong>en</strong>sief is – is dankzij deze techniek niet nodig.<br />

De isogloss<strong>en</strong> vorm<strong>en</strong> e<strong>en</strong> beperkte <strong>en</strong> subjectief gekoz<strong>en</strong> gegev<strong>en</strong>sverzameling. Met de<br />

Lev<strong>en</strong>shtein-afstand wordt echter e<strong>en</strong> grote hoeveelheid aselect gekoz<strong>en</strong> materiaal verwerkt, wat<br />

leidt tot objectieve resultat<strong>en</strong>. We vond<strong>en</strong> dat de neg<strong>en</strong> isogloss<strong>en</strong> – als het ware e<strong>en</strong> kleine<br />

aggregaatje - sam<strong>en</strong> 44% van de Lev<strong>en</strong>shtein-afstand<strong>en</strong> – het grote aggregaat - verklar<strong>en</strong>. De<br />

isogloss<strong>en</strong>afstand<strong>en</strong> sugger<strong>en</strong> dan ook e<strong>en</strong> andere gebiedsindeling dan de Lev<strong>en</strong>shteinafstand<strong>en</strong>.<br />

We zi<strong>en</strong> dit als we de kaart<strong>en</strong> in Figuur 3 vergelijk<strong>en</strong> met de kaart<strong>en</strong> in Figuur 4. Onze conclusie is<br />

dat het niet g<strong>en</strong>oeg is om e<strong>en</strong> gebiedsindeling te baser<strong>en</strong> op e<strong>en</strong> klein aantal selectief gekoz<strong>en</strong><br />

isogloss<strong>en</strong>. Om e<strong>en</strong> objectief beeld te krijg<strong>en</strong> zal de dialectoloog zich moet<strong>en</strong> baser<strong>en</strong> op e<strong>en</strong> grote<br />

hoeveelheid aselect gekoz<strong>en</strong> materiaal. Met de Lev<strong>en</strong>shein-afstand kan dit materiaal snel <strong>en</strong><br />

efficiënt word<strong>en</strong> verwerkt.<br />

De kaart<strong>en</strong> in de Figur<strong>en</strong> 4b <strong>en</strong> 4c vorm<strong>en</strong> e<strong>en</strong> belangrijk resultaat in deze bijdrage. In paragraaf 2<br />

beschrev<strong>en</strong> we de data waarop onze meting<strong>en</strong> zijn gebaseerd: de RND. Aan de RND hebb<strong>en</strong> 16<br />

veldwerkers meegewerkt, waardoor sommige dialectgr<strong>en</strong>z<strong>en</strong> die gevond<strong>en</strong> word<strong>en</strong>, in feite<br />

veldwerkersgr<strong>en</strong>z<strong>en</strong> zijn. 27 Aan de andere kant is het omgekeerde ook mogelijk: veldwerkers mak<strong>en</strong><br />

opnam<strong>en</strong> in juist die gebied<strong>en</strong> waarvan ze de dialect<strong>en</strong> goed k<strong>en</strong>n<strong>en</strong>. Het is dus goed mogelijk dat<br />

dialectgr<strong>en</strong>z<strong>en</strong> <strong>en</strong> veldwerkersgr<strong>en</strong>z<strong>en</strong> sam<strong>en</strong>vall<strong>en</strong>. Om echter alle onzekerheid uit te sluit<strong>en</strong>, zou<br />

het mooi zijn om kaart<strong>en</strong> te mak<strong>en</strong> die gebaseerd zijn op materiaal dat door slechts één veldwerker<br />

verzameld is. Maar dergelijk materiaal is voor e<strong>en</strong> voldo<strong>en</strong>de dicht net van plaats<strong>en</strong> in het<br />

Nederlandse dialectgebied (nog) niet beschikbaar. Beide kaart<strong>en</strong> vorm<strong>en</strong> voor dit mom<strong>en</strong>t dus het<br />

maximaal haalbare wanneer het gaat om de classificatie van variëteit<strong>en</strong> op basis van<br />

uitspraakverschill<strong>en</strong>.<br />

Vervolg<strong>en</strong>s zijn we nog e<strong>en</strong> stap verder gegaan <strong>en</strong> hebb<strong>en</strong> we de repres<strong>en</strong>tativiteit van de elk van de<br />

neg<strong>en</strong> isogloss<strong>en</strong> afzonderlijk t<strong>en</strong> opzichte van de grote aggregaat bepaald. De slot-n <strong>en</strong> de jij/gij/ieonderscheiding<br />

zijn inderdaad relatief belangrijke isogloss<strong>en</strong> zoals in de traditionele dialectologie<br />

gesuggereerd wordt, maar de uitspraak (of weglating) van de prefix in bijvoorbeeld geweest lijkt<br />

belangrijker te zijn dan het wel of niet uitsprek<strong>en</strong> van de slot-n.<br />

De meting<strong>en</strong>, analyses <strong>en</strong> cartografische weergave van geaggregeerde afstand<strong>en</strong> bleek met het GISpakket<br />

RuG/L04 op e<strong>en</strong> adequate manier mogelijk. Veel GIS-pakkett<strong>en</strong> bied<strong>en</strong> alle<strong>en</strong> monadische<br />

functies. Elk punt heeft eig<strong>en</strong>schapp<strong>en</strong>, <strong>en</strong> die word<strong>en</strong> geanalyseerd <strong>en</strong> gevisualiseerd. RuG/L04<br />

biedt de mogelijkheid om relaties tuss<strong>en</strong> de punt<strong>en</strong>, namelijk geaggregeerde taalkundige afstand<strong>en</strong>,<br />

te berek<strong>en</strong><strong>en</strong>, te analyser<strong>en</strong> <strong>en</strong> te visualiser<strong>en</strong>. Dit GIS-pakket bleek e<strong>en</strong> onmisbaar instrum<strong>en</strong>t te<br />

zijn bij de beantwoording van de vraag inhoeverre dialectindeling<strong>en</strong> op basis van één of meer


isogloss<strong>en</strong> e<strong>en</strong> repres<strong>en</strong>tatief beeld gev<strong>en</strong>.


1 J. Nerbonne, ‘Data-Driv<strong>en</strong> Dialectology’, aang<strong>en</strong>om<strong>en</strong> om te verschijn<strong>en</strong> in: Language and Linguistics Compass.<br />

2 E. Blancquaert <strong>en</strong> W. Pée (eds.), Reeks Nederlands(ch)e dialectatlass<strong>en</strong>. De Sikkel (Antwerp<strong>en</strong> 1925-1982).<br />

3 E. Blancquaert, Na meer dan 25 jaar dialect-onderzoek op het terrein. Nr. 28; Reeks III. Koninklijke Vlaamse academie<br />

voor taal- <strong>en</strong> letterkunde (G<strong>en</strong>t 1948).<br />

4 E<strong>en</strong> uitvoerige bespreking van de keuze van de woord<strong>en</strong> uit de RND kan word<strong>en</strong> gevond<strong>en</strong> in: W. Heeringa, ‘De<br />

selectie <strong>en</strong> digitalisatie van dialect<strong>en</strong> <strong>en</strong> woord<strong>en</strong> uit de Reeks Nederlandse Dialectatlass<strong>en</strong>’, TABU, Bulletin voor<br />

Taalwet<strong>en</strong>schap, 31 (2001), 61-103. De gedigitaliseerde data zijn met toestemming van uitgeverij De Sikkel (later<br />

opgegaan in De Boeck, Antwerp<strong>en</strong>) vrij beschikbaar via: http://www.let.rug.nl/~heeringa/dialectology/atlas/.<br />

5 A. Weijn<strong>en</strong>, De Nederlandse dialect<strong>en</strong>, Noordhoff (Groning<strong>en</strong> 1941).<br />

6 A. Weijn<strong>en</strong>, Nederlandse dialectkunde. Van Gorcum & Comp. N.V. - G.A. Hak & Dr. J. Prakke (Ass<strong>en</strong> 1958).<br />

7 J. Gooss<strong>en</strong>s, ‘Niederländisch<strong>en</strong> Mundart<strong>en</strong> - vom Deutsch<strong>en</strong> aus geseh<strong>en</strong>’, Niederdeutsches Wort, 10 (1970), 61-80. De<br />

kaart is ook te vind<strong>en</strong> in: G. Geerts, Voorlopers <strong>en</strong> variant<strong>en</strong> van het Nederlands; e<strong>en</strong> gedokum<strong>en</strong>teerd dia- <strong>en</strong><br />

synchroon overzicht. Uitgeverij Acco (Leuv<strong>en</strong> 1975). Blz 165.<br />

8 Zie bijvoorbeeld de isogloss<strong>en</strong>kaart achterin: A. Weijn<strong>en</strong>, Nederlandse dialectkunde. Van Gorcum & Comp (Ass<strong>en</strong><br />

1966).<br />

9 J. Daan <strong>en</strong> D. P. Blok, Van randstad tot landrand. Toelichting bij de kaart: dialect<strong>en</strong> <strong>en</strong> naamkunde. Bijdrag<strong>en</strong> <strong>en</strong><br />

mededeling<strong>en</strong> der Dialect<strong>en</strong>commissie van de Koninklijke Nederlandse Akademie van Wet<strong>en</strong>schapp<strong>en</strong> te Amsterdam<br />

37, N.V. Noord-Hollandsche uitgevers maatschappij (Amsterdam 1969).<br />

10 Weijn<strong>en</strong> (1958) <strong>en</strong> ook: Weijn<strong>en</strong> (1966).<br />

11 L. Bloomfield, Language. H<strong>en</strong>ry Holt & Co (New York 1933).<br />

12 J. Chambers <strong>en</strong> P. Trudgill, Dialectology. Cambridge University Press (Cambridge 1998).<br />

13 Zie met name blz. 137-138 in Chambers' <strong>en</strong> Trudgill's Dialectology.<br />

14 B. Kessler, ‘Computational dialectology in Irish Gaelic’, in: Proceedings of the 7 th confer<strong>en</strong>ce of the European chapter<br />

of the association for computational linguistics. EACL (Dublin 1995), 60-67.<br />

15 J. Nerbonne, P. Kleiweg, W. Heeringa <strong>en</strong> F. Manni, ‘Projecting Dialect Differ<strong>en</strong>ces to Geography: Bootstrap Clustering<br />

vs. Noisy Clustering’, in: Christine Preisach, Lars Schmidt-Thieme, Hans Burkhardt <strong>en</strong> Reinhold Decker (eds.), Data<br />

Analysis, Machine Learning, and Applications. Proc. of the 31st Annual Meeting of the German Classification Society.<br />

Springer (Berlin 2008), 647-654. Zie ook: W. Heeringa, W., Measuring dialect pronunciation differ<strong>en</strong>ces using<br />

Lev<strong>en</strong>shtein distance. Proefschrift rijksuniversiteit Groning<strong>en</strong> (Groning<strong>en</strong> 2004).<br />

16 R. Bolognesi <strong>en</strong> W. Heeringa, ‘De invloed van dominante tal<strong>en</strong> op het lexicon <strong>en</strong> de fonologie van Sardische dialect<strong>en</strong>’,<br />

Gramma/TTT; tijdschrift voor taalwet<strong>en</strong>schap, 9 (2002), 45-84.<br />

17 Ch. Goosk<strong>en</strong>s <strong>en</strong> W. Heeringa, ‘Perceptive evaluation of Lev<strong>en</strong>shtein dialect distance measurem<strong>en</strong>ts using Norwegian<br />

dialect data’, Language variation and change, 16 (2004), 189-207.<br />

18 J. Nerbonne <strong>en</strong> C. Siedle, ‘Dialektklassifikation auf der Grundlage aggregierter Ausspracheunterschiede’, Zeitschrift für<br />

Dialektologie und Linguistik, 72 (2005), 129-147.<br />

19 Om het voorbeeld e<strong>en</strong>voudig te houd<strong>en</strong> zijn diacritische tek<strong>en</strong>s hier buit<strong>en</strong> beschouwing gelat<strong>en</strong>, maar word<strong>en</strong> in de<br />

berek<strong>en</strong>ing<strong>en</strong> verderop in deze bijdrage wel verwerkt. In deze inleid<strong>en</strong>de bijdrage voert het te ver daar dieper op in te<br />

gaan, maar we verwijz<strong>en</strong> de lezer naar Heeringa (2004) waarin de mogeljikhed<strong>en</strong> tot verwerking van diacritische tek<strong>en</strong>s<br />

bij gebruik van de Lev<strong>en</strong>shtein-afstand uitvoerig word<strong>en</strong> besprok<strong>en</strong>.<br />

20 Voor details zie hoofdstuk 4 in: Heeringa (2004).<br />

21 Om het voorbeeld e<strong>en</strong>voudig te houd<strong>en</strong> gebruik<strong>en</strong> we hier weer ge<strong>en</strong> graduele klankafstand<strong>en</strong>, maar de ruwere aanpak<br />

waarbij de drie gewicht<strong>en</strong> (toevoeg<strong>en</strong>, vervang<strong>en</strong>, verwijder<strong>en</strong>) altijd de waarde 1 hebb<strong>en</strong>. Ook lat<strong>en</strong> we diacritsche<br />

tek<strong>en</strong>s (bijvoorbeeld l<strong>en</strong>gte) buit<strong>en</strong> beschouwing. E<strong>en</strong> diftong wordt verwerkt als de ope<strong>en</strong>volging van twee<br />

monoftong<strong>en</strong>.<br />

22 A. Jain, <strong>en</strong> R. C. Dubes, Algorithms for clustering data, Pr<strong>en</strong>tice Hall (Englewoord Cliffs, N.J. 1988).<br />

23 Zie blz. 150-153 in: Heeringa (2004).<br />

24 P. Kleiweg, J. Nerbonne <strong>en</strong> L. Bosveld, ‘Geographic Projection of Cluster Composites’, in: Alan Blackwell, Kim<br />

Marriott <strong>en</strong> Atsushi Shimojima (eds.), Diagrammatic Repres<strong>en</strong>tation and Infer<strong>en</strong>ce. Third International Confer<strong>en</strong>ce,<br />

Diagrams 2004. Cambridge, UK, March 2004 / Lecture Notes in Artificial Intellig<strong>en</strong>ce 2980. Springer (Berlin 2004),<br />

392-394.<br />

25 Nerbonne et al. (2008).<br />

26 Zie blz. 156-163 in: Heeringa (2004).<br />

27 Zie hoofdstuk 9 in: Heeringa, (2004).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!