Abstraktit - Oulu
Abstraktit - Oulu
Abstraktit - Oulu
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
51. NIKOLAEV, ALEXANDRE – SUOMEN NOMINAALISEN<br />
TAIVUTUSJÄRJESTELMÄN KVANTITATIIVISTA ANALYYSIA<br />
Joensuun yliopisto / Yleinen kielitiede<br />
Asiasanat:<br />
Miten taivutustyyppien produktiivisuus ilmenee suomen kielen<br />
taivutusjärjestelmässä? Jos katsomme ongelmaa naiivin kielenpuhujan silmin, niin<br />
yksi toteamuksistamme lienee, että toisissa taivutustyypeissä on paljon sanoja kun<br />
taas toisissa vähän. Ehkä myös näkisimme taivutuksen jälkimmäisissä tyypeissä<br />
olevan jollakin tavalla mutkikkaampaa verrattuna edellisiin tyyppeihin. Mieleen<br />
voisi tulla esimerkiksi lasten tekemiä virheitä tyyppiä *käsin pro käden, joissa lapsi<br />
sijoittaa sanan väärään taivutustyyppiin.<br />
Lingvisteinä näemme yllä mainittuja toteamuksia taivutusjärjestelmän<br />
produktiivisuuden indekseinä. Kuinka paljon tällaisia indeksejä on? Onko niiden<br />
välillä vuorovaikutusta ja voiko sitä mitata jollakin tavalla? Esitelmäni tarkoitus on<br />
kuvata produktiivisuuden ilmentymistä eri muuttujien kautta suomen<br />
nominaalisessa taivutusjärjestelmässä sekä esittää jälkimmäisen kvantitatiivista<br />
analyysia.<br />
Tarkastelen esitelmässäni tyypin laajuuden ja käyttöyleisyyden<br />
(lemmataajuuden) suhdetta kunkin taivutustyypin kohdalla soveltamalla näihin<br />
korrelaatiomatriiseja sekä useamman selittäjän regressioanalyysiä. Selittäjinä<br />
käytän mm. lemmataajuutta (mediaani, summa), hapaksien määrää ja tavujen<br />
määrää per sana (keskiarvo). Laskeakseni jälkimmäisen muuttujan jaoin kaikki<br />
lemmat (n. 25 000, ks. alla) tavuihin, minkä jälkeen ryhmittelin lemmat kussakin<br />
taivutustyypissä tavumäärän suhteen. Tilastollisen testin luotettavuutta puoltaa<br />
aineiston määrä: käytän Suomen Kielen Perussanakirjan ja CD-Perussanakirjan<br />
paradigmaklassifikaatiota (49 nominaalista paradigmaa, noin 25 000 lemmaa ja 50<br />
000 yhdyssanaa) sekä Kielipankin (www.csc.fi) suomenkielisiä korpuksia (yli 130<br />
milj. sanetta). Laskin käyttöyleisyyden (lemmataajuuden) jokaiselle lemmalle ja<br />
yhdyssanalle, joten tein siis kaiken kaikkiaan yli 75 000 hakua 130 miljoonan<br />
suuruisesta korpuksesta.<br />
Lähteet:<br />
KIELITIETEEN PÄIVÄT 24.–25.5.2007 74 / 155<br />
OULU