11.05.2014 Views

Abstraktit - Oulu

Abstraktit - Oulu

Abstraktit - Oulu

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

51. NIKOLAEV, ALEXANDRE – SUOMEN NOMINAALISEN<br />

TAIVUTUSJÄRJESTELMÄN KVANTITATIIVISTA ANALYYSIA<br />

Joensuun yliopisto / Yleinen kielitiede<br />

Asiasanat:<br />

Miten taivutustyyppien produktiivisuus ilmenee suomen kielen<br />

taivutusjärjestelmässä? Jos katsomme ongelmaa naiivin kielenpuhujan silmin, niin<br />

yksi toteamuksistamme lienee, että toisissa taivutustyypeissä on paljon sanoja kun<br />

taas toisissa vähän. Ehkä myös näkisimme taivutuksen jälkimmäisissä tyypeissä<br />

olevan jollakin tavalla mutkikkaampaa verrattuna edellisiin tyyppeihin. Mieleen<br />

voisi tulla esimerkiksi lasten tekemiä virheitä tyyppiä *käsin pro käden, joissa lapsi<br />

sijoittaa sanan väärään taivutustyyppiin.<br />

Lingvisteinä näemme yllä mainittuja toteamuksia taivutusjärjestelmän<br />

produktiivisuuden indekseinä. Kuinka paljon tällaisia indeksejä on? Onko niiden<br />

välillä vuorovaikutusta ja voiko sitä mitata jollakin tavalla? Esitelmäni tarkoitus on<br />

kuvata produktiivisuuden ilmentymistä eri muuttujien kautta suomen<br />

nominaalisessa taivutusjärjestelmässä sekä esittää jälkimmäisen kvantitatiivista<br />

analyysia.<br />

Tarkastelen esitelmässäni tyypin laajuuden ja käyttöyleisyyden<br />

(lemmataajuuden) suhdetta kunkin taivutustyypin kohdalla soveltamalla näihin<br />

korrelaatiomatriiseja sekä useamman selittäjän regressioanalyysiä. Selittäjinä<br />

käytän mm. lemmataajuutta (mediaani, summa), hapaksien määrää ja tavujen<br />

määrää per sana (keskiarvo). Laskeakseni jälkimmäisen muuttujan jaoin kaikki<br />

lemmat (n. 25 000, ks. alla) tavuihin, minkä jälkeen ryhmittelin lemmat kussakin<br />

taivutustyypissä tavumäärän suhteen. Tilastollisen testin luotettavuutta puoltaa<br />

aineiston määrä: käytän Suomen Kielen Perussanakirjan ja CD-Perussanakirjan<br />

paradigmaklassifikaatiota (49 nominaalista paradigmaa, noin 25 000 lemmaa ja 50<br />

000 yhdyssanaa) sekä Kielipankin (www.csc.fi) suomenkielisiä korpuksia (yli 130<br />

milj. sanetta). Laskin käyttöyleisyyden (lemmataajuuden) jokaiselle lemmalle ja<br />

yhdyssanalle, joten tein siis kaiken kaikkiaan yli 75 000 hakua 130 miljoonan<br />

suuruisesta korpuksesta.<br />

Lähteet:<br />

KIELITIETEEN PÄIVÄT 24.–25.5.2007 74 / 155<br />

OULU

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!