'Norantz'datu-basea: Aurkezpena eta aditz komunztadurako datuak
'Norantz'datu-basea: Aurkezpena eta aditz komunztadurako datuak
'Norantz'datu-basea: Aurkezpena eta aditz komunztadurako datuak
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
artxibo-00685841, version 1 - 6 Apr 2012<br />
F. AHOSKERA<br />
F.1. Frantsesetikako maileguak ><br />
euskarak ez dituen fonemak<br />
F.2. Frantsesaren eraginez gal daitezkeen<br />
oposak<strong>eta</strong>k<br />
3. taula. Galdetegia.<br />
79 galdera<br />
99 galdera<br />
Galdetegi hon<strong>eta</strong>ko 746 galderen bitartez lortu diren erantzunak (44.000 pasatxo)<br />
erabiltzailearen esku jarri dira sarean, <strong>eta</strong> hori<strong>eta</strong>ko bakoitzean klik eginez entzun daitezke.<br />
Nahiz euskarazko corpusa den NORANTZ, <strong>eta</strong> beraz corpus elebakarren ezaugarriak <strong>eta</strong><br />
mugak dituen, tarteka bada perpaus elebidunen bat edo beste, hiztun batzuen erantzun<strong>eta</strong>n<br />
badirelako frantseserako lerratzeak. Bere horr<strong>eta</strong>n argitaratu ditugu halakoak, hiztun horien<br />
solasaren ezaugarria direlakoan. Luz<strong>eta</strong>sun desberdin<strong>eta</strong>koak izan daitezke lerratze horiek:<br />
batzu<strong>eta</strong>n hitzaren mailakoak dira (ad. force*a ‘indarra’, restaurant*ilat ‘jatetxera’), beste<br />
batzu<strong>eta</strong>n sintagmaren mailakoak (ad. haurrak igorri ditut à l’instituteur* ‘haurrak<br />
irakaslearengana igorri ditut’). Ez da aldez aurretik pentsatu honelako perpaus elebidunak<br />
elizitatzeko galderarik. Besterik gabe transkripzioan delako hitza edo sintagma frantsesa<br />
dela seinalatzeko marka bat (izartxoa) erabili dugu, <strong>eta</strong> frantses ortografiaren arabera<br />
idatzi.<br />
2.3. Kontuan hartu beharrekoak<br />
Corpus batean oinarritutako ikerk<strong>eta</strong> proiektua da NORANTZ. Corpusa eraikitzen hasterako,<br />
bi gauza hartu behar dira kontuan: bata, nolako <strong>datuak</strong> atera <strong>eta</strong> erabili nahi ditugun, <strong>eta</strong><br />
bigarrena, nolako azterk<strong>eta</strong>k egin ahal izango diren gero datu horiekin, behin corpusa<br />
osatua <strong>eta</strong> bururatua dagoenean. Horiek erabakitzea <strong>eta</strong> zehaztea izaten da lehenbiziko<br />
zailtasuna honelako ikerket<strong>eta</strong>n, <strong>eta</strong> mugak ongi finkatzea. Garbi esan behar dugu<br />
NORANTZen helburua ez dela izan erkidego oso baten mintzoa biltzea, baizik <strong>eta</strong>, aurreko<br />
atalean azaldu dugun hiztun tipologiaren arabera (§2. taula) <strong>eta</strong> hizkuntzaren erabilera<br />
mota desberdinak kontuan edukiz, egungo hiztunek euskara baliatzean beren jakitate<br />
abstraktuan dituzten egitura gramatikalen <strong>eta</strong> fonetikoen bilduma bat egitea, <strong>eta</strong> datu-base<br />
batean antolatuta Interneten eskaintzea. Jarraian azalduko ditugu <strong>datuak</strong> biltzean <strong>eta</strong><br />
sareratzeko prestatzean sortu zaizkigun arazo batzuk edo <strong>datuak</strong> baliatzerakoan gogoan<br />
8