08.11.2014 Views

Descarga en formato PDF - Centro Ramón Piñeiro para a ...

Descarga en formato PDF - Centro Ramón Piñeiro para a ...

Descarga en formato PDF - Centro Ramón Piñeiro para a ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Mª Carm<strong>en</strong> Paz Roca<br />

Mª Carm<strong>en</strong> Paz Roca<br />

1. Por que usar córpora?<br />

O uso de córpora na investigación lexicográfica non é un descubrim<strong>en</strong>to do século XX,<br />

pero a forma de procesalos <strong>para</strong> obter información sobre o uso real da lingua é algo<br />

relacionado co des<strong>en</strong>volvem<strong>en</strong>to da informática. Ó principio, a maioría dos traballos de<br />

lexicografía computacional c<strong>en</strong>trábase nas palabras e frecu<strong>en</strong>cias, mais a fraseoloxía e o<br />

estudo da fixación a través de córpora foi adquirindo máis relevancia nas últimas<br />

décadas.<br />

Lexicógrafos como Samuel Johnson, ou mesmo os c<strong>en</strong>tos de persoas que traballaron<br />

<strong>para</strong> compila-lo Oxford English Dictionary, xa usaban un corpus. Con todo, a súa idea<br />

de como empregalo <strong>para</strong> sabe-lo significado dunha palabra baseábase <strong>en</strong> recoller léxico<br />

l<strong>en</strong>do textos e fac<strong>en</strong>do fichas con citas que contiñan cada lema e mailos contextos<br />

correspond<strong>en</strong>tes. Podemos imaxina-lo tamaño dun proxecto destas características hai<br />

dousc<strong>en</strong>tos anos, cando todo se facía sobre papel e non había ord<strong>en</strong>ador <strong>para</strong> organizar<br />

ou levar conta do traballo. Hoxe <strong>en</strong> día son tamén moitos os dicionarios que se veñ<strong>en</strong><br />

compilando desde o <strong>en</strong>foque da simple base de datos, só que agora resulta moito máis<br />

rápido coa axuda dos ord<strong>en</strong>adores. Así e todo, cada vez é máis frecu<strong>en</strong>te que os<br />

dicionarios modernos estean baseados nun corpus. O obxectivo deste novo <strong>en</strong>foque non<br />

é usa-los ord<strong>en</strong>adores <strong>para</strong> face-lo mesmo traballo que facían Samuel Johnson e os seus<br />

contemporáneos, s<strong>en</strong>ón <strong>para</strong> face-lo traballo dunha forma que só podemos facer grazas á<br />

informática.<br />

Biber describe a difer<strong>en</strong>za <strong>en</strong>tre un método e mailo outro como segue:<br />

The primary differ<strong>en</strong>ce is that citation slips repres<strong>en</strong>t only those contexts that a<br />

human reader happ<strong>en</strong>s to notice (in some cases repres<strong>en</strong>ting only the more<br />

unusual uses). In contrast, a corpus-based listing provides an exhaustive listing<br />

of all occurr<strong>en</strong>ces and contexts (Biber et alli 1998: 26) .<br />

Mercé ó uso dos ord<strong>en</strong>adores, ademais de ter unha lista, podemos ter tamén<br />

automaticam<strong>en</strong>te as frecu<strong>en</strong>cias de uso <strong>en</strong> distintos rexistros e variedades de lingua; e<br />

isto vale tanto <strong>para</strong> a lexicografía <strong>en</strong> xeral coma <strong>para</strong> o caso concreto da investigación<br />

fraseolóxica.<br />

En resumo, moitas das listas fraseolóxicas coas que contamos compiláronse a base de ler<br />

textos e recoñece-la fixación e os contextos de uso de xeito manual ou b<strong>en</strong> a partir de<br />

traballo de campo ou da memoria do propio autor. Así e todo, ter un corpus facilita a<br />

análise de frecu<strong>en</strong>cias e mais a elaboración das listas de palabras <strong>en</strong> contexto.<br />

2. CORGA, BNC e a fraseoloxía<br />

T<strong>en</strong>do <strong>en</strong> conta o exposto anteriorm<strong>en</strong>te, o obxectivo deste traballo é pres<strong>en</strong>tar un estudo<br />

práctico que leve á reflexión sobre como pode contribuí-la análise de corpus ó estudo das<br />

colocacións e das expresións fixas. Para iso, escolléronse as colocacións co verbo galego<br />

caer e o correspond<strong>en</strong>te inglés to fall e os córpora empregados foron o CORGA (Corpus<br />

de Refer<strong>en</strong>cia do Galego Actual) e o BNC (British National Corpus).<br />

2<br />

206

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!