Descarga en formato PDF - Centro Ramón Piñeiro para a ...
Descarga en formato PDF - Centro Ramón Piñeiro para a ...
Descarga en formato PDF - Centro Ramón Piñeiro para a ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Mª Carm<strong>en</strong> Paz Roca<br />
Mª Carm<strong>en</strong> Paz Roca<br />
1. Por que usar córpora?<br />
O uso de córpora na investigación lexicográfica non é un descubrim<strong>en</strong>to do século XX,<br />
pero a forma de procesalos <strong>para</strong> obter información sobre o uso real da lingua é algo<br />
relacionado co des<strong>en</strong>volvem<strong>en</strong>to da informática. Ó principio, a maioría dos traballos de<br />
lexicografía computacional c<strong>en</strong>trábase nas palabras e frecu<strong>en</strong>cias, mais a fraseoloxía e o<br />
estudo da fixación a través de córpora foi adquirindo máis relevancia nas últimas<br />
décadas.<br />
Lexicógrafos como Samuel Johnson, ou mesmo os c<strong>en</strong>tos de persoas que traballaron<br />
<strong>para</strong> compila-lo Oxford English Dictionary, xa usaban un corpus. Con todo, a súa idea<br />
de como empregalo <strong>para</strong> sabe-lo significado dunha palabra baseábase <strong>en</strong> recoller léxico<br />
l<strong>en</strong>do textos e fac<strong>en</strong>do fichas con citas que contiñan cada lema e mailos contextos<br />
correspond<strong>en</strong>tes. Podemos imaxina-lo tamaño dun proxecto destas características hai<br />
dousc<strong>en</strong>tos anos, cando todo se facía sobre papel e non había ord<strong>en</strong>ador <strong>para</strong> organizar<br />
ou levar conta do traballo. Hoxe <strong>en</strong> día son tamén moitos os dicionarios que se veñ<strong>en</strong><br />
compilando desde o <strong>en</strong>foque da simple base de datos, só que agora resulta moito máis<br />
rápido coa axuda dos ord<strong>en</strong>adores. Así e todo, cada vez é máis frecu<strong>en</strong>te que os<br />
dicionarios modernos estean baseados nun corpus. O obxectivo deste novo <strong>en</strong>foque non<br />
é usa-los ord<strong>en</strong>adores <strong>para</strong> face-lo mesmo traballo que facían Samuel Johnson e os seus<br />
contemporáneos, s<strong>en</strong>ón <strong>para</strong> face-lo traballo dunha forma que só podemos facer grazas á<br />
informática.<br />
Biber describe a difer<strong>en</strong>za <strong>en</strong>tre un método e mailo outro como segue:<br />
The primary differ<strong>en</strong>ce is that citation slips repres<strong>en</strong>t only those contexts that a<br />
human reader happ<strong>en</strong>s to notice (in some cases repres<strong>en</strong>ting only the more<br />
unusual uses). In contrast, a corpus-based listing provides an exhaustive listing<br />
of all occurr<strong>en</strong>ces and contexts (Biber et alli 1998: 26) .<br />
Mercé ó uso dos ord<strong>en</strong>adores, ademais de ter unha lista, podemos ter tamén<br />
automaticam<strong>en</strong>te as frecu<strong>en</strong>cias de uso <strong>en</strong> distintos rexistros e variedades de lingua; e<br />
isto vale tanto <strong>para</strong> a lexicografía <strong>en</strong> xeral coma <strong>para</strong> o caso concreto da investigación<br />
fraseolóxica.<br />
En resumo, moitas das listas fraseolóxicas coas que contamos compiláronse a base de ler<br />
textos e recoñece-la fixación e os contextos de uso de xeito manual ou b<strong>en</strong> a partir de<br />
traballo de campo ou da memoria do propio autor. Así e todo, ter un corpus facilita a<br />
análise de frecu<strong>en</strong>cias e mais a elaboración das listas de palabras <strong>en</strong> contexto.<br />
2. CORGA, BNC e a fraseoloxía<br />
T<strong>en</strong>do <strong>en</strong> conta o exposto anteriorm<strong>en</strong>te, o obxectivo deste traballo é pres<strong>en</strong>tar un estudo<br />
práctico que leve á reflexión sobre como pode contribuí-la análise de corpus ó estudo das<br />
colocacións e das expresións fixas. Para iso, escolléronse as colocacións co verbo galego<br />
caer e o correspond<strong>en</strong>te inglés to fall e os córpora empregados foron o CORGA (Corpus<br />
de Refer<strong>en</strong>cia do Galego Actual) e o BNC (British National Corpus).<br />
2<br />
206