11.04.2013 Views

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

36 ♦ LER E ESCREVER EM PORTUGUÊS EUROPEU - VOL. I<br />

As formas flexiona<strong>da</strong>s <strong>da</strong>s palavras constituem as entra<strong>da</strong>s <strong>do</strong>s léxicos de<br />

wordforms. Estes léxicos são de extensão consideravelmente maior <strong>do</strong> que<br />

os anteriores, pois parte de to<strong>do</strong>s os lemas e modifica-os, quan<strong>do</strong> aplicável,<br />

em to<strong>da</strong>s as formas flexiona<strong>da</strong>s possíveis. Assim, para os cat e call <strong>do</strong><br />

léxico de lemas, o léxico de wordforms contém entra<strong>da</strong>s como cat, cats; e<br />

call, calls, calling, called. Das três línguas que constituem o CELEX, o<br />

alemão é aquela que admite um maior número de flexões. Isto pode ser visto<br />

no Quadro 2, onde o tamanho <strong>do</strong> léxico de wordforms é três vezes maior <strong>do</strong><br />

que o de lemas em holandês e em inglês, mas sete vezes maior em alemão.<br />

O terceiro tipo de léxico - denomina<strong>do</strong> de léxico tipo corpus - é<br />

simplesmente uma lista ordena<strong>da</strong> de to<strong>da</strong>s as sequências alfanuméricas<br />

existentes no corpus. Para ca<strong>da</strong> sequência alfanumérica são forneci<strong>da</strong>s<br />

contagens brutas, que não têm em conta os respectivos lemas ou wordforms<br />

homógrafos.<br />

Vimos, então, que o CELEX contém três bases lexicais, para o holandês,<br />

o inglês e o alemão, des<strong>do</strong>bran<strong>do</strong>-se, ca<strong>da</strong> uma destas, em três bases de<br />

acor<strong>do</strong> com o tipo de entra<strong>da</strong>s. Vejamos agora que tipo de informação se<br />

encontra disponível para ca<strong>da</strong> uma delas.<br />

O CELEX reúne informação vária de tipo ortográfico, fonológico,<br />

morfológico, sintáctico e de frequência. Esta informação (como no Brulex)<br />

encontra-se disposta na vertical, num total de aproxima<strong>da</strong>mente 950 colunas<br />

(o valor equivalente no Brulex é de 29, e no Porlex é de 45). Aqui vale a

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!