11.04.2013 Views

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

PORLEX: UMA BASE LEXICAL INFORMATIZADA DO PORTUGUÊS EUROPEU ♦ 39<br />

frequência extraí<strong>do</strong>s de material escrito, (2) de material verbal, e (3) valores<br />

de frequência ten<strong>do</strong> em conta as duas fontes - o escrito e o verbal (a soma<br />

<strong>da</strong>s duas frequências anteriores).<br />

Corpora portugueses<br />

Vimos <strong>do</strong>is exemplos de bases lexicais que reúnem uma varie<strong>da</strong>de de<br />

informação psicolinguística para o francês, o holandês, o inglês e o alemão.<br />

Trata-se de um acervo de informação bastante útil na investigação em<br />

psicologia cognitiva. Por isso se torna importante dispor de uma base lexical<br />

análoga para o Português, mais especificamente para o Português Europeu.<br />

Antes, porém, de empreendermos a tarefa de desenvolver uma base de<br />

<strong>da</strong><strong>do</strong>s lexicais portugueses, procedemos a um levantamento <strong>da</strong>s bases<br />

disponíveis para a nossa língua. Nascimento, Rodrigues e Gonçalves (1996)<br />

publicaram um volume dedica<strong>do</strong> exclusivamente aos corpora portugueses.<br />

Neste volume encontram-se recensea<strong>do</strong>s 27 corpora, to<strong>do</strong>s eles de conteú<strong>do</strong><br />

e formato bastante diversos (para uma síntese <strong>do</strong>s vários corpora cf.<br />

Apêndice A). Destes corpora, cerca de metade são bases lexicais e foi sobre<br />

estas que recaiu a nossa atenção.<br />

No Quadro 3 encontra-se uma descrição <strong>do</strong>s 14 corpora lexicais em<br />

termos <strong>do</strong> número de entra<strong>da</strong>s e <strong>do</strong> tipo de informação disponível. Com<br />

excepção <strong>do</strong>s corpora BDFA1A e ONOMÁSTICA (entra<strong>da</strong>s 10 e 11), para<br />

os quais não há referência quanto ao formato actual, to<strong>do</strong>s os outros se

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!