11.04.2013 Views

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

c - Repositório Aberto da Universidade do Porto

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

40 ♦ LER E ESCREVER EM PORTUGUÊS EUROPEU - VOL. I<br />

encontram em formato informático. A constituição <strong>do</strong>s 14 corpora foi feita<br />

com base em três tipos de material: material escrito, material fala<strong>do</strong>, ou<br />

material escrito e fala<strong>do</strong>. Nos seis primeiros corpora <strong>do</strong> Quadro 3, as<br />

palavras foram extraí<strong>da</strong>s de material escrito como jornais, textos e revistas.<br />

To<strong>do</strong>s eles contêm um número eleva<strong>do</strong> de palavras. No entanto, à excepção<br />

<strong>do</strong> corpus NATURA-PÚBLICO Etiqueta<strong>do</strong>, to<strong>da</strong>s as bases incluem formas<br />

de palavras repeti<strong>da</strong>s. Os corpora 7 a 13 foram obti<strong>do</strong>s a partir de material<br />

verbal fala<strong>do</strong>, como entrevistas ou discursos. O último corpus - Corpus de<br />

Referência <strong>do</strong> Português Contemporâneo - é o único que foi feito a partir de<br />

material escrito e fala<strong>do</strong>. To<strong>do</strong>s estes incluem formas de palavras repeti<strong>da</strong>s.<br />

De notar ain<strong>da</strong> que, em ca<strong>da</strong> corpus, o leque de anotação é relativamente<br />

restrito. Nem sempre é <strong>da</strong><strong>da</strong> indicação sobre o tipo de informação que<br />

incluem {corpora 5, 7, 9, 10, 12 <strong>do</strong> Quadro 3). Para os outros, a informação<br />

disponível para além <strong>da</strong> ortográfica é ou a transcrição fonética, ou a<br />

informação morfossintáctica, ou a informação sintáctica. Nenhum <strong>do</strong>s<br />

corpora continha, até 1996, informação de frequência ou outro tipo de<br />

elementos mais específicos <strong>do</strong> género <strong>do</strong>s encontra<strong>do</strong>s no Brulex ou no<br />

CELEX.<br />

Resumin<strong>do</strong>, apesar de existirem corpora de palavras para o Português<br />

Europeu, alguns <strong>do</strong>s quais com uma extensão considerável, a ver<strong>da</strong>de é que<br />

estes contêm um número muito reduzi<strong>do</strong> de anotações sobre as suas<br />

entra<strong>da</strong>s. Situação que aliás se mantém hoje (Janeiro de 2001), de acor<strong>do</strong><br />

com o catálogo de recursos forneci<strong>do</strong> no âmbito <strong>do</strong> projecto Processamento

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!