13.07.2015 Views

Caderno de Resumos - Celsul.org.br

Caderno de Resumos - Celsul.org.br

Caderno de Resumos - Celsul.org.br

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ASPECTOS MORFOSSINTÁTICOS E COMPUTACIONAIS DASEQÜÊNCIA DEPOIS QUE: UMA ABORDAGEM DE BASE EMCORPUSMarco Rocha (UFSC)A comunicação apresenta um estudo <strong>de</strong> base em corpus da seqüência <strong>de</strong>poisque, tendo em vista o aperfeiçoamento <strong>de</strong> um sistema capaz <strong>de</strong> analisartextos em português e atribuir uma categoria morfossintática a cada uma daspalavras e expressões multipalavra do texto em questão, através <strong>de</strong> umaetiqueta codificadora selecionada <strong>de</strong>ntre um conjunto <strong>de</strong> etiquetaspreviamente <strong>de</strong>finido segundo critérios lingüísticos. A análise <strong>de</strong> corpus tevecomo base uma amostra <strong>de</strong> 1864 ocorrências da seqüência <strong>de</strong>pois queextraídas da versão etiquetada do Corpus NILC. A investigação incluiutambém outras amostras menores extraídas da Web através <strong>de</strong> ferramentas<strong>de</strong> busca como a Webcorp, a fim <strong>de</strong> verificar aspectos específicos <strong>de</strong>fenômenos <strong>de</strong> coocorrência <strong>de</strong>tectados na análise da primeira amostra. Ofoco da análise é a <strong>de</strong>limitação <strong>de</strong> parâmetros que permitam distinguir comsegurança as ocorrências da seqüência <strong>de</strong>pois que em que a etiquetaçãolinguisticamente a<strong>de</strong>quada é a expressão multipalavra, uma locuçãoconjuntiva (etiqueta LC) subordinativa adverbial temporal, daquelas em queas categorias morfossintáticas apropriadas são advérbio <strong>de</strong> tempo (etiquetaADV) + conjunção integrante (etiqueta KS), on<strong>de</strong> o item lexical <strong>de</strong>pois é ummodificador do verbo, in<strong>de</strong>pen<strong>de</strong>nte da conjunção integrante que o segue,cuja função é introduzir uma oração subordinada objetiva direta que serve <strong>de</strong>objeto do verbo. No primeiro caso, temos sentenças como: O caso ganhouas páginas dos jornais <strong>de</strong>pois que_LC grupos ecologistas fizeram pressãoso<strong>br</strong>e o governo da Lombardia. No segundo caso, estão sentenças como: Ostrabalhadores são recrutados em áreas afetadas por seca ou <strong>de</strong>semprego elevados para trabalhar a centenas <strong>de</strong> quilômetros <strong>de</strong> suas casas, tendo<strong>de</strong>pois_ADV que_KS pagar aos empregadores transporte, alimentação,hospedagem e ferramentas. Além da versão automaticamente etiquetada doCorpus NILC, foram discutidas também as soluções do LACIOWEBMACMORPHO, corpus também compilado pelo NILC cuja etiquetação foirevisada manualmente, e os resultados <strong>de</strong> etiquetadores <strong>de</strong> categoriasmorfossintáticas do CEPRIL e da XEROX. A pesquisa conclui com a<strong>de</strong>finição <strong>de</strong> padrões <strong>de</strong> coocorrência relacionados a cada uma dasalternativas <strong>de</strong> análise, baseados numa tipologia dos verbos das oraçõesprincipais e suas relações com seus objetos diretos nominais ou oracionais, afim <strong>de</strong> permitir o reconhecimento automático da distinção apontada acima.Espera-se que estes padrões, se integrados ao léxico computacional,contribuam para o aperfeiçoamento do processo <strong>de</strong> etiquetação <strong>de</strong> categoriasmorfossintáticas em sistemas computacionais no âmbito <strong>de</strong> aplicações emtecnologia das línguas humanas.247

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!