13.07.2015 Views

Caderno de Resumos - Celsul.org.br

Caderno de Resumos - Celsul.org.br

Caderno de Resumos - Celsul.org.br

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

interpessoais, como, p. ex., a persuasão; o compreen<strong>de</strong>r, para averda<strong>de</strong>/falsida<strong>de</strong> das <strong>de</strong>scrições lógico-semânticas; e, por fim, o expressar,para a socialização das experiências dos interlocutores. A TCD postula quetais classes <strong>de</strong> rotinas são fruto da experimentação <strong>de</strong> disposições psíquicasinatas e que, por isso mesmo, estão entranhadas nas experiências. O mo<strong>de</strong>lohipotético que disso <strong>de</strong>riva prevê a articulação <strong>de</strong> algumas rotinas queconstituem tais classes <strong>de</strong> processos psíquicos. Por ora, tais processos estãoescritos em linguagem formal, baseados nos símbolos e operadores da lógicaclássica, e não em linguagem <strong>de</strong> programação. Apesar disso, a forma <strong>de</strong>computação que preten<strong>de</strong>mos simular distancia-se dos princípios rígidos dalógica clássica. As principais características <strong>de</strong> seu modus operandi sãomuito semelhantes ao do processamento neuropsicológico: a) computaçãoparalela e distribuída; b) emprego <strong>de</strong> cálculos estatísticos, e não categóricos,dos dados; b) processamento por parentesco <strong>de</strong> família, e não por critérios <strong>de</strong>necessida<strong>de</strong> e suficiência; c) processamento retroativo e dinâmico dasinformações. Com isso, a TCD preten<strong>de</strong> ser uma teoria geral da linguagemem uso, pois permite integrar sob um mesmo princípio teóricoepistemológicoaspectos das experiências humanas tratados até entãoseparadamente, como a linguagem verbal, a cognição e os afetos.COMPILAÇÃO E ANOTAÇÃO DE CORPUS – UM ESTUDO SOBREOS COMPOSTOS NOMINAISLílian Figueiró Teixeira (UNISINOS)Lucas Lermen (UNISINOS)A utilização <strong>de</strong> recursos computacionais para o estudo da língua tem setornado cada vez mais freqüente. Além <strong>de</strong> facilitar o trabalho do lingüista,com dados mais precisos e obtidos rapidamente, é possível compilar corpora(conjuntos <strong>de</strong> textos <strong>org</strong>anizados com fins <strong>de</strong> pesquisa) consi<strong>de</strong>ravelmentegran<strong>de</strong>s. No entanto, encontrar um corpus apropriado aos propósitos <strong>de</strong> um<strong>de</strong>terminado estudo nem sempre é fácil. Nesta comunicação, nosso objetivoé refletir so<strong>br</strong>e a metodologia que adotamos para realizar a coleta ecompilação <strong>de</strong> corpus paralelo. Como parte <strong>de</strong> pesquisa em nível <strong>de</strong>mestrado, cujo propósito é estudar a semântica dos compostos nominaisatravés da sua tradução do inglês para o português, a compilação do corpusexigiu uma série <strong>de</strong> procedimentos computacionais. Inicialmente foi feita acoleta <strong>de</strong> <strong>de</strong>z edições da revista National Geographic em inglês e a suatradução em português. Essa revista foi escolhida por ser conceituada e osmesmos artigos publicados em inglês são traduzidos na íntegra na edição<strong>br</strong>asileira. Além disso, as principais reportagens estão disponíveisgratuitamente on-line. Após a compilação do corpus, precisava-se encontraros compostos nominais formados por dois substantivos (NN), já queposteriormente a semântica <strong>de</strong>ssas expressões seriam analisadas. Assim,tornou-se necessário a etiquetação dos textos em inglês, tarefa que constituina classificação morfológica feita com o auxílio <strong>de</strong> uma ferramenta(etiquetador). Por ser gratuito e confiável, utilizou-se o TreeTagger, que338

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!