título do trabalho completo: letra maiúscula, negrito ... - X CELSUL
título do trabalho completo: letra maiúscula, negrito ... - X CELSUL
título do trabalho completo: letra maiúscula, negrito ... - X CELSUL
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
ANÁLISE ACÚSTICA DA PRODUÇÃO DE CONSOANTES OCLUSIVAS INICIAIS<br />
POR FALANTES NATIVOS DE PB<br />
1<br />
Susana Pinheiro da Cruz PRESTES 1<br />
RESUMO: O presente estu<strong>do</strong> versa sobre a produção de consoantes oclusivas surdas e<br />
sonoras <strong>do</strong> inglês em posição inicial. É traçada uma comparação entre a produção de<br />
aprendizes brasileiros de inglês e falantes nativos estadunidenses. Para tanto, lançamos mão<br />
da análise acústica da duração de VOT (Voice Onset Time). Observamos que as produções<br />
<strong>do</strong>s <strong>do</strong>is grupos diferem tanto em relação às oclusivas surdas quanto às sonoras. Para as<br />
surdas, os níveis de aspiração são consideravelmente inferiores nos da<strong>do</strong>s <strong>do</strong>s aprendizes e,<br />
nos <strong>do</strong>is grupos, o ponto de articulação tem influência direta sobre esses níveis. Para as<br />
sonoras, foram observa<strong>do</strong>s índices de sonoridade superiores nos da<strong>do</strong>s <strong>do</strong>s aprendizes, ao<br />
passo que não fica completamente nítida a influência <strong>do</strong> ponto de articulação para a<br />
sonoridade, especialmente nos da<strong>do</strong>s <strong>do</strong>s aprendizes. A opção por descrever os da<strong>do</strong>s por<br />
meio <strong>do</strong>s índices de VOT implica uma perspectiva dinâmica de aquisição de língua<br />
estrangeira, uma vez que o que está em jogo no presente <strong>trabalho</strong> não é a oposição entre<br />
sistemas fonético-fonológicos que apresentem ou não uma dada característica, mas o que<br />
aproxima a produção <strong>do</strong> aprendiz da produção <strong>do</strong> nativo.<br />
PALAVRAS-CHAVE: Consoantes oclusivas; Produção; Análise acústica.<br />
ABSTRACT: The present study deals with the production of both voiced and voiceless stops of<br />
English in word-beginning position. A comparison will be carried out between the production<br />
of Brazilian EFL speakers and North American native speakers of English. In order to <strong>do</strong> so,<br />
we use the acoustic analysis of VOT (Voice Onset Time). It was noted that the productions for<br />
the two groups differ in relation to both voiceless and voiced stops. Concerning the voiceless<br />
stops, the levels of aspiration are considerably lower in the learners’ data. Besides, the place<br />
of articulation has direct influence on these levels. Regarding the voiced stops, we found<br />
higher levels of sonority in the learners’ data, whereas the influence of place of articulation<br />
was not completely clear, particularly in the learners’ data. The choice for describing the<br />
data through VOT levels involves a dynamic perspective of foreign language acquisition,<br />
since what is at stake here is not the opposition between two phonetic/phonological systems in<br />
terms of the presence or not of a certain characteristic, but what approximates the<br />
productions of an EFL speaker and a native speaker.<br />
KEY WORDS: Stop consonants; Production; Acoustic analysis.<br />
1 Introdução<br />
Este estu<strong>do</strong> visa investigar a produção das consoantes oclusivas surdas e sonoras na<br />
língua inglesa por falantes nativos de português brasileiro (PB). Mais especificamente, será<br />
traçada uma comparação entre a produção de aprendizes brasileiros de inglês e falantes<br />
nativos. Os níveis de aspiração, no que tange às oclusivas surdas, e os índices de sonoridade,<br />
no caso das sonoras, serão mensura<strong>do</strong>s em da<strong>do</strong>s obti<strong>do</strong>s de sujeitos brasileiros e<br />
1 Mestranda <strong>do</strong> Programa de Pós Graduação em Letras da Universidade Federal <strong>do</strong> Paraná, e-mail:<br />
susanaprestes@yahoo.com.br.
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
estadunidenses por meio da análise acústica da duração de VOT (Voice Onset Time), que<br />
consiste no intervalo existente entre a soltura <strong>do</strong>s articula<strong>do</strong>res na consoante oclusiva e o<br />
início <strong>do</strong> vozeamento <strong>do</strong> segmento seguinte.<br />
A escolha por analisar o da<strong>do</strong> fonético por meio da mensuração <strong>do</strong>s índices de VOT<br />
pressupõe uma perspectiva dinâmica de aquisição de língua estrangeira. Em outras palavras,<br />
buscou-se olhar para os fenômenos de aspiração e sonorização das oclusivas em termos de<br />
gradiência, ao invés de tratá-los relativamente a sua ausência ou presença nos sistemas<br />
fonético-fonológicos. O que passa a ter centralidade aqui é o que aproxima a produção <strong>do</strong><br />
aprendiz da produção <strong>do</strong> nativo, ou seja, parte-se da hipótese de que os aprendizes realizam a<br />
aspiração, porém mais brevemente que os nativos. Não se trata, portanto, de conceber que os<br />
aprendizes devam aprender a produzir um aspecto sonoro novo, mas de fazê-los produzir tal<br />
aspecto com maior duração.<br />
2 Hipótese e objetivos<br />
Sabe-se que, em início de sílaba tônica, as consoantes oclusivas surdas <strong>do</strong> inglês, a<br />
saber: [p], [t] e [k], apresentam um ruí<strong>do</strong> aspira<strong>do</strong> de duração considerável após a soltura <strong>do</strong>s<br />
articula<strong>do</strong>res, exceto quan<strong>do</strong> precedidas de [s] na mesma sílaba.<br />
É sabi<strong>do</strong> ainda que tal fenômeno aparentemente não ocorre no PB, ou pelo menos, não<br />
nos mesmos níveis encontra<strong>do</strong>s na língua inglesa. Dessa forma, é espera<strong>do</strong> que falantes de PB<br />
aprendizes de inglês apresentem certa dificuldade na realização de segmentos aspira<strong>do</strong>s e que,<br />
portanto, através de uma análise acústica, ostentem índices de VOT consideravelmente mais<br />
baixos na L2 <strong>do</strong> que aqueles apresenta<strong>do</strong>s por falantes nativos.<br />
Além disso, as consoantes oclusivas sonoras <strong>do</strong> inglês caracterizam-se por um baixo<br />
índice de sonoridade quan<strong>do</strong> comparadas àquelas presentes no PB. Espera-se, dessa forma,<br />
que os aprendizes brasileiros apresentem índices mais altos de sonoridade na produção da L2,<br />
o que deverá ser comprova<strong>do</strong> por uma análise acústica que venha a medir os valores de VOT<br />
exibi<strong>do</strong>s por falantes nativos e aprendizes.<br />
A partir da análise acústica da produção de aprendizes brasileiros de língua inglesa e<br />
falantes nativos de inglês americano, será possível traçar uma comparação mais acurada entre<br />
L2 e língua-alvo, uma vez que os da<strong>do</strong>s terão si<strong>do</strong> coleta<strong>do</strong>s sob as mesmas condições.<br />
Assim sen<strong>do</strong>, este <strong>trabalho</strong> visa verificar como as consoantes oclusivas são realizadas por<br />
aprendizes brasileiros de inglês e seus falantes nativos, especialmente com relação à duração<br />
de VOT. Além disso, objetiva-se comparar a produção nos <strong>do</strong>is grupos e identificar o quanto<br />
falta para que se equiparem.<br />
3 Caracterização das consoantes oclusivas<br />
As consoantes oclusivas, também chamadas plosivas, têm como característica<br />
primordial um bloqueio momentâneo total <strong>do</strong> trato vocal, ou seja, uma oclusão articulatória<br />
em algum ponto <strong>do</strong> trato. Na língua inglesa, bem como no português, tal oclusão localiza-se<br />
essencialmente nos pontos bilabial, alveolar e velar. Embora a língua inglesa conte ainda com<br />
a oclusiva glotal [ʔ], sua realização se dá em contextos muito específicos. Ela aparece, por<br />
exemplo, na expressão de negação normalmente transcrita ortograficamente como uh-uh e<br />
foneticamente transcrita como [ʔʌʔʌ]. Surge ainda como alofone <strong>do</strong> [t] em palavras como<br />
beaten, kitten e fatten, ou diante de oclusivas surdas em palavras como rap, rat e rack<br />
(LADEFOGED, 2001). Por essa razão, tomamos a decisão de não contemplar a oclusiva<br />
glotal nesta pesquisa.<br />
2
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
As oclusivas com as quais trabalharemos localizam-se em posição prévocalica e<br />
podem ser identificadas por meio de três eventos acústicos: a obstrução, a soltura e a<br />
transição. Durante a fase de obstrução, que dura entre 50ms e 100ms, há pouca ou nenhuma<br />
energia acústica, uma vez que há bloqueio total <strong>do</strong>s articula<strong>do</strong>res. Na fase de soltura, é<br />
identifica<strong>do</strong> o chama<strong>do</strong> burst, ou explosão, que dura entre 5ms e 40ms e que pode ou não ser<br />
segui<strong>do</strong> de aspiração. Por fim, a transição entre uma oclusiva e a vogal seguinte nos dá pistas<br />
sobre o ponto de articulação da consoante já que este causa mudanças características nos<br />
formantes2 da vogal (KENT &READ, 1992).<br />
A aspiração, por sua vez, é um evento acústico no qual o ar passa pelas pregas vocais e<br />
através da faringe geran<strong>do</strong> um som sussurra<strong>do</strong> semelhante à fricativa glotal [h] presente na<br />
palavra hat. Não é à toa que se marca foneticamente a aspiração por meio de um h sobrescrito,<br />
como na transcrição da palavra peak [pʰik]. Na língua inglesa, as oclusivas surdas<br />
prevocálicas são aspiradas em posição tônica, exceto quan<strong>do</strong> antecedidas de [s] na mesma<br />
sílaba, ao passo que as oclusivas sonoras são normalmente não-aspiradas. Portanto, além <strong>do</strong><br />
vozeamento em si, a aspiração constitui uma pista para a distinção surda/sonora nas<br />
consoantes oclusivas prevocálicas.<br />
É possível ainda caracterizar as oclusivas por meio de um parâmetro acústico chama<strong>do</strong><br />
VOT (Voice Onset Time), que é o intervalo existente entre a soltura <strong>do</strong>s articula<strong>do</strong>res e o<br />
início <strong>do</strong> vozeamento proveniente <strong>do</strong> segmento seguinte. Tal conceito foi primeiramente<br />
utiliza<strong>do</strong> em um <strong>trabalho</strong> de Lisker e Abramson (1964) no qual os autores buscavam<br />
identificar um parâmetro único para distinguir oclusivas surdas e sonoras. Assim surgiu o<br />
foco na relação de tempo entre o início <strong>do</strong> vozeamento e a soltura <strong>do</strong>s articula<strong>do</strong>res da<br />
consoante oclusiva. Para fins de medição <strong>do</strong> VOT, o momento da soltura é determina<strong>do</strong> como<br />
ponto zero, e to<strong>do</strong> vozeamento que começar antes da soltura terá, portanto, valor negativo.<br />
Valores médios para o VOT de oclusivas sonoras em inglês ficam entre -20ms e<br />
+20ms. Por outro la<strong>do</strong>, as consoantes oclusivas surdas assumem sempre valores positivos de<br />
VOT entre 25 e 100ms (KENT &READ, 1992). De acor<strong>do</strong> com Ladefoged (1999), no inglês<br />
norte-americano, há pouco ou nenhum vozeamento das consoantes oclusivas sonoras durante<br />
a oclusão, exceto no caso em que ocorrem entre sons vozea<strong>do</strong>s. Portanto, é de se esperar que<br />
aprendizes anglófonos de português apresentem desvozeamento das oclusivas vozeadas.<br />
4 Revisão bibliográfica<br />
Um experimento conduzi<strong>do</strong> por Stein (2011) confirma a existência <strong>do</strong> desvozeamento<br />
entre sujeitos anglofalantes aprendizes de português. Ao estudar tal fenômeno, o pesquisa<strong>do</strong>r<br />
confirma que os da<strong>do</strong>s por ele coleta<strong>do</strong>s junto aos aprendizes anglofalantes demonstram que o<br />
desvozeamento se projetou de forma recorrente quan<strong>do</strong> os sujeitos pronunciaram as oclusivas<br />
vozeadas <strong>do</strong> PB, inclusive no nível avança<strong>do</strong> de aprendizagem. Os da<strong>do</strong>s foram obti<strong>do</strong>s de<br />
<strong>do</strong>is informantes americanos em níveis básico e pré-intermediário e duas informantes inglesas<br />
em níveis intermediário e avança<strong>do</strong>. O pesquisa<strong>do</strong>r não recorreu a sentenças-veículo, mas a<br />
textos e frases. A análise acústica foi feita através <strong>do</strong> programa computacional Praat, o mesmo<br />
utiliza<strong>do</strong> na presente pesquisa.<br />
No que diz respeito às oclusivas surdas, os valores de VOT no PB tendem a ser<br />
consideravelmente mais baixos, o que explica o fato de os brasileiros serem considera<strong>do</strong>s<br />
falantes de uma língua em que não há aspiração. Logo, aprendizes brasileiros de inglês podem<br />
vir a transferir essa característica de sua língua materna para a língua estrangeira, o que fará<br />
2 Formantes são picos de energia em uma região <strong>do</strong> espectro sonoro. São realça<strong>do</strong>s em função <strong>do</strong> formato que o<br />
trato vocal assume na produção de determina<strong>do</strong> som vocálico.<br />
3
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
com que as oclusivas surdas em início de sílaba na L2 acabem por apresentar VOT de duração<br />
consideravelmente mais curta <strong>do</strong> que o de um nativo. Zimmer (2004) refere-se a essa<br />
transferência como desaspiração das oclusivas surdas iniciais e, segun<strong>do</strong> a pesquisa<strong>do</strong>ra, o<br />
fator que leva falantes de PB à desaspiração envolve a ativação <strong>do</strong> conhecimento fonéticofonológico<br />
de sua língua materna. Em sua pesquisa, ela <strong>trabalho</strong>u com a leitura de palavras e<br />
não-palavras e analisou da<strong>do</strong>s de 156 estudantes em quatro estágios diferentes de<br />
aprendizagem: 50 no nível básico, 57 no intermediário, 34 no intermediário-avança<strong>do</strong> e 15 no<br />
avança<strong>do</strong>. Seu <strong>trabalho</strong> revela que o processo de desaspiração diminui significativamente<br />
conforme aumenta o nível de proficiência <strong>do</strong>s sujeitos. Ela conclui que a formação categórica<br />
de contrastes fonéticos da L2 é dificultada para adultos em razão da experiência linguística <strong>do</strong><br />
falante e não necessariamente na perda da plasticidade resultante da maturação neuronal.<br />
França (2011) trabalha com a aquisição da aspiração das plosivas surdas <strong>do</strong> inglês por<br />
falantes de PB em sua dissertação de mestra<strong>do</strong>. A pesquisa<strong>do</strong>ra analisa os da<strong>do</strong>s de 22<br />
sujeitos com diferentes níveis de proficiência e faz uso da gravação de sentenças-veículo em<br />
língua portuguesa e inglesa. França (2011) levanta os seguintes valores de VOT para o PB:<br />
19,56ms para [p], 21,66ms para [t] e 47,20ms e para [k]. Ela aponta, no entanto, que a<br />
literatura sobre VOT no Brasil é escassa e as médias encontradas foram consideravelmente<br />
maiores <strong>do</strong> que as relatadas por Istre (1983, apud França 2011), que equivalem a 12ms para<br />
[p], 18ms para [t] e 38ms para [k]. A autora nos remete ainda ao <strong>trabalho</strong> de Cho &<br />
Ladefoged (1999), para os quais é preciso que os segmentos apresentem valores de 55ms para<br />
[p], 70ms para [t] e 80ms para [k] a fim de que possam ser considera<strong>do</strong>s aspira<strong>do</strong>s.<br />
Por outro la<strong>do</strong>, quan<strong>do</strong> se trata de da<strong>do</strong>s da língua inglesa obti<strong>do</strong>s de aprendizes<br />
falantes de PB, França (2011) encontra índices de VOT que correspondem a 27,43 para [p],<br />
45,83 para [t] e 58,61 para [k], ou seja, maiores <strong>do</strong> que aqueles apresenta<strong>do</strong>s na L1, o que a<br />
leva a concluir que os aprendizes encontram-se em uma etapa de desenvolvimento em direção<br />
à língua-alvo. Tal conclusão corrobora pesquisas anteriores que mostram que, conforme os<br />
aprendizes adquirem maior proficiência na língua, maiores tendem a ser os índices de VOT na<br />
realização de oclusivas surdas (ZIMMER, 2004).<br />
5 Meto<strong>do</strong>logia<br />
Os da<strong>do</strong>s utiliza<strong>do</strong>s nesta pesquisa foram coleta<strong>do</strong>s em novembro de 2011 junto a <strong>do</strong>is<br />
brasileiros aprendizes de inglês como L2 e <strong>do</strong>is falantes nativos estadunidenses. Os brasileiros<br />
são ambos paranaenses, sen<strong>do</strong> uma informante de Curitiba, com idade de 31 anos e um<br />
informante de Ibaiti, com 24 anos. Na ocasião da coleta, ambos estudavam inglês no Centro<br />
de Línguas da Universidade Federal <strong>do</strong> Paraná, em nível pré-intermediário. Como ambos<br />
relataram ter estuda<strong>do</strong> inglês nesta instituição desde o nível inicial, é possível precisar que os<br />
<strong>do</strong>is informantes contavam com aproximadamente 300 horas de instrução da língua-alvo, o<br />
que acaba por ser um da<strong>do</strong> mais confiável <strong>do</strong> que a flutuante noção de nível préintermediário.<br />
Os informantes estadunidenses são ambos <strong>do</strong> sexo masculino, sen<strong>do</strong> o primeiro um<br />
estudante de 32 anos, originário de Tallahassee, Flórida e o segun<strong>do</strong> natural de Bar Harbor,<br />
Maine. Ambos estavam no Brasil há menos de um ano e, na ocasião da coleta, estudavam<br />
português no Centro de Línguas da Universidade Federal <strong>do</strong> Paraná.<br />
O corpus utiliza<strong>do</strong> contou com monossílabos nos quais as oclusivas surdas [p], [t] e<br />
[k] e as sonoras [b], [d] e [g] estavam em posição inicial inseri<strong>do</strong>s na sentença-veículo “Say<br />
______ to me”. Foram feitas 5 repetições da leitura das sentenças e, a cada repetição, a<br />
ordem de apresentação aleatória das sentenças era modificada. Os da<strong>do</strong>s foram grava<strong>do</strong>s no<br />
4
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
Laboratório de Estu<strong>do</strong>s Fônicos da UFPR (LEFON), que dispõe de cabine com tratamento<br />
acústico.<br />
Por uma questão de tempo, fez-se necessário selecionar apenas parte <strong>do</strong>s da<strong>do</strong>s <strong>do</strong><br />
corpus, o que, entretanto, foi feito com o cuida<strong>do</strong> de incluir os três diferentes pontos de<br />
articulação das oclusivas em inglês de maneira igualitária: três palavras com oclusivas surdas<br />
bilabiais: peach, pack e poot; três alveolares: teed, tap e took; e três velares: keek, cap e cook.<br />
O mesmo se deu com a escolha das sonoras, haven<strong>do</strong> três exemplares de bilabiais: beach,<br />
back e boot; três alveolares: deed, dap e <strong>do</strong>ok; e três velares: geek, gap e gook. As vogais<br />
seguintes também foram selecionadas de mo<strong>do</strong> a sempre incluir uma vogal anterior alta, uma<br />
central baixa e uma posterior alta.<br />
A análise <strong>do</strong>s da<strong>do</strong>s foi feita por intermédio <strong>do</strong> software Praat (Boersma e Weenink,<br />
2012). Após recortarmos todas as sentenças através <strong>do</strong> programa menciona<strong>do</strong>, foi medida a<br />
duração absoluta <strong>do</strong> VOT de cada consoante oclusiva inicial, bem como a duração da<br />
sentença-veículo. Em seguida, calculou-se a duração relativa <strong>do</strong> VOT, ou seja, a porcentagem<br />
de duração <strong>do</strong> VOT em relação à sentença-veículo. Será essa, inclusive, nossa opção para a<br />
apresentação <strong>do</strong>s da<strong>do</strong>s, uma vez que acreditamos ser a duração relativa mais acurada em<br />
relação à duração absoluta, pois corrige quaisquer desvios que venham a existir por conta da<br />
taxa de elocução <strong>do</strong>s informantes.<br />
6 Resulta<strong>do</strong>s<br />
Primeiramente, o foco são as consoantes oclusivas surdas. O que diferencia a produção<br />
de nativos daquela encontrada em aprendizes brasileiros são os níveis de aspiração exibi<strong>do</strong>s<br />
nos <strong>do</strong>is grupos. Para mensurar tais níveis, foi feita uma análise acústica da duração de VOT<br />
presente nos da<strong>do</strong>s, que coincide com a duração <strong>do</strong> evento da aspiração nas oclusivas surdas.<br />
As Figuras 1 e 2 mostram os da<strong>do</strong>s <strong>do</strong> nativo N1 e da aprendiz A2, respectivamente. Ambas<br />
as figuras (1 e 2) exibem a primeira repetição da palavra tap. Destacadas entre linhas<br />
pontilhadas estão as durações absolutas <strong>do</strong> VOT produzi<strong>do</strong> por ambos os informantes na<br />
consoante inicial de tap. O VOT é medi<strong>do</strong> após a ocorrência <strong>do</strong> burst até o primeiro pulso da<br />
vogal seguinte. O burst é um evento típico da produção de oclusivas cuja visualização no<br />
espectrograma se dá por uma barra vertical de cor cinza escura. A duração absoluta de VOT<br />
para o da<strong>do</strong> <strong>do</strong> falante nativo (Fig. 1) é de 82 milissegun<strong>do</strong>s, ao passo que para a aprendiz<br />
brasileira (Fig. 2) a duração é bem menor, ou seja, 9 ms. Esse é um padrão típico para os <strong>do</strong>is<br />
grupos representa<strong>do</strong>s pelos informantes aqui seleciona<strong>do</strong>s.<br />
FIGURA 1: Oscilograma e espectrograma da primeira repetição da palavra tap pelo<br />
informante estadunidense N1. Entre as linhas pontilhadas, destaca-se a duração<br />
absoluta de VOT da consoante inicial [t].<br />
5
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
FIGURA 2: Oscilograma e espectrograma da primeira repetição da palavra tap pela<br />
informante brasileira A2. Entre as linhas pontilhadas, destaca-se a duração absoluta de<br />
VOT da consoante inicial [t].<br />
Embora as Figuras 1 e 2 apresentem as durações absolutas de VOT, to<strong>do</strong>s os da<strong>do</strong>s<br />
neste <strong>trabalho</strong> serão apresenta<strong>do</strong>s em termos de duração relativa, o que quer dizer que<br />
tomaremos a duração absoluta <strong>do</strong> VOT com relação à duração da sentença-veículo.<br />
Quanto à análise <strong>do</strong>s da<strong>do</strong>s, é possível notar que eles corroboram pesquisas anteriores<br />
que atestam a influência <strong>do</strong> ponto de articulação sobre a duração da aspiração. Sabe-se que,<br />
quanto mais posterior o ponto de articulação, mais longa será a aspiração e,<br />
consequentemente, a duração de VOT exibida (Cho e Ladefoged, 1999; Yavas, 2007; Alves,<br />
2011; Stein, 2011; França, 2011).<br />
É exatamente isso que pode ser observa<strong>do</strong> nos da<strong>do</strong>s aqui analisa<strong>do</strong>s. A bilabial [p]<br />
exibiu os menores índices de VOT, a alveolar [t] exibiu níveis intermediários e a velar [k]<br />
exibiu os maiores índices de VOT. Esse fato se repetiu para cada um <strong>do</strong>s informantes, tanto<br />
nativos (N1 e N2) quanto aprendizes (A1 e A2), embora em graus distintos, como mostra o<br />
Gráfico 1.<br />
6
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
GRÁFICO 1: Percentual de aspiração representa<strong>do</strong> pela duração relativa de VOT por<br />
informante para os três diferentes pontos de articulação das consoantes oclusivas<br />
surdas.<br />
O Gráfico 1 deixa claro que, de forma geral, observa-se o aumento da duração da<br />
aspiração conforme a consoante se torna mais posterior. Nos da<strong>do</strong>s <strong>do</strong>s falantes nativos, há<br />
uma diferença acentuada entre a bilabial e os <strong>do</strong>is outros pontos de articulação, que contam<br />
com um nível de aspiração maior. Quanto aos aprendizes, entretanto, a diferença mais<br />
acentuada se dá para a velar [k], que possui nível de aspiração consideravelmente maior em<br />
relação aos <strong>do</strong>is pontos anteriores.<br />
Se fizermos uma média da produção <strong>do</strong>s <strong>do</strong>is nativos e outra da produção <strong>do</strong>s <strong>do</strong>is<br />
aprendizes, confirmaremos esse fato. Para a bilabial [p] os nativos exibem um valor de<br />
duração relativa de VOT igual a 4,69% contra 0,74% <strong>do</strong>s aprendizes. Assim sen<strong>do</strong>, o índice<br />
de VOT e, consequentemente, a aspiração na produção <strong>do</strong>s aprendizes precisa aumentar em<br />
84,23% para se equiparar à <strong>do</strong>s nativos. Com relação à alveolar [t] essa diferença diminui um<br />
pouco, já que produção <strong>do</strong>s nativos exibe um valor de 6,31%, ao passo que os aprendizes<br />
contam com VOT médio de 1,85%, ou seja, 70,68% menor. Finalmente, a produção da<br />
oclusiva velar [k] por aprendizes apresenta valores consideravelmente mais robustos que nos<br />
<strong>do</strong>is primeiros pontos de articulação. Aqui, observa-se que o valor médio de duração relativa<br />
de VOT para os nativos é de 6,62%, enquanto que para os aprendizes é de 3,75%. Em outras<br />
palavras, o VOT na produção <strong>do</strong>s não-nativos deve aumentar em apenas 43,35% a fim de que<br />
possa ser percebida como típica de nativos. Os da<strong>do</strong>s seguem expressos na Tabela 1.<br />
TABELA 1: Média da duração relativa de VOT em consoantes oclusivas surdas para<br />
nativos e aprendizes, seguida da diferença percentual entre elas.<br />
Oclusiva Nativos Aprendizes Diferença em %<br />
[p] 4,69 0,74 84,23<br />
[t] 6,31 1,85 70,68<br />
[k] 6,62 3,75 43,35<br />
Média 5,87 2,11 66,08<br />
7
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
Portanto, a despeito da classificação <strong>do</strong> PB como uma língua desprovida de aspiração,<br />
é possível observar que os aprendizes brasileiros estão certamente aspiran<strong>do</strong> as consoantes<br />
oclusivas surdas quan<strong>do</strong> da sua produção em língua inglesa. Isso pode ser interpreta<strong>do</strong> como<br />
um esforço em direção ao refinamento da pronúncia <strong>do</strong>s aprendizes brasileiros visan<strong>do</strong> a<br />
adequá-la às características <strong>do</strong> sistema fonético-fonológico da L2.<br />
O passo seguinte é observar como se dá a produção das oclusivas sonoras para os <strong>do</strong>is<br />
grupos. Como anteriormente menciona<strong>do</strong>, a língua inglesa caracteriza-se por possuir um VOT<br />
entre -20 ms até +20 ms, o que coincide com as taxas de vozeamento. Valores negativos<br />
ocorrem quan<strong>do</strong> o vozeamento precede o burst em alguns milissegun<strong>do</strong>s (KENT &READ,<br />
1992).<br />
Em uma análise acústica, a duração <strong>do</strong> VOT será calculada, portanto, com base na<br />
observação da presença da barra de sonoridade no espectrograma. Quanto menores os valores<br />
absolutos de VOT, maior é a sonoridade da consoante, uma vez que ela é medida<br />
acusticamente <strong>do</strong> burst para trás.<br />
O primeiro <strong>do</strong>s informantes nativos (N1) causou certa surpresa, pois em boa parte de<br />
seus da<strong>do</strong>s observaram-se valores negativos bem abaixo <strong>do</strong>s -20 ms (Figura 3), o que<br />
aproximaria sua produção daquela apresentada pelos aprendizes brasileiros. Entretanto, é<br />
preciso notar que, em várias ocasiões, o VOT possuía valor zero, o que não ocorreu no grupo<br />
<strong>do</strong>s aprendizes.<br />
FIGURA 3: Oscilograma e espectrograma da segunda repetição da palavra deed pelo<br />
informante estadunidense N1. Entre as linhas pontilhadas, destaca-se a presença da<br />
barra de sonoridade no espaço imediatamente anterior ao burst da consoante inicial [d].<br />
A Figura 3 mostra o oscilograma e espectrograma da segunda repetição da palavra<br />
deed pelo primeiro informante estadunidense. A barra de sonoridade corresponde ao sinal<br />
cinza escuro na parte inferior da janela espectrográfica entre as linhas pontilhadas. É possível<br />
notar que o informante N1 apresentou vozeamento durante toda a oclusão, inclusive no<br />
momento imediatamente anterior à soltura, o que caracteriza um VOT de -108 ms. Esse valor<br />
não é normalmente descrito pela literatura como típico para falantes nativos, mas pode se<br />
dever ao fato de que a consoante oclusiva alveolar está entre <strong>do</strong>is sons vozea<strong>do</strong>s. Ressalta-se,<br />
porém, que apesar de os aprendizes apresentarem índices de VOT muito semelhantes a este, a<br />
diferença fica por conta de que o informante N1 também possui certo número de da<strong>do</strong>s cujo<br />
8
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
VOT é zero. Logo, notar-se-á que na comparação final <strong>do</strong>s da<strong>do</strong>s, os níveis de vozeamento <strong>do</strong><br />
informante N1 figurarão como consideravelmente inferiores.<br />
Por outro la<strong>do</strong>, o segun<strong>do</strong> informante nativo manteve sua produção dentro <strong>do</strong><br />
espera<strong>do</strong>, apresentan<strong>do</strong> VOT de valor zero na maior parte <strong>do</strong>s da<strong>do</strong>s. (Figura 4)<br />
FIGURA 4: Oscilograma e espectrograma da segunda repetição da palavra deed pelo<br />
informante estadunidense N2. Entre as linhas pontilhadas, destaca-se a ausência da<br />
barra de sonoridade no espaço imediatamente anterior ao burst da consoante inicial [d].<br />
A Figura 4 apresenta um da<strong>do</strong> típico <strong>do</strong> informante N2. A palavra escolhida também<br />
foi a segunda repetição de deed e a parte em destaque nos mostra o momento da oclusão.<br />
Nota-se que barra de sonoridade está presente em boa parte da oclusão, mas se desfaz antes de<br />
ocorrer o burst. Isso quer dizer que o VOT nesse da<strong>do</strong> corresponde a zero. É possível ainda<br />
acompanhar no oscilograma que o sinal se desfaz antes <strong>do</strong> burst, prova de que o vozeamento<br />
que observamos na oclusão não faz parte <strong>do</strong> VOT, mas da vogal precedente.<br />
Quanto aos aprendizes (A1 e A2), não houve grandes surpresas. Ambos apresentam<br />
VOT absoluto de valor negativo de maneira consistente através <strong>do</strong>s da<strong>do</strong>s. Isso garantirá<br />
maiores níveis de vozeamento quan<strong>do</strong> da comparação com os da<strong>do</strong>s <strong>do</strong>s nativos, pois apesar<br />
de termos produções aparentemente atípicas <strong>do</strong> informante N1 que, por vezes, equiparam-se<br />
às produções <strong>do</strong>s aprendizes, estes apresentaram valores absolutos de VOT ainda mais baixos<br />
em boa parte <strong>do</strong>s da<strong>do</strong>s e, além disso, não contaram com VOT zero ou próximo de zero. A<br />
figura 5 mostra a terceira repetição de deed pelo informante A2.<br />
9
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
FIGURA 5: Oscilograma e espectrograma da terceira repetição da palavra deed pelo<br />
aprendiz brasileiro A2. Entre as linhas pontilhadas, destaca-se a barra de sonoridade no<br />
espaço imediatamente anterior ao burst da consoante inicial [d].<br />
A Figura 5 mostra um da<strong>do</strong> típico <strong>do</strong> informante A2. A barra de sonoridade aparece<br />
nitidamente no espectrograma entre as linhas pontilhadas e sinaliza um VOT de -201ms, o<br />
que demonstra uma tendência ao vozeamento muito mais robusta para os aprendizes, mesmo<br />
em relação à produção atípica <strong>do</strong> informante estadunidense N1, cujo valor de VOT foi de -<br />
102ms no mesmo da<strong>do</strong>.<br />
Passemos agora à comparação da produção de cada um <strong>do</strong>s informantes no Gráfico 2.<br />
Vale lembrar que os valores aqui não são negativos, pois estamos lidan<strong>do</strong> com a porcentagem<br />
<strong>do</strong> valor absoluto com relação à sentença-veículo.<br />
GRÁFICO 2: Percentual de vozeamento representa<strong>do</strong> pela duração relativa de VOT<br />
por informante para os três diferentes pontos de articulação das consoantes oclusivas<br />
sonoras.<br />
10
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
Diferentemente <strong>do</strong> que ocorreu com as oclusivas surdas, não foi possível observar um<br />
padrão geral de comportamento no que se refere ao ponto de articulação das consoantes.<br />
Ambos os nativos apresentaram duração relativa de VOT em níveis consideráveis (6,5% e<br />
3,95%) para a bilabial [b]. Quanto aos demais pontos de articulação, o informante N1 exibiu<br />
duração relativa de VOT em níveis que seriam considera<strong>do</strong>s altos para um nativo (6,91% para<br />
[d] e 4,43% para [g]), ao passo que o informante N2 exibiu valores bem mais baixos (1,38%<br />
para [d] e 0,27% para [g]). No que tange aos aprendizes, os valores não diferiram muito de<br />
um informante para outro, assim como não diferiram de maneira considerável quanto ao<br />
ponto de articulação.<br />
O passo seguinte é, como fizemos com as consoantes surdas, encontrarmos a média<br />
da produção <strong>do</strong>s <strong>do</strong>is nativos e a <strong>do</strong>s <strong>do</strong>is aprendizes. Nota-se que para a bilabial [b] os<br />
nativos exibiram um valor de duração relativa de VOT igual a 5,23% contra 11,38% <strong>do</strong>s<br />
aprendizes. Como neste caso a referência são as sonoras, a duração relativa de VOT <strong>do</strong>s<br />
aprendizes precisaria diminuir ao invés de aumentar para que se equipare a duração exibida<br />
pelos nativos. O valor de VOT relativo ou, em outras palavras, o índice de sonoridade na<br />
produção <strong>do</strong>s aprendizes, precisaria diminuir em 53,76%.<br />
Com relação à alveolar [d] e à velar [g], o esforço precisaria ser progressivamente<br />
maior, já que na produção <strong>do</strong>s aprendizes a duração relativa de VOT deveria ser 58,2% menor<br />
para [d] e 74,87% menor para [g]. Temos os da<strong>do</strong>s <strong>completo</strong>s na Tabela 2.<br />
TABELA 2: Média da duração relativa de VOT em consoantes oclusivas sonoras para<br />
nativos e aprendizes, seguida da diferença percentual entre elas.<br />
Oclusiva Nativos Aprendizes Diferença em %<br />
/b/ 5,23 11,31 53,76<br />
/d/ 4,10 9,81 58,2<br />
/g/ 2,35 9,35 74,87<br />
Média 3,89 10,15 62,27<br />
Com os da<strong>do</strong>s de nativos e aprendizes agrupa<strong>do</strong>s por média, encontramos um padrão<br />
que faltava ao analisar os da<strong>do</strong>s <strong>do</strong>s informantes separadamente. Aqui, é possível notar que a<br />
produção <strong>do</strong>s nativos exibe valores de duração relativa de VOT progressivamente menores,<br />
quanto mais posterior é o ponto de articulação. Em outras palavras, a bilabial exibe<br />
vozeamento maior que a alveolar, que exibe vozeamento maior que a velar. Entretanto, os<br />
aprendizes apresentam índices bastante próximos de vozeamento para três pontos de<br />
articulação, algo em torno de 10% em relação à sentença-veículo.<br />
7 Discussão<br />
Os da<strong>do</strong>s obti<strong>do</strong>s nos permitem vislumbrar que aprendizes brasileiros de inglês e falantes<br />
nativos norte-americanos produzem tanto oclusivas surdas quanto sonoras de maneira distinta.<br />
No entanto, essa diferença não se dá em termos de presença ou ausência de uma dada<br />
característica fonológica, como geralmente se assume em abordagens tradicionais de<br />
aquisição de língua estrangeira. O que o da<strong>do</strong> fonético nos permite ver é que tanto a aspiração<br />
quanto à sonoridade ocorrem na fala <strong>do</strong>s <strong>do</strong>is grupos, porém em níveis distintos. Tal olhar<br />
implica assumir uma perspectiva dinâmica de aquisição de LE, na qual o primitivo de análise<br />
11
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
passa a ser o gesto articulatório 3 . Sob essa perspectiva, o que está em jogo não é a aquisição<br />
de um aspecto fonológico absolutamente novo por parte <strong>do</strong>s aprendizes, mas a tentativa de<br />
aprimorar algo que eles já produzem, organizan<strong>do</strong> e coordenan<strong>do</strong> os gestos articulatórios de<br />
maneira distinta. Em última instância, professores e aprendizes podem partir de uma produção<br />
já existente e concentrar esforços visan<strong>do</strong> seu refinamento.<br />
8 Conclusões<br />
A presente pesquisa procurou investigar a produção de oclusivas em posição inicial<br />
por aprendizes brasileiros, comparan<strong>do</strong>-a com a produção de nativos. Através da análise<br />
acústica <strong>do</strong>s índices de VOT presentes nos da<strong>do</strong>s, foi possível vislumbrar os percentuais de<br />
diferença que separam a produção de aprendizes daquela exibida por nativos. Assim, acreditase<br />
estar contribuin<strong>do</strong> para a formulação e execução de futuras estratégias que visem o<br />
refinamento da produção de nossos aprendizes em relação à língua-alvo.<br />
Referências<br />
ALVES, M. A. Production of English and Portuguese Voiceless stops by Brazilian speakers.<br />
Dissertação – Mestra<strong>do</strong> em Letras. Florianópolis: UFSC, 2011.<br />
BOERSMA, P & WEENINK, D. Praat: <strong>do</strong>ing phonetics by computer. (Version 5303).<br />
Amsterdam: University of Amsterdam, 2012.<br />
CHO, T. & LADEFOGED, P. Variation and universals in VOT: evidence from 18 languages.<br />
Journal of Phonetics, 27, p.207-227, 1999. Disponível em: http://tcho.hanyang.ac.kr/papers/<br />
Cho_Ladefoged_VOT_JPhon_1999_rf.pdf> Acesso em: 15 mar. 2012<br />
FRANÇA, K. V. A aquisição da aspiração das plosivas surdas <strong>do</strong> inglês por falantes de<br />
português brasileiro: implicações teóricas decorrentes de duas diferentes formas de<br />
descrição <strong>do</strong>s da<strong>do</strong>s. Dissertação (Mestra<strong>do</strong> em Letras). Pelotas: Universidade Católica de<br />
Pelotas, 2011.<br />
LADEFOGED, P. American English. In: Handbook of the International Phonetic Association.<br />
A guide to the use of the International Phonetic Alphabet. Cambridge: Cambridge University<br />
Press, 1999.<br />
LISKER, L.; ABRAMSON A. A cross-language study of voicing in initial stops: acoustical<br />
measurements. Words, 20, p.384-422, 1964. Disponível em: < http://www.haskins.yale.edu/<br />
Reprints/HL0053.pdf> Acesso em: 15 mar. 2012.<br />
KENT, R.D. & READ, C. The Acoustic Analysis of Speech. San Diego: Singular Publishing<br />
Group, 1992.<br />
STEIN, C. C. Adequação <strong>do</strong>s gestos articulatórios típicos das consoantes oclusivas no inglês<br />
ao português brasileiro. In: VII Congresso Internacional da Abralin, 2011, Curitiba-PR.<br />
Anais <strong>do</strong> VII Congresso Internacional da Abralin, v. 1, p. 802-815,Curitiba, 2011. Disponível<br />
em Acesso em: 15 jan.<br />
2012.<br />
YAVAS, M. Factors Influencing the VOT of English Long Lag Stops and Interlanguage<br />
Phonology. In: New Sounds 2007: Proceedings of the Fifth International Symposium on the<br />
Acquisition of Second Language Speech. Universidade Federal de Santa Catarina.<br />
Florianópolis, p. 492-498, 2007 Disponível em: < http://www.nupffale.ufsc.br/newsounds/<br />
Papers/45.Yavas_Mehmet.pdf>. Acesso em: 22 dez. 2011.<br />
3 Gesto articulatório é o primitivo de análise utiliza<strong>do</strong> na Fonologia Gestual. O leitor encontrará mais detalhes<br />
em Browman & Goldstein, 1992.<br />
12
Anais <strong>do</strong> X Encontro <strong>do</strong> <strong>CELSUL</strong> – Círculo de Estu<strong>do</strong>s Linguísticos <strong>do</strong> Sul<br />
UNIOESTE - Universidade Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná<br />
Cascavel-PR | 24 a 26 de outubro de 2012 | ISSN 2178-7751<br />
ZIMMER, M. C. A desaspiração de plosivas surdas iniciais na transferência <strong>do</strong><br />
conhecimento fonético <strong>do</strong> português brasileiro (L1) para o inglês (L2). Anais <strong>do</strong> 6º Encontro<br />
<strong>do</strong> Celsul. Florianópolis, 2004. Disponível em: < http://www.celsul.org.br/Encontros<br />
/06/Individuais/08.pdf>. Acesso em: 15 mar. 2012.<br />
13