As determinantes locais da paradiplomacia: o caso dos municípios ...
As determinantes locais da paradiplomacia: o caso dos municípios ...
As determinantes locais da paradiplomacia: o caso dos municípios ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
segundo nas falhas de seleção <strong>dos</strong> pesquisadores ao trabalharem com esse tipo de evento. No<br />
primeiro, são sugeri<strong>da</strong>s correções de cálculos para que os eventos raros não passem<br />
despercebi<strong>dos</strong>. No segundo, são elabora<strong>dos</strong> conselhos para que os pesquisadores coletem<br />
menos <strong>caso</strong>s e melhorem os critérios de escolha <strong>da</strong>s variáveis independentes (com <strong>da</strong><strong>dos</strong> mais<br />
robustos).<br />
De forma específica, entendem que sempre há um trade off entre coletar mais<br />
observações e incluir melhores ou mais variáveis independentes. Nos <strong>da</strong><strong>dos</strong> de eventos raros,<br />
o temor de coletar bases de <strong>da</strong><strong>dos</strong> com não-eventos ou poucos eventos levou os pesquisadores<br />
a coletarem um grande número de <strong>caso</strong>s com poucas variáveis independentes ou com uma<br />
quanti<strong>da</strong>de satisfatória de VI, mas com mensuração pobre. Na ver<strong>da</strong>de, a decisão de se ocupar<br />
com uma grande quanti<strong>da</strong>de de observações, para conseguir alguns 1s a mais, representa<br />
menos tempo para selecionar boas variáveis independentes e, muitas vezes, incorrem em<br />
maiores custos financeiros para a pesquisa. Essas condicionali<strong>da</strong>des tornam as estratégias de<br />
coleta e seleção ineficientes.<br />
Além disso, segundo os autores, modelos como o logit ou o probit não executam<br />
muito bem a tarefa de prever eventos raros. Muitas vezes, os coeficientes do logit podem ser<br />
enviesa<strong>dos</strong> em pequenas amostras (convenciona<strong>da</strong>s como menos de 200 observações).<br />
Mesmo em amostras grandes existe a probabili<strong>da</strong>de de um evento ser subestimado se ele se<br />
tratar de um evento raro. O relogit tenta corrigir, tanto os vieses <strong>dos</strong> eventos raros quanto os<br />
de amostras pequenas, já que ambos os problemas são similares, na medi<strong>da</strong> em que exprimem<br />
a falta de informações presentes nos <strong>da</strong><strong>dos</strong>.<br />
A conclusão é a de que o logit subestima a probabili<strong>da</strong>de de um evento e isso se<br />
aprofun<strong>da</strong> quanto mais raros os eventos se tornam. A noção por trás disso se refere aos erros<br />
de classificação, ou seja, a habili<strong>da</strong>de de aferir corretamente um ponto de corte para distinguir<br />
1s de 0s. Quando os eventos são raros há uma tendência de favorecer os não-eventos em<br />
detrimento <strong>dos</strong> eventos. Isso é até intuitivo, porque se dispõem de mais informações sobre os<br />
zeros do que sobre os 1s e, portanto, há maior facili<strong>da</strong>de para classificá-los.<br />
King e Zeng (2001a, 2001b) apresentam esses vieses de forma gráfica e por meio de<br />
cálculos. Para este estudo, basta detectar a existência desse tipo de viés decorrente <strong>dos</strong><br />
problemas de seleção e subestimação. A proposta de modelo <strong>dos</strong> autores busca ultrapassar<br />
esses obstáculos. Eles propõem que os pesquisadores de eventos raros busquem coletar to<strong>dos</strong><br />
os 1s possíveis e uma amostra aleatória de 0s. Na econometria, essa técnica é chama<strong>da</strong> de<br />
choice-based sampling e na bioestatística, de case control studies. A ideia é que de posse <strong>da</strong><br />
proporção de 1s na população, possa-se utilizar esse valor para corrigir a equação quando uma<br />
amostra aleatória de 0s é utiliza<strong>da</strong>. A partir <strong>da</strong>í pode-se, por meio de comparação, ver qual o<br />
195