As determinantes locais da paradiplomacia: o caso dos municípios ...
As determinantes locais da paradiplomacia: o caso dos municípios ...
As determinantes locais da paradiplomacia: o caso dos municípios ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
É possível calcular o log-likelihood para vários modelos e compará-los pelas<br />
diferenças de seus resulta<strong>dos</strong>. Isso pode ser utilizado na comparação de um modelo específico<br />
com um modelo-base. O modelo básico geralmente utilizado é aquele que considera apenas a<br />
constante. Fez-se uso até agora <strong>da</strong>s médias (porque era o mais simples existente), entretanto,<br />
seria ilógico usar o modelo <strong>da</strong> média quando a variável dependente só pode assumir dois<br />
valores (geralmente 0 e 1), porque sua média não representa na<strong>da</strong> <strong>da</strong>s observações.<br />
Caso se saiba a frequência com que aparecem os 0s e 1s, o melhor modelo seria<br />
aquele que previsse qual <strong>dos</strong> dois aparece mais. Suponha-se que há uma amostra com 100<br />
ci<strong>da</strong>des e que em 70 delas há área internacional (a presença <strong>da</strong> área é a variável dependente),<br />
então o melhor modelo seria aquele que prevê que o evento acontece (70 contra 30). <strong>As</strong>sim<br />
como na regressão múltipla, o modelo base é o que dá uma melhor previsão quando não existe<br />
nenhuma informação disponível além <strong>da</strong> VD. No <strong>caso</strong> logístico, ele é aquele que o resultado<br />
ocorre com maior frequência.<br />
Pode-se, portanto, pegar o modelo novo (o que foi escolhido) e subtrair dele o<br />
modelo base (aquele que só inclui a constante ou que ignora as variáveis) para calcular a<br />
melhoria do modelo, a representação numérica desse processo é <strong>da</strong><strong>da</strong> por:<br />
<br />
( )<br />
Percebe-se que a subtração é multiplica<strong>da</strong> por dois. Isso acontece para conseguir o<br />
resultado numa distribuição qui-quadrado. Não serão explica<strong>da</strong>s quais as especifici<strong>da</strong>des<br />
dessa distribuição, é suficiente saber que ela facilita a tarefa de calcular a significância do<br />
valor. Também foram apresenta<strong>dos</strong> os graus de liber<strong>da</strong>de (degrees of freedom, df) <strong>da</strong><br />
distribuição qui-quadrado.<br />
O log-likelihood tem a capaci<strong>da</strong>de de substituir na regressão logística a função do R²,<br />
e por consequência o R, porque pode comparar os resulta<strong>dos</strong> previstos e observa<strong>dos</strong> <strong>da</strong> VD;<br />
existe, entretanto outra forma de representar mais diretamente a ideia dessas duas medi<strong>da</strong>s. Na<br />
regressão logística a versão <strong>da</strong> correlação múltipla é <strong>da</strong><strong>da</strong> pela estatística-R. Ela é a correlação<br />
parcial entre a variável dependente e ca<strong>da</strong> uma <strong>da</strong>s variáveis independentes e assume valores<br />
que vão de –1 a +1. Um valor positivo significa que quando uma VI aumenta, a chance de o<br />
evento ocorrer também cresce, já um valor negativo quer dizer que quando a VI aumenta, a<br />
chance de o evento ocorrer diminui. Na mesma lógica, se uma VI possui valor pequeno de R,<br />
então ela contribui pouco para o modelo.<br />
Identifica-se a representação de R pela equação:<br />
189