11.07.2015 Views

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>de</strong>pen<strong>de</strong>nte <strong>da</strong> quali<strong>da</strong><strong>de</strong> <strong>da</strong> amostra. Como o algoritmo divi<strong>de</strong> recursivamente oconjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> <strong>de</strong> treinamento original, as divisões vão sendo avalia<strong>da</strong>s comamostras ca<strong>da</strong> vez menores. Isto significa que as estimativas <strong>de</strong> erro têm menos acuráciaà medi<strong>da</strong> que a árvore cresce.Com intuito <strong>de</strong> diminuir o número <strong>de</strong> regras gera<strong>da</strong>s, minimizar este problema eevitar o super ajustamento dos <strong><strong>da</strong>dos</strong> <strong>de</strong> treinamento com árvores muito complexasrealizou-se a po<strong>da</strong>.Nesse estudo foi utilizado o método <strong>da</strong> pré-po<strong>da</strong>, na qual o crescimento <strong>da</strong>árvore é interrompido antes que a divisão seja consi<strong>de</strong>ra<strong>da</strong> não-confiável. Esse métodousa um procedimento “passo único”. Este algoritmo corre através dos nós <strong>da</strong> árvore ou“<strong>de</strong> baixo <strong>para</strong> cima” ou “<strong>de</strong> cima <strong>para</strong> baixo”, <strong>de</strong>cidindo <strong>para</strong> ca<strong>da</strong> nó, se a po<strong>da</strong><strong>de</strong>veria ser realiza<strong>da</strong> <strong>de</strong> acordo com algum critério <strong>de</strong> avaliação.Assim, foram <strong>de</strong>fini<strong>da</strong>s três classes <strong>de</strong> po<strong>da</strong>, 20, 50 e 100, sendo que essesnúmeros representam o número mínimo <strong>de</strong> pixels que as regras <strong>de</strong>vem chegar até que seencontre uma uni<strong>da</strong><strong>de</strong> <strong>de</strong> mapeamento <strong>de</strong> <strong>solo</strong> (folha <strong>da</strong> árvore). A partir <strong>da</strong> observação<strong>da</strong> tabela 14 é possível verificar que há uma diminuição do tamanho <strong>da</strong> árvore e nonúmero <strong>de</strong> regras gera<strong>da</strong>s com o aumento <strong>da</strong> po<strong>da</strong>, o que já era esperado. Assim, 48regras foram elimina<strong>da</strong>s com o aumento <strong>da</strong> po<strong>da</strong> <strong>de</strong> 20 <strong>para</strong> 100, enquanto aporcentagem do mo<strong>de</strong>lo permaneceu por volta <strong>de</strong> 54,9 % <strong>de</strong> acurácia. Esses resultadosindicam que algumas regras são essenciais no <strong>de</strong>senvolvimento do mo<strong>de</strong>lo, enquantooutras apenas aumentam a complexi<strong>da</strong><strong>de</strong> <strong>de</strong>ste, além <strong>de</strong> não contribuírem <strong>para</strong> oaumento <strong>de</strong> acurácia.Tabela 14 – Diferentes classes <strong>de</strong> po<strong>da</strong>s aplica<strong>da</strong>s nos <strong><strong>da</strong>dos</strong> com a melhor acurácia geral.Classes <strong>de</strong> po<strong>da</strong> Regras Acurácia (%)20 212 54,9550 178 54,94100 164 54,91A partir <strong>de</strong> testes <strong>de</strong> entropia e qui-quadrado foi possível verificar orankeamento dos atributos quanto à contribuição no mo<strong>de</strong>lo gerado. A tabela 15 ilustraa or<strong>de</strong>m <strong>de</strong> importância <strong>para</strong> a folha São Pedro <strong>para</strong> os dois testes.66

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!