11.07.2015 Views

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

−∑H x / y)= p .ln( p / p )[3](ij ij ie <strong>de</strong> modo inverso, a entropia <strong>de</strong> y <strong>da</strong>do x é:−∑H y / x)= p .ln( p / p )[4](ij i j ja incerteza <strong>de</strong> y <strong>da</strong>do x, U (y|x), é:[ H ( y)− H ( y / x)]U ( y / x)= [5]H ( y)U (y|x) dá uma idéia <strong>da</strong> fração <strong>de</strong> y que é redun<strong>da</strong>nte com a informação em x, contudoessa relação é exponencial e não linear. Os mapas x e y po<strong>de</strong>m ser tratadossimetricamente <strong>para</strong> <strong>da</strong>r a incerteza <strong>de</strong> informações conjuntas, U (x, y):[ H ( y)+ H ( x)− H ( x,y)]U ( x / y)= [6]H ( y)+ H ( x)Se o mapa predito for y e o mapa <strong>de</strong> treinamento é x, U (y|x) é a medi<strong>da</strong> <strong>da</strong> força <strong>da</strong>previsão. O coeficiente <strong>de</strong> incerteza simétrico, U (x, y), é mais apropriado <strong>para</strong>com<strong>para</strong>r os resultados <strong>de</strong> dois métodos <strong>para</strong> fazer previsões <strong>de</strong> mapa.A construção <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão tem, então, três objetivos: diminuir aentropia (aleatorie<strong>da</strong><strong>de</strong> <strong>da</strong> variável objetivo), ser consistente com o conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> epossuir o menor número <strong>de</strong> nós.Uma árvore <strong>de</strong> <strong>de</strong>cisão tem, portanto, a função <strong>de</strong> subdividir recursivamente umconjunto <strong>de</strong> treinamento, até que ca<strong>da</strong> subconjunto obtido <strong>de</strong>sta subdivisão contenhacasos <strong>de</strong> uma única classe. Para atingir esta meta, a técnica <strong>de</strong> árvores <strong>de</strong> <strong>de</strong>cisãoexamina e com<strong>para</strong> a distribuição <strong>de</strong> classes durante a construção <strong>da</strong> árvore. O resultadoobtido, após a construção <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão são <strong><strong>da</strong>dos</strong> organizados <strong>de</strong> maneiracompacta, que são utilizados <strong>para</strong> classificar novos casos (HOLSHEIMER & SIEBES,1994). A partir <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão é possível <strong>de</strong>rivar regras. As regras sãoescritas consi<strong>de</strong>rando o trajeto do nó raiz até uma folha <strong>da</strong> árvore.A avaliação <strong>da</strong> árvore <strong>de</strong> <strong>de</strong>cisão foi realiza<strong>da</strong> através <strong>da</strong> utilização <strong>de</strong> <strong><strong>da</strong>dos</strong> quenão tenham sido usados no treinamento. Esta estratégia permite estimar como a árvoregeneraliza os <strong><strong>da</strong>dos</strong> e se a<strong>da</strong>pta a novas situações, po<strong>de</strong>ndo, também, estimar aproporção <strong>de</strong> erros e acertos ocorridos na sua construção (BRAZDIL, 2008). Essasmatrizes <strong>de</strong> erros po<strong>de</strong>m ser avalia<strong>da</strong>s através do índice Kappa (equação 7), que me<strong>de</strong> omontante dos <strong><strong>da</strong>dos</strong> que estão em concordância com o mo<strong>de</strong>lo e corrige os <strong><strong>da</strong>dos</strong>21

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!