05.08.2013 Views

ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA

ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA

ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

X <strong>SBA</strong>I – Simpósio Brasileiro de Automação Inteligente<br />

18 a 21 de setembro de 2011<br />

São João del-Rei - MG - Brasil<br />

efetuados, os resultados do F<strong>ID3</strong> não superaram<br />

os do <strong>ID3</strong>.<br />

Já o algoritmo aqui proposto não utiliza nenhum<br />

cálculo existente no <strong>ID3</strong>, apenas a ideia de<br />

escolher atributos para construir a árvore de decisão.<br />

Em vez disso, o <strong>ID3</strong>-<strong>RMF</strong> apresenta um cálculo<br />

todo baseado no conceito de funções de pertinência<br />

aproximada, possibilitando o tratamento<br />

de informações incertas e, consequentemente, uma<br />

maior capacidade de aprendizado em determinados<br />

casos.<br />

Por outro lado, esse cálculo é baseado em interseções<br />

entre conjuntos e acarreta em um tempo<br />

de treinamento maior em relação ao tempo gasto<br />

pelo cálculo do ganho de informação que, por sua<br />

vez, apenas conta elementos e, com isso, tem um<br />

tempo de execução bem inferior. Essa velocidade<br />

pode ser constatada na Tabela 2, em que o tempo<br />

de treinamento (quesito H ) do <strong>ID3</strong> foi inferior ao<br />

seu tempo de teste (quesito I ).<br />

Com isso, conforme pode ser observado na Tabela<br />

3, o <strong>ID3</strong>-<strong>RMF</strong> conseguiu obter o mesmo grau<br />

de suporte do <strong>ID3</strong> com um número menor de regras,<br />

o que evidencia essa maior capacidade em<br />

algumas situações. Na base KDD99, o <strong>ID3</strong> se mostrou<br />

melhor mas com pouca diferença em relação<br />

ao algoritmo aqui proposto.<br />

7 Conclusão<br />

O algoritmo proposto se mostrou, nos testes<br />

efetuados, bastante estável em diferentes bases,<br />

com diferentes números de dados e atributos e diferentes<br />

tipos de classificação (binária e não binária),<br />

e com uma capacidade de aprendizado e<br />

generalização equivalentes a algoritmos já consagrados<br />

na literatura, como o <strong>ID3</strong> clássico e o RS1.<br />

Com relação ao tempo de execução, o <strong>ID3</strong>-<br />

<strong>RMF</strong> foi um pouco mais lento que o <strong>ID3</strong> clássico,<br />

porém muito mais rápido e igualmente eficiente ao<br />

o RS1. Essa perda no tempo de execução para o<br />

<strong>ID3</strong> pode ser compensada pelo fato de o <strong>ID3</strong>-<strong>RMF</strong><br />

ser inspirado na Teoria de Conjuntos Aproximados,<br />

que é um formalismo matemático proposto<br />

para representação de incerteza. Além disso, esse<br />

formalismo também é largamente utilizado para<br />

indução de conhecimento e possui propostas atuais,<br />

conforme pode ser visto nos trabalhos de Li<br />

and Dong (2008) e Ding et al. (2009).<br />

Como o algoritmo aqui proposto conta com<br />

esse formalismo matemático não só para induzir<br />

conhecimento, mas também para a representação<br />

de incerteza (a indiscernibilidade), ele se mostra,<br />

em determinadas situações, mais capaz de descobrir<br />

conhecimento que o <strong>ID3</strong> clássico, que constrói<br />

uma árvore de decisão sem tratar, e sequer analisar,<br />

informações incertas.<br />

Além disso, como visto em (Uchôa, 1998), a<br />

função de pertinência aproximada é o elo de ligação<br />

entre a TCA e a Teoria de Conjuntos Fuzzy,<br />

que é outro formalismo consagrado e largamente<br />

utilizado para indução de conhecimento e representação<br />

de incerteza, possibilitando uma extensão<br />

do algoritmo <strong>ID3</strong>-<strong>RMF</strong> com conceitos da TCF<br />

de uma maneira relativamente simples e imediata.<br />

Como trabalho futuro, além da combinação<br />

do algoritmo aqui proposto com a TCF, está a<br />

melhoria desse algoritmo utilizando características<br />

próprias da TCA, com o objetivo de diminuir seu<br />

tempo de execução e aumentar seu grau de suporte<br />

e sua capacidade de induzir conhecimento.<br />

8 Agradecimentos<br />

Os autores agradecem À FAPEMIG, pelo apoio<br />

recebido durante a realização deste trabalho.<br />

Referências<br />

Ding, B., Zheng, Y. and Zang, S. (2009). A New Decision<br />

Tree Algorithm Based on Rough Set Theory,<br />

Asia-Pacific Conference on Information Processing<br />

.<br />

Du, W., Li, H., Gao, Y. and Meng, D. (2005). Another<br />

Kind of Fuzzy Rough Sets, IEEE International<br />

Conference on Granular Computing 1: 145.<br />

Dubois, D. and Prade, H. (1992). Intelligent Decision<br />

Support: Handbook of Applications and Advances<br />

of the Sets Theory, Kluwer, Dordrecht, chapter<br />

Putting fuzzy sets and rough sets together,<br />

pp. 203–232.<br />

Li, X. and Dong, M. (2008). An Algorithm for Constructing<br />

Decision Tree Based on Variable Precision<br />

Rough Set Model, Fourth International Conference<br />

on Natural Computation 1: 280.<br />

Pawlak, Z. (1982). Rough sets., International Journal<br />

of Computer and Information Sciences. pp. 341–<br />

356.<br />

Quinlan, J. R. (1986). Induction of Decision Trees,<br />

Machine Learning 1: 81–106.<br />

Shaw, M. J. and Gentry, J. A. (1990). Inductive learning<br />

for risk classification., IEEE Expert pp. 47–<br />

53.<br />

Uchôa, J. Q. (1998). Representação e indução de conhecimento<br />

usando teoria de conjuntos aproximados,<br />

Master’s thesis, UFScar.<br />

Wang, H., Ma, C. and Zhou, L. (2009). A Brief Review<br />

of Machine Learning and its Application.,<br />

Information Engineering and Computer Science.<br />

.<br />

Wong, S. K. M. and Ziarko, W. (1986). Comparison<br />

of rough-set and statistical methods in inductive<br />

learning., Internacional Journal of Man-Machine<br />

Studies 24: 53–72.<br />

Xue, M. and Zhu, C. (2009). A Study and Application<br />

on Machine Learning of Artificial Intellligence.,<br />

International Joint Conference on Artificial Intelligence.<br />

.<br />

Ziarko, W. (1993). Variable Precision Rough Set Model,<br />

Journal of Computer and System Sciences<br />

46: 39–59.<br />

ISSN: 2175-8905 - Vol. X 74

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!