ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA
ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA
ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
X <strong>SBA</strong>I – Simpósio Brasileiro de Automação Inteligente<br />
18 a 21 de setembro de 2011<br />
São João del-Rei - MG - Brasil<br />
efetuados, os resultados do F<strong>ID3</strong> não superaram<br />
os do <strong>ID3</strong>.<br />
Já o algoritmo aqui proposto não utiliza nenhum<br />
cálculo existente no <strong>ID3</strong>, apenas a ideia de<br />
escolher atributos para construir a árvore de decisão.<br />
Em vez disso, o <strong>ID3</strong>-<strong>RMF</strong> apresenta um cálculo<br />
todo baseado no conceito de funções de pertinência<br />
aproximada, possibilitando o tratamento<br />
de informações incertas e, consequentemente, uma<br />
maior capacidade de aprendizado em determinados<br />
casos.<br />
Por outro lado, esse cálculo é baseado em interseções<br />
entre conjuntos e acarreta em um tempo<br />
de treinamento maior em relação ao tempo gasto<br />
pelo cálculo do ganho de informação que, por sua<br />
vez, apenas conta elementos e, com isso, tem um<br />
tempo de execução bem inferior. Essa velocidade<br />
pode ser constatada na Tabela 2, em que o tempo<br />
de treinamento (quesito H ) do <strong>ID3</strong> foi inferior ao<br />
seu tempo de teste (quesito I ).<br />
Com isso, conforme pode ser observado na Tabela<br />
3, o <strong>ID3</strong>-<strong>RMF</strong> conseguiu obter o mesmo grau<br />
de suporte do <strong>ID3</strong> com um número menor de regras,<br />
o que evidencia essa maior capacidade em<br />
algumas situações. Na base KDD99, o <strong>ID3</strong> se mostrou<br />
melhor mas com pouca diferença em relação<br />
ao algoritmo aqui proposto.<br />
7 Conclusão<br />
O algoritmo proposto se mostrou, nos testes<br />
efetuados, bastante estável em diferentes bases,<br />
com diferentes números de dados e atributos e diferentes<br />
tipos de classificação (binária e não binária),<br />
e com uma capacidade de aprendizado e<br />
generalização equivalentes a algoritmos já consagrados<br />
na literatura, como o <strong>ID3</strong> clássico e o RS1.<br />
Com relação ao tempo de execução, o <strong>ID3</strong>-<br />
<strong>RMF</strong> foi um pouco mais lento que o <strong>ID3</strong> clássico,<br />
porém muito mais rápido e igualmente eficiente ao<br />
o RS1. Essa perda no tempo de execução para o<br />
<strong>ID3</strong> pode ser compensada pelo fato de o <strong>ID3</strong>-<strong>RMF</strong><br />
ser inspirado na Teoria de Conjuntos Aproximados,<br />
que é um formalismo matemático proposto<br />
para representação de incerteza. Além disso, esse<br />
formalismo também é largamente utilizado para<br />
indução de conhecimento e possui propostas atuais,<br />
conforme pode ser visto nos trabalhos de Li<br />
and Dong (2008) e Ding et al. (2009).<br />
Como o algoritmo aqui proposto conta com<br />
esse formalismo matemático não só para induzir<br />
conhecimento, mas também para a representação<br />
de incerteza (a indiscernibilidade), ele se mostra,<br />
em determinadas situações, mais capaz de descobrir<br />
conhecimento que o <strong>ID3</strong> clássico, que constrói<br />
uma árvore de decisão sem tratar, e sequer analisar,<br />
informações incertas.<br />
Além disso, como visto em (Uchôa, 1998), a<br />
função de pertinência aproximada é o elo de ligação<br />
entre a TCA e a Teoria de Conjuntos Fuzzy,<br />
que é outro formalismo consagrado e largamente<br />
utilizado para indução de conhecimento e representação<br />
de incerteza, possibilitando uma extensão<br />
do algoritmo <strong>ID3</strong>-<strong>RMF</strong> com conceitos da TCF<br />
de uma maneira relativamente simples e imediata.<br />
Como trabalho futuro, além da combinação<br />
do algoritmo aqui proposto com a TCF, está a<br />
melhoria desse algoritmo utilizando características<br />
próprias da TCA, com o objetivo de diminuir seu<br />
tempo de execução e aumentar seu grau de suporte<br />
e sua capacidade de induzir conhecimento.<br />
8 Agradecimentos<br />
Os autores agradecem À FAPEMIG, pelo apoio<br />
recebido durante a realização deste trabalho.<br />
Referências<br />
Ding, B., Zheng, Y. and Zang, S. (2009). A New Decision<br />
Tree Algorithm Based on Rough Set Theory,<br />
Asia-Pacific Conference on Information Processing<br />
.<br />
Du, W., Li, H., Gao, Y. and Meng, D. (2005). Another<br />
Kind of Fuzzy Rough Sets, IEEE International<br />
Conference on Granular Computing 1: 145.<br />
Dubois, D. and Prade, H. (1992). Intelligent Decision<br />
Support: Handbook of Applications and Advances<br />
of the Sets Theory, Kluwer, Dordrecht, chapter<br />
Putting fuzzy sets and rough sets together,<br />
pp. 203–232.<br />
Li, X. and Dong, M. (2008). An Algorithm for Constructing<br />
Decision Tree Based on Variable Precision<br />
Rough Set Model, Fourth International Conference<br />
on Natural Computation 1: 280.<br />
Pawlak, Z. (1982). Rough sets., International Journal<br />
of Computer and Information Sciences. pp. 341–<br />
356.<br />
Quinlan, J. R. (1986). Induction of Decision Trees,<br />
Machine Learning 1: 81–106.<br />
Shaw, M. J. and Gentry, J. A. (1990). Inductive learning<br />
for risk classification., IEEE Expert pp. 47–<br />
53.<br />
Uchôa, J. Q. (1998). Representação e indução de conhecimento<br />
usando teoria de conjuntos aproximados,<br />
Master’s thesis, UFScar.<br />
Wang, H., Ma, C. and Zhou, L. (2009). A Brief Review<br />
of Machine Learning and its Application.,<br />
Information Engineering and Computer Science.<br />
.<br />
Wong, S. K. M. and Ziarko, W. (1986). Comparison<br />
of rough-set and statistical methods in inductive<br />
learning., Internacional Journal of Man-Machine<br />
Studies 24: 53–72.<br />
Xue, M. and Zhu, C. (2009). A Study and Application<br />
on Machine Learning of Artificial Intellligence.,<br />
International Joint Conference on Artificial Intelligence.<br />
.<br />
Ziarko, W. (1993). Variable Precision Rough Set Model,<br />
Journal of Computer and System Sciences<br />
46: 39–59.<br />
ISSN: 2175-8905 - Vol. X 74