ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA

X SBAI – Simpósio Brasileiro de Automação Inteligente 

18 a 21 de setembro de 2011 

São João del-Rei - MG - Brasil 

efetuados, os resultados do FID3 não superaram 

os do ID3. 

Já o algoritmo aqui proposto não utiliza nenhum 

cálculo existente no ID3, apenas a ideia de 

escolher atributos para construir a árvore de decisão. 

Em vez disso, o ID3-RMF apresenta um cálculo 

todo baseado no conceito de funções de pertinência 

aproximada, possibilitando o tratamento 

de informações incertas e, consequentemente, uma 

maior capacidade de aprendizado em determinados 

casos. 

Por outro lado, esse cálculo é baseado em interseções 

entre conjuntos e acarreta em um tempo 

de treinamento maior em relação ao tempo gasto 

pelo cálculo do ganho de informação que, por sua 

vez, apenas conta elementos e, com isso, tem um 

tempo de execução bem inferior. Essa velocidade 

pode ser constatada na Tabela 2, em que o tempo 

de treinamento (quesito H ) do ID3 foi inferior ao 

seu tempo de teste (quesito I ). 

Com isso, conforme pode ser observado na Tabela 

3, o ID3-RMF conseguiu obter o mesmo grau 

de suporte do ID3 com um número menor de regras, 

o que evidencia essa maior capacidade em 

algumas situações. Na base KDD99, o ID3 se mostrou 

melhor mas com pouca diferença em relação 

ao algoritmo aqui proposto. 

7 Conclusão 

O algoritmo proposto se mostrou, nos testes 

efetuados, bastante estável em diferentes bases, 

com diferentes números de dados e atributos e diferentes 

tipos de classificação (binária e não binária), 

e com uma capacidade de aprendizado e 

generalização equivalentes a algoritmos já consagrados 

na literatura, como o ID3 clássico e o RS1. 

Com relação ao tempo de execução, o ID3- 

RMF foi um pouco mais lento que o ID3 clássico, 

porém muito mais rápido e igualmente eficiente ao 

o RS1. Essa perda no tempo de execução para o 

ID3 pode ser compensada pelo fato de o ID3-RMF 

ser inspirado na Teoria de Conjuntos Aproximados, 

que é um formalismo matemático proposto 

para representação de incerteza. Além disso, esse 

formalismo também é largamente utilizado para 

indução de conhecimento e possui propostas atuais, 

conforme pode ser visto nos trabalhos de Li 

and Dong (2008) e Ding et al. (2009). 

Como o algoritmo aqui proposto conta com 

esse formalismo matemático não só para induzir 

conhecimento, mas também para a representação 

de incerteza (a indiscernibilidade), ele se mostra, 

em determinadas situações, mais capaz de descobrir 

conhecimento que o ID3 clássico, que constrói 

uma árvore de decisão sem tratar, e sequer analisar, 

informações incertas. 

Além disso, como visto em (Uchôa, 1998), a 

função de pertinência aproximada é o elo de ligação 

entre a TCA e a Teoria de Conjuntos Fuzzy, 

que é outro formalismo consagrado e largamente 

utilizado para indução de conhecimento e representação 

de incerteza, possibilitando uma extensão 

do algoritmo ID3-RMF com conceitos da TCF 

de uma maneira relativamente simples e imediata. 

Como trabalho futuro, além da combinação 

do algoritmo aqui proposto com a TCF, está a 

melhoria desse algoritmo utilizando características 

próprias da TCA, com o objetivo de diminuir seu 

tempo de execução e aumentar seu grau de suporte 

e sua capacidade de induzir conhecimento. 

8 Agradecimentos 

Os autores agradecem À FAPEMIG, pelo apoio 

recebido durante a realização deste trabalho. 

Referências 

Ding, B., Zheng, Y. and Zang, S. (2009). A New Decision 

Tree Algorithm Based on Rough Set Theory, 

Asia-Pacific Conference on Information Processing 

. 

Du, W., Li, H., Gao, Y. and Meng, D. (2005). Another 

Kind of Fuzzy Rough Sets, IEEE International 

Conference on Granular Computing 1: 145. 

Dubois, D. and Prade, H. (1992). Intelligent Decision 

Support: Handbook of Applications and Advances 

of the Sets Theory, Kluwer, Dordrecht, chapter 

Putting fuzzy sets and rough sets together, 

pp. 203–232. 

Li, X. and Dong, M. (2008). An Algorithm for Constructing 

Decision Tree Based on Variable Precision 

Rough Set Model, Fourth International Conference 

on Natural Computation 1: 280. 

Pawlak, Z. (1982). Rough sets., International Journal 

of Computer and Information Sciences. pp. 341– 

356. 

Quinlan, J. R. (1986). Induction of Decision Trees, 

Machine Learning 1: 81–106. 

Shaw, M. J. and Gentry, J. A. (1990). Inductive learning 

for risk classification., IEEE Expert pp. 47– 

53. 

Uchôa, J. Q. (1998). Representação e indução de conhecimento 

usando teoria de conjuntos aproximados, 

Master’s thesis, UFScar. 

Wang, H., Ma, C. and Zhou, L. (2009). A Brief Review 

of Machine Learning and its Application., 

Information Engineering and Computer Science. 

. 

Wong, S. K. M. and Ziarko, W. (1986). Comparison 

of rough-set and statistical methods in inductive 

learning., Internacional Journal of Man-Machine 

Studies 24: 53–72. 

Xue, M. and Zhu, C. (2009). A Study and Application 

on Machine Learning of Artificial Intellligence., 

International Joint Conference on Artificial Intelligence. 

. 

Ziarko, W. (1993). Variable Precision Rough Set Model, 

Journal of Computer and System Sciences 

46: 39–59. 

ISSN: 2175-8905 - Vol. X 74

Previous page

Next page

1

2

3

4

5

6

ID3-RMF: UM ALGORITMO DE APRENDIZADO INDUTIVO ... - SBA

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?