Práctica 1 de MinerÃa de Datos - PoliformaT - UPV
Práctica 1 de MinerÃa de Datos - PoliformaT - UPV
Práctica 1 de MinerÃa de Datos - PoliformaT - UPV
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Figura 30. Calidad <strong>de</strong>l mo<strong>de</strong>lo generado para los datos <strong>de</strong> entrenamientoCon lo que tenemos un 96,5% <strong>de</strong> acierto. Es <strong>de</strong>cir un error <strong>de</strong> sólo el 3,5% sobre los datos <strong>de</strong>entrenamiento. Este mo<strong>de</strong>lo es muchísimo mejor que sí sólo nos guiamos por la distribución, que nosdaría un error <strong>de</strong> más <strong>de</strong>l 50% (el 54,5% <strong>de</strong> las veces el medicamento DRUGY no es el a<strong>de</strong>cuado).De todas maneras, es posible hacerlo mejor... ¿pero cómo? ¿con otro tipo <strong>de</strong> algoritmo <strong>de</strong>aprendizaje, una red neuronal, p.ej.?Es posible que otros mo<strong>de</strong>los (p.ej. las re<strong>de</strong>s neuronales) dieran mejor resultado (ya loprobaremos), pero el asunto aquí es que igual no hemos examinado suficientemente los datos <strong>de</strong>entrada.Vamos a analizar, con más <strong>de</strong>tenimiento, los atributos <strong>de</strong> entrada <strong>de</strong>l problema. Es posible que sepuedan establecer mejores mo<strong>de</strong>los si combinamos algunos atributos. Po<strong>de</strong>mos analizar pares <strong>de</strong>atributos utilizando diferentes gráficos.Para comparar los atributos discretos, el gráfico “Malla” suele ser conveniente. Creemos un nodo“malla” y enganchemos el nodo <strong>de</strong> fuentes <strong>de</strong> datos “drug1n” con él. Al editarlo, <strong>de</strong>cimos que vamos aexaminar los campos discretos (Sex, BP, Cho, Drug):Figura 31. Configurando un nodo mallaUsaremos valores “Absolutos”. Ahora ejecutaremos el nodo:20