12.07.2015 Views

Data Mining 1(pdf) - Wiphala.net

Data Mining 1(pdf) - Wiphala.net

Data Mining 1(pdf) - Wiphala.net

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Laboratorio 05. Sesión 2CREAR UN ESCENARIO DE CORREO DIRECTOPlanteamiento del problemaEl departamento de marketing de Adventure Worksdesea aumentar las ventas dirigiendo una campañade correo directo a clientes específicos.Mediante el análisis de los atributos de clientesconocidos, la empresa espera determinar lospatrones de comportamiento que posteriormente seaplicarán a clientes potenciales.La empresa pretende utilizar los patrones halladospara predecir qué clientes potenciales tienen másprobabilidades de comprar un producto.Tipos de atributos.Atributos continuos. Son aquellos atributos porlo general numéricos, tales como 23.45, 23.4555,87. Por ejemplo una columna puede contenerinformación salarial como valores de sueldoactuales, que son continuosAtributo discreto. Son aquellos datoscategóricos tales como alto, bajo, varon o mujer.Generalmente se afirma que un atributo esdiscreto cuando tiene una cantidad de posible devalores diferentes que se pueden contar. Porejemplo una columna puede contenerinformación salarial en rangos de sueldocodificados, como 1 = < $25.000; 2 = de $25.000a $50.000, que son discretos.Modelo de árboles de decisión.El algoritmo de árboles de decisión es un algoritmode clasificación y regresión para modelar lapredicción de atributos (clase) discretos o continuos:Para los atributos discretos, el algoritmo hacepredicciones basándose en las relaciones entrelas columnas de entrada de un conjunto dedatos. Utiliza los valores, conocidos comoestados, de estas columnas para predecir losestados de una columna que se designa comoelemento de predicción (generalmente se lellama la clase), el algoritmo identifica lascolumnas de entrada que se correlacionan con lacolumna de predicción.Requisitos previosAntes de desarrollar este laboratorio debe de leer eltutorial de árboles de decisión. Para confirmar queha leído y entendido el tutorial diga el significado delos siguientes términos:Predicción.ClasificaciónRegresiónAtributoClaseNodoHojaRegla de decisiónError del clasificadorOtros conceptos importantesEscenario de correo electrónico. Corresponde aun problema que puede ser abordado con lastécnicas de la minería de datos, generalmentecorresponde a problemas de clasificación opredicción.Asistente de minería de datos. Herramienta delSSAS para facilitar la creación de modelos demienería de datos.Estructura de minería de datos. Objetos (tablas,vistas), algoritmos necesarios para implementarla solución a un problema de minería de datos.Para el desarrollo de este laboratorio sedesarrollaran los siguientes tereas:1. Crear una estructura del modelo de minería dedatos Targeted Mailing.2. Modificar el modelo Targeted Mailing.3. Explorar los modelos Targeted Mailing4. Comprobar la precisión de los modelos deminería de datos5. Crear prediccionesPara los atributos continuos, el algoritmo usa laregresión lineal para determinar dónde se divideun árbol de decisión.6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!