Tesis y Tesistas 2020 - Postgrado - Fac. de Informática - UNLP

Recommendations

Info

DOCTORADO ENCIENCIAS INFORMÁTICASDra. Patricia RosaliaJimbo Santanae-mailprjimbo@uce.edu.ecDirectoresDra. Laura LanzariniDr. Aurelio Fernández BarivieraFecha de defensa14 de julio de 2020SEDICIhttp://sedici.unlp.edu.ar/handle/10915/101163Obtención de reglas de clasificacióndifusas utilizando técnicas deoptimización. Caso de estudioriesgo crediticioPalabras clave: Reglas de Clasificación Difusas (Fuzzy Classification Rules); Optimización mediante Cúmulo de partículastamaño variable (Variable Particle Swarm Optimization); Minería de datos.MotivaciónEn los últimos años gracias al avance de la tecnología, lasorganizaciones han almacenado gran cantidad de información.Esto las ha llevado a la necesidad de incorporartécnicas que permitan procesar y obtener información útilde los datos.Dentro del proceso de KDD (Knowledge Discovery inDatabases), la Minería de Datos (Data Mining) es consideradala fase más importante, ya que agrupa a las técnicascapaces de modelizar la información disponible. A partir deluso o comprensión del modelo generado es posible extraerconocimiento. Este conocimiento que se genera resulta degran interés para las organizaciones, debido a que constituyeuna herramienta sumamente importante para la toma dedecisiones tácticas y estratégicas, lo cual se convierte en unaventaja competitiva.Una característica deseable de los modelos construidos conlas técnicas de la Minería de Datos es que el conocimientoque se extrae se exprese en términos comprensibles.En este sentido, las reglas de clasificación son consideradas,por quienes deben tomar decisiones, como una de lasformas más comprensibles que puede ser utilizada pararepresentar el conocimiento, ya que tienen la capacidad deexplicarse por sí mismas.Si a esto se le suma que las reglas de clasificación empleenlógica difusa a través de conjuntos difusos para describir losvalores de sus atributos, se obtienen ”Reglas de ClasificaciónDifusas”, facilitando aún más su comprensión, permitiendoademás el manejo de la incertidumbre, aproximándonoscada vez más al razonamiento humano.El objetivo central de esta tesis es contribuir a la mineríade datos con un nuevo método para obtener reglas declasificación difusas, y al área de riesgo financiero a travésde la evaluación de las reglas.Aportes de la tesisEl aporte central de esta tesis es la definición de un nuevométodo capaz de generar un conjunto de reglas de clasificacióndifusas de fácil interpretación, baja cardinalidad y unabuena precisión. Estas características ayudan a identificar ycomprender las relaciones presentes en los datos facilitandode esta forma la toma de decisiones.El nuevo método propuesto se denomina FRvarPSO (FuzzyRules variable Particle Swarm Oprmization) y combina unared neuronal competitiva con una técnica de optimizaciónbasada en cúmulo de partículas de población variable para laobtención de reglas de clasificación difusas, capaces de operarsobre atributos nominales y numéricos. Los antecedentesde las reglas están formados por atributos nominales y/ocondiciones difusas. La conformación de estas últimas requiereconocer el grado de pertenencia a los conjuntos difusos quedefinen a cada variable lingüística. Esta tesis propone tresalternativas distintas para resolver este punto.Con respecto a la forma de obtención de las reglas, el métodopropuesto utiliza un proceso iterativo por medio del cual se vancubriendo los ejemplos de una clase a la vez hasta lograr lacobertura deseada. Por lo tanto, el consecuente de la regla quedadeterminado por la clase seleccionada y es el antecedente elque se extrae a través de la técnica de optimización.Uno de los aportes de esta tesis radica en la definición dela función de aptitud o fitness de cada partícula basada en20
españolDra. Patricia Rosalia Jimbo Santanaun ”Criterio de Votación” que pondera de manera difusa laparticipación de las condiciones difusas en la conformacióndel antecedente.Su valor se obtiene a partir de los grados de pertenenciade los ejemplos que cumplen con la regla y se utiliza parareforzar el movimiento de la partícula en la dirección dondese encuentra el valor más alto. Con la utilización de PSO laspartículas compiten entre ellas para encontrar a la mejorregla de la clase seleccionada.La eficiencia y eficacia de FRvarPSO se encuentranfuertemente condicionadas por la manera en que sedeterminen las funciones de pertenencia de los conjuntosdifusos. En el marco de las investigaciones de esta tesis sehan utilizado diferentes opciones. Uno de estas opcionesfue particionar el rango de cada atributo numérico enintervalos de igual longitud, y centrando en cada uno deellos una función triangular con un solapamiento adecuado.Otra de las formas para obtener los conjuntos difusos hasido utilizando el método Fuzzy C-Means. Adicionalmente,se utilizó también como técnica el conocimiento de unexperto para la definición de los conjuntos difusos, y sucorrespondiente valor de pertenencia.La medición se realizó sobre doce bases de datos delrepositorio UCI (Machine Learning Repository) y tres casosreales en el área de crédito del Sistema Financiero delEcuador asociadas al riesgo crediticio considerando unconjunto de variables micro y macroeconómicas.Otro de los aportes de esta tesis fue haber realizado unaconsideración especial en la morosidad del cliente teniendoen cuenta los días de vencimiento de la cartera otorgada;esto fue posible debido a que se tenía información delcliente en un horizonte de tiempo, una vez que el créditose había concedidoSe verificó que con este análisis las reglas difusas obtenidasa través de FRvarPSO permiten que el oficial de crédito derespuesta al cliente en menor tiempo, y principalmentedisminuya el riesgo que representa el otorgamiento decrédito para las instituciones financieras. Lo anterior fueposible, debido a que al aplicar una regla difusa se toma elmenor grado de pertenencia promedio de las condicionesdifusas que forman el antecedente de la regla, con lo quese tiene una métrica proporcional al riesgo de su aplicación.Esta tesis fue presentada por Patricia Rosalía Jimbo Santana,en el marco de su doctorado en cotutela como requisito paraobtener su grado de Doctor en Ciencias Informáticas por laUniversidad Nacional de la Plata (UNLP Argentina) y Doctoren Ingeniería Informática y matemáticas de la seguridadpor la Universitat Rovira i Virgili (URV España)Líneas de I/D futurasComo líneas de trabajo futura se debe considerar la optimizaciónde la función de pertenencia, con la finalidad de identificarautomáticamente los parámetros de dicha función, sinperder de lado el objetivo que es tener un conjunto de reglasreducidas, pero conservando la interpretabilidad con las variableslingüísticas.Un segundo aspecto que se debe considerar es la obtenciónde una nueva forma de representación de los atributos nominales,con el objetivo de reducir el tiempo computacional,y disminuir la longitud de la representación del antecedentedentro de cada partícula.Otra variante que se debe tener en cuenta es incorporar técnicaspara el manejo del desbalance de las clases.Utilizar este método en otras áreas de riesgo como el operacional,liquidez entre otros en el área financiera. Incluso elmétodo propuesto puede utilizarse en otras áreas como la medicina,para saber el riesgo que un paciente tiene en contraeruna determinada enfermedad.21 TESIS Y TESISTAS 2020
Page 2 and 3: índiceEquipo Editorialpag. 4MAESTR
Page 4 and 5: equipoeditorialDIRECTOR DE POSTGRAD
Page 7 and 8: 01DOCTORADO ENCIENCIAS INFORMÁTICA
Page 9 and 10: españolDr. Facundo Manuel Quiroga5
Page 11 and 12: englishDr. Facundo Manuel Quirogaeq
Page 13 and 14: españolDr. Diego Miguel Montezanti
Page 15 and 16: englishDr. Diego Miguel Montezantit
Page 17 and 18: españolDra. Verónica ArtolaAsí,
Page 19: englishDr. Verónica Artola• The
Page 23 and 24: englishDr. Patricia Rosalia Jimbo S
Page 25 and 26: españolDr. Sergio Hernán Rocabado
Page 27 and 28: englishDr. Sergio Hernán Rocabado
Page 29 and 30: españolDra. Noelia Soledad Pintoat
Page 31 and 32: englishDr. Noelia Soledad Pintoof e
Page 33 and 34: DOCTORADO ENCIENCIAS INFORMÁTICASD
Page 35 and 36: españolDr. Nahuel Mangiaruautiliza
Page 37: englishDr. Nahuel Mangiaruaand reco
Page 40 and 41: MAESTRÍATECNOLOGÍA INFORMÁTICAAP
Page 70 and 71:
MAESTRÍATECNOLOGÍA INFORMÁTICAAP
Page 72 and 73:
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
MAESTRÍAINGENIERÍA DE SOFTWAREMg.
Page 80 and 81:
Page 82 and 83:
Page 84 and 85:
Page 86 and 87:
Page 88 and 89:
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
MAESTRÍAredes de datosMg. Mónica
Page 96 and 97:
MAESTRÍAredes de datosMg. Mónica
Page 98 and 99:
MAESTRÍAredes de datosMg. Moises E
Page 100 and 101:
MAESTRÍAredes de datosMg. Diego Ro
Page 102 and 103:
MAESTRÍAredes de datosMg. Diego Ro
Page 104 and 105:
MAESTRÍAredes de datosMg. Hugo Ort
Page 106 and 107:
MAESTRÍAredes de datosMg. Hugo Ort
Page 108 and 109:
MAESTRÍAredes de datosMg. Emanuel
Page 110 and 111:
MAESTRÍACómputo de AltasPrestacio
Page 113 and 114:
03especializacionesTECNOLOGÍA INFO
Page 115 and 116:
españolDr. José Manuel Ochoa Robl
Page 117 and 118:
englishDr. José Manuel Ochoa Roble
Page 119 and 120:
españolEsp. Mario Alberto Vincenzi
Page 121 and 122:
englishEsp. Mario Alberto VincenziW
Page 123 and 124:
españolEsp. Nicolás Martín Páez
Page 125 and 126:
englishEsp. Nicolás Martín PáezP
Page 127 and 128:
españolEsp. Cesar Armando Estrebou
Page 129 and 130:
englishEsp. Cesar Armando Estrebouw
Page 131 and 132:
españolEsp. Laura Randa Calcagnius
Page 133 and 134:
englishEsp. Laura Randa Calcagnican
Page 135 and 136:
especializaciónIngeniería de Soft
Page 137 and 138:
JURADOSDESIGNADOSLic. Azrilevich Pa
show all

Tesis y Tesistas 2020 - Postgrado - Fac. de Informática - UNLP

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?