Views
3 years ago

CAp 2009

CAp 2009

CAp

CAp 2009(η + , η − ) Alg. B.-Cancer Diabetis German Heart(0.0, 0.0) All 26.26 ± 4.41 23.46 ± 1.67 24.12 ± 2.24 15.27 ± 3.21(0.0, 0.2)(0.0, 0.4)(0.2, 0.0)(0.2, 0.2)(0.2, 0.4)(0.4, 0.0)CSVM 29.35 ± 4.19 25.43 ± 2.22 27.72 ± 2.59 16.54 ± 3.83SCPA 26.74 ± 4.73 23.75 ± 1.74 24.63 ± 2.17 15.93 ± 3.69CSVM 40.62 ± 6.61 35.47 ± 3.69 40.2 ± 3.09 20.41 ± 4.03SCPA 27.21 ± 4.57 24.21 ± 1.96 25.47 ± 2.37 16.54 ± 3.43CSVM 25.95 ± 4.47 25.35 ± 2.61 25.2 ± 2.25 15.69 ± 3.22SCPA 26.75 ± 4.55 23.6 ± 1.67 24.34 ± 2.17 15.67 ± 3.52CSVM 27.13 ± 4.24 24.53 ± 1.94 25.71 ± 2.88 16.56 ± 3.24SCPA 28.06 ± 5.02 24.51 ± 2.01 25.53 ± 2.28 17.19 ± 3.99CSVM 37.55 ± 8.13 32.14 ± 3.86 35.84 ± 3.84 19.81 ± 4.37SCPA 29.35 ± 5.71 26.47 ± 2.67 27.97 ± 2.65 19.7 ± 4.1CSVM 26.36 ± 4.73 27.39 ± 2.07 27.12 ± 2.03 17.36 ± 3.43SCPA 26.83 ± 4.63 24.3 ± 1.82 24.95 ± 2.36 16.35 ± 3.78TABLE 1 – Erreur de classification de CSVM et SCPA sur 4 problèmes UCI altérés pardu bruit CCCN.5 SimulationsAfin de mettre en valeur le bien fondé de notre approche, nous avons procédé à unensemble d’expériences sur des problèmes UCI. Dans la première sous section, la probabilitéde mauvais étiquetage est connue de l’algorithme. Dans la seconde, nous proposonsune méthode pour évaluer les niveaux de bruit lorsqu’ils sont inconnus.5.1 Problèmes UCIUn premier ensemble d’expériences a été réalisé sur 4 problèmes UCI, prétraités etrendus disponible par Gunnar Rätsch. Ces simulations numériques consistent en l’ajoutd’un bruit conditionnel par classe (avec des taux allant de 0 à 0.40) aux données, puisen l’apprentissage d’un classifieur linéaire sur les jeux de données bruités avec CSVMet SCPA. Pour chaque problème, les données sont partagées en 100 ensembles apprentissageet test. Plusieurs valeurs (de 0.005 à 1000) pour le paramètre C ont été testées.Pour chaque problème et pour chaque niveau de bruit, et dans le but de mettre en valeurla tolérance au bruit de SCPA, nous avons choisi : (a) pour CSVM, la valeur qui minimisel’erreur de généralisation sur toutes les valeurs testées, (b) pour SCPA, le paramètre quiminimise l’erreur de généralisation de CSVM sur les données non bruitées.Les résultats sont récapitulés dans le Tableau 5.1. Ils montrent que SCPA est plustolérant que CSVM de manière régulière. C’est particulièrement clair lorsque les bruitspar classe sont déséquilibrés, spécialement sur les problèmes Diabetis et German.

Algorithme par Plans Sécants pour SVM Bruitées(η + , η − )HeartThyroidBruit estimé Erreur Bruit estimé Erreur(0.3, 0.0) (0.27,0.15) 16.6 (0.26,0.03) 12.7(0.2, 0.1) (0.23,0.21) 16.4 (0.24,0.06) 14.4(0.2, 0.3) (0.15,0.26) 17.6 (0.19,0.29) 14.4(0.1, 0.4) (0.12,0.34) 18.4 (0.12,0.29) 14.7TABLE 2 – Estimation du bruit sur 2 problèmes UCI et erreur de généralisation de SCPA5.2 Une Heuristique pour Estimer les Niveaux de BruitDans la sous-section précédente, nous avons supposé que les taux de bruit sont connusde l’algorithme. Cette hypothèse n’est pas irréaliste puisque, pour des problèmes réels,il doit exister un expert capable d’estimer les données non bruitées (à partir desquellesle bruit peut être clairement estimé) – autrement, il ne serait pas possible de faire qued’apprendre la distribution bruitée telle quelle. Nous proposons néanmoins une stratégiepour estimer les paramètres de bruit les plus vraisemblables à partir des données. Si unclassifieur est précis sur un problème non bruité, il fera, sur le problème altéré, uneerreur proche du taux de bruit sur chacune des classes. Nous calculons les taux de= P x∼S y [y〈w,x〉

guide rando 2009 - Parc naturel régional des Caps et Marais d'Opale
CAP SUR DÉCOUVRARTS - L'Écho de Cap-Rouge
Trombinoscope - Cap 3B
Activités de classe - Cap Sciences
Cap sur la mer ! - La Seyne-sur-Mer
CAP/DAKAR FORMATION PROFESSIONNELLE
CAP INVESTORS - F2iC
Roquebrune - Cap - Martin - Leaseback.co.uk
Cap Nord de la Francophonie - WBI
au temps des mammouths - Cap Sciences