12.07.2015 Views

Jean-Patrick Baudry - Lsta - Université Pierre et Marie CURIE

Jean-Patrick Baudry - Lsta - Université Pierre et Marie CURIE

Jean-Patrick Baudry - Lsta - Université Pierre et Marie CURIE

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Jean</strong>-<strong>Patrick</strong> <strong>Baudry</strong>54, rue de Ménilmontant75020 Paris∼jean-patrick.baudry@upmc.frwww.lsta.upmc.fr/<strong>Baudry</strong>.htmlLaboratoire de Statistique Théorique <strong>et</strong>AppliquéeUniversité <strong>Pierre</strong> <strong>et</strong> <strong>Marie</strong> Curie4 place JussieuBC 15875252 Paris Cedex 5∼Barre 15-25, 2 ème étage, Bureau 18∼01.44.27.33.53Postes antérieurs2009–2010 ATER (service compl<strong>et</strong>). Département STID, IUT Paris Descartes.Accueilli pour la recherche par l’équipe du MAP5, Université Paris Descartes.2006–2009 Allocataire-Moniteur Normalien. Université Paris-Sud.Recherche au sein de l’équipe Probabilités <strong>et</strong> Statistiques du LMO, Université Paris-Sud<strong>et</strong> de l’équipe SELECT, INRIA Saclay Île-de-France.Cursus universitaire2006–2009 Doctorat de Mathématiques à l’Université Paris-Sud, sous la direction de G. Celeux :Sélection de modèle pour la classification non supervisée. Choix du nombre de classes.Thèse soutenue le 3 décembre 2009.2001–2006 École Normale Supérieure de ParisLicence, Maîtrise <strong>et</strong> Magistère de Mathématiques (ENS Paris)Mémoire de maîtrise (avec S. Arlot) sous la direction de Y. Baraud : Sélection de modèles.DEA « Modélisation stochastique <strong>et</strong> statistique » (Université Paris-Sud)Mémoire de DEA sous la direction de Y. Baraud : Classification adaptative.Agrégation de Mathématiques.1998–2001 Classes Préparatoires MPSI <strong>et</strong> MP* au lycée Louis-Le-Grand, Paris.


Thèmes de rechercheEstimationMinimisation de contraste,ConcentrationRésultats théoriques,Notion de classe1 classe=1 composantegaussienneMLEMLccEStatistiqueasymptotiqueCritères pénalisés :BIC, ICL, Lcc-ICL...Statistique nonasymptotiqueConsistanceRobustesseClassification non superviséepar modèles de mélangeChoix du nombrede classesEclairage d’unepartition externeHeuristiquede penteCalibration« data-driven »de critères pénalisésMise en œuvre pratique,Package « CAPUSHE »1 classe=1 mélangegaussienCombinaisonhiérarchiqueSICLMélanges demélangesOutils graphiquesChoix du nombre declassesCompétences diversesInformatiqueLanguesWindows, Linux ; Bureautique courante, notamment L A TEX.Matlab, R, Scilab familiers ; spss, Excel enseignés ; Maple étudié.Anglais courant ; Allemand scolaire.


Thèse de doctoratThèse de doctorat, spécialité Mathématiques, préparée à l’Université Paris-Sud, sous la direction deGilles Celeux :Sélection de modèle pour la classification non supervisée.Choix du nombre de classes.Soutenue le 3 décembre 2009 devant le jury :Gérard BiauGilles CeleuxGérard GovaertChristian Hennig<strong>Jean</strong>-Michel MarinPascal Massart(Rapporteur)(Directeur de thèse)(Examinateur)(Rapporteur)(Examinateur)(Président du jury)RésuméLe cadre principal de ma thèse est la classification non supervisée, traitée par une approche statistiquedans le cadre des modèles de mélange. Plus particulièrement, nous nous intéressons au choix dunombre de classes <strong>et</strong> au critère de sélection de modèle ICL. Une approche fructueuse de son étud<strong>et</strong>héorique consiste à considérer un contraste, à minimiser, adapté à la classification non supervisée :ce faisant, un nouvel estimateur ainsi que de nouveaux critères de sélection de modèle sont proposés<strong>et</strong> étudiés. Des solutions pratiques pour leur calcul s’accompagnent de r<strong>et</strong>ombées positives pour lecalcul du maximum de vraisemblance standard dans les modèles de mélange, par l’algorithme EM. Laméthode de l’heuristique de pente est appliquée pour la calibration des critères pénalisés considérés.Aussi les bases théoriques en sont-elles rappelées en détails, <strong>et</strong> deux approches pour son applicationsont étudiées.Une autre approche de la classification non supervisée est considérée : chaque classe peut être modéliséeelle-même par un mélange. Une méthode est proposée pour répondre notamment à la questiondu choix des composantes à regrouper.Enfin, un critère est proposé pour perm<strong>et</strong>tre de lier le choix du nombre de composantes, lorsqu’il estidentifié au nombre de classes, à une éventuelle classification externe connue a priori.


Communications écritesArticle publié dans une revue à comité de lecture[1] J.-P. <strong>Baudry</strong> , A.E. Raftery, G. Celeux, K. Lo, R. Gottardo (2010). Combining mixture componentsfor clustering. Journal of Computational and Graphical Statistics. June 1, 2010, 19(2) :332-353.Article paru dans des proceedings de conférence avec comité de lecture[2] J.-P. <strong>Baudry</strong>, G. Celeux <strong>et</strong> J.-M. Marin (2008). Selecting models focussing on the modeler’s purpose.COMPSTAT 2008: Proceedings in Computational Statistics, pages 337–348, Heidelberg.Physica-Verlag.Article en cours révision pour une revue à comité de lecture[3] J.-P. <strong>Baudry</strong>, C. Maugis <strong>et</strong> B. Michel. Slope Heuristics : Overview and Implementation. Soumis.Un rapport de recherche INRIA rend compte de ce travail : RR-7223, disponible depuis ma pageweb.Articles en préparation[4] J.-P. <strong>Baudry</strong>, G. Celeux, A. Sousa Ferreira. Selecting a clustering model in view of an externalclassification. C<strong>et</strong> article correspondra au chapitre 8 de ma thèse.[5] J.-P. <strong>Baudry</strong>. Estimation and model selection for model-based clustering with the conditionalclassification likelihood. C<strong>et</strong> article reprendra en bonne partie le chapitre 4 de ma thèse.[6] J.-P. <strong>Baudry</strong>. Note on the breakdown point properties of L cc -ICL. C<strong>et</strong> article reprendra le chapitre5 de ma thèse.Autres travaux en cours• A. Bar-Hen (MAP5), J.-P. <strong>Baudry</strong>. Nous nous intéressons à des méthodes de prévision d’ensemble,appliquées à des situations impliquant des lois d’extrêmes.• J.-P. <strong>Baudry</strong>, A. Samson (MAP5). Nous avons pour proj<strong>et</strong> de travailler sur des critères pénaliséspour de la sélection de modèles à eff<strong>et</strong>s mixtes impliquant des mélanges.


Communications oralesCommunications orales lors de conférences• Session "Apprentissage statistique" des journées mas à Bordeaux (2010).• Session "Sélection de modèles" des journées mas à Bordeaux (2010).• Statistique Mathématique <strong>et</strong> Applications, Fréjus (2008).• Working Group on Applied, Bayesian and Computational Statistics, Seattle, USA (2008).• Congrès conjoint de la SSC <strong>et</strong> de la SFdS, Ottawa, Canada (2008).• Deuxièmes Rencontres des Jeunes Statisticiens, Aussois (2007).Présentations de posters lors de conférences• Working Group on Model-Based Clustering, Paris (2009).• One-Day Statistical Workshop, Lisieux (2007).Exposés dans des séminaires <strong>et</strong> des groupes de travail• Groupe de travail Paris-Sud / Ecole Polytechnique autour de la classification (2010).• Séminaire de l’équipe Probabilités <strong>et</strong> Statistiques, Université Paris-Sud Orsay (2010).• Séminaire de Probabilités <strong>et</strong> Statistique, Montpellier II (2010).• Séminaire MODAL’X, Paris X (2010).• Groupe de travail ECAIS du département STID de l’IUT de Paris (2010).• Groupe de travail en Statistiques du MAP5, Paris V (2009).• Séminaire du SAMOS, Paris I (2009).• Séminaire des doctorants, Université Paris-Sud, Orsay (2008).• Groupe de travail INA P-G/SELECT, Paris (2008).Évaluation d’équipe• Exposé à l’occasion de l’évaluation INRIA de l’équipe SELECT (2010).Participation à des congrès sans communication• Statistique Mathématique <strong>et</strong> Applications, Luminy (2006).• Journées MAS de la SMAI, Lille (2006).


Participation régulière à des groupes de travail <strong>et</strong> séminairesJ’ai suivi régulièrement :• Groupe de travail Apprentissage (Ulm, Paris), devenu SMILE (IHP, Paris).• Groupe de travail AgroParisTech-SELECT (INA P-G, Paris).• Séminaire du groupe SELECT• Groupe de travail NeuroSpin-SELECT (NeuroSpin, CEA, Saclay) (2007–2008).Et de façon moins systématique, selon les années :• Séminaire Parisien de Statistiques.• Séminaire de Statistiques d’Orsay.• Groupe de travail en Statistiques du MAP5.• Séminaire des doctorants d’Orsay.• Séminaire des doctorants du MAP5.• Groupe de travail ECAIS au département STID de l’IUT Paris Descartes.Visite scientifique• University of British Columbia, Vancouver, Canada (2008).Rapports pour des revues• Un article soumis à IEEE Transactions on Neural N<strong>et</strong>works (2008).• Cinq articles soumis pour les proceedings de 19th International Conference on Computational Statistics(Compstat) (2010).Co-organisation d’un groupe de travailJ’ai modestement contribué à l’organisation matérielle du groupe de travail international Modelbasedclustering, qui s’est tenu à Paris en juill<strong>et</strong> 2009 (le pot d’accueil, la traditionnelle randonnée...).


Activités d’enseignementEnseignement universitaire2009–2010 ATER au département STID de l’IUT Paris Descartes :Première Année : Statistique Desctiptive (48h de TP SPSS, 27h de TD).Première Année : Probabilités (42h de cours).Année Spéciale : Estimation (40h de cours/TD intégrés).Deuxième année : Encadrement d’un Travail de Fin d’Études sur la classificationsupervisée, notamment avec cart.2006–2009 Monitorat à l’Université Paris-Sud :Filière Bioinformatique <strong>et</strong> Biostatistiques :Inférence Statistique <strong>et</strong> Mise à Niveau en Mathématiques en L3 <strong>et</strong> M1 (160h de TDavec utilisation du logiciel R).Filière Ingénierie Mathématique :Modélisation Statistique en M1 (16h de TD avec utilisation du logiciel R).Filières diverses :Proj<strong>et</strong> Professionnel, aide à l’orientation des étudiants de L1 (16h).Vulgarisation scientifique2008–2009 À l’occasion de l’installation d’un pendule de Foucault à la bibliothèque des sciencesde Paris XI, j’ai été chargé de quelques unes des démonstrations, avec explications,devant des étudiants de l’Université <strong>et</strong> des groupes scolaires (collèges) venus pour c<strong>et</strong>teoccasion.DiversAide ponctuelle en mathématiques dans mon milieu personnel : niveaux variés.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!