11.07.2015 Views

L'analyse de séquence dans R avec la librairie TraMineR Outline ...

L'analyse de séquence dans R avec la librairie TraMineR Outline ...

L'analyse de séquence dans R avec la librairie TraMineR Outline ...

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesCe que <strong>TraMineR</strong> permet <strong>de</strong> faireIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesCe que <strong>TraMineR</strong> permet <strong>de</strong> fairePrise en charge et conversion <strong>de</strong> différents types <strong>de</strong> données longitudinalesGestion <strong>de</strong>s poids et <strong>de</strong>s données manquantesVisualisation d’un ensemble <strong>de</strong> <strong>séquence</strong>s (in<strong>de</strong>x plot, <strong>séquence</strong>s fréquentes,distributions transversales, et plus...)Caractéristiques longitudinales <strong>de</strong> <strong>séquence</strong>s individuelles (complexité, durées <strong>de</strong>séjour <strong>dans</strong> chaque état, entropie longitudinale, turbulence, et plus ...)Séquence <strong>de</strong> caractéristiques transversales (distribution <strong>de</strong>s états, entropietransversale, état modal)Autres caractéristiques agrégées (taux <strong>de</strong> transition, durées moyennes <strong>de</strong> séjour<strong>dans</strong> chaque état)Dissimi<strong>la</strong>rités entre paires <strong>de</strong> <strong>séquence</strong>s (Optimal matching, Longest CommonSubsequence, Hamming, Dynamic Hamming, Multichannel et plus ...)Mesure <strong>de</strong> dispersion d’un ensemble <strong>de</strong> <strong>séquence</strong>sSéquences représentativesANOVA et arbres <strong>de</strong> régression à partir <strong>de</strong> matrices <strong>de</strong> dissimi<strong>la</strong>ritésExtraction <strong>de</strong> <strong>séquence</strong>s d’événements fréquentsI<strong>de</strong>ntification <strong>de</strong> <strong>séquence</strong>s d’événements discriminantesPrise en charge et conversion <strong>de</strong> différents types <strong>de</strong> données longitudinalesGestion <strong>de</strong>s poids et <strong>de</strong>s données manquantesVisualisation d’un ensemble <strong>de</strong> <strong>séquence</strong>s (in<strong>de</strong>x plot, <strong>séquence</strong>s fréquentes,distributions transversales, et plus...)Caractéristiques longitudinales <strong>de</strong> <strong>séquence</strong>s individuelles (complexité, durées <strong>de</strong>séjour <strong>dans</strong> chaque état, entropie longitudinale, turbulence, et plus ...)Séquence <strong>de</strong> caractéristiques transversales (distribution <strong>de</strong>s états, entropietransversale, état modal)Autres caractéristiques agrégées (taux <strong>de</strong> transition, durées moyennes <strong>de</strong> séjour<strong>dans</strong> chaque état)Dissimi<strong>la</strong>rités entre paires <strong>de</strong> <strong>séquence</strong>s (Optimal matching, Longest CommonSubsequence, Hamming, Dynamic Hamming, Multichannel et plus ...)Mesure <strong>de</strong> dispersion d’un ensemble <strong>de</strong> <strong>séquence</strong>sSéquences représentativesANOVA et arbres <strong>de</strong> régression à partir <strong>de</strong> matrices <strong>de</strong> dissimi<strong>la</strong>ritésExtraction <strong>de</strong> <strong>séquence</strong>s d’événements fréquentsI<strong>de</strong>ntification <strong>de</strong> <strong>séquence</strong>s d’événements discriminantes28/4/2011gr 9/2528/4/2011gr 9/25Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs Références<strong>Outline</strong>Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesLe jeu <strong>de</strong> données mvad1 Introduction2 Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong>3 Documentation et communauté d’utilisateursEtu<strong>de</strong> <strong>de</strong> McVicar and Anyadike-Danes (2002) sur <strong>la</strong>transition entre formation et emploi en Ir<strong>la</strong>n<strong>de</strong> du Nord.Jeu <strong>de</strong> données distribué <strong>avec</strong> <strong>la</strong> <strong>librairie</strong> <strong>TraMineR</strong>.Provient d’une enquête auprès 712 jeunes ir<strong>la</strong>ndais.Les <strong>séquence</strong>s représentent leur suivi pendant les 6 annéessuivant <strong>la</strong> fin <strong>de</strong> <strong>la</strong> sco<strong>la</strong>rité obligatoire (16 ans) et sontconstituées <strong>de</strong>s 70 variables indiquant les états mensuelssuccessifs <strong>de</strong> chaque individu entre septembre 1993 et juin1999.Les états sont : EM en emploiFE formation secondaireHE formation supérieureJL au chômageSC écoleTR en stage ou apprentissage.28/4/2011gr 10/2528/4/2011gr 11/25


Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesSéquences d’états - Jeu <strong>de</strong> données mvadIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesPrésentations graphiques : ExemplesPremières <strong>séquence</strong>s du jeu <strong>de</strong> données (20 premiers mois)Sequence1 EM-EM-EM-EM-TR-TR-EM-EM-EM-EM-EM-EM-EM-EM-EM-EM-EM-EM-EM-EM2 FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE-FE3 TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR4 TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TR-TRReprésentation compacte(format SPS)Sequence[1] (EM,4)-(TR,2)-(EM,64)[2] (FE,36)-(HE,34)[3] (TR,24)-(FE,34)-(EM,10)-(JL,2)[4] (TR,47)-(EM,14)-(JL,9)4 seq. (n=4)4 3 2 1Sep.93 Sep.94 Sep.95 Sep.96 Sep.97 Sep.9828/4/2011gr 12/2528/4/2011gr 13/25Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesAperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong>Charger <strong>TraMineR</strong> et créer un objet ‘<strong>séquence</strong>s d’états’R> library(<strong>TraMineR</strong>)R> data(mvad)R> mvad.seq mvad.om library(cluster)R> clusterward mvad.cl4 cl4.<strong>la</strong>b seqdplot(mvad.seq, group = cl4.<strong>la</strong>b, bor<strong>de</strong>r = NA)Freq. (n=265)Freq. (n=194)0.0 0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0Cluster 1Sep.93 Mar.95 Sep.96 Mar.98Cluster 3Sep.93 Mar.95 Sep.96 Mar.98Freq. (n=153)Freq. (n=100)0.0 0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0Cluster 2Sep.93 Mar.95 Sep.96 Mar.98Cluster 4Sep.93 Mar.95 Sep.96 Mar.98employmentFEHEjoblessnessschooltraining28/4/2011gr 14/2528/4/2011gr 15/25


Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesAperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> (suite 2)Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesArbre <strong>de</strong> régressionTemps moyen <strong>dans</strong> les états par c<strong>la</strong>sseR> seqmtplot(mvad.seq, group = cl4.<strong>la</strong>b)Cluster 1Cluster 2Mean time (n=265)0 14 28 42 56 70employment HE schoolMean time (n=153)0 14 28 42 56 70employment HE school(Stu<strong>de</strong>r et al., 2011, 2009)R> dt seqtreedisp<strong>la</strong>y(dt, filename = "fg_mvadseqtree.png",+ type = "d", bor<strong>de</strong>r = NA, showtree = FALSE)Mean time (n=194)0 14 28 42 56 70Cluster 3Mean time (n=100)0 14 28 42 56 70Cluster 4La visualisation <strong>de</strong> l’arbre utilise Graphviz (http://www.graphviz.org/)qui doit être installé sur le système.employment HE schoolemployment HE schoolemploymentFEHEjoblessnessschooltraining28/4/2011gr 16/2528/4/2011gr 17/25Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesArbre <strong>de</strong> régressionIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs Références<strong>Outline</strong>1 Introduction2 Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong>3 Documentation et communauté d’utilisateurs28/4/2011gr 18/2528/4/2011gr 19/25


Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesDocumentationLe succès <strong>de</strong> <strong>TraMineR</strong> est <strong>la</strong>rgement dû à sa documentation.Site internet http://mephisto.unige.ch/traminer<strong>de</strong>rnières nouvellesaperçu <strong>de</strong>s possibilitésdocumentation :manuel <strong>de</strong> l’utilisateur (env. 120 pages)tutorielsversion en ligne (html) du manuel <strong>de</strong> référencepublications <strong>de</strong> l’équipepublications d’utilisateurs <strong>de</strong> <strong>TraMineR</strong>information sur les formations à TraMiner28/4/2011gr 20/2528/4/2011gr 21/25Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesSite R-forge et communauté d’utilisateursIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesSite R-forge et communauté d’utilisateursNous avons également crééune liste <strong>de</strong> discussionun site sur R-forge(https://r-forge.r-project.org/projects/traminer/)pourmettre à disposition <strong>la</strong> version <strong>de</strong> développement,permettre aux utilisateurs <strong>de</strong> reporter <strong>de</strong>s bugs,et <strong>de</strong> proposer <strong>de</strong>s fonctionnalités.... et prochainement : un blogNous avons également crééune liste <strong>de</strong> discussionun site sur R-forge(https://r-forge.r-project.org/projects/traminer/)pourmettre à disposition <strong>la</strong> version <strong>de</strong> développement,permettre aux utilisateurs <strong>de</strong> reporter <strong>de</strong>s bugs,et <strong>de</strong> proposer <strong>de</strong>s fonctionnalités.... et prochainement : un blog28/4/2011gr 22/2528/4/2011gr 22/25


Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesIntroduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesReferences IMerci!Abbott, A. (1997). Optimize. http://home.uchicago.edu/˜aabbott/om.html.Abbott, A. (2001). Time Matters. On Theory and Methods. Chicago: ChicagoPress.Berchtold, A. and A. Berchtold (2004). MARCH 2.02: Markovian mo<strong>de</strong>lcomputation and analysis. User’s gui<strong>de</strong>.Brzinsky-Fay, C., U. Kohler, and M. Luniak (2006). Sequence analysis withStata. The Stata Journal 6(4), 435–460.Elzinga, C. H. (2007). CHESA 2.1 User manual. User gui<strong>de</strong>, Dept of SocialScience Research Methods, Vrije Universiteit, Amsterdam.Gabadinho, A., G. Ritschard, N. S. Müller, and M. Stu<strong>de</strong>r (2011). Analyzingand visualizing state sequences in R with <strong>TraMineR</strong>. Journal of StatisticalSoftware 40(4), 1–37.Gabadinho, A., G. Ritschard, M. Stu<strong>de</strong>r, and N. S. Müller (2009). Miningsequence data in R with the <strong>TraMineR</strong> package: A user’s gui<strong>de</strong>. Technicalreport, Department of Econometrics and Laboratory of Demography,University of Geneva, Geneva.28/4/2011gr 23/2528/4/2011gr 24/25Introduction Aperçu <strong>de</strong>s possibilités <strong>de</strong> <strong>TraMineR</strong> Documentation et communauté d’utilisateurs RéférencesReferences II28/4/2011gr 25/25Gabadinho, A., G. Ritschard, M. Stu<strong>de</strong>r, and N. S. Müller (2011). Extractingand ren<strong>de</strong>ring representative sequences. In A. Fred, J. L. G. Dietz, K. Liu,and J. Filipe (Eds.), Knowledge Discovery, Knowledge Engineering andKnowledge Management, Volume 128 of Communications in Computer andInformation Science (CCIS), pp. 94–106. Springer-Ver<strong>la</strong>g.McVicar, D. and M. Anyadike-Danes (2002). Predicting successful andunsuccessful transitions from school to work using sequence methods.Journal of the Royal Statistical Society A 165(2), 317–334.Ritschard, G., A. Gabadinho, N. S. Müller, and M. Stu<strong>de</strong>r (2008). Miningevent histories: A social science perspective. International Journal of DataMining, Mo<strong>de</strong>lling and Management 1(1), 68–90.Rohwer, G. and U. Pötter (2002). TDA user’s manual. Software,Ruhr-Universität Bochum, Fakultät für Sozialwissenschaften, Bochum.Stu<strong>de</strong>r, M., G. Ritschard, A. Gabadinho, et N. S. Müller (2009). Analyse <strong>de</strong>dissimi<strong>la</strong>rités par arbre d’induction. Revue <strong>de</strong>s nouvelles technologies <strong>de</strong>l’information RNTI E-15, 7–18.Stu<strong>de</strong>r, M., G. Ritschard, A. Gabadinho, et N. S. Müller (2011). Discrepancyanalysis of state sequences. Sociological Methods and Research. In press.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!