24.04.2014 Views

Pratique de Sas Windows ...9.3 Volume 2 - Ined

Pratique de Sas Windows ...9.3 Volume 2 - Ined

Pratique de Sas Windows ...9.3 Volume 2 - Ined

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.5 Echanges avec R<br />

4.5.1 Quels sont les outils existants ?<br />

Sans accepter l’adoption <strong>de</strong> critères [ promus par un ancien utilisateur <strong>de</strong> <strong>Sas</strong> et <strong>de</strong> Spss Robert A. Muenchen, <strong>de</strong>venu évangéliste R (<br />

http://r4stats.com/2012/05/09/beginning-of-the-end/)] calqués sur le Shanghai spirit, tels que http://langin<strong>de</strong>x.sourceforge.net/#categ<br />

ou http://www.tiobe.com/in<strong>de</strong>x.php/content/paperinfo/tpci/in<strong>de</strong>x.html, on peut dire, sans<br />

aucun problème ou ressentiment, qu’il existe d’autres logiciels à usage statistique tels que Stata, Spss et R, malgré les<br />

discussions immenses et polémiques à propos <strong>de</strong> <strong>Sas</strong> et R. ! voir par ex http://stats.stackexchange.com/questions/33780/rvs-<strong>Sas</strong>-why-is-<strong>Sas</strong>-prefered-by-private-companies<br />

ou http://www.listserv.uga.edu/cgi-bin/wa?A2=ind1209c&L=<strong>Sas</strong>l&F=&S=&P=1099<br />

<strong>Sas</strong> a déjà construit sa passerelle vers Stata et Spss et nous l’avons présentée en V1_p101-102.<br />

Depuis la 9.2.3, <strong>Sas</strong> a également construit une solution d’échange avec R en passant par un produit<br />

autonome <strong>Sas</strong> IML Studio et <strong>de</strong> plus, en 9.3, a également construit une possibilité d’échange à partir <strong>de</strong> la<br />

simple proc Iml. Les habitués <strong>de</strong>s livraisons Académique et Recherche disposent <strong>de</strong>s <strong>de</strong>ux possibilités.<br />

[La situation antérieure était conflictuelle : d’une part R, issu <strong>de</strong> S plus, grandissait avec un a-priori <strong>de</strong> ses<br />

créateurs/utilisateurs: ignorer <strong>Sas</strong> car payant et non documenté quant à la structure <strong>de</strong> ses tables, hormis celle <strong>de</strong> la table<br />

xport.<br />

Seule exception Frank Harrell : ce statisticien, ancien <strong>Sas</strong>seur auteur d’une proc logist<br />

http://www.sascommunity.org/sugi/SUGI80/Sugi-80-37 Harrell Lee McKinnis.pdf , a construit une passerelle par rapport au<br />

type <strong>de</strong> fichier xport (V1_p69) datant <strong>de</strong> la version 5 (dans le package Hmisc) au début du siècle . Frank Harrell est bien<br />

actif: il propose encore ce cours : http://biostat.mc.van<strong>de</strong>rbilt.edu/twiki/pub/Main/StatGraphCourse/graphscourse.pdf .<br />

Cette position chez R, a entrainé un certain nombre <strong>de</strong> questions et réponses totalement insuffisantes dans les échanges sur<br />

les listes : https://stat.ethz.ch/pipermail/r-help/2007-December/149209.html<br />

ou même le tout récent http://www.mail-archive.com/r-help@r-project.org/msg174408.html<br />

En 2007, Erik Jorgensen( http://gbi.agrsci.dk/~ejo/R/docs/<strong>Sas</strong>Import.pdf ) a proposé quelque chose que j’ai un<br />

peu modifié et relaté dans une note technique <strong>de</strong> 16 p « Aller/retour entre <strong>Sas</strong> et R (multiples chemins possibles) » rédigée<br />

en 2008. C’est une importation à l’intérieur <strong>de</strong> R d’une table avec formats personnels issue <strong>de</strong> <strong>Sas</strong> 9.1.3 (toujours transitant<br />

par fichier <strong>de</strong> type –xport-) et supposant une version <strong>de</strong> <strong>Sas</strong> installée en local. Les utilisateurs <strong>de</strong> <strong>Sas</strong> ont donc<br />

majoritairement continué à passer par un tiers produit, plus facilement importable dans R.<br />

Or, <strong>Sas</strong> a bien évolué <strong>de</strong>puis et ses tables .sas7bdat se sont bien plus étoffées en longueur <strong>de</strong> noms <strong>de</strong> variable et labels et<br />

formats et la forme xport a été délaissée au profit <strong>de</strong> la norme Cdisc dans le domaine pharmaceutique et CDC.<br />

Il y a eu plus récemment, une tentative réussie d’une interface compatible avec la 9.2 et s’appuyant sur l’ODBC,<br />

mais elle a essuyé un échec commercial pour <strong>de</strong> multiples raisons juridiques et <strong>de</strong> marché : «Bridge to R for <strong>Sas</strong> Users »<br />

proposé par Phil Rack et adapté <strong>de</strong> ce qui avait été construit comme passerelle pour le produit WPS. La trace qui en reste :<br />

http://www.minequest.com/Misc/bridge2r<strong>de</strong>mo/Bridge_2_R_for_<strong>Sas</strong>.html<br />

En 2011, cela a encore bougé cette fois-ci du côté R avec un projet <strong>de</strong> Shotwell (à la Van<strong>de</strong>rBilt University)<br />

https://github.com/biostatmatt/<strong>Sas</strong>7bdat, décrit sur cette page http://cran.r-project.org/web/packages/<strong>Sas</strong>7bdat/<strong>Sas</strong>7bdat.pdf<br />

avec quelques discussions sur sa convivialité http://<strong>Sas</strong>-and-r.blogspot.fr/2011/07/really-useful-r-package-<strong>Sas</strong>7bdat.html .<br />

http://<strong>Sas</strong>syrea<strong>de</strong>r.eobjects.org/in<strong>de</strong>x.html est une autre tentative qui en est dérivée.<br />

Revolution Analytics propose http://www.insi<strong>de</strong>-r.org/packages/cran/<strong>Sas</strong>cii/docs/read.sascii <strong>de</strong> Anthony Damico.<br />

Stattransfer a aussi proposé la création <strong>de</strong> dataframe (je n’ai pas encore eu à le tester car faisant extrèmement peu<br />

<strong>de</strong> R) et il semble qu’il lui faille un complément : http://biostat.mc.van<strong>de</strong>rbilt.edu/wiki/Main/Jr<strong>Sas</strong>toR avec Frank Harrell<br />

toujours sur la brèche.<br />

De son côté, <strong>Sas</strong> a offert en 2011 ses solutions (en gras plus haut) pour travailler dans <strong>Sas</strong> et se servir <strong>de</strong> temps à<br />

autre <strong>de</strong> R. C’est ce que nous verrons ici.<br />

Cela nécessite bien sûr au minimum le module <strong>Sas</strong>-Iml et le Base+Stat du Foundation (ce que nous avons). Robert<br />

Muenchen le mentionne d’ailleurs sommairement en 3.6 dans son gros volume chez Springer Verlag 2011 2nd edition 686<br />

pages « R for <strong>Sas</strong> and Spss users ». Fin <strong>de</strong> cette petite histoire.]<br />

Nous allons examiner l’usage pratique <strong>de</strong>s solutions <strong>Sas</strong> à travers quelques exemples.<br />

Un logiciel <strong>Sas</strong> IML Studio 3.4 (en 32bit <strong>Windows</strong>) a été livré avec <strong>Sas</strong> Foundation 9.3, tout comme Enterprise<br />

Gui<strong>de</strong> 4.3 que nous pouvons utiliser en local (l’aspect serveur à distance n’est pas vu, mais est possible).<br />

La <strong>de</strong>rnière information technique sur l’évolution <strong>de</strong> <strong>Sas</strong> Iml studio 12.1 vient <strong>de</strong> tomber ce 11 septembre 2012:<br />

-La disponibilité d’une édition soit 32 soit 64 accédant chacune à <strong>Sas</strong> ou R qu’ils soient sous 32 ou 64 bits.<br />

-Alors qu’actuellement implicitement en mo<strong>de</strong> listing, le support <strong>de</strong> la <strong>de</strong>stination html par défaut permettra <strong>de</strong><br />

supporter directement la visualisation <strong>de</strong>s résultats <strong>de</strong> l’ods graphics. Le repli sur le listing existera cependant<br />

toujours.<br />

-Capacité accrue <strong>de</strong>s performances en programmation multiple en parallèle et sur divers ordinateurs multi-cœurs<br />

et multiprocesseurs<br />

220 <strong>Pratique</strong> <strong>de</strong> <strong>Sas</strong> windows ….93 <strong>Volume</strong> 2 et Coll.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!