24.11.2015 Views

REX

BD16_REX

BD16_REX

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Retours d’expériences Big Data en entreprise<br />

SOLUTION<br />

• SAS Visual Analytics<br />

BÉNÉFICES<br />

• VA va réduire de 18 à 5 mois le délai nécessaire pour rendre les données exploitables<br />

• Les multiples extractions ne sont plus nécessaires (chaque chercheur dispose de droits de consultation personnalisés<br />

et d’espaces de travail sécurisés, accessibles via un simple navigateur web).<br />

• L’ensemble des modifications et des mises à jour sont tracées.<br />

• VA offre une richesse fonctionnelle qui permet de nouvelles dimensions d’analyse.<br />

• Visualisation dynamique de la répartition des données en toute autonomie.<br />

• Résultats obtenus instantanés.<br />

• Exploitation des big data pour enrichir les analyses et susciter la collaboration.<br />

SAS - UTAC-OTC<br />

UTAC-OTC : PREMIER TOUR DE PISTE AVEC SAS® VISUAL ANALYTICS<br />

POUR L’ORGANISME DE SUPERVISION DU CONTROLE TECHNIQUE<br />

Chaque année, plus de 20 millions de contrôles techniques (100 000 par jour environ) sont centralisés par<br />

l’Organisme Technique Central (OTC, groupe UTAC/CERAM).<br />

Pour mieux explorer et exploiter ces données, l’OTC s’est doté en 2013 de SAS® Visual Analytics. Retour sur une<br />

première année de mise en œuvre, avec les premiers résultats, les premiers enseignements, et les perspectives de<br />

développement. Mis en place en 1992 pour les véhicules légers, le contrôle technique automobile est aujourd’hui<br />

assuré par 6 000 installations de contrôle, la plupart appartenant à l’un des cinq grands réseaux opérant sur tout<br />

le territoire. Depuis l’origine, l’UTAC a été notifié par le ministère des Transports comme Organisme Technique<br />

Central pour recueillir, aujourd’hui en temps réel, les données issues de chaque contrôle. L’organisme surveille<br />

les opérateurs et délivre les agréments, s’assure de l’homogénéité des contrôles et tient à jour des informations<br />

sur l’état du parc automobile français pour adapter et faire évoluer les équipements et les méthodes de contrôle.<br />

Aujourd’hui, l’OTC dispose de plusieurs bases de données contenant l’ensemble des contrôles techniques depuis<br />

1992 – soit environ 400 millions de contrôles au total, avec quelque 450 variables relevées !<br />

INSTALLATION DE L’OUTIL : UNE FORMATION EXPRESS<br />

Déjà équipé d’outils SAS pour l’analyse des données, l’OTC a choisi en 2013 de se doter de SAS Visual Analytics.<br />

« Avec une telle volumétrie, il était impossible d’ignorer la data visualisation... au moins pour voir ! » explique<br />

Thierry Ageron, responsable Etudes & Productions Statistiques du groupe UTAC/CERAM. L’OTC a donc choisi de<br />

partir sur une configuration minimale (un serveur de 16 cœurs avec 100 Go de données lues sur disque et 50 Go<br />

de données en mémoire) pour tester l’exploration de données et les possibilités de l’outil en matière d’édition de<br />

rapports. Une base de données de 42 Go contenant tous les contrôles effectués depuis 2008 (soit 43 colonnes et<br />

148 millions de lignes), a ainsi été chargée « in memory ».<br />

La mise en place de SAS Visual Analytics s’est réalisée en quatre jours : deux jours pour l’installation du produit,<br />

puis deux jours de formation et de prise en main pour les quatre statisticiens chargés d’explorer l’outil. Travailler<br />

en amont avec les consultants SAS pour assurer le transfert de compétences constituait pour Thierry Ageron un<br />

investissement humain essentiel : « on imagine souvent qu’on peut en faire l’économie, on se dit que ‘ça va passer’...<br />

mais prendre le temps au départ n’est pas un luxe inutile : c’est un vrai facteur de succès ! ».<br />

ANALYSE EXPLORATOIRE : TRAVAILLER PLUS VITE SUR DE MEILLEURES DONNÉES<br />

La première étude menée avec « VA » a concerné les temps de contrôle. Avec d’emblée, un atout important : la<br />

détection très facile des données atypiques (des contrôles inférieurs à 5 minutes, par exemple... voire des durées<br />

négatives en cas de mauvaise saisie des données), et la possibilité de les éliminer in-memory pour travailler plus<br />

vite sur une base statistiquement plus fiable. « Nous n’avions pas cette souplesse auparavant ! » note Thierry<br />

Ageron, qui rappelle qu’outre les études statistiques, les cas les plus étonnants peuvent être transmis aux services<br />

dépendant du ministère des transports, qui peuvent ainsi « contrôler les contrôleurs ».<br />

Des premières analyses ont ainsi été réalisées pour comparer les durées moyennes selon les réseaux, l’installation<br />

de contrôle, le jour de la semaine - ou selon les mois de l’année, avec des changements qui apparaissent clairement<br />

lors des deux mois d’été... Le bilan ? « SAS Visual Analytics permet de bien voir les tendances générales,<br />

avec la possibilité de zoomer sur une situation qui semble atypique, et de retourner en un clic à la donnée de base<br />

pour l’examiner. Ce qui nous prenait beaucoup de temps avant se fait ici très facilement ». Un mode d’exploration<br />

idéal pour échanger sur nos hypothèses lorsque l’on explore les données à plusieurs.<br />

Document réalisé par la Société Corp Events - Janvier 2015<br />

95

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!