REX
BD16_REX
BD16_REX
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Retours d’expériences Big Data en entreprise<br />
SOLUTION<br />
• SAS Visual Analytics<br />
BÉNÉFICES<br />
• VA va réduire de 18 à 5 mois le délai nécessaire pour rendre les données exploitables<br />
• Les multiples extractions ne sont plus nécessaires (chaque chercheur dispose de droits de consultation personnalisés<br />
et d’espaces de travail sécurisés, accessibles via un simple navigateur web).<br />
• L’ensemble des modifications et des mises à jour sont tracées.<br />
• VA offre une richesse fonctionnelle qui permet de nouvelles dimensions d’analyse.<br />
• Visualisation dynamique de la répartition des données en toute autonomie.<br />
• Résultats obtenus instantanés.<br />
• Exploitation des big data pour enrichir les analyses et susciter la collaboration.<br />
SAS - UTAC-OTC<br />
UTAC-OTC : PREMIER TOUR DE PISTE AVEC SAS® VISUAL ANALYTICS<br />
POUR L’ORGANISME DE SUPERVISION DU CONTROLE TECHNIQUE<br />
Chaque année, plus de 20 millions de contrôles techniques (100 000 par jour environ) sont centralisés par<br />
l’Organisme Technique Central (OTC, groupe UTAC/CERAM).<br />
Pour mieux explorer et exploiter ces données, l’OTC s’est doté en 2013 de SAS® Visual Analytics. Retour sur une<br />
première année de mise en œuvre, avec les premiers résultats, les premiers enseignements, et les perspectives de<br />
développement. Mis en place en 1992 pour les véhicules légers, le contrôle technique automobile est aujourd’hui<br />
assuré par 6 000 installations de contrôle, la plupart appartenant à l’un des cinq grands réseaux opérant sur tout<br />
le territoire. Depuis l’origine, l’UTAC a été notifié par le ministère des Transports comme Organisme Technique<br />
Central pour recueillir, aujourd’hui en temps réel, les données issues de chaque contrôle. L’organisme surveille<br />
les opérateurs et délivre les agréments, s’assure de l’homogénéité des contrôles et tient à jour des informations<br />
sur l’état du parc automobile français pour adapter et faire évoluer les équipements et les méthodes de contrôle.<br />
Aujourd’hui, l’OTC dispose de plusieurs bases de données contenant l’ensemble des contrôles techniques depuis<br />
1992 – soit environ 400 millions de contrôles au total, avec quelque 450 variables relevées !<br />
INSTALLATION DE L’OUTIL : UNE FORMATION EXPRESS<br />
Déjà équipé d’outils SAS pour l’analyse des données, l’OTC a choisi en 2013 de se doter de SAS Visual Analytics.<br />
« Avec une telle volumétrie, il était impossible d’ignorer la data visualisation... au moins pour voir ! » explique<br />
Thierry Ageron, responsable Etudes & Productions Statistiques du groupe UTAC/CERAM. L’OTC a donc choisi de<br />
partir sur une configuration minimale (un serveur de 16 cœurs avec 100 Go de données lues sur disque et 50 Go<br />
de données en mémoire) pour tester l’exploration de données et les possibilités de l’outil en matière d’édition de<br />
rapports. Une base de données de 42 Go contenant tous les contrôles effectués depuis 2008 (soit 43 colonnes et<br />
148 millions de lignes), a ainsi été chargée « in memory ».<br />
La mise en place de SAS Visual Analytics s’est réalisée en quatre jours : deux jours pour l’installation du produit,<br />
puis deux jours de formation et de prise en main pour les quatre statisticiens chargés d’explorer l’outil. Travailler<br />
en amont avec les consultants SAS pour assurer le transfert de compétences constituait pour Thierry Ageron un<br />
investissement humain essentiel : « on imagine souvent qu’on peut en faire l’économie, on se dit que ‘ça va passer’...<br />
mais prendre le temps au départ n’est pas un luxe inutile : c’est un vrai facteur de succès ! ».<br />
ANALYSE EXPLORATOIRE : TRAVAILLER PLUS VITE SUR DE MEILLEURES DONNÉES<br />
La première étude menée avec « VA » a concerné les temps de contrôle. Avec d’emblée, un atout important : la<br />
détection très facile des données atypiques (des contrôles inférieurs à 5 minutes, par exemple... voire des durées<br />
négatives en cas de mauvaise saisie des données), et la possibilité de les éliminer in-memory pour travailler plus<br />
vite sur une base statistiquement plus fiable. « Nous n’avions pas cette souplesse auparavant ! » note Thierry<br />
Ageron, qui rappelle qu’outre les études statistiques, les cas les plus étonnants peuvent être transmis aux services<br />
dépendant du ministère des transports, qui peuvent ainsi « contrôler les contrôleurs ».<br />
Des premières analyses ont ainsi été réalisées pour comparer les durées moyennes selon les réseaux, l’installation<br />
de contrôle, le jour de la semaine - ou selon les mois de l’année, avec des changements qui apparaissent clairement<br />
lors des deux mois d’été... Le bilan ? « SAS Visual Analytics permet de bien voir les tendances générales,<br />
avec la possibilité de zoomer sur une situation qui semble atypique, et de retourner en un clic à la donnée de base<br />
pour l’examiner. Ce qui nous prenait beaucoup de temps avant se fait ici très facilement ». Un mode d’exploration<br />
idéal pour échanger sur nos hypothèses lorsque l’on explore les données à plusieurs.<br />
Document réalisé par la Société Corp Events - Janvier 2015<br />
95