REX
BD16_REX
BD16_REX
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Retours d’expériences Big Data en entreprise<br />
PagesJaunes est le leader français de la publicité et de l’information locale sur Internet (pagesjaunes.fr, pagespro.<br />
com), mobile (sites et applications) et imprimé (l’annuaire PagesJaunes et l’annuaire PagesBlanches). Pages-<br />
Jaunes est aussi un des leaders des services de renseignements par téléphone et SMS (118008), des petites<br />
annonces en ligne (annoncesjaunes.fr) et est le premier créateur de site Internet en France.<br />
En pleine transformation numérique de ses métiers, PagesJaunes est à la recherche de solutions analytiques<br />
agiles qui permettent à ses équipes commerciales de prendre les bonnes décisions, rapidement. « L’entreprise<br />
s’est engagée dans une transformation de sa plateforme d’aide à la décision pour sortir de la Business Intelligence<br />
traditionnelle et tirer réellement des avantages business des Big Data. Notre ambition est de faire parler<br />
les données, » situe Abed Ajraou, responsable de Domaine Business Intelligence au sein de Business Solutions<br />
chez PagesJaunes. Il a rejoint l’entreprise il y a un an environ pour mettre en place une stratégie Big Data, dans<br />
le contexte d’une migration d’une infrastructure base de données IBM avec appliance Netezza vers le framework<br />
Hadoop. L’objectif est de faire face aux défis techniques en termes de capacité (explosion du volume des données),<br />
de stockage de données non structurées et de reporting en temps réel.<br />
SYNCSORT PIONNIER SUR LE MARCHÉ<br />
« ETL pour Hadoop permet d’optimiser notre informatique décisionnelle, » explique Abed Ajraou. En résumé,<br />
l’enjeu consiste à mettre à disposition des responsables commerciaux des capacités d’analyse granulaire, leur<br />
permettant d’optimiser leurs forces de vente par secteur géographique notamment.<br />
La solution DMX-h fournie par Syncsort est utilisée pour l’extraction, la transformation et le chargement (ETL) sur<br />
Hadoop, ainsi que pour des fonctions d’exportation et importation de données. « Les échos du marché étaient<br />
positifs quant aux performances de l’ETL Hadoop de Syncsort. Des progrès considérables ont été réalisés en 2<br />
ans. Nos tests et notre proof of concept ont également été concluants. Venant du monde du mainframe, le fournisseur<br />
jouissait déjà d’une réputation de solidité. Ce sont les premiers à fournir ce genre d’outil sur Hadoop.,»<br />
souligne Abed Ajraou.<br />
Bien que la vocation première du projet Hadoop chez PagesJaunes ne soit pas de réaliser des économies, mais<br />
bien d’améliorer la qualité des données et booster ainsi les performances commerciales, le coût abordable de la<br />
solution Syncsort est également un argument non négligeable : « la solution devrait nous permettre de faire des<br />
économies substantielles sur les coûts de support logiciel. Nous pourrons faire beaucoup plus avec beaucoup<br />
moins, » affirme Abed Ajraou. Le déploiement d’applications sur Syncsort DMX-h a démarré début 2015. Un<br />
premier retour d’expériences est attendu pour mars et sera d’ailleurs partagé à la conférence Big Data de Paris.<br />
REPORTING FINANCIER EN TEMPS RÉEL<br />
Une demi-douzaine d’applications web sont progressivement mises en production. Elles visent pour la plupart à<br />
booster les performances des équipes marketing et ventes en accélérant le reporting financier, le cas échéant sur<br />
un appareil mobile. Les applications sont en effet conçues selon les principes du ‘responsive design’. « Un point<br />
central porte sur la possibilité de rafraîchir les chiffres de ventes, toutes les 5 minutes, par produit, par segment,<br />
par géographie ou par agence. »<br />
Globalement, les enjeux de performances techniques sont davantage liés à la rapidité des temps de réponse et à<br />
la granularité des données analysées qu’au volume de données en tant que tel. « Nous parlons de 45 millions de<br />
lignes de data, ce qui n’est pas si énorme comparé à d’autres implémentations sur Hadoop. La plateforme nous<br />
permet à l’avenir de gérer de gros volumes de données pouvant atteindre entre 15 et 20 To de données, » poursuit<br />
Abeb Ajraou. Ce projet Big Data sur Hadoop est emblématique d’une stratégie d’entreprise qui met l’informatique<br />
au service du business, n’hésitant pas le cas échéant à anticiper les besoins des équipes commerciales et à<br />
leurs donner des instruments de proactivité. « Ce n’est pas pour rien qu’au sein de PagesJaunes, le département<br />
‘systèmes d’information » a été rebaptisé ‘Business Solutions’, avec une mission qui va bien au-delà d’un simple<br />
support opérationnel. Ce type de projet contribue à renforcer la valeur ajoutée de l’informatique auprès de la direction<br />
générale,» souligne Abed Ajraou.<br />
SYNCSORT - TÉLÉCOMS, MÉDIAS, ENTERTAINMENT<br />
COMMENT LIBÉRER LES CAPACITÉS DES BASES DE DONNÉES ET<br />
RÉDUIRE LES COÛTS AVEC HADOOP<br />
Profil de l’entreprise : Grand groupe de télécoms, médias et home entertainment.<br />
PROBLÉMATIQUE<br />
Acteur majeur du home entertainment, cette entreprise génère et collecte des volumes de données parmi les plus<br />
importants du marché. Pour cela, elle exploite un data warehouse Netezza de plusieurs pétaoctets dont le volume<br />
suit chaque année une croissance à deux chiffres. Comptes clients, communications, programmes de fidélisation,<br />
paramètres de confidentialité, mesures d’audimat… ce data warehouse sous-tend les applications critiques de<br />
toute l’entreprise.<br />
Document réalisé par la Société Corp Events - Janvier 2015<br />
116