24.11.2015 Views

REX

BD16_REX

BD16_REX

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Retours d’expériences Big Data en entreprise<br />

PagesJaunes est le leader français de la publicité et de l’information locale sur Internet (pagesjaunes.fr, pagespro.<br />

com), mobile (sites et applications) et imprimé (l’annuaire PagesJaunes et l’annuaire PagesBlanches). Pages-<br />

Jaunes est aussi un des leaders des services de renseignements par téléphone et SMS (118008), des petites<br />

annonces en ligne (annoncesjaunes.fr) et est le premier créateur de site Internet en France.<br />

En pleine transformation numérique de ses métiers, PagesJaunes est à la recherche de solutions analytiques<br />

agiles qui permettent à ses équipes commerciales de prendre les bonnes décisions, rapidement. « L’entreprise<br />

s’est engagée dans une transformation de sa plateforme d’aide à la décision pour sortir de la Business Intelligence<br />

traditionnelle et tirer réellement des avantages business des Big Data. Notre ambition est de faire parler<br />

les données, » situe Abed Ajraou, responsable de Domaine Business Intelligence au sein de Business Solutions<br />

chez PagesJaunes. Il a rejoint l’entreprise il y a un an environ pour mettre en place une stratégie Big Data, dans<br />

le contexte d’une migration d’une infrastructure base de données IBM avec appliance Netezza vers le framework<br />

Hadoop. L’objectif est de faire face aux défis techniques en termes de capacité (explosion du volume des données),<br />

de stockage de données non structurées et de reporting en temps réel.<br />

SYNCSORT PIONNIER SUR LE MARCHÉ<br />

« ETL pour Hadoop permet d’optimiser notre informatique décisionnelle, » explique Abed Ajraou. En résumé,<br />

l’enjeu consiste à mettre à disposition des responsables commerciaux des capacités d’analyse granulaire, leur<br />

permettant d’optimiser leurs forces de vente par secteur géographique notamment.<br />

La solution DMX-h fournie par Syncsort est utilisée pour l’extraction, la transformation et le chargement (ETL) sur<br />

Hadoop, ainsi que pour des fonctions d’exportation et importation de données. « Les échos du marché étaient<br />

positifs quant aux performances de l’ETL Hadoop de Syncsort. Des progrès considérables ont été réalisés en 2<br />

ans. Nos tests et notre proof of concept ont également été concluants. Venant du monde du mainframe, le fournisseur<br />

jouissait déjà d’une réputation de solidité. Ce sont les premiers à fournir ce genre d’outil sur Hadoop.,»<br />

souligne Abed Ajraou.<br />

Bien que la vocation première du projet Hadoop chez PagesJaunes ne soit pas de réaliser des économies, mais<br />

bien d’améliorer la qualité des données et booster ainsi les performances commerciales, le coût abordable de la<br />

solution Syncsort est également un argument non négligeable : « la solution devrait nous permettre de faire des<br />

économies substantielles sur les coûts de support logiciel. Nous pourrons faire beaucoup plus avec beaucoup<br />

moins, » affirme Abed Ajraou. Le déploiement d’applications sur Syncsort DMX-h a démarré début 2015. Un<br />

premier retour d’expériences est attendu pour mars et sera d’ailleurs partagé à la conférence Big Data de Paris.<br />

REPORTING FINANCIER EN TEMPS RÉEL<br />

Une demi-douzaine d’applications web sont progressivement mises en production. Elles visent pour la plupart à<br />

booster les performances des équipes marketing et ventes en accélérant le reporting financier, le cas échéant sur<br />

un appareil mobile. Les applications sont en effet conçues selon les principes du ‘responsive design’. « Un point<br />

central porte sur la possibilité de rafraîchir les chiffres de ventes, toutes les 5 minutes, par produit, par segment,<br />

par géographie ou par agence. »<br />

Globalement, les enjeux de performances techniques sont davantage liés à la rapidité des temps de réponse et à<br />

la granularité des données analysées qu’au volume de données en tant que tel. « Nous parlons de 45 millions de<br />

lignes de data, ce qui n’est pas si énorme comparé à d’autres implémentations sur Hadoop. La plateforme nous<br />

permet à l’avenir de gérer de gros volumes de données pouvant atteindre entre 15 et 20 To de données, » poursuit<br />

Abeb Ajraou. Ce projet Big Data sur Hadoop est emblématique d’une stratégie d’entreprise qui met l’informatique<br />

au service du business, n’hésitant pas le cas échéant à anticiper les besoins des équipes commerciales et à<br />

leurs donner des instruments de proactivité. « Ce n’est pas pour rien qu’au sein de PagesJaunes, le département<br />

‘systèmes d’information » a été rebaptisé ‘Business Solutions’, avec une mission qui va bien au-delà d’un simple<br />

support opérationnel. Ce type de projet contribue à renforcer la valeur ajoutée de l’informatique auprès de la direction<br />

générale,» souligne Abed Ajraou.<br />

SYNCSORT - TÉLÉCOMS, MÉDIAS, ENTERTAINMENT<br />

COMMENT LIBÉRER LES CAPACITÉS DES BASES DE DONNÉES ET<br />

RÉDUIRE LES COÛTS AVEC HADOOP<br />

Profil de l’entreprise : Grand groupe de télécoms, médias et home entertainment.<br />

PROBLÉMATIQUE<br />

Acteur majeur du home entertainment, cette entreprise génère et collecte des volumes de données parmi les plus<br />

importants du marché. Pour cela, elle exploite un data warehouse Netezza de plusieurs pétaoctets dont le volume<br />

suit chaque année une croissance à deux chiffres. Comptes clients, communications, programmes de fidélisation,<br />

paramètres de confidentialité, mesures d’audimat… ce data warehouse sous-tend les applications critiques de<br />

toute l’entreprise.<br />

Document réalisé par la Société Corp Events - Janvier 2015<br />

116

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!