13.07.2013 Views

dans des entrepôts de données XML - CoDE - Université Libre de ...

dans des entrepôts de données XML - CoDE - Université Libre de ...

dans des entrepôts de données XML - CoDE - Université Libre de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 4. ETL : ÉTAT DE L’ART 27<br />

4.5.2 ETLs open source<br />

4.5.2.1 Talend open studio<br />

Talend Open Studio est un ETL graphique et open source développé en Java/Eclipse. Pour<br />

un fichier <strong>XML</strong> se présentant en entrée, il le lit ligne par ligne pour le scin<strong>de</strong>r en champs et<br />

envoie ces <strong>de</strong>rniers tels que définis <strong>dans</strong> le schéma au composant suivant du job, via un lien<br />

Row.<br />

L’approche peut paraître relativement lente pour l’accès aux éléments mais si on tient compte<br />

<strong>de</strong> la lour<strong>de</strong>ur <strong><strong>de</strong>s</strong> applications java, il ne serait peut-être pas optimal d’envisager le chargement<br />

d’un grand-t-arbre <strong>XML</strong> en mémoire. Le lecteur trouvera plus d’informations sur<br />

http://www.talend.com.<br />

4.5.2.2 Scriptella<br />

Scriptella (http://scriptella.javaforge.com) est un ETL open source développé en<br />

java. Il nous a semblé relativement moins approprié pour une production réelle. En effet, il<br />

utilise essentiellement le SQL pour les transformations. Ce qui n’est pas spécialement adapté<br />

pour les <strong>données</strong> <strong>XML</strong>. Il faut <strong>de</strong> toutes les façons aller éditer un fichier <strong>XML</strong> pour préciser<br />

les informations <strong>de</strong> connexion (host, login, ...) et les requêtes éventuelles à exécuter.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!