dans des entrepôts de données XML - CoDE - Université Libre de ...
dans des entrepôts de données XML - CoDE - Université Libre de ...
dans des entrepôts de données XML - CoDE - Université Libre de ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
CHAPITRE 4. ETL : ÉTAT DE L’ART 27<br />
4.5.2 ETLs open source<br />
4.5.2.1 Talend open studio<br />
Talend Open Studio est un ETL graphique et open source développé en Java/Eclipse. Pour<br />
un fichier <strong>XML</strong> se présentant en entrée, il le lit ligne par ligne pour le scin<strong>de</strong>r en champs et<br />
envoie ces <strong>de</strong>rniers tels que définis <strong>dans</strong> le schéma au composant suivant du job, via un lien<br />
Row.<br />
L’approche peut paraître relativement lente pour l’accès aux éléments mais si on tient compte<br />
<strong>de</strong> la lour<strong>de</strong>ur <strong><strong>de</strong>s</strong> applications java, il ne serait peut-être pas optimal d’envisager le chargement<br />
d’un grand-t-arbre <strong>XML</strong> en mémoire. Le lecteur trouvera plus d’informations sur<br />
http://www.talend.com.<br />
4.5.2.2 Scriptella<br />
Scriptella (http://scriptella.javaforge.com) est un ETL open source développé en<br />
java. Il nous a semblé relativement moins approprié pour une production réelle. En effet, il<br />
utilise essentiellement le SQL pour les transformations. Ce qui n’est pas spécialement adapté<br />
pour les <strong>données</strong> <strong>XML</strong>. Il faut <strong>de</strong> toutes les façons aller éditer un fichier <strong>XML</strong> pour préciser<br />
les informations <strong>de</strong> connexion (host, login, ...) et les requêtes éventuelles à exécuter.