28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Projektbericht Cuberunner<br />

Smart Wind Farm Control – Dokumentation<br />

4 Zusammenführen 1-4 Merge<br />

Join<br />

5 Nummerierung entfernen<br />

Select /<br />

Rename<br />

values<br />

anschließenden Merge Join auszuführen.<br />

Zusammenführung aller Datensätze anh<strong>and</strong> des<br />

zuvor generierten Timestamp auf eine Datenbasis.<br />

Löschung der Timestamp Duplikate, sodass nur<br />

noch ein Timestamp vorh<strong>and</strong>en ist.<br />

6 Sortieren Final Sort rows Erneute Sortierung der Datensätze anh<strong>and</strong> des<br />

Timestamp, dieses dient als Sicherheit um Fehler<br />

in den Folgeschritten auf Grund einer fehlerhaften<br />

Sortierung zu vermeiden.<br />

7 Null / 0 Filter Filter<br />

rows<br />

Löschung der kompletten Datensätze, welche Null<br />

oder 0 Werte enthalten. Die Filterung erfolgt auf<br />

Basis von Bedingungen bspw.: (Windrichtung<br />

CONTAINS [NA] OR Windrichtung = [0])<br />

Alle Werte, welche diese Bedingung nicht erfüllen,<br />

werden an Vorgang 9 weitergegeben und sonst<br />

an Vorgang 8.<br />

8 Papierkorb Dummy Dient als Dummy um die zuvor gefilterten Null<br />

oder 0 Werte aufzunehmen bzw. zu löschen.<br />

9 Tabelle erweitern Add<br />

constant<br />

values<br />

10 Nummerierung Final Get Value<br />

From<br />

Sequence<br />

11 Anlagen ID Setzen Replace in<br />

String<br />

12 Datei Output Text file<br />

output<br />

Pentaho Data Integration CE – Job<br />

Erweiterung der Datensätze um alle aktuell im<br />

Datenmodell enthaltene Attribute bspw. Anlagen_ID,<br />

Blatteinstellwinkel. Diese Werte werden<br />

mit dem Wert 0 gefüllt, somit enthalten die Datensätze<br />

nach dem späteren Import in das SAP<br />

HANA System keine Null Werte. Eventuelle Fehler<br />

durch Null Werte in z.B. Reports werden damit<br />

im Vorfeld vermieden.<br />

Finale inkrementelle Nummerierung der Datensätze.<br />

Setzen der aktuellen Anlagen_ID in allen Datenzeilen,<br />

diese wird der Umgebungsvariable ${sensor}<br />

entnommen.<br />

Export der Daten in eine Textdatei. Die einzelnen<br />

Werte werden dabei durch Semikolons getrennt.<br />

Tabelle 3.11: Erläuterung der Transformationskette<br />

Insbesondere die große Datenmenge führte zu einer langen Bearbeitungszeit der beschriebenen Transformationskette<br />

je WEA. Um diese auch unbeaufsichtigt durchzuführen, ist ein Job angelegt worden,<br />

mit dessen Hilfe alle Transformationen hinterein<strong>and</strong>er ausgeführt werden können, (siehe Abbildung<br />

3.5). Die dort aufgeführten Transformationen rufen jeweils die beschriebene Transformationskette auf<br />

und übergeben die zu transformierende WEA Nummer, in diesem Fall die Nummern 1 bis 12. Weiterhin<br />

werden insgesamt drei E-Mails über den aktuellen Status des Jobs an die hinterlegte E-Mailadresse<br />

versendet.<br />

475

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!