06.11.2013 Aufrufe

RapidMiner im akademischen Einsatz - Documentation - Rapid

RapidMiner im akademischen Einsatz - Documentation - Rapid

RapidMiner im akademischen Einsatz - Documentation - Rapid

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2. Die Anwendungsfälle<br />

greift man auf seinen Wert über %{loop value} zu. Dies läßt sich <strong>im</strong> Prozess<br />

01.3 - Report Counts with groups zum Beispiel <strong>im</strong> ersten Loop Values-Operator<br />

sehen, der Geschlecht genannt wurde, da dieser über die beiden Ausprägungen<br />

des Attributs ”<br />

Geschlecht“ iteriert. Öffnet man per Doppelklick den Subprozess,<br />

sieht man als ersten Operator einen Filter Examples-Operator, der nur Zeilen<br />

behält, deren Attribut Geschlecht gleich dem Wert des Makros loop value ist.<br />

Führen wir den Prozess durch, sehen wir, dass in der generierten Excel-Datei<br />

für jede Gruppierung ein eigenes Tabellenblatt angelegt wird, während die einzelnen<br />

Gruppen untereinander aufgeführt werden. Einziger Schönheitsfehler ist<br />

die Gruppe der Studenten, die in der Gruppierung nach Jahrgangsstufe als Jahrgangsstufe<br />

“0” erscheint. Obwohl das natürlich schnell manuell beseitigt ist, wollen<br />

wir das direkt <strong>im</strong> Prozess bereinigen.<br />

Um dies zu beheben, müssen wir eigentlich weniger tun als bisher, wir müssen<br />

eben das Schreiben in den Bericht unterlassen, wenn wir bei Jahrgangsstufe den<br />

Wert 0 erreichen. Glücklicherweise stehen uns nicht nur Operatoren für Schleifen<br />

zur Verfügung, sondern auch eine bedingte Verzweigung. Dazu können wir den<br />

Operator Branch verwenden, der zwei Subprozesse hat. Einer wird ausgeführt,<br />

wenn die angegebene Bedingung erfüllt ist, der andere wenn sie nicht erfüllt<br />

ist. Die Bedingung lässt sich dabei in den Parametern einstellen. Neben datenabhängigen<br />

Bedingungen, wie zum Beispiel einer min<strong>im</strong>alen Größe der Eingabetabelle<br />

oder ähnlichem, lässt sich auch ein einfacher Ausdruck evaluieren. Ein<br />

Ausdruck wie ”%{loop value}”==”0” ist genau dann wahr, wenn der aktuelle<br />

Wert 0 ist. In unserem Beispiel wollen wir den inneren Subprozess genau dann<br />

ausführen, wenn diese Bedingung nicht erfüllt ist. Entsprechend brauchen wir unseren<br />

bisherigen Prozess für die Jahrgangsstufe also nur in den Else-Subprozess<br />

zu verschieben, wie in Abbildung 2.10 zu sehen.<br />

Das Ergebnis dieser Änderung kann in Prozess 01.04 - Report Counts with groups<br />

and exceptions betrachtet werden. Nach der Durchführung steht uns die bereinigte<br />

Excel-Datei zur Verfügung. Das einzig Ärgerliche bei der Erstellung unseres<br />

Berichts ist die Tatsache, dass wir jeweils exakt die gleiche Funktionalität <strong>im</strong>mer<br />

wieder und wieder in den Subprozessen eingefügt haben, einmal für jede Art von<br />

Gruppierung. Natürlich lassen sich die kompletten Subprozesse einfach kopieren,<br />

30

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!