RapidMiner im akademischen Einsatz - Documentation - Rapid
RapidMiner im akademischen Einsatz - Documentation - Rapid
RapidMiner im akademischen Einsatz - Documentation - Rapid
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2. Die Anwendungsfälle<br />
greift man auf seinen Wert über %{loop value} zu. Dies läßt sich <strong>im</strong> Prozess<br />
01.3 - Report Counts with groups zum Beispiel <strong>im</strong> ersten Loop Values-Operator<br />
sehen, der Geschlecht genannt wurde, da dieser über die beiden Ausprägungen<br />
des Attributs ”<br />
Geschlecht“ iteriert. Öffnet man per Doppelklick den Subprozess,<br />
sieht man als ersten Operator einen Filter Examples-Operator, der nur Zeilen<br />
behält, deren Attribut Geschlecht gleich dem Wert des Makros loop value ist.<br />
Führen wir den Prozess durch, sehen wir, dass in der generierten Excel-Datei<br />
für jede Gruppierung ein eigenes Tabellenblatt angelegt wird, während die einzelnen<br />
Gruppen untereinander aufgeführt werden. Einziger Schönheitsfehler ist<br />
die Gruppe der Studenten, die in der Gruppierung nach Jahrgangsstufe als Jahrgangsstufe<br />
“0” erscheint. Obwohl das natürlich schnell manuell beseitigt ist, wollen<br />
wir das direkt <strong>im</strong> Prozess bereinigen.<br />
Um dies zu beheben, müssen wir eigentlich weniger tun als bisher, wir müssen<br />
eben das Schreiben in den Bericht unterlassen, wenn wir bei Jahrgangsstufe den<br />
Wert 0 erreichen. Glücklicherweise stehen uns nicht nur Operatoren für Schleifen<br />
zur Verfügung, sondern auch eine bedingte Verzweigung. Dazu können wir den<br />
Operator Branch verwenden, der zwei Subprozesse hat. Einer wird ausgeführt,<br />
wenn die angegebene Bedingung erfüllt ist, der andere wenn sie nicht erfüllt<br />
ist. Die Bedingung lässt sich dabei in den Parametern einstellen. Neben datenabhängigen<br />
Bedingungen, wie zum Beispiel einer min<strong>im</strong>alen Größe der Eingabetabelle<br />
oder ähnlichem, lässt sich auch ein einfacher Ausdruck evaluieren. Ein<br />
Ausdruck wie ”%{loop value}”==”0” ist genau dann wahr, wenn der aktuelle<br />
Wert 0 ist. In unserem Beispiel wollen wir den inneren Subprozess genau dann<br />
ausführen, wenn diese Bedingung nicht erfüllt ist. Entsprechend brauchen wir unseren<br />
bisherigen Prozess für die Jahrgangsstufe also nur in den Else-Subprozess<br />
zu verschieben, wie in Abbildung 2.10 zu sehen.<br />
Das Ergebnis dieser Änderung kann in Prozess 01.04 - Report Counts with groups<br />
and exceptions betrachtet werden. Nach der Durchführung steht uns die bereinigte<br />
Excel-Datei zur Verfügung. Das einzig Ärgerliche bei der Erstellung unseres<br />
Berichts ist die Tatsache, dass wir jeweils exakt die gleiche Funktionalität <strong>im</strong>mer<br />
wieder und wieder in den Subprozessen eingefügt haben, einmal für jede Art von<br />
Gruppierung. Natürlich lassen sich die kompletten Subprozesse einfach kopieren,<br />
30