RapidMiner im akademischen Einsatz - Documentation - Rapid
RapidMiner im akademischen Einsatz - Documentation - Rapid
RapidMiner im akademischen Einsatz - Documentation - Rapid
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. Transparenz von Veröffenlichungen<br />
die hier geöffnet wird, lässt sich ein Prozess auch eindeutig identifizieren, wodurch<br />
sie zum Zitieren verwendet werden kann.<br />
Um einen eigenen Prozess auf myExper<strong>im</strong>ent hochzuladen, öffnen Sie den gewünschten<br />
Prozess und arrangieren ihn in der gewünschten Weise. Der aktuell angezeigte<br />
Subprozess wird als Bild auf myExper<strong>im</strong>ent hochgeladen und erscheint<br />
be<strong>im</strong> Browsen. Eine hübsche und übersichtliche Anordnung macht sich hier also<br />
bezahlt. Danach können Sie in der Browse MyExper<strong>im</strong>ent-Ansicht auf Upload<br />
klicken. Das in Abbildung 3.2 dargestellte Fenster öffnet sich und bietet Ihnen<br />
Felder zum Eingeben eines Titels und einer Beschreibung an. Die allgemeine Umgangssprache<br />
auf myExper<strong>im</strong>ent ist Englisch.<br />
3.3 Verfügbarmachen der Daten<br />
Da myExper<strong>im</strong>ent das Speichern von Daten aus Kapazitätsgründen nicht übern<strong>im</strong>mt,<br />
müssen wir für die Veröffentlichung der verwendeten Daten einen anderen<br />
Weg beschreiten, sofern die Daten überhaupt veröffentlicht werden dürfen und<br />
keiner Beschränkung aufgrund von Urheberrecht oder Vertraulichkeit unterliegen.<br />
Hierbei kommt uns die Fähigkeit von <strong><strong>Rapid</strong>Miner</strong> sehr entgegen, mit Daten<br />
von fast beliebigen Quellen umzugehen.<br />
Der häufig wohl einfachste Weg wäre, die Daten zunächst als CSV-Datei zu exportieren<br />
und die exportierte Datei auf einem beliebigen Webserver abzulegen. In<br />
<strong><strong>Rapid</strong>Miner</strong> können wir jetzt diese Adresse mit einem Open File-Operator öffnen,<br />
der auch Daten aus Internetquellen verarbeiten kann. Dieser Operator interpretiert<br />
die Daten zunächst nicht, sondern liefert ein File-Objekt für diese Datei. Wir<br />
können dann dieses Objekt an den file Eingang des Read CSV-Operators legen,<br />
um die Datei als CSV zu interpretieren und den Datensatz zu laden. Den Read<br />
CSV-Operator kann man dabei mit dem Wizard einfach konfigurieren, wobei der<br />
Wizard bequemlichkeitshalber auf einer lokalen Kopie der Datei ausgeführt werden<br />
kann. Denkt man jetzt noch daran, be<strong>im</strong> Export als CSV und be<strong>im</strong> Import<br />
dasselbe Encoding zu setzen, steht der Veröffentlichung kein Problem mehr <strong>im</strong><br />
Weg.<br />
38