22.01.2015 Aufrufe

w26M2

w26M2

w26M2

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Hortonworks<br />

Data Platform<br />

Source<br />

Data<br />

Load<br />

SQOOP<br />

compute<br />

&<br />

storage<br />

HCATALOG (table metadata)<br />

. . .<br />

Interactive<br />

HIVE/SQL<br />

Visualize<br />

Twitter<br />

Feed<br />

FLUME<br />

NFS<br />

(Alternate)<br />

. . . .<br />

Batch<br />

Map<br />

Reduce<br />

. . . .<br />

PIG<br />

. . .<br />

AMBARI<br />

compute<br />

&<br />

storage<br />

Online<br />

HBASE<br />

Abbildung 43: Anwendung der Hortonworks Data Platform für die Analyse von Twitter-Daten<br />

Abbildung 44: Beispiel-Szenario – Emotions-Analyse bei PKW<br />

Im PKW-Beispiel (vgl. Abbildung 44) wird der Ausgangstext<br />

zusammen mit allen Annotationen in einem UIMA-<br />

Dokument gespeichert. Mittels Apache UIMA kann eine<br />

Sequenz von Buchstaben oder Worten durch eine Annotation<br />

gekennzeichnet werden, z. B. wird eine Wortfolge<br />

als Nennung eines Autotyps annotiert. Darüber hinaus<br />

können auch Relationen zwischen Annotationen im Text<br />

markiert werden, z. B. Ärger// /Verbrauch.<br />

UIMA erlaubt einen schnellen Zugriff<br />

auf diese Annotationen und kann sie als XML-Dokument<br />

auslagern. Die Schritte bei der Sprachverarbeitung und<br />

Analyse sind in Tabelle 13 aufgelistet.<br />

106

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!