w26M2
w26M2
w26M2
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Big-Data-Technologien – Wissen für Entscheider<br />
Diese Fähigkeit zur Approximation – zur Findung ungefährer<br />
Antworten – unterscheidet ElasticSearch von<br />
traditionellen Datenbanken. Da Big Data mit unstrukturierten<br />
und polystrukturierten Daten zu tun hat, kommt<br />
dieser Fähigkeit große Bedeutung zu. Daher besteht die<br />
Grundidee darin, statistische Analysen und Algorithmen<br />
auf Textdaten anzuwenden. Mit einer möglichst einfachen<br />
Benutzeroberfläche wird diese Komplexität vor dem<br />
Benutzer weitestgehend verborgen.<br />
Technologisch gesehen weist ElasticSearch gewisse<br />
Ähnlichkeiten mit NoSQL-Dokumenten-Datenbanken<br />
wie Couchbase oder Cassandra auf, da in beiden Fällen<br />
textbasierte Dokumente gespeichert werden, auch wenn<br />
NoSQL-Dokumenten-Datenbanken nicht über die Möglichkeit<br />
verfügen, ähnliche Ergebnisse zurück zu senden,<br />
da keine Indizes erstellt werden.<br />
Search- und Discovery-Technologien wie ElasticSearch<br />
eignen sich gut für folgende Fragestellungen:<br />
Bei traditionellen relationalen Datenbanken stehen<br />
Präzision und Integrität der Daten im Vordergrund. Antworten<br />
sind schwarz oder weiß, nicht Schattierungen von<br />
Grautönen. Daher eignet sich Search nicht für Fragestellungen,<br />
für die relationale Datenbanken optimiert sind,<br />
wie beispielsweise:<br />
• Berechnung des noch verbleibenden Lagerbestands<br />
• Summierung aller ausstehenden Forderungen im<br />
laufenden Monat<br />
• Ausführung und Bestätigung von Transaktionen mit<br />
Rollback-Unterstützung<br />
• Vergabe von Identifikatoren bzw. Schlüsseldaten, die<br />
garantiert nur einmal vorkommen dürfen 63 .<br />
4.2.4 Query<br />
• Durchsuchen einer großen Anzahl von Produktbeschreibungen<br />
für die beste Übereinstimmung mit<br />
einem bestimmten Suchbegriff (z. B. »Schirm«) und<br />
Rücksendung der besten Ergebnisse,<br />
• Aufzeigen der verschiedenen Abteilungen bzw. Orte,<br />
in denen der Suchbegriff (»Schirm«) erscheint (»Facettierung«,<br />
z. B. Regenschirm, Sonnenschirm, Abschirmung,<br />
unter möglichem Ausschluss anderer Sprachen<br />
die auch das Wort Schirm enthalten),<br />
• Suche nach Wörtern, die ähnlich klingen,<br />
• Automatisches Ausfüllen eines Suchfelds auf der Basis<br />
eines nur teilweise getippten Wortes, basierend auf<br />
zuvor eingegebenen Suchbegriffen, unter Berücksichtigung<br />
von falschen Schreibweisen,<br />
• Speichern einer großen Menge von semi-strukturierten<br />
(JSON-)Daten verteilt über einen Server Cluster,<br />
mit einem bestimmten Niveau an Redundanz.<br />
Query ist die englische Bezeichnung für Abfrage. In der<br />
Welt der traditionellen Business Intelligence ist SQL die<br />
Standard-Sprache für Abfragen. Im allgemeinen Sprachgebrauch<br />
steht SQL als Abkürzung für Structured Query<br />
Language. SQL ist eine Datenbanksprache zur Definition<br />
von Datenstrukturen in relationalen Datenbanken sowie<br />
zum Bearbeiten (Einfügen, Verändern, Löschen) und<br />
Abfragen von darauf basierenden Datenbeständen.<br />
Die Sprache basiert auf der relationalen Algebra. Ihre<br />
Syntax ist relativ einfach aufgebaut und semantisch<br />
an die englische Umgangssprache angelehnt. Fast alle<br />
gängigen relationalen Datenbank-Systeme unterstützen<br />
SQL – allerdings in unterschiedlichem Umfang und leicht<br />
voneinander abweichenden »Dialekten«.<br />
Durch den Einsatz von SQL strebt man die Unabhängigkeit<br />
der Anwendungen vom eingesetzten Datenbank-<br />
Management-System an. Mit SQL können Benutzer zum<br />
Beispiel Datenbestände auswählen, filtern, sortieren,<br />
verknüpfen und umbenennen. Das Ergebnis einer Abfrage<br />
63<br />
z. B. eine Telefonnummer pro Kunde<br />
55