Big Data erfordert Big Data Management - Uniserv

ExpErtENiNtErviEW 

speichern und auswerten und bilden so häufig die Klammer 

um die verschiedenen Daten-Welten. 

Dr. Wolfgang Martin: 

Eine Big-Data-Architektur lehnt sich an traditionelle Architekturen 

an. Die unterste Schicht ist die der Datenhaltung. 

Hier brauchen wir jetzt alternative, hoch-performante 

Technologien zur Datenhaltung, die die relationalen Technologien 

ergänzen. Auf der Datenhaltungsschicht sitzt 

Information Management, das zunächst einmal die traditionellen 

Komponenten wie Integrationsplattform, Repository 

und Data Quality Management enthält, dann aber 

auch neue wie Quellenidentifikation mittels Suchmaschinen 

und Extraktionswerkzeuge, die auch ohne APIs Daten extrahieren 

können. Hier werden verstärkt In-Memory und 

Parallelverarbeitung Einzug halten. Schließlich folgt die 

Analytik-Schicht, wo jetzt Data Discovery eine große Rolle 

spielt. Wichtig ist auch neben Data und Text Mining die Textanalytik, 

die sich insbesondere mittels linguistischer Verfahren 

gut für die Analyse unstrukturierter Daten eignet. 

Weiterhin spielen in der Analytik jetzt auch Suchmaschinen 

eine bedeutende Rolle. Dazu kommen noch Anreicherungsverfahren 

wie Geocoding, um all die Lokalisierungsdaten 

aus dem mobilen Internet auch gewinnbringend in Analysen 

und Prozessen nutzen zu können. 

4 

Holger Stelz, Director Business Development 

& Marketing, UNISERV GmbH. 

Datenqualität & Datenintegration trifft Big Data. Wie be- 

einflusst die Datenqualität Big-Data-Management? 

Holger Stelz 

Das Paradigma „der Prozess bestimmt die Datenqualität“ 

ändert sich auch bei Big Data nicht. Datenqualität ist auch 

bei Big Data von enormer Bedeutung. Vor allem dann, 

wenn – wie schon von mir angesprochen – Unternehmens- 

daten mit Informationen aus Big Data angereichert wer- 

den. Wenn also beispielsweise Kundendaten durch Daten 

aus den sozialen Medien ergänzt werden sollen, zum Beispiel 

bei den benutzerangepassten Suchergebnissen einer 

Google-Suche. Eine hohe Datenqualität muss bereits vor 

der Datenanalyse gewährleistet sein – am besten schon 

bei der Dateneingabe beziehungsweise Datenerhebung. 

Denn erst eine einheitliche, qualitativ hochwertige Datenbasis 

versetzt die Anwender in die Lage, Daten schnell zu 

analysieren und so beispielsweise rechtzeitig auf Markttendenzen 

zu reagieren. Die Grundaufgaben von Data 

Management in Bezug auf Big Data bleiben dabei die 

gleichen: Profiling, Cleansing sowie Anreichern und Abgleichen 

mit Referenzdaten. Aber auch hier steigt im Bereich 

Big Data die Bedeutung von Datenqualität: Das Schaffen 

des Single Point of Truth ist beim gegebenen Datenvolumen 

schwieriger geworden und auch die Anforderungen 

an die Performance der Datenqualitätslösungen sind stark 

angewachsen. 

Dr. Wolfgang Martin 

In der Vergangenheit hatten wir uns stets bemüht, den Single 

Point of Truth herzustellen und zu bewahren. Das wird 

nicht mehr so wie bisher, also deterministisch, im Big Data 

machbar sein, da eine Konsistenz über alle Datenquellen 

in der Regel nicht mehr erreichbar sein wird. Daher wird 

der Single Point of Truth eher mit wahrscheinlichkeitstheoretischen 

Ansätzen formuliert und definiert werden 

müssen. Mit diesen Überlegungen stehen wir aber noch 

ganz am Anfang. 

Holger Stelz 

Um auch mit Big Data im Unternehmen den Single Point of 

Truth anzustreben, müssen neben der Performance auch 

die Service-Orientierung der Werkzeuge, die Services selbst 

und die Plattformen stimmen. Denkbar ist hier zum Beispiel 

der Einsatz von hybriden Cloud-Lösungen, bei denen 

bestimmte Services in der Cloud zur Verfügung stehen und 

andere wiederum on demand abgerufen werden können.

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

Big Data erfordert Big Data Management - Uniserv

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?