18.03.2015 Aufrufe

Optimierung der Datenqualität im Unternehmen - we.CONECT

Optimierung der Datenqualität im Unternehmen - we.CONECT

Optimierung der Datenqualität im Unternehmen - we.CONECT

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong><br />

<strong>Unternehmen</strong><br />

Wie Sie schlechte Informationen in den Griff bekommen<br />

Ein Whitepaper<br />

von Vincent Lam<br />

1<br />

Information Buil<strong>der</strong>s


Vincent Lam<br />

Vincent Lam ist <strong>der</strong> für die Vermarktung <strong>der</strong> gesamten Produktlinie von iWay<br />

Software verantwortliche Produktmarketingleiter.<br />

Er verfügt über breit gefächerte Erfahrungen <strong>im</strong> Technologiesektor<br />

und hat zur erfolgreichen Positionierung von iWay Software an <strong>der</strong><br />

Marktspitze beigetragen. Zu Beginn seiner beruflichen Karriere war Lam<br />

als strategischer Produktmanager tätig. Er führte neue strategische und<br />

innovative Produkte am Markt ein, z. B. WebFOCUS Magnify, die <strong>we</strong>lt<strong>we</strong>it<br />

erste transaktionsbasierte Echtzeit-Suchlösung für den <strong>Unternehmen</strong>seinsatz.<br />

Lam trug in Firmen an <strong>der</strong> Wall Street und in High-Tech-<strong>Unternehmen</strong> zu<br />

Innovationen bei und war auch unternehmerisch tätig.<br />

Vincent Lam besitzt einen Bachelor of Science von <strong>der</strong> Cornell University in<br />

Ithaca, New York.


Inhaltsverzeichnis<br />

1<br />

Einführung<br />

2<br />

2<br />

3<br />

6<br />

6<br />

Verbesserung <strong>der</strong> Datenqualität<br />

Profiling<br />

Bereinigung, Standardisierung, Anreicherung, Abgleich und Zusammenführung<br />

Scoring<br />

Er<strong>we</strong>iterbarkeit und Flexibilität für individuelle Daten<br />

7<br />

7<br />

7<br />

8<br />

Qualitätsmanagement <strong>im</strong> gesamten Daten-Lebenszyklus<br />

Upstream<br />

Instream<br />

Downstream<br />

9<br />

9<br />

9<br />

Datenqualität effektiv nutzen<br />

Qualitätssicherung bei externen Daten<br />

Warum es auf die Qualität bei Echtzeitdaten ankommt<br />

10<br />

10<br />

11<br />

iWay Software: Perfektes Datenqualitätsmanagement <strong>im</strong> <strong>Unternehmen</strong><br />

iWay Data Quality Center<br />

iWay Data Profiler<br />

13<br />

Entscheidend in je<strong>der</strong> Informationsmanagement-Strategie<br />

14<br />

Schlussfolgerungen


Einführung<br />

Datenqualität – das Maß für Korrektheit, Vollständigkeit und Einheitlichkeit von Daten <strong>im</strong><br />

<strong>Unternehmen</strong> – steht in vielen <strong>Unternehmen</strong> <strong>im</strong> Zentrum des Informationsmanagements.<br />

<strong>Unternehmen</strong> je<strong>der</strong> Größe kämpfen mit Problemen bei <strong>der</strong> Datenqualität. Umfragen bestätigen,<br />

dass mindestens 75% aller Großunternehmen <strong>der</strong>zeit große Herausfor<strong>der</strong>ungen angesichts<br />

unzureichenden Informationsgehaltes haben. Damit nicht genug, behauptet eine Studie von<br />

SiriusDecisions, dass selbst in Firmen mit opt<strong>im</strong>ierten Prozessen etwa 10 % aller Kundendatensätze<br />

gravierende Fehler auf<strong>we</strong>isen. Bei Firmen ohne formalisiertes Datenmanagement kann dieser Wert<br />

<strong>im</strong> Extremfall bei 25 % liegen. 1<br />

Solche Datenqualitätsprobleme können unterschiedlichste Ursachen haben. Es ist noch nicht<br />

lange her, da fand die große Mehrheit aller Daten ihren Weg in die <strong>Unternehmen</strong>s-IT über<br />

fehlerträchtige manuelle Datenerfassung. Neue Datenquellen wie Web-Portale und B2B-<br />

Interaktionen mit Lieferanten und Partnern erhöhen die Komplexität <strong>der</strong> Datenumgebungen in<br />

den <strong>Unternehmen</strong>. Diese unterschiedlichen elektronischen Echtzeit-Quellen liefern Informationen,<br />

die anspruchsvoller und vielfältiger und damit geschäftlich <strong>we</strong>rtvoller sind. Gleichzeitig<br />

ersch<strong>we</strong>ren Sie eine einheitliche Datenqualität <strong>im</strong> <strong>Unternehmen</strong>, <strong>we</strong>il zur Sicherung <strong>der</strong><br />

Informationen eine Echtzeit-Firewall not<strong>we</strong>ndig wird.<br />

Außerdem sind ähnliche Informationen wie z. B. Kundendaten in unterschiedlichen separaten<br />

Quellen gespeichert, etwa CRM-An<strong>we</strong>ndungen o<strong>der</strong> Buchhaltungssystemen. Die Informationen<br />

<strong>we</strong>rden in einer Quelle aktualisiert, aber nicht in <strong>der</strong> an<strong>der</strong>en, und so entstehen Inkonsistenzen,<br />

die zu unterschiedlichen Versionen führen. Darüber hinaus sind manche Daten sch<strong>we</strong>r zu finden.<br />

Wenn die Benutzer nicht in <strong>der</strong> Lage sind, auf die am dringendsten benötigten Informationen<br />

zuzugreifen und schnelle Entscheidungen zu treffen, sinkt <strong>der</strong> Wert <strong>der</strong> <strong>Unternehmen</strong>sdaten. Ein<br />

kleiner Fehler kann Daten <strong>im</strong> gesamten <strong>Unternehmen</strong> unbrauchbar machen, und beschädigte<br />

Daten können fatale Folgen haben. Marktstudien schätzen, dass US-Firmen durch Kundendaten-<br />

Qualitätsprobleme jährlich ein Schaden von 611 Milliarden Dollar entsteht.<br />

In seinem Buch „Data Driven: Profiting From Your Most Important Business Asset“ stellt Thomas C.<br />

Redman die These auf, dass ein einziges Prozent fehlerhafter Daten katastrophale Folgen haben<br />

kann. Er führt als Beispiel eine Kundenbestellung an, für die 12 Informationen benötigt wurden.<br />

Werden 100 Bestellungen mit je 12 Informationselementen perfekt eingegeben, kostet dies das<br />

<strong>Unternehmen</strong> je Bestellung einen Dollar, also insgesamt hun<strong>der</strong>t Dollar. Bei Berücksichtigung <strong>der</strong><br />

Fehlerquelle von 1 % <strong>we</strong>rden 12 Bestellungen falsch abgewickelt, was die entsprechenden Kosten<br />

mehr als verdoppeln kann. 2<br />

In diesem Artikel sollen Techniken behandelt <strong>we</strong>rden, mit denen Firmen die Datenqualität<br />

unternehmens<strong>we</strong>it verbessern können. Außerdem <strong>we</strong>rden die Datenqualitätsmanagement-<br />

Lösungen von iWay Software vorgestellt, mit denen Richtigkeit, Vollständigkeit und Einheitlichkeit<br />

von Informationen in sämtlichen Systemen innerhalb <strong>der</strong> Firmeninfrastruktur effektiv und<br />

kostengünstig gesichert <strong>we</strong>rden können.<br />

1 “The Impact of Bad Data on Demand Creation,” SiriusDecisions, 2008.<br />

2 Redman, Thomas C., “Data Driven: Profiting From Your Most Important Business Asset,” 2008.<br />

1<br />

Information Buil<strong>der</strong>s


Verbesserung <strong>der</strong> Datenqualität<br />

Der Schlüssel zur konstant hohen Datenqualität ist die Sicherung einheitlicher<br />

Datenqualitätsverfahren für alle Informationsquellen <strong>im</strong> <strong>Unternehmen</strong>. Gängige<br />

Datenqualitätsmanagement-Methoden:<br />

Profiling<br />

Wird auch als Data-Discovery bezeichnet. Profiling ist <strong>der</strong> Prozess <strong>der</strong> Erstellung von Statistiken<br />

über <strong>Unternehmen</strong>sdaten. Was sind ihre Haupteigenschaften und Attribute? Wie und von <strong>we</strong>m<br />

wurden sie erstellt? Welche Benutzer greifen am häufigsten zu? Für <strong>we</strong>lche Z<strong>we</strong>cke <strong>we</strong>rden sie vor<br />

allem eingesetzt? Und vor allen Dingen, in <strong>we</strong>lchem Zustand befinden sie sich?<br />

Profiling ist eines <strong>der</strong> effektivsten Mittel, <strong>we</strong>nn es darum geht, <strong>Unternehmen</strong>sdaten zu<br />

durchschauen. Solche Erkenntnisse erleichtern es, den Gesamtzustand <strong>der</strong> Daten präzise<br />

einzuschätzen, Fehler zu ermitteln, zu priorisieren und zu korrigieren und die Ursachen von<br />

Qualitätsproblemen zu beheben. Ist erst einmal ein Profil erstellt, kann ein <strong>Unternehmen</strong> durch die<br />

laufende Überwachung profilbezogener Parameter frühzeitiger auf Qualitätsprobleme reagieren.<br />

2<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Bereinigung, Standardisierung, Anreicherung, Abgleich und<br />

Zusammenführung<br />

Alle diese unzusammenhängend erscheinenden Schritte sind <strong>we</strong>sentlich für die Erzielung und<br />

Aufrechterhaltung max<strong>im</strong>aler Datenqualität. Durch die Bereinigung <strong>we</strong>rden Fehler in Datenbanken<br />

und an<strong>der</strong>en Informationsquellen durch die Verän<strong>der</strong>ung vorhandener Daten anhand<br />

vordefinierter Regeln und Kriterien el<strong>im</strong>iniert.<br />

Im Beispiel unten wurden Datensätze mit fehlerhaften Namen identifiziert. Be<strong>im</strong><br />

Bereinigungsprozess <strong>we</strong>rden fehlende Einträge ergänzt und ausgefüllte Fel<strong>der</strong> <strong>we</strong>rden<br />

automatisch nach festgelegten Regeln an ein best<strong>im</strong>mtes Format angepasst.<br />

Source Data<br />

Name G SIN Birth Date Address<br />

Dr. John Smith M 000000000 12/16/1978 14618 110 Ave Surrey V3R 2A9<br />

Smith W. John M 095-242-434 16.12.1978 Surrey 14618 110 Ave<br />

John William Smith 095242434 781612 25 Linden Str Toronto M4X 1V5<br />

Dr. J.W. Smith M 095242433 11/16/78<br />

John Smith 095252433 16.11.1978 8500 Leslie L3T 7M8 Toronto<br />

Smith John 16.11.1978 8500 Leslie street Marham<br />

John Smiht 095252433 16.11.1978<br />

Jane Watson 420347213 1982 600-8500 Leslie str. Toronto L3T 7M8<br />

Watson Jane F 420-347-213 5.1.1982 8500 Leslei street Toronto L3T 7M8<br />

Jane Smith F SIN420347213 1982-01-0<br />

J. Smith 420-347-213<br />

Daten vor <strong>der</strong> Bereinigung<br />

Cleansed Data<br />

First Last G SIN Birth Date Address<br />

John Smith M 1987-12-16 V3R 2A9; BC; Surrey; 14618 110 Avenue<br />

John Smith M 095242434 1978-12-16 V3R 2A9; BC; Surrey; 14618 110 Avenue<br />

John Smith M 095242434 M4X 1V5; ON;Toronto; 25 Linden Street<br />

Smith M 1987-11-16<br />

John Smith M 095252433 1978-11-16 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />

John Smith M 1978-11-16 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />

John Smith M 095252433 1978-11-16<br />

Jane Watson F 420347213 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />

Jane Watson F 420347213 1982-01-01 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />

Jane Smith F 420347213 1982-01-05<br />

J. Smith 420347213<br />

Daten nach <strong>der</strong> Bereinigung<br />

3<br />

Information Buil<strong>der</strong>s


Bei <strong>der</strong> Anreicherung wird <strong>der</strong> Inhalt abgerundet, indem die Informationen durch den Vergleich<br />

mit externen Inhalten wie Altersstrukturen o<strong>der</strong> geografischen Faktoren verglichen und ggf. durch<br />

Attribute dynamisch er<strong>we</strong>itert und opt<strong>im</strong>iert <strong>we</strong>rden. In diesem Beispiel <strong>we</strong>rden bisher fehlende<br />

PLZ anhand <strong>der</strong> Adressen ermittelt und als separates Feld ergänzt.<br />

Cleansed Data<br />

First Last G SIN Birth Date Address<br />

John Smith M 1978-12-16 BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 1978-12-16 BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 ON;Toronto;25 Linden Street<br />

Smith M 1978-11-16<br />

John Smith M 095252433 1978-11-16 ON;Markham;8500 Leslie Str.<br />

John Smith M 1978-11-16 ON;Markham;8500 Leslie Str.<br />

John Smith M 095252433 1978-11-16<br />

Jane Watson F 420347213 ON;Markham;8500 Leslie Str.<br />

Jane Watson F 420347213 1982-01-01 ON;Markham;8500 Leslie Str.<br />

Jane Smith F 420347213 1982-01-05<br />

J. Smith 420347213<br />

Daten vor <strong>der</strong> Anreicherung<br />

Enriched Data<br />

First Last G SIN Birth Date Address Zip<br />

John Smith M 1978-12-16 BC; Surrey; 14618 110 Avenue V3R 2A9<br />

John Smith M 095242434 1978-12-16 BC; Surrey; 14618 110 Avenue V3R 2A9<br />

John Smith M 095242434 ON; Toronto; 25 Linden Street M4X 1V5<br />

Smith M 1978-11-16<br />

John Smith M 095252433 1978-11-16 ON; Markham; 8500 Leslie Str. L3T 7M8<br />

John Smith M 1978-11-16 ON; Markham; 8500 Leslie Str. L3T 7M8<br />

John Smith M 095252433 1978-11-16<br />

Jane Watson F 420347213 ON; Markham; 8500 Leslie Str. L3T 7M8<br />

Jane Watson F 420347213 1982-01-01 ON; Markham; 8500 Leslie Str. L3T 7M8<br />

Jane Smith F 420347213 1982-01-05<br />

J. Smith 420347213<br />

Daten nach <strong>der</strong> Anreicherung<br />

Zusammenführung und Abgleich för<strong>der</strong>n die Einheitlichkeit, <strong>we</strong>il verwandte Einträge innerhalb<br />

eines Systems o<strong>der</strong> systemübergreifend automatisch erkannt <strong>we</strong>rden und dann verknüpft,<br />

abgest<strong>im</strong>mt o<strong>der</strong> verschmolzen <strong>we</strong>rden können. Das Beispiel zeigt, wie <strong>der</strong> Abgleich- und<br />

Zusammenführungsprozess abläuft.<br />

4<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Cleansed Data<br />

First Last G SIN Birth Date Address<br />

John Smith M 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 M4X 1V5;ON;Toronto;25 Linden Street<br />

Smith M 1978-11-16<br />

John Smith M 095252433 1978-11-16 L3T 7M8;ON;Markham;8500 Leslie Str.<br />

John Smith M 1978-11-16 L3T 7M8;ON;Markham;8500 Leslie Str.<br />

John Smith M 095252433 1978-11-16<br />

Jane Watson F 420347213 L3T 7M8;ON;Markham;8500 Leslie Str.<br />

Jane Watson F 420347213 1982-01-01 L3T 7M8;ON;Markham;8500 Leslie Str.<br />

Jane Smith F 420347213 1982-01-05<br />

J. Smith 420347213<br />

Abgleich<br />

Es <strong>we</strong>rden verwandte Einträge für John Smith und Jane Watson gefunden. Trotz <strong>der</strong> Ähnlichkeiten<br />

zwischen den Datensätzen sind nicht alle Informationen redundant – es gibt wirklich z<strong>we</strong>i<br />

verschiedene John Smiths. Leistungsfähige Abgleichfunktionen <strong>we</strong>rten die Daten in den<br />

einzelnen Sätzen detailliert aus und ermitteln, <strong>we</strong>lche redundant sind und <strong>we</strong>lche eigenständig.<br />

Cleansed Data<br />

First Last G SIN Birth Date Address<br />

John Smith M 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />

John Smith M 095242434 M4X 1V5;ON;Toronto;25 Linden Street<br />

Golden Record<br />

First Last G SIN Birth Date Address<br />

John Smith M 095242434 1978-12-16 V3R;BC;Surrey;14618 110 Avenue<br />

Zusammenführung<br />

Durch die Zusammenführung <strong>we</strong>rden die abgest<strong>im</strong>mten Daten zu einem umfassenden Datensatz.<br />

Hier <strong>we</strong>rden die doppelten Einträge für John Smith zu einem vollständigen Datensatz vereinigt,<br />

<strong>der</strong> alle Informationen enthält. Da das Adressfeld wi<strong>der</strong>sprüchliche Daten enthielt, wurde anhand<br />

fester Regeln die häufigste Version ver<strong>we</strong>ndet. Auch Householding, eine ähnliche Technik wie<br />

die Zusammenführung, bei <strong>der</strong> verwandte Informationen von getrennten Systemen gesammelt<br />

und in einer zentralen Datenbank gespeichert <strong>we</strong>rden, fällt in diese Kategorie. Mit Householding<br />

können Firmen ähnliche Informationen etwa über Familien o<strong>der</strong> <strong>Unternehmen</strong> konsolidieren und<br />

so dem Benutzer ein vollständiges Bild bieten.<br />

5<br />

Information Buil<strong>der</strong>s


Scoring<br />

Viele <strong>Unternehmen</strong> setzen auf ein Scoringsystem, um die Datenqualität besser beurteilen und<br />

Probleme besser priorisieren zu können, sobald diese auftreten. Dabei wird jedem Datensatz<br />

eine Zahl zugeordnet, die etwas über die Qualität aussagt. Ein lupenreiner Datensatz kann<br />

beispiels<strong>we</strong>ise einen Wert von 5 erhalten, während ein völlig ungültiger Datensatz einen Wert von<br />

1 erhält. Die Werte dazwischen zeigen, wieviel Vertrauen das <strong>Unternehmen</strong> in die Korrektheit des<br />

Datensatzes setzt und gibt an, ob Maßnahmen erfor<strong>der</strong>lich sind (Datensätze mit Werten von 3 und<br />

darunter sind manuell zu prüfen).<br />

In <strong>der</strong> Praxis zählt hier Flexibilität – für verschiedene Datentypen müssen unterschiedliche<br />

Regeln ver<strong>we</strong>ndet <strong>we</strong>rden, die bei Problemen die je<strong>we</strong>ilige Dringlichkeit deutlich machen.<br />

Kritische Daten wie Informationen über Kunden sollten strenger be<strong>we</strong>rtet <strong>we</strong>rden als Daten über<br />

Verbrauchsmaterialbestände.<br />

Er<strong>we</strong>iterbarkeit und Flexibilität für individuelle Daten<br />

Um ermitteln zu können, <strong>we</strong>lche Daten mangelhaft sind, muss festgelegt <strong>we</strong>rden, wie die<br />

Datensätze aussehen müssen. Informationen wie Adressen und Postleitzahlen können einfach<br />

mit einer Datenbank abgeglichen <strong>we</strong>rden, aber für die meisten Datentypen ist das nicht möglich.<br />

Ein Großteil <strong>der</strong> Daten ist technischer Natur – z. B. Produktdaten – und die Beurteilung erfor<strong>der</strong>t<br />

Fachkenntnisse.<br />

Zur proaktiven Be<strong>we</strong>rtung solcher Daten müssen feste Schemata vorhanden sein. Die Regeln<br />

müssen einfach zu definieren und umzusetzen sein und sollten idealer<strong>we</strong>ise von vornherein<br />

verhin<strong>der</strong>n, dass fehlerhafte Daten überhaupt in die Umgebung gelangen.<br />

6<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Qualitätsmanagement <strong>im</strong> gesamten Daten-Lebenszyklus<br />

<strong>Unternehmen</strong>sdaten haben einen Lebenszyklus. Sie be<strong>we</strong>gen sich in verschiedenen Richtungen<br />

innerhalb und außerhalb eines Betriebs. Im Geschäftsablauf fließen Daten:<br />

Upstream<br />

Daten gelangen auf verschiedenen Wegen und in zahllosen Formaten in ein <strong>Unternehmen</strong>, z.<br />

B. als E-Mail, Fax o<strong>der</strong> Brief. Sie können bei Telefonaten, Besprechungen o<strong>der</strong> <strong>im</strong> dynamischen<br />

und automatisierten B2B-Austausch erfasst <strong>we</strong>rden. Sie können sogar über neue Kanäle wie<br />

Web-Portale und Self-Service-Umgebungen sowie gehostete o<strong>der</strong> Cloud-basierte Quellen wie<br />

Salesforce.com ankommen.<br />

Die Berührungspunkte, über die Daten generiert und gesammelt <strong>we</strong>rden, sind in den letzten<br />

Jahren komplexer geworden und die Fehlerquellen haben zugenommen. Das ersch<strong>we</strong>rt die<br />

Einhaltung von Regeln und Datenqualitätsstandards und damit auch die Sicherstellung <strong>der</strong><br />

Datenintegrität.<br />

Instream<br />

Vorhandene Daten <strong>we</strong>rden laufend durch das <strong>Unternehmen</strong> transportiert und <strong>we</strong>rden<br />

bei komplexen Geschäftstransaktionen o<strong>der</strong> zur Unterstützung von Reporting- o<strong>der</strong><br />

Analyseaktivitäten häufig verän<strong>der</strong>t o<strong>der</strong> mit an<strong>der</strong>en Datensätzen kombiniert.<br />

7<br />

Information Buil<strong>der</strong>s


Diese ständige Be<strong>we</strong>gung schafft das Potenzial für gravierende Qualitätsprobleme. Ein Mangel<br />

an aktiven Kontrollen be<strong>im</strong> Datenkonsum kann zu mangelhaft abgeglichenen, schlecht<br />

kategorisierten, redundanten Daten und zu Datenverlust führen. Derartige Probleme <strong>we</strong>rden oft<br />

zu spät erkannt.<br />

Downstream<br />

Endan<strong>we</strong>n<strong>der</strong> greifen häufig zu Aus<strong>we</strong>rtungs- o<strong>der</strong> Analysez<strong>we</strong>cken auf Daten zu. Daten können<br />

direkt von Backend-Quellen o<strong>der</strong> Datenspeichern abgerufen <strong>we</strong>rden und <strong>we</strong>rden dann für<br />

operatives, Finanz- o<strong>der</strong> Compliance-Reporting genutzt, Managern anhand von Dashboards o<strong>der</strong><br />

Scorecards präsentiert o<strong>der</strong> in mehrd<strong>im</strong>ensionale Cubes für <strong>we</strong>itergehende Bearbeitung und<br />

Analyse geladen.<br />

Zugriffsprobleme wie Duplikation o<strong>der</strong> inkonsistente Semantik können die Benutzer dabei<br />

behin<strong>der</strong>n, Daten sinnvoll für die tägliche Arbeit zu nutzen. Das kann sich negativ auf betriebliche<br />

Effizienz, Geschäftserfolg und Profitabilität auswirken.<br />

Es ist bekannt, dass fehlerhafte Daten sich vermehren. So wie ein verschmutzter Fluss das Wasser<br />

eines Sees kontaminiert, in den er fließt, so kann ein einziger defekter Datensatz zahlreiche<br />

Systeme infizieren. Je länger ein <strong>Unternehmen</strong> damit wartet, fehlerhafte Daten zu berichtigen,<br />

desto schädlicher. Datenmanagement muss frühzeitig ansetzen, damit nicht aus kleinsten<br />

Qualitätsproblemen große <strong>we</strong>rden.<br />

8<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Datenqualität effektiv nutzen<br />

Qualitätssicherung bei externen Daten<br />

Datenqualität wird meist <strong>im</strong> Hinblick auf Informationen in Backend-Datenbanken und sonstigen<br />

internen Datenquellen diskutiert. Viele Daten kommen jedoch von außen. Sie stammen aus<br />

An<strong>we</strong>ndungen von Lieferanten, Distributoren und an<strong>der</strong>en Partnern, <strong>we</strong>rden von Websites<br />

abgerufen o<strong>der</strong> kommen von Kunden in diversen unstrukturierten Formaten.<br />

Dennoch wird dieser Umstand von <strong>we</strong>nigen Datenqualitätsinitiativen berücksichtigt, was den<br />

Erfolg solcher Initiativen durch große Lücken und risikobehaftete Umgebungen ersch<strong>we</strong>rt. Da<br />

schon ein einzelner Datensatz jede Menge an<strong>der</strong>e Systeme kontaminieren kann, sind solche<br />

externen Quellen ein erhebliches Risiko.<br />

Deshalb ist es so wichtig, bewährte Qualitätsmanagement-Techniken wie Scoringsysteme,<br />

Bereinigung, Abgleich und Zusammenführung für alle Datenquellen einzusetzen. Die Einführung<br />

einer Datenqualitätspolitik ausschließlich für interne Systeme schützt nur einen Teil <strong>der</strong> kritischen<br />

Daten und schränkt die Effektivität einer solchen Initiative stark ein.<br />

Warum es auf die Qualität bei Echtzeitdaten ankommt<br />

Die Ermittlung und Korrektur fehlerhafter Daten nach dem Eintritt in das System ist wichtig, aber<br />

das Management <strong>der</strong> Datenqualität in Echtzeit bringt erheblich größere Effekte. Der SiriusDesigns-<br />

Report stellt die „1-10-100-Regel“ vor, die den Nutzen proaktiven Handelns bei <strong>der</strong> Datenqualität<br />

veranschaulicht. Diese Regel besagt, dass es einen Dollar kostet, einen Datensatz zu überprüfen,<br />

zehn Dollar, ihn nach <strong>der</strong> Erfassung zu berichtigen und zu deduplizieren und hun<strong>der</strong>t Dollar an<br />

potenziellen Produktivitätsverlusten o<strong>der</strong> Umsätzen, <strong>we</strong>nn gar nichts unternommen wird.5<br />

Nehmen wir noch einmal das Beispiel des Flusses. Es ist <strong>we</strong>niger aufwändig, das verschmutzte<br />

Wasser an <strong>der</strong> Quelle aufzufangen, als ein großes Gewässer nach erfolgter Verschmutzung zu<br />

reinigen.<br />

Gleiches gilt für <strong>Unternehmen</strong>sdaten. Die Bereinigung von Daten, die über mehrere Quellen<br />

verteilt sind, verursacht <strong>we</strong>it mehr Aufwand als das Berichtigen eines fehlerhaften Datensatzes,<br />

bevor dieser in eine Datenbank gelangt.<br />

5 “The Impact of Bad Data on Demand Creation,” Sirius Decisions, 2008.<br />

9<br />

Information Buil<strong>der</strong>s


iWay Software:<br />

Perfektes Datenqualitätsmanagement <strong>im</strong> <strong>Unternehmen</strong><br />

iWay Software liefert Lösungen mit Leistungsmerkmalen, die Vollständigkeit, Richtigkeit,<br />

Einheitlichkeit und Unversehrtheit von <strong>Unternehmen</strong>sdaten opt<strong>im</strong>ieren. Unsere<br />

zukunfts<strong>we</strong>isenden Tools helfen <strong>Unternehmen</strong> je<strong>der</strong> Größe und jedes Zuschnitts, in allen<br />

relevanten Systemen max<strong>im</strong>ale Datenqualität zu erreichen.<br />

iWay Data Quality Center<br />

iWay Data Quality Center (DQC) ist ein grundlegendes Tool für komplexes<br />

Datenqualitätsmanagement. Mit seinen lückenlosen Regelsystemen und lokalisierten<br />

Wörterbüchern evaluiert, überwacht und verwaltet iWay DQC nicht nur die Datenqualität in<br />

verschiedenen Informationssystemen, son<strong>der</strong>n verhin<strong>der</strong>t auch, dass fehlerhafte Daten überhaupt<br />

in das System gelangen.<br />

Daraus ergeben sich folgende Vorteile:<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

Steuerung <strong>der</strong> Datenqualität in Transaktions- und Analysean<strong>we</strong>ndungen<br />

Bereinigung und Vereinheitlichung von Daten bei Systemmigrationen<br />

Sicherung <strong>der</strong> Qualität bei Software-Integrationsprojekten<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Integrität von Adress- und Kontaktinformationen<br />

Verbesserung von Kundendaten zur Identifizierung von Kunden<br />

Validierung und Korrektur unvollständiger Datensätze in Kundenprofilen<br />

Validierung von Daten, die über Self-Service-An<strong>we</strong>ndungen eingegeben wurden<br />

Tiefgreifendes Data Profiling durch Datenintegrations-Projektanalyse<br />

10<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Kostengünstig, integriert, intuitiv – iWay DQC liefert ein breites Spektrum zukunfts<strong>we</strong>isen<strong>der</strong><br />

Funktionen. Die wichtigsten Leistungsmerkmale:<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

Zentralisiertes Management aller Aktivitäten zur <strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität inklusive aller<br />

Geschäftsprozesse und Datenflüsse von einer einzelnen Plattform<br />

Kombinierte Administrations-Tools für einfache Konfiguration ohne<br />

externe An<strong>we</strong>ndungen<br />

Plattform-unabhängige Architektur auf <strong>der</strong> Basis offener Standards<br />

Parallelverarbeitung sichert Skalierbarkeit, unterstützt Batch- und On-demand-Modi und<br />

beschleunigt Datenqualitätsprozesse. Der gesamte Prozess dauert nur eine Zehntelsekunde; pro<br />

Stunde <strong>we</strong>rden über fünf Millionen Datensätze verarbeitet<br />

Zukunfts<strong>we</strong>isendes semantisches Profiling zur schnellen, präzisen Informationsanalyse<br />

Direkte Integration in jede An<strong>we</strong>ndung aus den Bereichen B2B, A2A, Portal, ESB, SOA und ETL<br />

Direkter Zugriff auf externe Datenquellen wie nationale Adress- o<strong>der</strong> Namensregister sowie<br />

Wörterbücher und Listen zu Analyse-, Bereinigungs- und Validierungsz<strong>we</strong>cken<br />

Leistungsfähige Algorithmen zum effizienten Abgleich bei <strong>der</strong> Datensatzvereinheitlichung<br />

unabhängig von internen Datenstrukturen<br />

iWay Data Profiler<br />

Der iWay Data Profiler integriert den Output des iWay DQC einfach und effektiv in die BI-<br />

Technologie. Administratoren können geschäftskritische Daten beobachten, überwachen,<br />

vergleichen und aus<strong>we</strong>rten. Zusätzliche Client-Software, Plugins o<strong>der</strong> Report-Vie<strong>we</strong>r sind nicht<br />

erfor<strong>der</strong>lich. iWay Data Profiler bietet leistungsfähige Integrationsfunktionen auf <strong>der</strong> Grundlage<br />

ausgereifter Tools für Datenqualitätsüberwachung, Reporting und Analyse, mit denen Profiling-<br />

Daten nahezu beliebig abgefragt, analysiert, geliefert und angezeigt <strong>we</strong>rden können.<br />

11<br />

Information Buil<strong>der</strong>s


Die mit den semantischen Analysefunktionen und komplexen Regelsystemen von iWay Data<br />

Quality Center generierten Data-Profiling-Informationen liefern grundlegende statistische<br />

Informationen wie Eindeutigkeit und Häufigkeit und decken Beziehungen zwischen Daten anhand<br />

von Pr<strong>im</strong>är- und Fremdschlüsseln auf. Diese Profiling-Daten können dann mit intuitiven, grafischen<br />

Reporting-Tools noch <strong>we</strong>iter analysiert <strong>we</strong>rden, sodass Ab<strong>we</strong>ichungen bei Datenprofilen in<br />

verschiedenen Zeiträumen sichtbar <strong>we</strong>rden. Die so entstandenen Kategorien können dann<br />

detaillierter aufgeschlüsselt <strong>we</strong>rden, sodass die einzelnen Datensätze sichtbar <strong>we</strong>rden.<br />

Der iWay Data Profiler bietet u. a. folgende Funktionen:<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

Individuell einstellbare Datenqualitätsindikatoren (DQI), mit denen verschiedene<br />

Gültigkeitsstufen festgelegt <strong>we</strong>rden können. Die DQI können dann auf Daten ange<strong>we</strong>ndet<br />

<strong>we</strong>rden, um direkt die Unversehrtheit best<strong>im</strong>mter Datensätze zu prüfen.<br />

Dynamische Sammlung von Profiling-Daten von iWay DQC<br />

Tagging und Archivierung von Profiling-Daten als Sets in einer zugehörigen relationalen<br />

Datenbank zum einfachen Abruf<br />

Er<strong>we</strong>iterte Datenmanipulation und Grafik<br />

Vergleich mehrerer Data-Profiling-Sets zur schnelleren Erkennung von Ab<strong>we</strong>ichungen<br />

Druck und Export von Data-Profiling-Ansichten in HTML, PDF, Excel und <strong>we</strong>iteren gängigen<br />

Formaten<br />

Direkt in den Profiling-Report eingebettete portable Analysefunktionen zur Anzeige und<br />

Analyse von Profiling-Daten in nahezu beliebiger Weise<br />

iWay Data Profiler ist auch als SaaS-An<strong>we</strong>ndung verfügbar. Die Vorteile:<br />

■<br />

■<br />

■<br />

■<br />

Beschleunigte Inbetriebnahme und Einrichtung<br />

Mehr Wirtschaftlichkeit durch praktisches Pay-per-use-Modell ohne hohe Anschaffungskosten<br />

Detaillierte Profiling-Informationen können leichter an die Veranstwortlichen <strong>we</strong>itergegeben<br />

<strong>we</strong>rden, in <strong>der</strong> Regel technisch nicht versierte An<strong>we</strong>n<strong>der</strong> in unterschiedlichen<br />

<strong>Unternehmen</strong>sbereichen<br />

Sofortige kostengünstige Skalierbarkeit bei Bedarf<br />

12<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Entscheidend in je<strong>der</strong> Informationsmanagement-Strategie<br />

Data Profiling und Datenqualitätsmanagement sind <strong>we</strong>sentliche Komponenten je<strong>der</strong> breit<br />

angelegten Enterprise-Information-Management (EIM)-Strategie. EIM verbindet die Prinzipien und<br />

Technologien <strong>der</strong> Enterprise Integration, Business Intelligence und Content-Management und<br />

rationalisiert so Erzeugung, Speicherung, Zugriff und Handhabung von Daten.<br />

Damit können <strong>Unternehmen</strong> den Wert ihrer Daten steigern und daraus durch höhere<br />

Produktivität, niedrigere Verwaltungskosten und höhere Leistungsfähigkeit substanzielle<br />

Wettbe<strong>we</strong>rbsvorteile schöpfen. iWay Software bietet ein umfassendes Programm von Tools und<br />

Lösungen für alle Aspekte des EIM.<br />

13<br />

Information Buil<strong>der</strong>s


Schlussfolgerungen<br />

Datenqualitätsfragen sind in <strong>Unternehmen</strong> je<strong>der</strong> Größe in allen Branchen präsent. Unabhängig<br />

von <strong>der</strong> Ursache kosten diese Probleme <strong>Unternehmen</strong> Jahr für Jahr Milliardenbeträge. Je länger<br />

die Probleme unerkannt bleiben, desto mehr Schaden richten sie an.<br />

Neue Verfahren helfen <strong>Unternehmen</strong> dabei, die gravierendsten Probleme zu überwinden. Mit<br />

solchen Methoden und Lösungen können sie formelle Datenqualitätsrichtlinien erfolgreich<br />

einführen und durchsetzen.<br />

iWay Software bietet ein lückenloses Programm von Datenqualitäts-Managementlösungen mit<br />

einem leistungsfähigen Data-Profiling-Tool und einer umfassenden Datenqualitätsplattform,<br />

mit denen Sie Datenqualität durchgängig steuern können, und zwar schneller, einfacher<br />

und kostengünstiger. Mit diesen Tools können <strong>Unternehmen</strong> Konsistenz, Korrektheit und<br />

Vollständigkeit ihrer wichtigsten Daten erheblich steigern – unabhängig davon, wo diese erzeugt<br />

wurden und wo sie gespeichert sind.<br />

14<br />

<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>


Welt<strong>we</strong>ite Nie<strong>der</strong>lassungen<br />

Nordamerika<br />

Europa<br />

■<br />

USA<br />

Belgien* Information Buil<strong>der</strong>s Belgium<br />

■ Atlanta,* GA (770) 395-9913<br />

Brüssel 32-2-7430240<br />

■ Balt<strong>im</strong>ore, MD Professionelle Services:<br />

■ Deutschland Information Buil<strong>der</strong>s (D) GmbH<br />

(703) 247-5565<br />

Eschborn* 49-6196-77576-0<br />

■ Boston,* MA (781) 224-7660<br />

■ Frankreich* Information Buil<strong>der</strong>s France S.A.<br />

■ Chicago,* IL (630) 971-6700<br />

Paris 33-14-507-6600<br />

■ Cincinnati,* OH (513) 891-2338<br />

■ Großbritannien* Information Buil<strong>der</strong>s (UK) Ltd.<br />

■ Dallas,* TX (972) 490-1300<br />

London 44-845-658-8484<br />

■ Denver,* CO (303) 770-4440<br />

■ Italien Information Buil<strong>der</strong>s Italy<br />

■ Detroit,* MI (248) 641-8820<br />

Milan 39-02-30-314-420<br />

■ Fe<strong>der</strong>al Systems,* DC (703) 276-9006<br />

■ Nie<strong>der</strong>lande* Information Buil<strong>der</strong>s<br />

■ Hartford, CT (860) 249-7229<br />

(Netherlands) B.V.<br />

■ Houston,* TX (713) 952-4800<br />

Amsterdam 31-20-4563333<br />

■ Kanäle, (800) 969-4636<br />

■ Portugal Information Buil<strong>der</strong>s Portugal<br />

■ Los Angeles,* CA (310) 615-0735<br />

Lisbon 351-217-217-400<br />

■ Minneapolis,* MN (651) 602-9100<br />

■ Sch<strong>we</strong>iz Information Buil<strong>der</strong>s Sch<strong>we</strong>iz AG<br />

■ New Jersey Vertrieb: (973) 593-0022<br />

Dietlikon 41-44-839-49-49<br />

■ New York,* NY Vertrieb: (212) 736-7928<br />

■ Spanien Information Buil<strong>der</strong>s Iberica S.A.<br />

Professionelle Services:<br />

Barcelona 34-93-344-32-70<br />

(212) 736-4433, Apparat 4443<br />

Bilbao 34-94-452-50-15<br />

■ Orlando, FL (407) 562-1852<br />

Madrid* 34-91-710-22-75<br />

■ Philadelphia,* PA Vertrieb: (610) 940-0790<br />

■ Phoenix, AZ (480) 346-1095<br />

Vertretungen<br />

■ Pittsburgh, PA Vertrieb: (412) 494-9699<br />

■ Ägypten InfoBuild Middle East<br />

■ St. Louis,* MO (636) 519-1411<br />

Abu Dhabi 971-2-627-5911<br />

■ San Jose,* CA (408) 453-7600<br />

Dubai 971-4-3914391<br />

■ Seattle, WA (206) 624-9055<br />

■ Äthiopien MKTY T Services Plc<br />

■ Washington,* DC Vertrieb: (703) 276-9006<br />

Addis Ababa 251-11-5501933<br />

Professionelle Services: (703) 247-5565<br />

■ Bahrain InfoBuild Middle East<br />

Dubai 973-17-536-222, ext. 312<br />

Kanada<br />

■ Brasilien InfoBuild Brazil Ltda.<br />

Information Buil<strong>der</strong>s (Canada) Inc.<br />

São Paulo 55-11-3285-1050<br />

■ Calgary (403) 437-3479<br />

■ China<br />

■ Montreal* (514) 421-1555<br />

Information Buil<strong>der</strong>s China (IBC)<br />

■ Ottawa (613) 233-7647<br />

Beijing 86-10-5128-9680<br />

■ Toronto* (416) 364-2760<br />

Beijing Xinrong Software Technology Co., Ltd.<br />

■ Vancouver (604) 688-2499<br />

Beijing 86-10-5873-2031<br />

■ Dänemark InfoBuild AB<br />

Mexiko<br />

Kista, SE 46-735-23-34-97<br />

Information Buil<strong>der</strong>s Mexico<br />

■<br />

■ Finnland InfoBuild Oy<br />

Mexico City 52-55-5062-0660<br />

Espoo 358-207-580-840<br />

■ Griechenland Applied Science<br />

Australien<br />

Athen 30-210-699-8225<br />

Information Buil<strong>der</strong>s Pty. Ltd.<br />

■ Guatemala IDS de Centroamerica<br />

■ Melbourne* 61-3-9631-7900<br />

Guatemala City 502-2412-4212<br />

■ Sydney* 61-2-8223-0600 ■ Indien* InfoBuild India<br />

Chennai 91-44-42177082<br />

■ Israel SRL Group Ltd.<br />

Tel Aviv 972-3-7662030<br />

■ Japan K.K. Ashisuto<br />

Osaka 81-6-6373-7113<br />

Tokio 81-3-5276-5863<br />

■ Jordanien InfoBuild Middle East<br />

Abu Dhabi 971-2-627-5911<br />

Dubai 971-4-3914391<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

■<br />

Katar InfoBuild Middle East<br />

Dubai 974-467-7311<br />

Korea<br />

UVANSYS<br />

Seoul 82-2-832-0705<br />

Kuwait InfoBuild Middle East<br />

Dubai 965-22322926<br />

Libanon InfoBuild Middle East<br />

Dubai 961-4-533162<br />

Nor<strong>we</strong>gen InfoBuild Norway<br />

Oslo 47-48-20-40-30<br />

Oman InfoBuild Middle East<br />

Abu Dhabi 971-2-627-5911<br />

Dubai 971-4-3914391<br />

Österreich Raiffeisen Informatik Consulting GmbH<br />

Vienna 43-12-1136-3870<br />

Polen/Mittel- und Osteuropa InfoBuild SP.J.<br />

Warschau 48-22-657-00-14<br />

Russische Fö<strong>der</strong>ation FOBOS Plus Co., Ltd.<br />

Moskau 7-495-926-3358<br />

Saudi-Arabien InfoBuild Middle East<br />

Riad 996-1-2180280<br />

Singapur<br />

Automatic Identification Technology Ltd.<br />

Singapur 65-6286-2922<br />

Südafrika<br />

InfoBuild South Africa (Pty.) Ltd.<br />

Gauteng 27-83-4600800<br />

Fujitsu Services (Pty.) Ltd.<br />

Johannesburg 27-11-2335911<br />

Taiwan Galaxy Software Services<br />

Taipei 886-2-2586-7890<br />

Thailand Datapro Computer Systems Co. Ltd.<br />

Bangkok 662-679-1927, ext. 200<br />

Türkei InfoBuild Middle East<br />

Ankara 90-312-266-33-00<br />

Istanbul 90-212-325-4114<br />

Venezuela InfoServices Consulting<br />

Caracas 58-212-763-1653<br />

Vereinigte Arabische Emirate<br />

InfoBuild Middle East<br />

Abu Dhabi 971-2-627-5911<br />

Dubai 971-4-3914391<br />

Gebührenfreie Nummer<br />

■<br />

Vertrieb, ISV, VAR und SI Partner-Informationen<br />

(800) 969-4636<br />

* Mit Schulungseinrichtungen ausgestattet.<br />

Hauptnie<strong>der</strong>lassung Two Penn Plaza, New York, NY 10121-2898, USA Tel.: (212) 736-4433 Fax (212) 967-6406 DN3601409.0110-DE<br />

informationbuil<strong>der</strong>s.com askinfo@informationbuil<strong>der</strong>s.com<br />

Kanadischer Hauptsitz 150 York St., Suite 1000, Toronto, ON M5H 3S5 , Kanada Tel.: (416) 364-2760 Fax (416) 364-6552<br />

Anfragen aus an<strong>der</strong>en Län<strong>der</strong>n +1(212) 736-4433<br />

Copyright © 2011 Information Buil<strong>der</strong>s. Alle Rechte vorbehalten. [92] Alle Produkte und Produktnamen, die in dieser Publikation erwähnt <strong>we</strong>rden,<br />

sind Marken o<strong>der</strong> eingetragene Marken ihrer je<strong>we</strong>iligen Firmen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!