Optimierung der Datenqualität im Unternehmen - we.CONECT
Optimierung der Datenqualität im Unternehmen - we.CONECT
Optimierung der Datenqualität im Unternehmen - we.CONECT
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong><br />
<strong>Unternehmen</strong><br />
Wie Sie schlechte Informationen in den Griff bekommen<br />
Ein Whitepaper<br />
von Vincent Lam<br />
1<br />
Information Buil<strong>der</strong>s
Vincent Lam<br />
Vincent Lam ist <strong>der</strong> für die Vermarktung <strong>der</strong> gesamten Produktlinie von iWay<br />
Software verantwortliche Produktmarketingleiter.<br />
Er verfügt über breit gefächerte Erfahrungen <strong>im</strong> Technologiesektor<br />
und hat zur erfolgreichen Positionierung von iWay Software an <strong>der</strong><br />
Marktspitze beigetragen. Zu Beginn seiner beruflichen Karriere war Lam<br />
als strategischer Produktmanager tätig. Er führte neue strategische und<br />
innovative Produkte am Markt ein, z. B. WebFOCUS Magnify, die <strong>we</strong>lt<strong>we</strong>it<br />
erste transaktionsbasierte Echtzeit-Suchlösung für den <strong>Unternehmen</strong>seinsatz.<br />
Lam trug in Firmen an <strong>der</strong> Wall Street und in High-Tech-<strong>Unternehmen</strong> zu<br />
Innovationen bei und war auch unternehmerisch tätig.<br />
Vincent Lam besitzt einen Bachelor of Science von <strong>der</strong> Cornell University in<br />
Ithaca, New York.
Inhaltsverzeichnis<br />
1<br />
Einführung<br />
2<br />
2<br />
3<br />
6<br />
6<br />
Verbesserung <strong>der</strong> Datenqualität<br />
Profiling<br />
Bereinigung, Standardisierung, Anreicherung, Abgleich und Zusammenführung<br />
Scoring<br />
Er<strong>we</strong>iterbarkeit und Flexibilität für individuelle Daten<br />
7<br />
7<br />
7<br />
8<br />
Qualitätsmanagement <strong>im</strong> gesamten Daten-Lebenszyklus<br />
Upstream<br />
Instream<br />
Downstream<br />
9<br />
9<br />
9<br />
Datenqualität effektiv nutzen<br />
Qualitätssicherung bei externen Daten<br />
Warum es auf die Qualität bei Echtzeitdaten ankommt<br />
10<br />
10<br />
11<br />
iWay Software: Perfektes Datenqualitätsmanagement <strong>im</strong> <strong>Unternehmen</strong><br />
iWay Data Quality Center<br />
iWay Data Profiler<br />
13<br />
Entscheidend in je<strong>der</strong> Informationsmanagement-Strategie<br />
14<br />
Schlussfolgerungen
Einführung<br />
Datenqualität – das Maß für Korrektheit, Vollständigkeit und Einheitlichkeit von Daten <strong>im</strong><br />
<strong>Unternehmen</strong> – steht in vielen <strong>Unternehmen</strong> <strong>im</strong> Zentrum des Informationsmanagements.<br />
<strong>Unternehmen</strong> je<strong>der</strong> Größe kämpfen mit Problemen bei <strong>der</strong> Datenqualität. Umfragen bestätigen,<br />
dass mindestens 75% aller Großunternehmen <strong>der</strong>zeit große Herausfor<strong>der</strong>ungen angesichts<br />
unzureichenden Informationsgehaltes haben. Damit nicht genug, behauptet eine Studie von<br />
SiriusDecisions, dass selbst in Firmen mit opt<strong>im</strong>ierten Prozessen etwa 10 % aller Kundendatensätze<br />
gravierende Fehler auf<strong>we</strong>isen. Bei Firmen ohne formalisiertes Datenmanagement kann dieser Wert<br />
<strong>im</strong> Extremfall bei 25 % liegen. 1<br />
Solche Datenqualitätsprobleme können unterschiedlichste Ursachen haben. Es ist noch nicht<br />
lange her, da fand die große Mehrheit aller Daten ihren Weg in die <strong>Unternehmen</strong>s-IT über<br />
fehlerträchtige manuelle Datenerfassung. Neue Datenquellen wie Web-Portale und B2B-<br />
Interaktionen mit Lieferanten und Partnern erhöhen die Komplexität <strong>der</strong> Datenumgebungen in<br />
den <strong>Unternehmen</strong>. Diese unterschiedlichen elektronischen Echtzeit-Quellen liefern Informationen,<br />
die anspruchsvoller und vielfältiger und damit geschäftlich <strong>we</strong>rtvoller sind. Gleichzeitig<br />
ersch<strong>we</strong>ren Sie eine einheitliche Datenqualität <strong>im</strong> <strong>Unternehmen</strong>, <strong>we</strong>il zur Sicherung <strong>der</strong><br />
Informationen eine Echtzeit-Firewall not<strong>we</strong>ndig wird.<br />
Außerdem sind ähnliche Informationen wie z. B. Kundendaten in unterschiedlichen separaten<br />
Quellen gespeichert, etwa CRM-An<strong>we</strong>ndungen o<strong>der</strong> Buchhaltungssystemen. Die Informationen<br />
<strong>we</strong>rden in einer Quelle aktualisiert, aber nicht in <strong>der</strong> an<strong>der</strong>en, und so entstehen Inkonsistenzen,<br />
die zu unterschiedlichen Versionen führen. Darüber hinaus sind manche Daten sch<strong>we</strong>r zu finden.<br />
Wenn die Benutzer nicht in <strong>der</strong> Lage sind, auf die am dringendsten benötigten Informationen<br />
zuzugreifen und schnelle Entscheidungen zu treffen, sinkt <strong>der</strong> Wert <strong>der</strong> <strong>Unternehmen</strong>sdaten. Ein<br />
kleiner Fehler kann Daten <strong>im</strong> gesamten <strong>Unternehmen</strong> unbrauchbar machen, und beschädigte<br />
Daten können fatale Folgen haben. Marktstudien schätzen, dass US-Firmen durch Kundendaten-<br />
Qualitätsprobleme jährlich ein Schaden von 611 Milliarden Dollar entsteht.<br />
In seinem Buch „Data Driven: Profiting From Your Most Important Business Asset“ stellt Thomas C.<br />
Redman die These auf, dass ein einziges Prozent fehlerhafter Daten katastrophale Folgen haben<br />
kann. Er führt als Beispiel eine Kundenbestellung an, für die 12 Informationen benötigt wurden.<br />
Werden 100 Bestellungen mit je 12 Informationselementen perfekt eingegeben, kostet dies das<br />
<strong>Unternehmen</strong> je Bestellung einen Dollar, also insgesamt hun<strong>der</strong>t Dollar. Bei Berücksichtigung <strong>der</strong><br />
Fehlerquelle von 1 % <strong>we</strong>rden 12 Bestellungen falsch abgewickelt, was die entsprechenden Kosten<br />
mehr als verdoppeln kann. 2<br />
In diesem Artikel sollen Techniken behandelt <strong>we</strong>rden, mit denen Firmen die Datenqualität<br />
unternehmens<strong>we</strong>it verbessern können. Außerdem <strong>we</strong>rden die Datenqualitätsmanagement-<br />
Lösungen von iWay Software vorgestellt, mit denen Richtigkeit, Vollständigkeit und Einheitlichkeit<br />
von Informationen in sämtlichen Systemen innerhalb <strong>der</strong> Firmeninfrastruktur effektiv und<br />
kostengünstig gesichert <strong>we</strong>rden können.<br />
1 “The Impact of Bad Data on Demand Creation,” SiriusDecisions, 2008.<br />
2 Redman, Thomas C., “Data Driven: Profiting From Your Most Important Business Asset,” 2008.<br />
1<br />
Information Buil<strong>der</strong>s
Verbesserung <strong>der</strong> Datenqualität<br />
Der Schlüssel zur konstant hohen Datenqualität ist die Sicherung einheitlicher<br />
Datenqualitätsverfahren für alle Informationsquellen <strong>im</strong> <strong>Unternehmen</strong>. Gängige<br />
Datenqualitätsmanagement-Methoden:<br />
Profiling<br />
Wird auch als Data-Discovery bezeichnet. Profiling ist <strong>der</strong> Prozess <strong>der</strong> Erstellung von Statistiken<br />
über <strong>Unternehmen</strong>sdaten. Was sind ihre Haupteigenschaften und Attribute? Wie und von <strong>we</strong>m<br />
wurden sie erstellt? Welche Benutzer greifen am häufigsten zu? Für <strong>we</strong>lche Z<strong>we</strong>cke <strong>we</strong>rden sie vor<br />
allem eingesetzt? Und vor allen Dingen, in <strong>we</strong>lchem Zustand befinden sie sich?<br />
Profiling ist eines <strong>der</strong> effektivsten Mittel, <strong>we</strong>nn es darum geht, <strong>Unternehmen</strong>sdaten zu<br />
durchschauen. Solche Erkenntnisse erleichtern es, den Gesamtzustand <strong>der</strong> Daten präzise<br />
einzuschätzen, Fehler zu ermitteln, zu priorisieren und zu korrigieren und die Ursachen von<br />
Qualitätsproblemen zu beheben. Ist erst einmal ein Profil erstellt, kann ein <strong>Unternehmen</strong> durch die<br />
laufende Überwachung profilbezogener Parameter frühzeitiger auf Qualitätsprobleme reagieren.<br />
2<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Bereinigung, Standardisierung, Anreicherung, Abgleich und<br />
Zusammenführung<br />
Alle diese unzusammenhängend erscheinenden Schritte sind <strong>we</strong>sentlich für die Erzielung und<br />
Aufrechterhaltung max<strong>im</strong>aler Datenqualität. Durch die Bereinigung <strong>we</strong>rden Fehler in Datenbanken<br />
und an<strong>der</strong>en Informationsquellen durch die Verän<strong>der</strong>ung vorhandener Daten anhand<br />
vordefinierter Regeln und Kriterien el<strong>im</strong>iniert.<br />
Im Beispiel unten wurden Datensätze mit fehlerhaften Namen identifiziert. Be<strong>im</strong><br />
Bereinigungsprozess <strong>we</strong>rden fehlende Einträge ergänzt und ausgefüllte Fel<strong>der</strong> <strong>we</strong>rden<br />
automatisch nach festgelegten Regeln an ein best<strong>im</strong>mtes Format angepasst.<br />
Source Data<br />
Name G SIN Birth Date Address<br />
Dr. John Smith M 000000000 12/16/1978 14618 110 Ave Surrey V3R 2A9<br />
Smith W. John M 095-242-434 16.12.1978 Surrey 14618 110 Ave<br />
John William Smith 095242434 781612 25 Linden Str Toronto M4X 1V5<br />
Dr. J.W. Smith M 095242433 11/16/78<br />
John Smith 095252433 16.11.1978 8500 Leslie L3T 7M8 Toronto<br />
Smith John 16.11.1978 8500 Leslie street Marham<br />
John Smiht 095252433 16.11.1978<br />
Jane Watson 420347213 1982 600-8500 Leslie str. Toronto L3T 7M8<br />
Watson Jane F 420-347-213 5.1.1982 8500 Leslei street Toronto L3T 7M8<br />
Jane Smith F SIN420347213 1982-01-0<br />
J. Smith 420-347-213<br />
Daten vor <strong>der</strong> Bereinigung<br />
Cleansed Data<br />
First Last G SIN Birth Date Address<br />
John Smith M 1987-12-16 V3R 2A9; BC; Surrey; 14618 110 Avenue<br />
John Smith M 095242434 1978-12-16 V3R 2A9; BC; Surrey; 14618 110 Avenue<br />
John Smith M 095242434 M4X 1V5; ON;Toronto; 25 Linden Street<br />
Smith M 1987-11-16<br />
John Smith M 095252433 1978-11-16 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />
John Smith M 1978-11-16 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />
John Smith M 095252433 1978-11-16<br />
Jane Watson F 420347213 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />
Jane Watson F 420347213 1982-01-01 L3T 7M8; ON; Markham; 8500 Leslie Str.<br />
Jane Smith F 420347213 1982-01-05<br />
J. Smith 420347213<br />
Daten nach <strong>der</strong> Bereinigung<br />
3<br />
Information Buil<strong>der</strong>s
Bei <strong>der</strong> Anreicherung wird <strong>der</strong> Inhalt abgerundet, indem die Informationen durch den Vergleich<br />
mit externen Inhalten wie Altersstrukturen o<strong>der</strong> geografischen Faktoren verglichen und ggf. durch<br />
Attribute dynamisch er<strong>we</strong>itert und opt<strong>im</strong>iert <strong>we</strong>rden. In diesem Beispiel <strong>we</strong>rden bisher fehlende<br />
PLZ anhand <strong>der</strong> Adressen ermittelt und als separates Feld ergänzt.<br />
Cleansed Data<br />
First Last G SIN Birth Date Address<br />
John Smith M 1978-12-16 BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 1978-12-16 BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 ON;Toronto;25 Linden Street<br />
Smith M 1978-11-16<br />
John Smith M 095252433 1978-11-16 ON;Markham;8500 Leslie Str.<br />
John Smith M 1978-11-16 ON;Markham;8500 Leslie Str.<br />
John Smith M 095252433 1978-11-16<br />
Jane Watson F 420347213 ON;Markham;8500 Leslie Str.<br />
Jane Watson F 420347213 1982-01-01 ON;Markham;8500 Leslie Str.<br />
Jane Smith F 420347213 1982-01-05<br />
J. Smith 420347213<br />
Daten vor <strong>der</strong> Anreicherung<br />
Enriched Data<br />
First Last G SIN Birth Date Address Zip<br />
John Smith M 1978-12-16 BC; Surrey; 14618 110 Avenue V3R 2A9<br />
John Smith M 095242434 1978-12-16 BC; Surrey; 14618 110 Avenue V3R 2A9<br />
John Smith M 095242434 ON; Toronto; 25 Linden Street M4X 1V5<br />
Smith M 1978-11-16<br />
John Smith M 095252433 1978-11-16 ON; Markham; 8500 Leslie Str. L3T 7M8<br />
John Smith M 1978-11-16 ON; Markham; 8500 Leslie Str. L3T 7M8<br />
John Smith M 095252433 1978-11-16<br />
Jane Watson F 420347213 ON; Markham; 8500 Leslie Str. L3T 7M8<br />
Jane Watson F 420347213 1982-01-01 ON; Markham; 8500 Leslie Str. L3T 7M8<br />
Jane Smith F 420347213 1982-01-05<br />
J. Smith 420347213<br />
Daten nach <strong>der</strong> Anreicherung<br />
Zusammenführung und Abgleich för<strong>der</strong>n die Einheitlichkeit, <strong>we</strong>il verwandte Einträge innerhalb<br />
eines Systems o<strong>der</strong> systemübergreifend automatisch erkannt <strong>we</strong>rden und dann verknüpft,<br />
abgest<strong>im</strong>mt o<strong>der</strong> verschmolzen <strong>we</strong>rden können. Das Beispiel zeigt, wie <strong>der</strong> Abgleich- und<br />
Zusammenführungsprozess abläuft.<br />
4<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Cleansed Data<br />
First Last G SIN Birth Date Address<br />
John Smith M 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 M4X 1V5;ON;Toronto;25 Linden Street<br />
Smith M 1978-11-16<br />
John Smith M 095252433 1978-11-16 L3T 7M8;ON;Markham;8500 Leslie Str.<br />
John Smith M 1978-11-16 L3T 7M8;ON;Markham;8500 Leslie Str.<br />
John Smith M 095252433 1978-11-16<br />
Jane Watson F 420347213 L3T 7M8;ON;Markham;8500 Leslie Str.<br />
Jane Watson F 420347213 1982-01-01 L3T 7M8;ON;Markham;8500 Leslie Str.<br />
Jane Smith F 420347213 1982-01-05<br />
J. Smith 420347213<br />
Abgleich<br />
Es <strong>we</strong>rden verwandte Einträge für John Smith und Jane Watson gefunden. Trotz <strong>der</strong> Ähnlichkeiten<br />
zwischen den Datensätzen sind nicht alle Informationen redundant – es gibt wirklich z<strong>we</strong>i<br />
verschiedene John Smiths. Leistungsfähige Abgleichfunktionen <strong>we</strong>rten die Daten in den<br />
einzelnen Sätzen detailliert aus und ermitteln, <strong>we</strong>lche redundant sind und <strong>we</strong>lche eigenständig.<br />
Cleansed Data<br />
First Last G SIN Birth Date Address<br />
John Smith M 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 1978-12-16 V3R 2A9;BC;Surrey;14618 110 Avenue<br />
John Smith M 095242434 M4X 1V5;ON;Toronto;25 Linden Street<br />
Golden Record<br />
First Last G SIN Birth Date Address<br />
John Smith M 095242434 1978-12-16 V3R;BC;Surrey;14618 110 Avenue<br />
Zusammenführung<br />
Durch die Zusammenführung <strong>we</strong>rden die abgest<strong>im</strong>mten Daten zu einem umfassenden Datensatz.<br />
Hier <strong>we</strong>rden die doppelten Einträge für John Smith zu einem vollständigen Datensatz vereinigt,<br />
<strong>der</strong> alle Informationen enthält. Da das Adressfeld wi<strong>der</strong>sprüchliche Daten enthielt, wurde anhand<br />
fester Regeln die häufigste Version ver<strong>we</strong>ndet. Auch Householding, eine ähnliche Technik wie<br />
die Zusammenführung, bei <strong>der</strong> verwandte Informationen von getrennten Systemen gesammelt<br />
und in einer zentralen Datenbank gespeichert <strong>we</strong>rden, fällt in diese Kategorie. Mit Householding<br />
können Firmen ähnliche Informationen etwa über Familien o<strong>der</strong> <strong>Unternehmen</strong> konsolidieren und<br />
so dem Benutzer ein vollständiges Bild bieten.<br />
5<br />
Information Buil<strong>der</strong>s
Scoring<br />
Viele <strong>Unternehmen</strong> setzen auf ein Scoringsystem, um die Datenqualität besser beurteilen und<br />
Probleme besser priorisieren zu können, sobald diese auftreten. Dabei wird jedem Datensatz<br />
eine Zahl zugeordnet, die etwas über die Qualität aussagt. Ein lupenreiner Datensatz kann<br />
beispiels<strong>we</strong>ise einen Wert von 5 erhalten, während ein völlig ungültiger Datensatz einen Wert von<br />
1 erhält. Die Werte dazwischen zeigen, wieviel Vertrauen das <strong>Unternehmen</strong> in die Korrektheit des<br />
Datensatzes setzt und gibt an, ob Maßnahmen erfor<strong>der</strong>lich sind (Datensätze mit Werten von 3 und<br />
darunter sind manuell zu prüfen).<br />
In <strong>der</strong> Praxis zählt hier Flexibilität – für verschiedene Datentypen müssen unterschiedliche<br />
Regeln ver<strong>we</strong>ndet <strong>we</strong>rden, die bei Problemen die je<strong>we</strong>ilige Dringlichkeit deutlich machen.<br />
Kritische Daten wie Informationen über Kunden sollten strenger be<strong>we</strong>rtet <strong>we</strong>rden als Daten über<br />
Verbrauchsmaterialbestände.<br />
Er<strong>we</strong>iterbarkeit und Flexibilität für individuelle Daten<br />
Um ermitteln zu können, <strong>we</strong>lche Daten mangelhaft sind, muss festgelegt <strong>we</strong>rden, wie die<br />
Datensätze aussehen müssen. Informationen wie Adressen und Postleitzahlen können einfach<br />
mit einer Datenbank abgeglichen <strong>we</strong>rden, aber für die meisten Datentypen ist das nicht möglich.<br />
Ein Großteil <strong>der</strong> Daten ist technischer Natur – z. B. Produktdaten – und die Beurteilung erfor<strong>der</strong>t<br />
Fachkenntnisse.<br />
Zur proaktiven Be<strong>we</strong>rtung solcher Daten müssen feste Schemata vorhanden sein. Die Regeln<br />
müssen einfach zu definieren und umzusetzen sein und sollten idealer<strong>we</strong>ise von vornherein<br />
verhin<strong>der</strong>n, dass fehlerhafte Daten überhaupt in die Umgebung gelangen.<br />
6<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Qualitätsmanagement <strong>im</strong> gesamten Daten-Lebenszyklus<br />
<strong>Unternehmen</strong>sdaten haben einen Lebenszyklus. Sie be<strong>we</strong>gen sich in verschiedenen Richtungen<br />
innerhalb und außerhalb eines Betriebs. Im Geschäftsablauf fließen Daten:<br />
Upstream<br />
Daten gelangen auf verschiedenen Wegen und in zahllosen Formaten in ein <strong>Unternehmen</strong>, z.<br />
B. als E-Mail, Fax o<strong>der</strong> Brief. Sie können bei Telefonaten, Besprechungen o<strong>der</strong> <strong>im</strong> dynamischen<br />
und automatisierten B2B-Austausch erfasst <strong>we</strong>rden. Sie können sogar über neue Kanäle wie<br />
Web-Portale und Self-Service-Umgebungen sowie gehostete o<strong>der</strong> Cloud-basierte Quellen wie<br />
Salesforce.com ankommen.<br />
Die Berührungspunkte, über die Daten generiert und gesammelt <strong>we</strong>rden, sind in den letzten<br />
Jahren komplexer geworden und die Fehlerquellen haben zugenommen. Das ersch<strong>we</strong>rt die<br />
Einhaltung von Regeln und Datenqualitätsstandards und damit auch die Sicherstellung <strong>der</strong><br />
Datenintegrität.<br />
Instream<br />
Vorhandene Daten <strong>we</strong>rden laufend durch das <strong>Unternehmen</strong> transportiert und <strong>we</strong>rden<br />
bei komplexen Geschäftstransaktionen o<strong>der</strong> zur Unterstützung von Reporting- o<strong>der</strong><br />
Analyseaktivitäten häufig verän<strong>der</strong>t o<strong>der</strong> mit an<strong>der</strong>en Datensätzen kombiniert.<br />
7<br />
Information Buil<strong>der</strong>s
Diese ständige Be<strong>we</strong>gung schafft das Potenzial für gravierende Qualitätsprobleme. Ein Mangel<br />
an aktiven Kontrollen be<strong>im</strong> Datenkonsum kann zu mangelhaft abgeglichenen, schlecht<br />
kategorisierten, redundanten Daten und zu Datenverlust führen. Derartige Probleme <strong>we</strong>rden oft<br />
zu spät erkannt.<br />
Downstream<br />
Endan<strong>we</strong>n<strong>der</strong> greifen häufig zu Aus<strong>we</strong>rtungs- o<strong>der</strong> Analysez<strong>we</strong>cken auf Daten zu. Daten können<br />
direkt von Backend-Quellen o<strong>der</strong> Datenspeichern abgerufen <strong>we</strong>rden und <strong>we</strong>rden dann für<br />
operatives, Finanz- o<strong>der</strong> Compliance-Reporting genutzt, Managern anhand von Dashboards o<strong>der</strong><br />
Scorecards präsentiert o<strong>der</strong> in mehrd<strong>im</strong>ensionale Cubes für <strong>we</strong>itergehende Bearbeitung und<br />
Analyse geladen.<br />
Zugriffsprobleme wie Duplikation o<strong>der</strong> inkonsistente Semantik können die Benutzer dabei<br />
behin<strong>der</strong>n, Daten sinnvoll für die tägliche Arbeit zu nutzen. Das kann sich negativ auf betriebliche<br />
Effizienz, Geschäftserfolg und Profitabilität auswirken.<br />
Es ist bekannt, dass fehlerhafte Daten sich vermehren. So wie ein verschmutzter Fluss das Wasser<br />
eines Sees kontaminiert, in den er fließt, so kann ein einziger defekter Datensatz zahlreiche<br />
Systeme infizieren. Je länger ein <strong>Unternehmen</strong> damit wartet, fehlerhafte Daten zu berichtigen,<br />
desto schädlicher. Datenmanagement muss frühzeitig ansetzen, damit nicht aus kleinsten<br />
Qualitätsproblemen große <strong>we</strong>rden.<br />
8<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Datenqualität effektiv nutzen<br />
Qualitätssicherung bei externen Daten<br />
Datenqualität wird meist <strong>im</strong> Hinblick auf Informationen in Backend-Datenbanken und sonstigen<br />
internen Datenquellen diskutiert. Viele Daten kommen jedoch von außen. Sie stammen aus<br />
An<strong>we</strong>ndungen von Lieferanten, Distributoren und an<strong>der</strong>en Partnern, <strong>we</strong>rden von Websites<br />
abgerufen o<strong>der</strong> kommen von Kunden in diversen unstrukturierten Formaten.<br />
Dennoch wird dieser Umstand von <strong>we</strong>nigen Datenqualitätsinitiativen berücksichtigt, was den<br />
Erfolg solcher Initiativen durch große Lücken und risikobehaftete Umgebungen ersch<strong>we</strong>rt. Da<br />
schon ein einzelner Datensatz jede Menge an<strong>der</strong>e Systeme kontaminieren kann, sind solche<br />
externen Quellen ein erhebliches Risiko.<br />
Deshalb ist es so wichtig, bewährte Qualitätsmanagement-Techniken wie Scoringsysteme,<br />
Bereinigung, Abgleich und Zusammenführung für alle Datenquellen einzusetzen. Die Einführung<br />
einer Datenqualitätspolitik ausschließlich für interne Systeme schützt nur einen Teil <strong>der</strong> kritischen<br />
Daten und schränkt die Effektivität einer solchen Initiative stark ein.<br />
Warum es auf die Qualität bei Echtzeitdaten ankommt<br />
Die Ermittlung und Korrektur fehlerhafter Daten nach dem Eintritt in das System ist wichtig, aber<br />
das Management <strong>der</strong> Datenqualität in Echtzeit bringt erheblich größere Effekte. Der SiriusDesigns-<br />
Report stellt die „1-10-100-Regel“ vor, die den Nutzen proaktiven Handelns bei <strong>der</strong> Datenqualität<br />
veranschaulicht. Diese Regel besagt, dass es einen Dollar kostet, einen Datensatz zu überprüfen,<br />
zehn Dollar, ihn nach <strong>der</strong> Erfassung zu berichtigen und zu deduplizieren und hun<strong>der</strong>t Dollar an<br />
potenziellen Produktivitätsverlusten o<strong>der</strong> Umsätzen, <strong>we</strong>nn gar nichts unternommen wird.5<br />
Nehmen wir noch einmal das Beispiel des Flusses. Es ist <strong>we</strong>niger aufwändig, das verschmutzte<br />
Wasser an <strong>der</strong> Quelle aufzufangen, als ein großes Gewässer nach erfolgter Verschmutzung zu<br />
reinigen.<br />
Gleiches gilt für <strong>Unternehmen</strong>sdaten. Die Bereinigung von Daten, die über mehrere Quellen<br />
verteilt sind, verursacht <strong>we</strong>it mehr Aufwand als das Berichtigen eines fehlerhaften Datensatzes,<br />
bevor dieser in eine Datenbank gelangt.<br />
5 “The Impact of Bad Data on Demand Creation,” Sirius Decisions, 2008.<br />
9<br />
Information Buil<strong>der</strong>s
iWay Software:<br />
Perfektes Datenqualitätsmanagement <strong>im</strong> <strong>Unternehmen</strong><br />
iWay Software liefert Lösungen mit Leistungsmerkmalen, die Vollständigkeit, Richtigkeit,<br />
Einheitlichkeit und Unversehrtheit von <strong>Unternehmen</strong>sdaten opt<strong>im</strong>ieren. Unsere<br />
zukunfts<strong>we</strong>isenden Tools helfen <strong>Unternehmen</strong> je<strong>der</strong> Größe und jedes Zuschnitts, in allen<br />
relevanten Systemen max<strong>im</strong>ale Datenqualität zu erreichen.<br />
iWay Data Quality Center<br />
iWay Data Quality Center (DQC) ist ein grundlegendes Tool für komplexes<br />
Datenqualitätsmanagement. Mit seinen lückenlosen Regelsystemen und lokalisierten<br />
Wörterbüchern evaluiert, überwacht und verwaltet iWay DQC nicht nur die Datenqualität in<br />
verschiedenen Informationssystemen, son<strong>der</strong>n verhin<strong>der</strong>t auch, dass fehlerhafte Daten überhaupt<br />
in das System gelangen.<br />
Daraus ergeben sich folgende Vorteile:<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
Steuerung <strong>der</strong> Datenqualität in Transaktions- und Analysean<strong>we</strong>ndungen<br />
Bereinigung und Vereinheitlichung von Daten bei Systemmigrationen<br />
Sicherung <strong>der</strong> Qualität bei Software-Integrationsprojekten<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Integrität von Adress- und Kontaktinformationen<br />
Verbesserung von Kundendaten zur Identifizierung von Kunden<br />
Validierung und Korrektur unvollständiger Datensätze in Kundenprofilen<br />
Validierung von Daten, die über Self-Service-An<strong>we</strong>ndungen eingegeben wurden<br />
Tiefgreifendes Data Profiling durch Datenintegrations-Projektanalyse<br />
10<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Kostengünstig, integriert, intuitiv – iWay DQC liefert ein breites Spektrum zukunfts<strong>we</strong>isen<strong>der</strong><br />
Funktionen. Die wichtigsten Leistungsmerkmale:<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
Zentralisiertes Management aller Aktivitäten zur <strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität inklusive aller<br />
Geschäftsprozesse und Datenflüsse von einer einzelnen Plattform<br />
Kombinierte Administrations-Tools für einfache Konfiguration ohne<br />
externe An<strong>we</strong>ndungen<br />
Plattform-unabhängige Architektur auf <strong>der</strong> Basis offener Standards<br />
Parallelverarbeitung sichert Skalierbarkeit, unterstützt Batch- und On-demand-Modi und<br />
beschleunigt Datenqualitätsprozesse. Der gesamte Prozess dauert nur eine Zehntelsekunde; pro<br />
Stunde <strong>we</strong>rden über fünf Millionen Datensätze verarbeitet<br />
Zukunfts<strong>we</strong>isendes semantisches Profiling zur schnellen, präzisen Informationsanalyse<br />
Direkte Integration in jede An<strong>we</strong>ndung aus den Bereichen B2B, A2A, Portal, ESB, SOA und ETL<br />
Direkter Zugriff auf externe Datenquellen wie nationale Adress- o<strong>der</strong> Namensregister sowie<br />
Wörterbücher und Listen zu Analyse-, Bereinigungs- und Validierungsz<strong>we</strong>cken<br />
Leistungsfähige Algorithmen zum effizienten Abgleich bei <strong>der</strong> Datensatzvereinheitlichung<br />
unabhängig von internen Datenstrukturen<br />
iWay Data Profiler<br />
Der iWay Data Profiler integriert den Output des iWay DQC einfach und effektiv in die BI-<br />
Technologie. Administratoren können geschäftskritische Daten beobachten, überwachen,<br />
vergleichen und aus<strong>we</strong>rten. Zusätzliche Client-Software, Plugins o<strong>der</strong> Report-Vie<strong>we</strong>r sind nicht<br />
erfor<strong>der</strong>lich. iWay Data Profiler bietet leistungsfähige Integrationsfunktionen auf <strong>der</strong> Grundlage<br />
ausgereifter Tools für Datenqualitätsüberwachung, Reporting und Analyse, mit denen Profiling-<br />
Daten nahezu beliebig abgefragt, analysiert, geliefert und angezeigt <strong>we</strong>rden können.<br />
11<br />
Information Buil<strong>der</strong>s
Die mit den semantischen Analysefunktionen und komplexen Regelsystemen von iWay Data<br />
Quality Center generierten Data-Profiling-Informationen liefern grundlegende statistische<br />
Informationen wie Eindeutigkeit und Häufigkeit und decken Beziehungen zwischen Daten anhand<br />
von Pr<strong>im</strong>är- und Fremdschlüsseln auf. Diese Profiling-Daten können dann mit intuitiven, grafischen<br />
Reporting-Tools noch <strong>we</strong>iter analysiert <strong>we</strong>rden, sodass Ab<strong>we</strong>ichungen bei Datenprofilen in<br />
verschiedenen Zeiträumen sichtbar <strong>we</strong>rden. Die so entstandenen Kategorien können dann<br />
detaillierter aufgeschlüsselt <strong>we</strong>rden, sodass die einzelnen Datensätze sichtbar <strong>we</strong>rden.<br />
Der iWay Data Profiler bietet u. a. folgende Funktionen:<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
Individuell einstellbare Datenqualitätsindikatoren (DQI), mit denen verschiedene<br />
Gültigkeitsstufen festgelegt <strong>we</strong>rden können. Die DQI können dann auf Daten ange<strong>we</strong>ndet<br />
<strong>we</strong>rden, um direkt die Unversehrtheit best<strong>im</strong>mter Datensätze zu prüfen.<br />
Dynamische Sammlung von Profiling-Daten von iWay DQC<br />
Tagging und Archivierung von Profiling-Daten als Sets in einer zugehörigen relationalen<br />
Datenbank zum einfachen Abruf<br />
Er<strong>we</strong>iterte Datenmanipulation und Grafik<br />
Vergleich mehrerer Data-Profiling-Sets zur schnelleren Erkennung von Ab<strong>we</strong>ichungen<br />
Druck und Export von Data-Profiling-Ansichten in HTML, PDF, Excel und <strong>we</strong>iteren gängigen<br />
Formaten<br />
Direkt in den Profiling-Report eingebettete portable Analysefunktionen zur Anzeige und<br />
Analyse von Profiling-Daten in nahezu beliebiger Weise<br />
iWay Data Profiler ist auch als SaaS-An<strong>we</strong>ndung verfügbar. Die Vorteile:<br />
■<br />
■<br />
■<br />
■<br />
Beschleunigte Inbetriebnahme und Einrichtung<br />
Mehr Wirtschaftlichkeit durch praktisches Pay-per-use-Modell ohne hohe Anschaffungskosten<br />
Detaillierte Profiling-Informationen können leichter an die Veranstwortlichen <strong>we</strong>itergegeben<br />
<strong>we</strong>rden, in <strong>der</strong> Regel technisch nicht versierte An<strong>we</strong>n<strong>der</strong> in unterschiedlichen<br />
<strong>Unternehmen</strong>sbereichen<br />
Sofortige kostengünstige Skalierbarkeit bei Bedarf<br />
12<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Entscheidend in je<strong>der</strong> Informationsmanagement-Strategie<br />
Data Profiling und Datenqualitätsmanagement sind <strong>we</strong>sentliche Komponenten je<strong>der</strong> breit<br />
angelegten Enterprise-Information-Management (EIM)-Strategie. EIM verbindet die Prinzipien und<br />
Technologien <strong>der</strong> Enterprise Integration, Business Intelligence und Content-Management und<br />
rationalisiert so Erzeugung, Speicherung, Zugriff und Handhabung von Daten.<br />
Damit können <strong>Unternehmen</strong> den Wert ihrer Daten steigern und daraus durch höhere<br />
Produktivität, niedrigere Verwaltungskosten und höhere Leistungsfähigkeit substanzielle<br />
Wettbe<strong>we</strong>rbsvorteile schöpfen. iWay Software bietet ein umfassendes Programm von Tools und<br />
Lösungen für alle Aspekte des EIM.<br />
13<br />
Information Buil<strong>der</strong>s
Schlussfolgerungen<br />
Datenqualitätsfragen sind in <strong>Unternehmen</strong> je<strong>der</strong> Größe in allen Branchen präsent. Unabhängig<br />
von <strong>der</strong> Ursache kosten diese Probleme <strong>Unternehmen</strong> Jahr für Jahr Milliardenbeträge. Je länger<br />
die Probleme unerkannt bleiben, desto mehr Schaden richten sie an.<br />
Neue Verfahren helfen <strong>Unternehmen</strong> dabei, die gravierendsten Probleme zu überwinden. Mit<br />
solchen Methoden und Lösungen können sie formelle Datenqualitätsrichtlinien erfolgreich<br />
einführen und durchsetzen.<br />
iWay Software bietet ein lückenloses Programm von Datenqualitäts-Managementlösungen mit<br />
einem leistungsfähigen Data-Profiling-Tool und einer umfassenden Datenqualitätsplattform,<br />
mit denen Sie Datenqualität durchgängig steuern können, und zwar schneller, einfacher<br />
und kostengünstiger. Mit diesen Tools können <strong>Unternehmen</strong> Konsistenz, Korrektheit und<br />
Vollständigkeit ihrer wichtigsten Daten erheblich steigern – unabhängig davon, wo diese erzeugt<br />
wurden und wo sie gespeichert sind.<br />
14<br />
<strong>Opt<strong>im</strong>ierung</strong> <strong>der</strong> Datenqualität <strong>im</strong> <strong>Unternehmen</strong>
Welt<strong>we</strong>ite Nie<strong>der</strong>lassungen<br />
Nordamerika<br />
Europa<br />
■<br />
USA<br />
Belgien* Information Buil<strong>der</strong>s Belgium<br />
■ Atlanta,* GA (770) 395-9913<br />
Brüssel 32-2-7430240<br />
■ Balt<strong>im</strong>ore, MD Professionelle Services:<br />
■ Deutschland Information Buil<strong>der</strong>s (D) GmbH<br />
(703) 247-5565<br />
Eschborn* 49-6196-77576-0<br />
■ Boston,* MA (781) 224-7660<br />
■ Frankreich* Information Buil<strong>der</strong>s France S.A.<br />
■ Chicago,* IL (630) 971-6700<br />
Paris 33-14-507-6600<br />
■ Cincinnati,* OH (513) 891-2338<br />
■ Großbritannien* Information Buil<strong>der</strong>s (UK) Ltd.<br />
■ Dallas,* TX (972) 490-1300<br />
London 44-845-658-8484<br />
■ Denver,* CO (303) 770-4440<br />
■ Italien Information Buil<strong>der</strong>s Italy<br />
■ Detroit,* MI (248) 641-8820<br />
Milan 39-02-30-314-420<br />
■ Fe<strong>der</strong>al Systems,* DC (703) 276-9006<br />
■ Nie<strong>der</strong>lande* Information Buil<strong>der</strong>s<br />
■ Hartford, CT (860) 249-7229<br />
(Netherlands) B.V.<br />
■ Houston,* TX (713) 952-4800<br />
Amsterdam 31-20-4563333<br />
■ Kanäle, (800) 969-4636<br />
■ Portugal Information Buil<strong>der</strong>s Portugal<br />
■ Los Angeles,* CA (310) 615-0735<br />
Lisbon 351-217-217-400<br />
■ Minneapolis,* MN (651) 602-9100<br />
■ Sch<strong>we</strong>iz Information Buil<strong>der</strong>s Sch<strong>we</strong>iz AG<br />
■ New Jersey Vertrieb: (973) 593-0022<br />
Dietlikon 41-44-839-49-49<br />
■ New York,* NY Vertrieb: (212) 736-7928<br />
■ Spanien Information Buil<strong>der</strong>s Iberica S.A.<br />
Professionelle Services:<br />
Barcelona 34-93-344-32-70<br />
(212) 736-4433, Apparat 4443<br />
Bilbao 34-94-452-50-15<br />
■ Orlando, FL (407) 562-1852<br />
Madrid* 34-91-710-22-75<br />
■ Philadelphia,* PA Vertrieb: (610) 940-0790<br />
■ Phoenix, AZ (480) 346-1095<br />
Vertretungen<br />
■ Pittsburgh, PA Vertrieb: (412) 494-9699<br />
■ Ägypten InfoBuild Middle East<br />
■ St. Louis,* MO (636) 519-1411<br />
Abu Dhabi 971-2-627-5911<br />
■ San Jose,* CA (408) 453-7600<br />
Dubai 971-4-3914391<br />
■ Seattle, WA (206) 624-9055<br />
■ Äthiopien MKTY T Services Plc<br />
■ Washington,* DC Vertrieb: (703) 276-9006<br />
Addis Ababa 251-11-5501933<br />
Professionelle Services: (703) 247-5565<br />
■ Bahrain InfoBuild Middle East<br />
Dubai 973-17-536-222, ext. 312<br />
Kanada<br />
■ Brasilien InfoBuild Brazil Ltda.<br />
Information Buil<strong>der</strong>s (Canada) Inc.<br />
São Paulo 55-11-3285-1050<br />
■ Calgary (403) 437-3479<br />
■ China<br />
■ Montreal* (514) 421-1555<br />
Information Buil<strong>der</strong>s China (IBC)<br />
■ Ottawa (613) 233-7647<br />
Beijing 86-10-5128-9680<br />
■ Toronto* (416) 364-2760<br />
Beijing Xinrong Software Technology Co., Ltd.<br />
■ Vancouver (604) 688-2499<br />
Beijing 86-10-5873-2031<br />
■ Dänemark InfoBuild AB<br />
Mexiko<br />
Kista, SE 46-735-23-34-97<br />
Information Buil<strong>der</strong>s Mexico<br />
■<br />
■ Finnland InfoBuild Oy<br />
Mexico City 52-55-5062-0660<br />
Espoo 358-207-580-840<br />
■ Griechenland Applied Science<br />
Australien<br />
Athen 30-210-699-8225<br />
Information Buil<strong>der</strong>s Pty. Ltd.<br />
■ Guatemala IDS de Centroamerica<br />
■ Melbourne* 61-3-9631-7900<br />
Guatemala City 502-2412-4212<br />
■ Sydney* 61-2-8223-0600 ■ Indien* InfoBuild India<br />
Chennai 91-44-42177082<br />
■ Israel SRL Group Ltd.<br />
Tel Aviv 972-3-7662030<br />
■ Japan K.K. Ashisuto<br />
Osaka 81-6-6373-7113<br />
Tokio 81-3-5276-5863<br />
■ Jordanien InfoBuild Middle East<br />
Abu Dhabi 971-2-627-5911<br />
Dubai 971-4-3914391<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
■<br />
Katar InfoBuild Middle East<br />
Dubai 974-467-7311<br />
Korea<br />
UVANSYS<br />
Seoul 82-2-832-0705<br />
Kuwait InfoBuild Middle East<br />
Dubai 965-22322926<br />
Libanon InfoBuild Middle East<br />
Dubai 961-4-533162<br />
Nor<strong>we</strong>gen InfoBuild Norway<br />
Oslo 47-48-20-40-30<br />
Oman InfoBuild Middle East<br />
Abu Dhabi 971-2-627-5911<br />
Dubai 971-4-3914391<br />
Österreich Raiffeisen Informatik Consulting GmbH<br />
Vienna 43-12-1136-3870<br />
Polen/Mittel- und Osteuropa InfoBuild SP.J.<br />
Warschau 48-22-657-00-14<br />
Russische Fö<strong>der</strong>ation FOBOS Plus Co., Ltd.<br />
Moskau 7-495-926-3358<br />
Saudi-Arabien InfoBuild Middle East<br />
Riad 996-1-2180280<br />
Singapur<br />
Automatic Identification Technology Ltd.<br />
Singapur 65-6286-2922<br />
Südafrika<br />
InfoBuild South Africa (Pty.) Ltd.<br />
Gauteng 27-83-4600800<br />
Fujitsu Services (Pty.) Ltd.<br />
Johannesburg 27-11-2335911<br />
Taiwan Galaxy Software Services<br />
Taipei 886-2-2586-7890<br />
Thailand Datapro Computer Systems Co. Ltd.<br />
Bangkok 662-679-1927, ext. 200<br />
Türkei InfoBuild Middle East<br />
Ankara 90-312-266-33-00<br />
Istanbul 90-212-325-4114<br />
Venezuela InfoServices Consulting<br />
Caracas 58-212-763-1653<br />
Vereinigte Arabische Emirate<br />
InfoBuild Middle East<br />
Abu Dhabi 971-2-627-5911<br />
Dubai 971-4-3914391<br />
Gebührenfreie Nummer<br />
■<br />
Vertrieb, ISV, VAR und SI Partner-Informationen<br />
(800) 969-4636<br />
* Mit Schulungseinrichtungen ausgestattet.<br />
Hauptnie<strong>der</strong>lassung Two Penn Plaza, New York, NY 10121-2898, USA Tel.: (212) 736-4433 Fax (212) 967-6406 DN3601409.0110-DE<br />
informationbuil<strong>der</strong>s.com askinfo@informationbuil<strong>der</strong>s.com<br />
Kanadischer Hauptsitz 150 York St., Suite 1000, Toronto, ON M5H 3S5 , Kanada Tel.: (416) 364-2760 Fax (416) 364-6552<br />
Anfragen aus an<strong>der</strong>en Län<strong>der</strong>n +1(212) 736-4433<br />
Copyright © 2011 Information Buil<strong>der</strong>s. Alle Rechte vorbehalten. [92] Alle Produkte und Produktnamen, die in dieser Publikation erwähnt <strong>we</strong>rden,<br />
sind Marken o<strong>der</strong> eingetragene Marken ihrer je<strong>we</strong>iligen Firmen.