w26M2

Empfehlungen

Info

verursachen höhere Schäden in der KFZ-Versicherung« ist sicherlich völlig unkritisch und publizierbar. Aber aus dem Muster »Porschefahrer unter 20 Jahren mit Wohnsitz in der PLZ 53727 verursachen häufiger Schäden über 1 Mio. Euro« lassen sich mit hoher Wahrscheinlichkeit personenbezogene Informationen zurückschließen – gerade wenn andere Informationsquellen wie Lokalnachrichten aus dem Internet zur Verfügung stehen. Das Privacy-Preserving Data Mining beschäftigt sich mit der Frage, wie Garantien über den Datenschutz in die Datenanalyse integriert werden können. Aufgrund der Komplexität der Fragestellung gibt es dabei kein Patentrezept, verschiedene Ansätze haben sich aber als sinnvoll herauskristallisiert. Ansatz Anonymize-and-Mine Beim Ansatz Anonymize-and-Mine werden Daten zuerst anonymisiert (bzw. pseudonymisiert). Dies geschieht, indem gezielt Informationen weggelassen werden, bis klar definierte Anonymitätskriterien erfüllt sind. Die gebräuchlichsten Anonymitätsmaße sind hier die k-Anonymität, l-Diversität und t-Closeness. Geeignete Tools dafür sind frei verfügbar. Der Vorteil dieses Ansatzes ist, dass einmal anonymisierte Daten bedenkenlos weiterverarbeitet werden können, die kritischen Informationen sind ein für allemal zerstört. Der Nachteil ist, dass dies ungerichtet erfolgt und dabei auch Informationen, die für eine Analyse sehr relevant sein könnten, zerstört werden können. Gerade bei sehr hochdimensionalen Daten – typisch für Big Data – ist dies ein sehr schwieriges Problem. Als Beispiel: wenn das Data Mining auf sehr hochdimensionalen Versicherungsdaten herausfindet, dass nur Alter und Wohnort für das Risiko relevant sind, ist eine Anonymisierung einfach. Wird allerdings vorher anonymisiert ist es sehr einfach möglich, dass gerade Alter und Wohnort aus den Daten entfernt werden, da sie zusammen mit wenigen anderen Daten eine Identifikation erlauben. Ansatz Mine-and-Anonymize Der Ansatz Mine-and-Anonymize geht die entgegengesetzte Richtung: die Datenanalyse erfolgt auf nichtanonymisierten Daten, erst für das Ergebnis werden Datenschutzgarantien gegeben. Dies erfolgt entweder durch ein geeignetes Post-Processing – Ergebnisse, die vorgegebenen Privacy-Kriterien widersprechen, werden herausgefiltert – oder durch den direkten Einbau der Kriterien in den Data-Mining-Algorithmus. Dadurch ist die Umsetzung dieses Ansatzes eher kompliziert – für jedes Data-Mining-Verfahren und jede Datenschutzanforderung muss eine eigene Implementierung erfolgen – aber dadurch sind hier auch die besten Ergebnisse zu erwarten. Secure Distributed Computing Ein Ansatz, der sich gerade bei verteilten Daten eignet, ist das Secure Distributed Computing. Typische Einsatzfälle sind, wenn mehrere Unternehmen bei der Datenanalyse kooperieren wollen – etwa um Betrugsmuster zu finden – ohne ihre eigenen Daten herauszugeben oder die verschiedenen Informationen über dieselben Personen an mehreren Stellen getrennt gespeichert sind und aus Sicherheitsgründen keine kombinierte Datenbank in Betracht kommt. Mittels spezieller kryptographischer Techniken lassen sich Data-Mining-Algorithmen umsetzen, die dieselben Ergebnisse erzeugen wie bei einer klassischen Analyse auf einem kombinierten Datensatz, ohne dass die einzelnen Daten exportiert werden müssen oder erschließbar sind. Auch hier sind hochqualitative Ergebnisse zu erwarten, bei der Umsetzung handelt es sich aber wiederum um Speziallösungen, die zudem aufgrund der eingesetzten kryptographischen Verfahren sehr laufzeitintensiv sind. Zusammengefasst lässt sich sagen, dass das Privacy- Preserving Data Mining sehr gute Ansätze liefert, Datenschutzanforderungen mit mathematischen Garantien zu erfüllen. Aufgrund der Komplexität der Fragestellungen sollten diese Fragestellungen aber auf jeden Fall direkt zu Beginn eines Big-Data-Projektes adressiert werden, um effektive Lösungen zu finden. 148
Big-Data-Technologien – Wissen für Entscheider • 8.2 Custodian Gateways und ihre Einsatzmöglichkeiten bei Big-Data- Anwendungen Die Verwertung und Vermarktung persönlicher Daten in digitaler Form nimmt stetig zu. Doch ebenso rasant werden die daraus resultierenden Spannungen und Probleme wachsen, sofern versäumt wird, den ordnungspolitischen Rahmen in Bezug auf die Nutzung dieser Daten entsprechend vorzugeben. Denn die großen Nutznießer der persönlichen Daten sind nicht die Individuen selbst, sondern jene, die diese Daten mit Hilfe von User Analytic Tools aufbereiten und gegen Entgelt zur wirtschaftlichen Verwertung anbieten. Aktuell ist die werbetreibende Industrie der größte Adressat derartiger Datenverwertungsmodelle. Das Individuum partizipiert an der Verwertung seiner Daten hingegen in der Regel nur mittelbar durch unentgeltlich zur Verfügung gestellte Informationen oder Anwendungen (Dienste). In der Bevölkerung zeichnet sich jedoch ein wachsendes Bewusstsein für den Wert persönlicher digitaler Daten ab, so dass davon auszugehen ist, dass die Bürger in Zukunft verstärkt nur dann eine wirtschaftliche Verwertung ihrer persönlichen Daten gestatten werden, wenn sie an den Erträgen angemessen beteiligt werden. Eine große Herausforderung liegt daher u.a. in der differenzierten monetären Bewertung persönlicher digitaler Daten. Hinzu kommen Aspekte der Daten-Sicherheit und des Verbraucherschutzes. Ebenso sind Aspekte und Potentiale der Steuer- und Wirtschaftspolitik zu berücksichtigen; so kann ein gezielter Aufbau von Verwertungsstrukturen zur Steigerung der nationalen Wertschöpfung beitragen, indem Individuen und Inhaber persönlicher digitaler Daten dabei unterstützt werden, ihre Rechte an deren Verwertung auszuüben, die Verwertung selber zu optimieren sowie ihr wirtschaftliches Potential gezielt und individuell zu nutzen. Folglich ist ein Modell zur Verwertung persönlicher digitaler Daten, an dem sowohl Dateninhaber, Datenverwerter als auch Dienstleister der Datensicherung, Datenaufbereitung sowie des Datenschutzes beteiligt sind, zu entwickeln. Die Ziele der neuen Datenverwertung sind jedoch nicht allein mit neuen technischen Lösungen zu erreichen. Voraussetzung für die Gestaltung bzw. Steuerung einer solchen persönlichen digitalen Datenwirtschaft (PDD) ist es, zwischen den diversen Stakeholdern ein »Level Playing Field« 209 auszutarieren. Eine mögliche Antwort auf die Herausforderungen im Umgang mit persönlichen digitalen Daten ist die Etablierung einer Deutschen Daten-Treuhand (DEDATE) in Form einer öffentlichrechtlichen Körperschaft (vgl. Abbildung 62). Sie fungiert zum einen als Steuerungseinheit, welche Spielregeln für die Nutzung und Verwertung der Daten, unter Berücksichtigung der Bedürfnisse der Marktteilnehmer, festlegt. Zum anderen gewährleistet sie die Einhaltung der vom Individuum gewährten Nutzungsrechte und nimmt ggf. die Nutzungsentgelte entgegen, welche an die Individuen ausgeschüttet werden. Vorteil eines solchen Modells ist die codierte Speicherung und kontrollierte Nutzung der persönlichen Daten. Der Datentreuhänder (Custodian) verfolgt keine wirtschaftlichen Interessen durch die Verwertung der Daten, sondern muss allein seiner Aufgabe der Datenspeicherung und sicherung gerecht werden. Dadurch kann auch folgenden Herausforderungen im Zuge der Verwertung persönlicher digitaler Daten begegnet werden: • Aushöhlung und Missbrauch ziviler und kommerzieller Rechte der Dateneigentümer, • Etablierung von unseriösen oder kriminellen Akteuren auf dem Markt der Datenerfassung und -verwaltung, • Verhinderung eines Marktgleichgewichts auf dem Markt für persönliche digitale Daten und der Ausschöpfung der Innovations- und Wertschöpfungspotentiale dieser Daten bei Behinderung oder Blockade des Zugriffs auf freigegebene persönliche digitale 209 Der Begriff bezieht sich auf den sich gegenwärtig intensivierenden Kampf um die Gewinne aus persönlichen Daten (»battle for share«), der durch Marktteilnehmer ohne marktbeherrschende Position hervorgerufen wird. Diese Tendenzen gehen von Individuen, Nutzer-Communities und Konzernen aus allen möglichen Branchen sowie auch der Regierung aus. Damit erlangt die persönliche digitale Datenwirtschaft eine erhebliche gesamtwirtschaftliche Bedeutung, die bei der Erstellung der volkswirtschaftlichen Gesamtrechnung in Betracht gezogen werden muss. Als logische Folge dieses Prozesses müssen Änderungen in der Besteuerung, bei den rechtlichen und ordnungspolitischen Rahmenbedingungen usw. vorgenommen werden. 149
Seite 1 und 2:
Big-Data-Technologien - Wissen für
Seite 3 und 4:
Seite 5 und 6:
Seite 7 und 8:
Seite 9 und 10:
Seite 11 und 12:
Seite 13 und 14:
Seite 15 und 16:
Seite 17 und 18:
Seite 19 und 20:
Seite 21 und 22:
Seite 23 und 24:
Seite 25 und 26:
Seite 27 und 28:
Seite 29 und 30:
Seite 31 und 32:
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
Seite 49 und 50:
Seite 51 und 52:
Seite 53 und 54:
Seite 55 und 56:
Seite 57 und 58:
Seite 59 und 60:
Seite 61 und 62:
Seite 63 und 64:
Seite 65 und 66:
Seite 67 und 68:
Seite 69 und 70:
Seite 71 und 72:
Seite 73 und 74:
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
Seite 81 und 82:
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100: Big-Data-Technologien - Wissen für
Seite 149: Big-Data-Technologien - Wissen für
Seite 201 und 202:
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Alle anzeigen

w26M2

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?