Frequent String Mining in mehreren Datenbanken

ai.cs.uni.dortmund.de

Frequent String Mining in mehreren Datenbanken

Überblick

Einführung: Was, warum und wie?

Datenstruktur und Basisalgorithmus

Speicherplatzeffiziente Erweiterung des Basisalgorithmus

Ergebnisse

Struktur!

Struktur in den Daten

Datenstruktur

Der Basisalgorithmus

◮ ” Ähnlichkeit mindestens l“ definiert Äquivalenzrelation auf

Suffixen

◮ Äquivalenzklassen entsprechen Intervallen in der sortierten

Suffixliste

◮ Jede Äquivalenzklasse kann ich mit dem gemeinsamen Präfix

der Mitglieder markieren. ( ” Das ω-Intervall“)

◮ Ich kann l variieren: Neue Äquivalenzrelation, neue

Partitionierung. Also Hierarchie von Äquivalenzklassen.

Peter Fricke Frequent String Mining in mehreren Datenbanken

Weitere Magazine dieses Users
Ähnliche Magazine