Frequent String Mining in mehreren Datenbanken

ai.cs.uni.dortmund.de

Frequent String Mining in mehreren Datenbanken

Überblick

Einführung: Was, warum und wie?

Datenstruktur und Basisalgorithmus

Speicherplatzeffiziente Erweiterung des Basisalgorithmus

Ergebnisse

Korrekturterme berechnen 2

◮ Benutze Hilfsarray C ′ der Länge n

Struktur in den Daten

Datenstruktur

Der Basisalgorithmus

◮ Iteriere lexikografisch aufsteigend über Suffixe

◮ Finde heraus, in welchem Originalstring ψ das aktuelle Suffix

T SA[e]...n beginnt (Zeilen färben im Beispiel auf S. 42)

◮ Finde den gespeicherten Index d des letzten Vorkommens

eines im Originalstring ψ beginnenden Präfixes.

◮ Für dieses Paar T SA[d]...n, T SA[e]...n von lexikografisch

adjazenten Suffixen, die im selben Originalstring beginnen,

erhöhe C ′ [m] um eins für m = arg mini

Weitere Magazine dieses Users
Ähnliche Magazine