Frequent String Mining in mehreren Datenbanken

ai.cs.uni.dortmund.de

Frequent String Mining in mehreren Datenbanken

Überblick

Einführung: Was, warum und wie?

Datenstruktur und Basisalgorithmus

Speicherplatzeffiziente Erweiterung des Basisalgorithmus

Ergebnisse

Problemdefinition ( ” Was?“)

Motivation ( ” Warum?“)

Grundidee ( ” Wie?“)

Problemdefinition: Frequent String Mining Problem

Frequent String Mining Problem

Gegeben:

◮ m Datenbanken D1, . . . Dm sind Mengen von Strings über Σ

◮ m Paare von Häufigkeitsschwellwerten

(minf1, maxf1), . . . (minfm, maxfm)

◮ Definition: Ein relevanter Substring ist ein beliebiger String,

dessen Häufigkeit in mindestens einer Datenbank zwischen den

Häufigkeitsschwellwerten liegt: minfi ≤ freq(φ, Di) ≤ maxfi

◮ Definition Frequent String Mining Problem: Finde

Schnittmenge der relevanten Substrings der einzelnen

Datenbanken.

Peter Fricke Frequent String Mining in mehreren Datenbanken

Weitere Magazine dieses Users
Ähnliche Magazine