Bachelorarbeit - Lehrstuhl für Künstliche Intelligenz der Universität ...

ai.cs.uni.dortmund.de

Bachelorarbeit - Lehrstuhl für Künstliche Intelligenz der Universität ...

2.2. SAX 5

Symbole, die Glättung durch Bildung des Mittelwertes über jedes Fenster. Kompression

und Genauigkeit des Distanzmaßes können durch Parameter gesteuert werden.

2.2.1 Verfahren

Die Symbolisierung durch SAX erfolgt in zwei Schritten: Der Reduktion mittels P AA und

der Symbolisierung.

Piecewise Aggregate Approximation

Im ersten Schritt, Piecewise Aggregate Approximation, wird die Zeitreihe in Fenster der

Länge w eingeteilt. w muss zuvor als Parameter des Algorithmus festgelegt werden und

steuert die Kompression der Datenreihe. Anschließend wird über den Werten in jedem der

Fenster der Mittelwert bestimmt. Dadurch wird die Zeitreihe C der Länge n komprimiert

als Zeitreihe C der Länge ⌈ n w

⌉ dargestellt. Zur Vereinfachung wird angenommen, dass n

durch w ohne Rest teilbar ist. Der i-te Wert c i ∈ C wird definiert durch

n

w i ∑

c i = w c j (2.1)

n

j= n w (i−1)+1

Diskretisierung zu SAX-Strings

Um die Werte c i ∈ C zu diskretisieren, werden sie einem Wertebereich v i zugeordnet. Die

Anzahl der Wertebereiche |V | wird durch den Parameter a bestimmt. Anstatt den gesamten

Wertebereich V C

von C, in a gleichgroße Bereiche einzuteilen, wird C in möglichst

gleichverteilte Symbole übersetzt. Durch Standardisierung der Zeitreihe C kann man von

einer Normalverteilung der Werte ausgehen. Die Wertebereiche werden nun so definiert,

dass 1 a

der Werte in jeden Wertebereich fallen.

Abbildung 2.1: Einteilung des Wertebereiches in 3 Teilbereiche. Links ist die Normalverteilung

eingezeichnet. Die gefensterten Teilstücke der Wertereihe sind, je nach Wertebereich, einem Symbol

zugeordnet. Quelle: [19]

Weitere Magazine dieses Users
Ähnliche Magazine