Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

2. Erzeuge aus den Frequent Itemsets alle möglichen Assoziationsregeln und 

berechne ihre Konfidenzen. Die generierten Assoziationsregeln haben automatisch 

den minimalen Support, da Support(A ⇒ B) =Support(A∪B) 

gilt und Support(A ∪ B) in der Menge der Frequent Items liegt. 

Für die Bewältigung der ersten Teilaufgabe stehen sehr viele Algorithmen zur 

Verfügung, in dieser Arbeit soll jedoch nur der bekannteste und grundlegendste 

ausführlich behandelt werden: der Apriori-Algorithmus, der auch als Grundlage 

für zalreiche weitere Methoden dient.. 

Bevor näher auf die Funktionsweise des Algorithmus eingegangen wird, soll noch 

eine Zusatzeigenschaft für Itemsets eingeführt werden: Items sollen in Itemsets 

lexikographisch angeordnet sein. Besteht ein Itemset X der Länge k aus den 

Items x1,x2, ..., xk soll gelten: x1 ≤ x2 ≤ ... ≤ xk. 

Ein Itemset hat die Länge k, wenn es aus k Elementen besteht. Durch die Ordnung 

wird die Menge der aus den Items erzeugbaren Itemsets stark beschränkt. 

n! 

Für eine Menge von Items I mit n Elementen gibt es (n−k)! mögliche Itemsets 

der Länge k, wenn die Items nicht lexikographisch angeordnet werden. Durch 

n! 

Einführung der lexikographischen Ordnung gibt es k!(n−k)! Möglichkeiten für 

ein Itemset der Länge k und es gilt: 

n! 

k!(n − k)! ≤ 

n! 

(n − k)! 

Es ist nicht von Interesse, in welcher Reihenfolge die Artikel in den Warenkorb 

wandern sondern ausschließlich, welche Artikel an der Transaktion beteiligt sind. 

Durch die Einführung dieser Ordnung kann der Zeitaufwand für die Datenanalyse 

bedeutend gesenkt werden. 

Basis des Apriori Algorithmus ist die Monotonie-Eigenschaft von Frequent 

Itemsets: Ist ein Itemset häufig, so sind auch alle Teilmengen dieses Itemsets 

häufig [San00a]. Anders formuliert: Ist ein Itemsets nicht häufig, dann sind alle 

Itemsets, die dieses Itemset als Teilmenge beinhalten ebenfalls nicht häufig. 

Der Apriori-Algorithmus beschränkt sich bei der Generierung von Assoziationsregeln 

auf die Verwendung von Frequent Itemsets aus denen neue Itemsets 

zusammengesetzt werden. Itemsets, die wegen der Monotonieeigenschaft nicht 

häufig sein können, werden von dem Algorithmus automatisch ignoriert. Die 

Wahrscheinlichkeit, dass die betrachteten Regeln den minimalen Support haben, 

steigt. 

Abbildung 1 zeigt den Algorithmus, wie er von Agrawal vorgestellt wird [AS94]. 

Gegeben seien eine Menge von Items I, eine Menge von Transaktionen T und 

ein Wert für Minsupp. Die Frequent Itemsets der Länge 1 lassen sich durch 

einfaches Abzählen der Items in den Transaktionen ermitteln. 

Apriori(I,T,Minsupp) 

L1 := {frequent 1-Itemsets aus I}; 

k := 2; 

while Lk−1 = ∅ do 

Ck := AprioriKandidatenGenerierung(Lk−1); 

for each Transaktiont∈Tdo 8

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?