Paper - Hogeschool Gent
Paper - Hogeschool Gent
Paper - Hogeschool Gent
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Hoofdstuk 2. Theoretische achtergrond 23<br />
Tijdens de testen is gebruik gemaakt van de laatst optie als stopcriterium. Dit betekent dat<br />
voor elke uiteindelijke cluster de objectieffunctie minimaal is. Dit minimum is echter een<br />
lokaal minimum. Bij een tweede uitvoering van de clustering op dezelfde dataset zullen met<br />
grote waarschijnlijkheid andere seeds geselecteerd worden, de keuze is immers willekeurig.<br />
Andere seeds kunnen tot verschillende clusteringen leiden.<br />
Naast de keuze voor een stopcriterium moet ook de waarde van het gewenste aantal clusters<br />
K, ook wel de kardinaliteit van de clustering genoemd, bepaald worden. Het uitvoeren van<br />
deze bepaling van een optimale waarde is echter een NP-probleem (Aloise et al. (2009)).<br />
Gelukkig zijn enkele heuristieken beschikbaar ((Manning et al., 2008)) om een aanvaardbare<br />
waarde te vinden. Op deze heuristieken wordt hier niet verder ingegaan. Het beschikbare<br />
werkgeheugen van de toestellen waarop de testen gedraaid werden, limiteerde immers het<br />
aantal clusters.<br />
2.4.3 Andere methodes<br />
Zoals aangehaald in de inleiding van het hoofdstuk (p.18) bestaan er naast K-means (een<br />
vlakke harde clustering) nog verschillende andere vormen van clustering. De verschillende<br />
vormen die nog aangehaald worden in (Manning et al., 2008) zijn:<br />
Expectation-Maximization (EM, een vlakke zachte clustering)<br />
Hierarchical agglomerative clustering (HAC)<br />
Single-link agglomerative clustering<br />
Complete-link agglomerative clustering<br />
Group-average agglomerative clustering<br />
Centroid similarity agglomerative clustering<br />
Divisive clustering<br />
Enkel de eerstgenoemde is geen hiërarchische clustering.