Klastrowanie, klasyfikacja
Klastrowanie, klasyfikacja
Klastrowanie, klasyfikacja
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Jak wybrać liczbę klastrów k?Average silhouette width – podejście heurystyczne• Dla każdej obserwacji i, definiuje się szerokość silhouette s(i)• a(i) = średnia odległość pomiędzy i oraz wszystkimi punktami z jego klastra• dla wszystkich innych klastrów C, niech d(i,C) = średnia odległość od i dowszystkich obserwacji w C. Niech b(i) = min C d(i,C)• Szerokość silhouette s(i) = (b(i)-a(i)) / max(a(i),b(i))• Maksymalna średnia szerokość silhouette dla wszystkich obserwacjimoże być użyta do wyboru liczby klastrów• Obserwacje z s(i) bliskim 1 mogą być rozważane jako dobrzeklastrowane, a s(i)