После получений результатов кластерного анализа


Проверка качества кластеризации
После получений результатов кластерного анализа методом k-средних следует проверить правильность кластеризации (т.е. оценить, насколько кластеры отличаются друг от друга). Для этого рассчитываются средние значения для каждого кластера.
При хорошей Достоинства алгоритма k-средних:
•              простота использования;
•              быстрота использования;
•              понятность и прозрачность алгоритма.
Недостатки алгоритма k-средних:
•              алгоритм слишком чувствителен к выбросам, которые могут искажать среднее. Возможным решением этой проблемы является использование модификации алгоритма -алгоритм k-медианы;
•              алгоритм может медленно работать на больших базах данных. Возможным решением данной проблемы является использование выборки данных.

Содержание раздела