Глава 1     Глава 2     Глава 3   

Задача кластеризации 5


На сегодняшний день разработано более сотни различных алгоритмов кластеризации. Некоторые, наиболее часто используемые, будут подробно описаны во втором разделе курса лекций.

Приведем краткую характеристику подходов к кластеризации [21].

                Алгоритмы, основанные на разделении данных (Partitioning algorithms), в т.ч. итеративные:

                разделение объектов на k кластеров;

                итеративное перераспределение объектов для улучшения кластеризации.

                Иерархические алгоритмы (Hierarchy algorithms):

                агломерация: каждый объект первоначально является кластером, кластеры, соединяясь друг с другом, формируют больший кластер и т.д.

                Методы, основанные на концентрации объектов (Density-based methods):

                основаны на возможности соединения объектов;

                игнорируют шумы, нахождение кластеров произвольной формы.

                Грид-методы (Grid-based methods):

                квантование объектов в грид-структуры.

                Модельные методы (Model-based): использование модели для нахождения кластеров, наиболее соответствующих данным.