Визуализация инструментов Data Mining


Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

•              Для деревьев решений это визуализатор дерева решений, список правил, таблица
сопряженности.

•              Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.

•              Для карт Кохонена: карты входов, выходов, другие специфические карты.

•              Для линейной регрессии в качестве визуализатора выступает линия регрессии.

•              Для кластеризации: дендрограммы, диаграммы рассеивания.

•              являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

•              помогают интерпретировать полученный результат;

•              являются средством оценки качества построенной модели;

•              сочетают перечисленные выше функции (дерево решений, дендрограмма).

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.



Содержание раздела