Глава 1     Глава 2     Глава 3   

Представление данных в одном, двух и трех измерениях


К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

•              одномерное (univariate) измерение, или 1-D;

•              двумерное (bivariate) измерение, или 2-D;

•              трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

•              его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

•              топологические особенности;

•              наличие трендов;

•              информацию о взаимном расположении данных;

•              существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

•              использование многомерных методов представления информации (они рассмотрены ниже);

•              снижение размерности до одно-, двух-или трехмерного представления. Существуют различные способы снижения размерности, один из них -факторный анализ -был рассмотрен в одной из предыдущих лекций.

Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.