Глава 1     Глава 2     Глава 3   

Основные характеристики пакета SAS Enterprise Miner 5.1 5


Уменьшение размерности

Выбор переменных:

•              Удаление переменных, не связанных с целевыми признаками, на основе критериев отбора хи-квадрат или R2.

•              Удаление переменных из иерархий.

•              Удаление переменных со многими недостающими значениями.

•              Сокращение числа классовых переменных с большим количеством уровней.

•              Группировка непрерывных исходных данных для выявления нелинейных взаимосвязей.

•              Выявление взаимодействий.

Главные компоненты:

•              Вычисление собственных значений и собственных векторов на основании матриц корреляции и ковариации.
•              Графики: масштабированное отклонение, логарифмические собственные значения, кумулятивные пропорциональные собственные значения.

•              Исследование выбранных основных компонентов при помощи методов предиктивного моделирования.

Исследование временных рядов:

•              Сокращение объемов транзакционных данных на основе формирования временных рядов с использованием разнообразных методов аккумуляции и преобразования.

•              Методы анализа включают сезонный анализ, анализ тенденций, анализ временных областей, сезонную декомпозицию.

•              Исследование сокращенных временных рядов при помощи методов кластерного и предиктивного моделирования.