Описание тренинга: в курсе разбираются методы классификации, которые также относят к методам добычи знаний (data mining), позволяющим находить скрытые и неочевидные закономерности в больших массивах данных и принимать на основе этих закономерностей управленческие решения.
По окончании тренинга Вы будете уметь:
- проводить кластерный анализ различными методами;
- использовать факторный и компонентный анализ в задачах классификации;
- проводить дискриминантный анализ и классификацию на его основе;
- строить деревья решений и уметь анализировать их
Продолжительность тренинга: 4 дня (с 10:00 до 17:00)
Программа тренинга:
Тема 1. Кластерный анализ и его применение
- Многомерные методы классификации
- Понятие и области применения кластерного анализа
- Задачи кластерного анализа
- Методы кластерного анализа
- Преимущества и недостатки кластерного анализа
- Этапы кластерного анализа
- Исходные данные для кластерного анализа
- Меры расстояния между объектами
- хАнализ качества классификации
Тема 2. Иерархический кластерный анализ
- Особенности иерархического кластерного анализа
- Алгоритм иерархических методов кластерного анализа
- Меры расстояния между кластерами
- Процедура Расстояния
- Меры различия
- Меры сходства
- Процедура Иерархический кластерный анализ
- Выбор метода иерархического кластерного анализа
- Результаты процедуры Иерархический кластерный анализ
- Графическое представление результатов иерархического кластерного анализа
- Настройка статистик процедуры Иерархический кластерный анализ
- Сохранение новых переменных
Тема 3. Классификация методом k-средних
- Сущность и особенности метода k-средних
- Алгоритм метода k-средних
- Процедура Кластерный анализ методом k-средних
- Результаты процедуры
- Кластерный анализ методом k-средних
- Настройка количества итераций
- Настройка дополнительных параметров
- Результаты вывода дополнительных настроек
- Сохранение новых переменных
- Графическое представление результатов
Тема 4. Двухэтапный кластерный анализ
- Особенности двухэтапного кластерного анализа
- Предпосылки двухэтапного кластерного анализа
- Алгоритм двухэтапного кластерного анализа
- Процедура Двухэтапный кластерный анализ
- Сводка результатов модели
- Оценка кластерной структуры
- Просмотр информации о кластерах
- Вывод информации по кластерам
- Управление выводом
- Вывод процедуры Двухэтапный кластерный анализ
- Дополнительная панель средства просмотра кластеров
- Отбор наблюдений по кластерам
- Параметры процедуры Двухэтапный кластерный анализ
Тема 5. Методы снижения размерности: факторный и компонентный анализ
- Понятие факторного анализа
- Цель и задачи факторного анализа
- Этапы факторного анализа
- Предпосылки применения факторного анализа
- Алгоритм компонентного анализа
- Алгоритм факторного анализа
- Сравнение факторного и компонентного анализов
- Предпосылки применения факторного и компонентного анализов
- Процедура Факторный анализ
- Результаты процедуры Факторный анализ
- Правила отбора факторов
- Выбор метода факторного анализа
- Проблема вращения факторов
- Настройка вращения факторов
- Параметры процедуры Факторной анализ
- Вывод описательных статистик
- Сохранение значений факторов
Тема 6. Классификация на основе откликов: дискриминантный анализ
- Сегментация на основе откликов
- Методы сегментации на основе откликов
- Исходные данные для дискриминантного анализа
- Сходства дискриминантного анализа и логистической регрессии
- Различия дискриминантного анализа и логистической регрессии
- Цель и задачи дискриминантного анализа
- Предпосылки дискриминантного анализа
- Этапы дискриминантного анализа
- Методы дискриминантного анализа
- Исходные данные
- Линейная модель дискриминантного анализа
- Процедура Дискриминантный анализ
- Результаты процедуры Дискриминантный анализ
- Статистики процедуры Дискриминантный анализ
- Метод пошагового отбора процедуры Дискриминантный анализ
- Классификация на основе результатов дискриминантного анализа
- Классификационные статистики
- Сохранение новых переменных
Тема 7. Модели классификации на основе деревьев решений
- Термины, применяемые в деревьях решений
- Методология деревьев решений
- Задачи и области применения деревьев решений
- Преимущества и недостатки деревьев решений
- Методы деревьев решений
- Процедура Деревья классификации
- Настройка Вывода модели
- Сохранение результатов
- Результаты процедуры Деревья классификации
- Проверка модели
Тема 8. Построение деревьев решений методом CHAID
- Описание метода CHAID
- Запуск и настройка процедуры Деревья классификации для метода CHAID
- Построение модели CHAID
- Построение модели CHAID по данным с пропусками
- Задание стоимостей ошибочной классификации
- Задание прибылей Задание значений
- Построение более надежных моделей с помощью метода Исчерпывающий CHAID
Тема 9. Построение деревьев решений методом CRT
- Описание метода CRT
- Запуск и настройка процедуры Деревья классификации для метода CRT
- Построение модели CRT
- Построение модели CRT по данным с пропусками
- Задание априорных вероятностей
Тема 10. Построение деревьев решений методом QUEST
- Описание метода QUEST
- Запуск и настройка процедуры Деревья классификации для метода QUEST
- Построение модели QUEST
- Построение модели QUEST по данным с пропусками
- Задание априорных вероятностей
Тема 11. Редактор деревьев
- Просмотр диаграммы дерева в Редакторе
- Просмотр содержимого узла
- Настройка внешнего вида диаграммы
- Изменение ориентации диаграммы
- Настройка содержимого узла
- Отбор наблюдений в Редакторе
Комментарии: