Как внедрять модели, используя SVB узлы

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 19:08


Один из важнейших этапов Data Mining включает в себя сравнение моделей, построенных на обучающей выборке, а именно, тестирование на новых данных. Этот пример поможет разобраться, как осуществить подобное в STATISTICA.

Как проще внедрять модели, используя новые типы узлов в Workspace

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 19:03


Данная статья призвана показать преимущества новых типов узлов в STATISTICA Workspace.

Подразумевается, что читатель знаком с устройством STATISTICA Workspace, для получения необходимых знаний можно обратиться к статье How to Navigate the STATISTICA Workspace.

Анализ продаж электронной и бытовой техники в системе STATISTICA

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 18:30


Содержание

  • Структура данных
  • Ассоциативные правила
  • Построение ассоциативных правил
    • Шаг 1. Импорт данных
    • Шаг 2. Построение ассоциативных правил
    • Шаг 3. Анализ результатов
  • Заключение
  • Список литературы

Анализ клиентских баз данных. Выявление мошенничества (fraud detection) на базе STATISTICA Data Miner

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 18:20


Содержание

  • Введение
  • Краткий обзор Data Mining
  • Вербальная постановка задачи
  • Структура данных
  • Основные подходы обнаружения мошенничества
  • Почему именно технология Data Mining, а не отдельные методы классификации и кластеризации?
  • Алгоритмы кластеризации
  • Описательный анализ
  • Кластеризация K-средних
  • EM-алгоритм
  • Автоматизация
  • Выводы
  • Приложение 1. Алгоритм запуска Алгоритма К-средних
  • Приложение 2. Алгоритм запуска EM-алгоритма

Задача распознавания спама

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 17:30


Содержание

  • Цель исследования
  • Описание примера
  • 1. Анализ с помощью МАР – сплайнов
  • 2. Анализ с помощью растущих деревьев классификации и регрессии
  • Вывод

Интерактивное бурение

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 17:17


Первым шагом во многих проектах добычи данных является интерактивное исследование данных с целью получения первоначального представления о типах переменных, используемых в анализе, и возможных взаимосвязях между ними. Система STATISTICA и модуль STATISTICA Добыча данных, в частности, предлагают широкий набор как методов разведочного анализа (EDA), так и методов графического анализа (графическая или визуальная добыча данных). Задача Интерактивного бурения состоит в том, чтобы предоставить пользователю инструмент анализа, сочетающий графические и разведочные методы, который позволит быстро определять распределения переменных и связи между ними, а также определять наблюдения, принадлежащие неким специфическим группам данных.

Новые достижения STATISTICA Data Miner – Прогнозирование погоды

Опубликовал: pvi777 в категорию Добыча данных (Data Mining) - 26.12.2014, 16:47


Содержание

  • Введение
  • Меню STATISTICA Data Miner
  • Исходные данные
  • Описательный анализ
  • Кластерный анализ
  • Прогнозирование средней температуры июля
  • Список литературы

Последнее на форуме

Последние коментарии

Ваше мнение

Какие программные продукты Вы используете для решения статистических и эконометрических задач?


Всего ответов: 27

Ключевые слова

курс «Data Mining with STATISTICA» Eviews программы обработки статистической статистический анализ временные ряды анализ Фурье спектральный анализ факторный анализ иерархическая классификация кластерный анализ классификация методом К средних метод К средних анализ временных рядов преобразования переменных анализ распределённых лагов распределённые лаги регрессионный анализ множественная нелинейная регрессия нелинейная регрессия подгонка распределений распределения регрессия пошаговая регрессия Data Mining многомерное шкалирование шкалирование Data Mining with STATISTICA классификация анализ главных компонент главные компоненты дискриминантный анализ АРПСС (ARIMA) одномерная АРПСС (ARIMA) анализ с повторяющимися изменениями дисперсионный анализ факторный дисперсионный анализ классификация текста Text mining Text Miner анализ и классификация текста анализ текста иерархический кластерный анализ кусочно-линейная регрессия нелинейное оценивание StatSoft Statistica метод взвешенных наименьших квадрат функция потерь визуализация данных поиск зависимостей прогнозирование скоринг нейросетевые вычисления анализ и обработка данных добыча данных (Data Mining) добыча текстов (Text Mining) задачи анализа данных автоматизация контроля качества банковское дело Бизнес маркетинг геологоразведка интернет анализ данных медицина промышленность страхование телекоммуникации Фармакология финансы социология статистика экономика официальные издания Росстата отраслевые решения энергетика материалы Росстата материалы по пакету Scilab пакет Scilab Scilab среда Scilab язык программирования Scilab статистические сборники

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты