Область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных данных; процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений. Анализ данных имеет множество аспектов и подходов, охватывает разные методы в различных областях науки и деятельности.
Подробнее...Предварительный анализ данных с целью выявления наиболее общих закономерностей и тенденций, характера и свойств анализируемых данных, законов распределения анализируемых величин. Применяется для нахождения связей между переменными в ситуациях, когда отсутствуют (или недостаточны) априорные представления о природе этих связей.
Подробнее...Совокупность методов обнаружения статистической взаимосвязи между случайными величинами или признаками, которые предусматривают возможность:
- построения корреляционного поля и составления корреляционной таблицы;
- вычисления выборочных коэффициентов корреляции и корреляционных отношений;
- проверки статистической гипотезы значимости связи.
Раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным. Цель регрессионного анализа состоит в определении общего вида уравнения регрессии, построении статистических оценок неизвестных параметров, входящих в уравнение регрессии, и проверке статистических гипотез о регрессии.
Подробнее...Статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Применяется для анализа результатов наблюдений, зависящих от различных, но одновременно действующих факторов, выбора наиболее важных и оценки их влияния. Суть анализа заключается в разложении общей дисперсии случайной величины на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия.
Подробнее...Раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным. Цель регрессионного анализа состоит в определении общего вида уравнения регрессии, построении статистических оценок неизвестных параметров, входящих в уравнение регрессии, и проверке статистических гипотез о регрессии.
Подробнее...Методы статистического вывода, которые применяются без каких-либо предположений относительно параметров изучаемой генеральной совокупности. Непараметрические критерии (тесты) позволяют исследовать данные без каких-либо допущений о характере распределения переменных. В непараметрических критериях обрабатываются не значения переменных, а их ранги или частоты. Непараметрические тесты можно применять при наличии в данных «выбросов» и неоднородных данных.
Подробнее...Анализ выживаемости занимается моделированием процессов наступления терминальных (критических) событий для элементов той или иной совокупности (изначально — «смерти» для элементов совокупности живых существ). В целом анализ выживаемости представляет собой построение моделей, описывающих данные о времени наступления события.
Так как живой организм может умереть лишь один раз, то традиционно в рамках данного подхода рассматриваются лишь единичные и единовременные терминальные события.
Нелинейное оценивание является универсальной аппроксимирующей процедурой, оценивающей любой вид зависимости между переменной отклика и набором независимых переменных. Нелинейное оценивание позволяет задать практически любой тип непрерывной или разрывной регрессионной модели. Различают два основных типа нелинейных моделей: а) регрессионные модели с линейной структурой; б) существенно нелинейные регрессионные модели.
Подробнее...Логлинейный анализ - метод анализа категориальных (номинальных) данных, позволяющий исследовать отношения между переменными в таблицах сопряженности.
Логлинейный анализ может рассматриваться как непараметрический аналог многофакторного дисперсионного анализа с дискретным измерением.
Анализ временных рядов объединяет методы изучения временных рядов, как пытающиеся понять природу точек данных (откуда они взялись? что их породило?), так и пытающиеся построить прогноз. Прогнозирование временных рядов заключается в построении модели для предсказания будущих событий основываясь на известных событий прошлого, предсказания будущих данных до того как они будут измерены.
Подробнее...Моделирования структурными уравнениями (SEPATH) представляет собой всеобъемлющую и необычайно мощную технику многомерного анализа, включающую большое количество методов из различных областей статистики.
SEPATH представляет собой мощное развитие многих методов многомерного анализа: множественная регрессия и факторный анализ получили здесь естественное развитие и объединение.
Кластерный анализ – это метод классификационного анализа, назначение которого состоит в разбиении множества объектов и признаков на однородные группы или кластеры. Он даёт возможность производить разбиение объектов по ряду признаков, не накладывает ограничений на вид рассматриваемых объектов и позволяет исследовать множество исходных данных различной природы.
Подробнее...Факторный анализ – это метод многомерного статистического анализа данных, цель которого состоит в сокращении числа переменных на основе классификации переменных и определения структуры взаимосвязей между ними. Сокращение достигается путем выделения скрытых (латентных) общих факторов, объясняющих связи между наблюдаемыми признаками объекта.
Подробнее...Канонический анализ предназначен для анализа зависимостей между двумя списками признаков (независимых переменных), характеризующих объекты. Канонический анализ является обобщением множественной корреляции как меры связи между одной переменной и множеством других переменных.
Подробнее...Надёжность и позиционный анализ содержит широкий набор процедур для разработки шкалы и оценки её надежности с помощью классической теории тестирования.
Оценивание надежности шкалы основано на корреляциях между индивидуальными позициями или измерениями, составляющими шкалу, и дисперсиями этих позиций.
Анализ соответствий содержит описательные и разведочные методы анализа двухвходовых и многовходовых таблиц, которые позволяют исследовать структуру группирующих переменных. Целью анализа соответствий является представление содержимого таблицы относительных частот в виде расстояний между строками и/или столбцами таблицы в пространстве возможно более низкой размерности.
Подробнее...Цель многомерного шкалирования – поиск и интерпретация латентных переменных, дающих возможность объяснить сходства между объектами, заданными точками в исходном пространстве признаков. Метод можно рассматривать как альтернативу факторному анализу, в котором достигается сокращение числа переменных, путем выделения латентных факторов, объясняющих связи между переменными.
Подробнее...Дискриминантный анализ включает статистические методы классификации многомерных наблюдений в ситуации, когда исследователь обладает обучающими выборками. Цель дискриминантного анализ состоит в том, чтобы на основе измерения различных характеристик (признаков) объекта классифицировать его, т.е. отнести к одной из нескольких заданных групп (классов) некоторым оптимальным способом.
Подробнее...Анализ мощности обобщает методы анализа мощности статистических критериев, объема выборки и углубленные методы доверительного интервального оценивания.
Его цель заключается в: а) определении объема выборки для получения надежных оценок, б) оценке вероятности того, что статистический тест будет обнаруживать экспериментальные эффекты данной величины, в) оценивании величины эффектов, полученных в экспериментах.
Нейронная сеть — это математическая модель, построенная по принципу биологических нейронных сетей, так как состоит из искусственных нейронов. Нейронные сети не программируются, они обучаются, т.е. самостоятельно выявляют зависимости между входными и выходными данными. Нейронные сети работают, в основном, как классификаторы, то есть определяют особенные признаки входных данных. Нейронные сети также можно использовать для решения проблем регрессии, когда нужно установить зависимость результата от параметров.
Подробнее...Data mining - совокупность методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Основу методов Data Mining составляют методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики.
Подробнее...Контрольная карта – это инструмент, позволяющий отслеживать ход протекания процесса и воздействовать на него, предупреждая его отклонения от предъявленных к процессу требований. Инструментарий карт контроля качества широко использует статистические методы, основанные на теории вероятностей и математической статистики.
Подробнее...Анализ производственных процессов относят к методам промышленной статистики. В управлении производством важно обеспечить изготовление продукции в заданном количестве, надлежащего качества и ассортимента в определенные сроки, минимизировать долю бракованных изделий. Статистические методы анализа производственных процессов позволяют решить эти управленческие задачи.
Подробнее...Искусство располагать наблюдения в определенном порядке или проводить специально спланированные проверки с целью полного использования возможностей этих методов и составляет содержание предмета «планирование эксперимента». Целью методов планирования экспериментов является изучение влияния определённых факторов на исследуемый процесс и поиск оптимальных уровней факторов, определяющих требуемый уровень течения данного процесса.
Подробнее...Комплекс теоретических и методических материалов, описывающих сущность и содержание статистического анализа, лежащего в основе проведения анализа и обработки данных, в основе построения систем бизнес-аналитики и принятия решений. Демонстрируются подходы, методы, методический и прикладной инструментарий статистического исследования эмпирического материала.
Библиотека учебных изданий и методических материалов, научной и специальной литературы, освещающей теоретические и практические вопросы дисциплин, изучающих проблемы статистического анализа и обработки данных, их место в математическом блоке образовательной программы высшей школы, их роль в подготовке специалиста высокого уровня квалификации.
Библиотека учебных изданий и методических материалов, научной и специальной литературы, освещающей теоретические и практические вопросы использования прикладных программных продуктов MS Excel, Dell StatSoft Statistica, IBM SPSS Statistics, EViews, Stata, Gretl, MathCAD, MatLAB и др. для решения прикладных задач статистического анализа и оброботки данных.
Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.