Дисперсионный анализ (ANOVA – analysis of variance) – статистический метод изучения взаимосвязи. Применяется для исследования влияния одной или нескольких качественных переменных на одну зависимую количественную переменную. В основе дисперсионного анализа лежит предположение, что одни переменные могут рассматриваться как причины (независимые переменные), а другие как следствия (зависимые переменные или отклики). Независимые переменные в дисперсионном анализе называют факторами, поскольку в ходе эксперимента исследователь может изменять их значения и анализировать получаемое значение зависимой количественной переменной.
Основная цель дисперсионного анализа – исследовать значимость различия между средними значениями зависимой количественной переменной по группам фактора. Достигается это с помощью разложения общей дисперсии зависимой переменной на составляющие: дисперсию за счет разбиения на группы (межгрупповая дисперсия) и дисперсию за счет остальных факторов (внутригрупповая дисперсия). Анализируя эти компоненты дисперсии можно оценить долю воздействия каждого фактора на зависимую переменную. Отдельная задача дисперсионного анализа – выявить, за счет каких именно групп идет различие средних значений зависимой переменной.
Различают разные модели дисперсионного анализа. В зависимости от числа факторов могут быть однофакторные и многофакторные дисперсионные модели. В зависимости от числа наблюдений в исследуемых группах различают сбалансированные и несбалансированные модели дисперсионного анализа. В зависимости от числа зависимых переменных различают одномерные и многомерные модели. По природе факторов различают детерминированные, случайные и смешанные модели. В зависимости от того зависимы или независимы выборки, образуемые категориями фактора, выделяют дисперсионные модели с независимыми измерениями и дисперсионный анализ с повторными измерениями.
Кроме того, выделяют параметрические методы дисперсионного анализа, а также непараметрический дисперсионный анализ: критерий Крускала-Уоллиса и критерий Джонкхиера-Терпстры для независимых выборок, критерий Фридмана и критерий Пейджа для повторных измерений.
Области применения дисперсионного анализа весьма обширны. Дисперсионный анализ применяется в планировании эксперимента в управлении производством и в ряде областей экономических, социологических, медико-биологических исследований.
Когда помимо категориальных факторов в модель вводятся количественные независимые переменные, модель называется ковариационным анализом.
Ковариационный анализ (covariance analysis) – совокупность методов математической статистики изучения взаимосвязи между количественной зависимой переменной и набором категориальных и одновременно набором количественных предикторов. Независимые количественные предикторы в модели ковариационного анализа называют ковариатами, а категориальные независимые переменные – факторами.
Ковариационный анализ является как бы синтезом регрессионного и дисперсионного анализа. Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. Если в линейной модели взаимосвязи присутствуют только категориальные предикторы с помощью введения фиктивных переменных, то получается модель дисперсионного анализа. Если в линейной модели присутствуют только количественные предикторы – получается модель регрессионного анализа. А при совместном введение факторов и ковариат проводиться ковариационный анализ.
По отношению к зависимой переменной ковариаты являются сопутствующими переменными. Ковариационный анализ часто используется при «управлении» эффектами внешних переменных. Другими словами, введение в модель ковариат позволяет оценить их влияние на взаимодействие зависимой переменной и факторов. Например, аналитик может использовать коэффициент IQ студентов в качестве ковариаты (количественный предиктор) при исследовании эффективности различных методов обучения (качественный предиктор).
Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.