Приводятся примеры влияние резко выделяющихся наблюдений на некоторые оценки моментов и параметров распределений. Вводится понятие "аномальное наблюдение (выброс)". Формулируется "модель больших ошибок". Даются некоторые рекомендации обработки данных содержащих выбросы. Приводятся типичные причины их возникновения. Вводится понятие "сила влияния измерения на оценку значения параметра линейной регрессии (leverage)". Вводится мера аномальности значений независимых переменных -- расстояние Махаланобиса (Mahalanobis distance). Вводятся понятие "удаленная остаточная разность", "стьюдентизированная остаточная разность". Описывается основанная на ней техника обнаружения выбросов. Вводится комплексная оценка аномальности наблюдения -- расстояние Кука (Cook's distance).
Лекция и тесты в НОУ ИНТУИТ http://www.intuit.ru/studies/courses/...
Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.
Комментарии: