Боровиков В.П. STATISTICA: искусство анализа данных

Опубликовал: pvi777 в категорию Материалы по Dell StatSoft Statistica - Дата добавления: 17.02.2019, 00:43


Во втором исправленном и дополненном, издании книги, написанной известным специалистом, научным директором компании StatSoft Russia, изложена концепция и технология современного анализа данных на компьютере. На основе элементарных понятии описываются углубленные методы анализа в системе STATIST1CA (StatSoft) с многочисленными примерами из экономики, маркетинга, рекламы, бизнеса, медицины, промышленности и других областей. Второе издание дополнено описанием языка STATISTICA VISUAL BASIC. Книга адресована самому широкому кругу читателей, желающих стать профессионалами в компьютерном анализе данных.
К книге прилагается компакт-диск, включающий учебник StatSoft по анализу данных, учебник по промышленной статистике, материалы обучающих курсов, демо-версии STATISTICA и SNN (нейронные сети) и большое количество данных для обучения и проведения самостоятельных исследований в STATISTICA и SNN.

СОДЕРЖАНИЕ

Введение
Вступительное эссе: приглашение к анализу данных на компьютере
Для кого эта книга?

Глава 1. Краткая экскурсия по системе STATISTICA                                
Вступление  
Командный язык STATISTICA                 
Кнопки автозадач                                                   
Взгляд в будущее    
Первые шаги в системе STATISTICA      
Графический анализ таблиц сопряженности      

Глава 2. Элементарные понятия анализа данных    
Что такое переменная?       
Простейшие описательные статистики    
Свойства описательных статистик
Шкалы измерений              
Какие статистики выбирать?         
Распределение переменной
Зависимости между переменными                       
Исследование связей между наблюдаемыми переменными в сравнении
с экспериментальными исследованиями             
Корреляции  
Почему зависимости между переменными являются важными                                  
Зависимые и независимые переменные   
Как измерить величину зависимости между переменными      
Две черты зависимости между переменными                            
Что такое статистическая значимость (р-уровень)?       
Как определить, является ли результат действительно значимым      
Статистическая значимость и количество выполненных анализов     
Величина зависимости между переменными в сравнении с надежностью зависимости
Почему более сильные зависимости между переменными являются более значимыми      
Почему объем выборки влияет на значимость зависимости                            
Почему слабые зависимости могут быть значимо доказаны только на больших выборках
Можно ли рассматривать отсутствие связей как значимый результат?          
Общая конструкция статистических тестов                                
Как вычисляется статистическая значимость     
Значимость коэффициента корреляции   
Как определить, являются ли два коэффициента корреляции значимо различными
Почему важно нормальное распределение         
Иллюстрация того, как нормальное распределение используется в статистических
рассуждениях           
Как проверить нормальность наблюдаемых величин    
Все ли статистики критериев нормально распределены?         
Как узнать последствия нарушений предположений нормальности? 
Оценка объема выборки                            
Визуальный подход к анализу мощности            
Понижение размерности данных  

Глава 3. Вероятностные распределения и их свойства        
В чем состоит идея вероятностных рассуждений?                    
Нормальное распределение
Равномерное распределение                                 
Экспоненциальное распределение           
Распределение Эрланга      
Распределение Лапласа      
Гамма-распределение                                                        
Логнормальное распределение     
Хи-квадрат-распределение
Биномиальное распределение                               
Распределение арксинуса              
Отрицательное биномиальное распределение    
Распределение Пуассона    
Геометрическое распределение    
Гипергеометрическое распределение      
Полиномиальное распределение                          
Бета-распределение 
Распределение экстремальных значений 
Распределения Релея          
Распределение Вейбулла                           
Распределение Парето        
Логистическое распределение      
Хотеллинга Т2-распределение      
Распределение Максвелла                         
Распределение Коши          
Распределение Стьюдента                         
F-распределение      

Глава 4. Подгонка вероятностных распределений к реальным данным
Пример 1. Подгонка распределения к данным: посещение непопулярного сайта    
Пример 2. Подгонка распределения к данным: посещение популярного сайта        
Пример 3. Скачки вверх и вниз курса акций                              
Пример 4. Количество покупок в магазине                                
Пример 5. Подгонка распределения Вейбулла к данным об отказах   

Глава 5. Двумерный визуальный анализ данных     
Гистограммы                       
Гистограммы и описательные статистики                                  
Группировка  
Подгонка теоретических распределений к наблюдаемым распределениям
Пересекающиеся категории                                  
Диаграммы рассеяния                                
Однородность распределений двух переменных (формы зависимостей)       
Выбросы       
Диаграммы рассеяния с гистограммами  
Диаграммы рассеяния с диаграммами размаха                           
Нормальные вероятностные графики                              
Графики вероятность – вероятность                                
Диаграммы диапазонов      
Диаграммы размаха                        
Столбчатые диаграммы                 
Линейные графики (для переменных)     
Линейные графики (профили наблюдений)        
Последовательные/наложенные графики
Круговые диаграммы
Диаграммы пропущенных значений и интервалов        
Графики функций пользователя                           

Глава 6. Трехмерный визуальный анализ данных   
Гистограммы двух переменных    
ЗМ диаграммы диапазонов                                               
ЗМ диаграммы размаха      
Трехмерные диаграммы рассеяния           
Графики поверхности        
Карты линий уровня
Трассировочные графики  
Тернарные графики                        
Трехмерные категоризованные графики 
Категоризованные тернарные графики   
Графики пользовательских функций                   
Матричные графики

Глава 7. Визуальный анализ категоризованных данных    
Что такое категоризованные графики?                                                   
Категоризованные графики и матричные графики        
Гистограммы и описательные статистики          
Категоризация значений в каждой гистограмме
Категоризация значений в составных графиках 
Категоризованные гистограммы и диаграммы рассеяния                                
Подгонка теоретических распределений к наблюдаемым распределениям
Подгонка распределений к множественным гистограммам     
Категоризованные диаграммы рассеяния
Нелинейная зависимость   
Категоризованные вероятностные графики        
Категоризованные графики квантиль – квантиль          
Категоризованные графики вероятность – вероятность
Категоризованные линейные графики    
Методы сглаживания         
Категоризованные прямоугольные диаграммы  
Связанные графики 
Категоризованные круговые диаграммы 
Круговые диаграммы рассеяния   
Категоризованные диаграммы пропущенных данных и диаграммы диапазонов      
Категоризованные трехмерные графики                                                
Категоризованные тернарные графики   

Глава 8. Пиктографики                                                                          
Анализ пиктографиков                                                      
Классификация пиктографиков                                                                           

Глава 9. Примеры визуального анализа и настройки графиков в STATISTICA
Пример 1. Настройка двумерных и трехмерных графиков       
Настройка двумерных графиков   
Настройка трехмерных графиков 
Пример 2. Подгонка функций, увеличение и закрашивание                                        
Построение диаграммы рассеяния
Приближение полиномами
Интерактивное удаление выбросов (Закрашивание)     
Увеличение  
Рисование пользовательской функции    
Добавление зависимости   
Пример 3. Динамическое закрашивание (Кисть)            
Файл данных                                   
Построение матричного графика                         
Закрашивание в редакторе данных графика       
Пример 4. Связывание и внедрение         
Растровые изображения                                                    
Метафайлы Windows («картинки»)                                                         
Собственный графический формат системы STATISTICA                              
Копирование и вставка графических объектов   
Вставка в виде текста         
Вставка в виде растрового изображения                                                 
Вставка в виде собственного графического объекта системы STATISTICA                         
Сетка
Функции клиента и сервера в OLE           
Создание трехмерной гистограммы                                            
Внедрение диаграммы рассеяния                          
Редактирование внедренного графика                                        
Внедрение или связывание графиков из файлов                                    
Автоматическое обновление связанных графиков         
Управление несколькими графическими объектами     
Изменение очередности изображения графических объектов  
Управление графиками системы STATISTICA в других приложениях Windows
средствами OLE      
Связывание графика системы STATISTICA       
Редактирование связанного графика        
Пример 5. Добавление заданных пользователем статистических графиков в окно Галерея
графиков и в меню Графика                                  
Файл данных
Определение параметров графика                        
Создание нового графика пользователя                          
Выбор заданного пользователем графика
Просмотр и редактирование списка графиков пользователя                            

Глава 10. Описательные статистики    
Корреляции  
Вычисление описательных статистик для группированных данных                          
Внутригрупповые корреляции                             

Глава 11. Построение и анализ таблиц
Вводный обзор        
Таблицы частот       
Таблицы сопряженности и таблицы флагов и заголовков        
Таблицы флагов и заголовков       
Статистики таблиц сопряженности          
Статистики, основанные на рангах                                  
Многомерные отклики и дихотомии        
Многомерные отклики                                                      
Многомерные дихотомии                          
Кросстабуляция многомерных откликов и дихотомий  
Парная кросстабуляция переменных с многомерными откликами     
Средства построения таблиц системы STATISTICA     
Таблицы частот                               
Таблицы сопряженности и таблицы флагов и заголовков                                
Многомерные отклики и дихотомии        
Примеры                              
Пример 1. Таблицы частот 
Пример 2. Таблицы флагов и заголовков
Пример 3. Таблицы сопряженности         
Пример 4. Табулирование многомерных откликов и дихотомий        
Пример (анализ продаж)                            

Глава 12. Т-критерий сравнения средних в двух группах данных
Т-критерий для независимых выборок    
Формальное определение t-критерия                               
Г-критерий для зависимых выборок        
Пример 1      
Пример 2      
Множественные сравнения
Однофакторный дисперсионный анализ и апостериорные сравнения средних        

Глава 13. Непараметрическая статистика                              -          
Краткий обзор непараметрических процедур     
Описание непараметрических процедур на примерах   
Стартовая панель модуля Непараметрические статистики       
Таблицы частот 2x2: статистики Хи/ V/Фи-квадрат, Макнемара, точный критерий Фишера..
Наблюдаемые частоты в сравнении с ожидаемыми        *         
Корреляции (Спирмена R, тау Кендалла, Гамма)                                   
Матричная диаграмма        
Критерий серий Вальда-Вольфовица       
U-критерий Манна-Уитни 
Двухвыборочный критерий Колмогорова-Смирнова    
Пример. Критерий серий Вальда-Вольфовица, Манна-Уитни U-критерий,
двухвыборочный критерий Колмогорова-Смирнова     
ANOVA Краскела-Уоллиса и медианный тест   
Критерий знаков     
Критерий Вилкоксона        
AN OVA Фридмана и коэффициент конкордации, или согласия, Кендалла  
Q-критерий Кохрена                                  
Описательные статистики 
Медиана       
Мода                         
Геометрическое среднее                            
Гармоническое среднее      
Дисперсия и стандартное отклонение     
Размах           
Квартильный размах           
Асимметрия 
Эксцесс                                

Глава 14. Анализ выживаемости          
Введение в анализ выживаемости
Таблицы времен жизни      
Оценки Каплана-Мейера   
Сравнение выживаемости в группах       
Регрессионные модели в анализе выживаемости
Модель Кокса          
Экспоненциальная регрессия        
Нормальная и логнормальная регрессия  
Обзор системы         
Альтернативные процедуры         
Пример 1. Таблицы времен жизни
Задание параметров анализа          
Пример 2. Регрессионная модель Кокса  
Задание параметров анализа                                 
Оценивание параметров                
Результаты   

Глава 15. Анализ соответствии                                                 
Пример 1 (анализ курильщиков)   
Пример 2 (анализ продаж) 

Глава 16. Примеры анализа данных в системе STATISTICA                   
Построение плана   
Задание имени и сохранение экспериментального плана                                 
Анализ экспериментальных данных        

Глава 17. Нейронные сети          
Пре/постпроцессирование 
Оценка качества работы сети        
Диалог в модуле Нейронные сети STATISTICA
Заключительные комментарии     

Глава 18. Язык STATISTICA VISUAL BASIC (SVB)
Структура языка STATISTICA Visual Basic        
Запись макросов      
Макрос анализа       
Запись макроса анализа                             
Создание графика    
Мастер-макрос                                                        
Клавиатурные макросы      
Среда программирования  
Основные соглашения STATISTICA Visual Basic          
Типы данных, массивы, функции             
Операторы управления порядком выполнения команд 
Глобальные переменные, передача аргументов по значению и по ссылке
Примеры программ с комментариями
Пример: формирование коллекции таблиц данных       
Создание таблицы данных и заполнение ее случайными числами      
Вывод индикатора состояния                               
Построение гистограммы с подгонкой нормального распределения  
Создание пользовательских диалогов      
Просмотр объектов и функций     
Приложение 1          
Приложение 2
Приложение 3           .
Словарь терминов пакета SNN (версия 4.0)        
Функции активации, реализованные в SNN
Функции ошибок, доступные в SNN        
PSP-функции           

Алфавитный указатель                               


Скачать:


  • Теги:

Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты