Рекомендуем

Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных
Прогностические модели оценки качества и подлинности винаХалафян А.А., Темердашев З.А. Прогностические модели оценки качества и подлинности вина
Популярное введение в современный анализ данных в системе STATISTICAБоровиков В.П. Популярное введение в современный анализ данных в системе STATISTICA

Книга

Популярное введение в современный анализ данных и машинное обучение на STATISTICA

Тиражирование книги начато в 2018 г.
354 стр.
Формат 70x100/16 (170x240 мм)
Исполнение: в мягкой обложке
ISBN 978-5-9912-0738-6
ББК 32.973
УДК 004.9:519.25
Аннотация

Популярно и увлекательно освещены современные возможности анализа данных и машинного обучения, являющегося трендом современной компьютерной аналитики. В изложении упор сделан на понимании методов и их применении к практическим задачам. «Делайте вслед за нами, и вы научитесь анализировать данные!» – основной лейтмотив книги. Подробно описаны классические статистические методы, включая многомерные методы: кластерный, дискриминантный анализ, множественная регрессия, факторный анализ, метод главных компонент, анализ выживаемости и регрессия Кокса. В отдельных главах изложены нейросетевые методы, методы добычи данных, деревья классификации и регрессии (CART – модели). Рассмотрены примеры из различных областей человеческой деятельности: промышленности, ритейла, инфокоммуникаций, бизнеса, медицины. Специальные главы посвящены теории вероятностей и методам оптимизации, лежащим в основе методов машинного обучения. Книга отражает многолетний опыт автора в решении прикладных задач и участия в значимых проектах. Синтез современных технологий и понимание методов позволяет добиться успеха в решении конкретных прикладных задач.

Для широкого круга читателей: инженеров, технологов, менеджеров, аналитиков, врачей, исследователей, интересующихся современными аналитическими методами и технологиями анализа данных и машинного обучения и их применением на практике.

Владимир Павлович Боровиков – известный российский аналитик, окончил с отличием факультет Вычислительной математики и кибернетики МГУ им. Ломоносова, кандидат физико-математических наук по специальности теория вероятностей и математическая статистика. Занимался сследовательской работой в области непараметрической статистики в Германии в должности приглашенного профессора. Автор ряда книг и более 40 статей по методологии и технологии анализа данных на компьютере.

Оглавление

Введение. КОМПЬЮТЕРНАЯ АНАЛИТИКА: ОТ КЛАССИЧЕСКИХ МЕТОДОВ К МАШИННОМУ ОБУЧЕНИЮ

Глава 1. ПЕРВЫЕ ШАГИ В STATISTICA
1.1. Запуск программы
1.2. Рабочее окно STATISTICA: классическое меню или Лента
1.3. Панели инструментов
1.4. Аналитические модули STATISTICA
1.5. Создание файла данных. Пример 1: результаты олимпийских чемпионов
1.6. Пример 2. Импорт газа и топлива в США
1.7. Вычисление дескриптивных статистик исходных данных
1.8. Корреляции: определения и вычисления
1.9. Простейшая визуализация: диаграммы рассеяния и гистограммы

Глава 2. ВЕРОЯТНОСТНЫЕ РАСПРЕДЕЛЕНИЯ
2.1. Вероятностный калькулятор
2.2. Биномиальное распределение и игровые задачи
2.3. Генерация случайных чисел в STATISTICA

Глава 3. ВИЗУАЛЬНЫЙ АНАЛИЗ ДАННЫХ
3.1. Двумерный визуальный анализ данных
3.2. Трехмерный визуальный анализ данных

Глава 4. КЛАССИФИКАЦИЯ ДАННЫХ
4.1. Обзор метода
4.2. Постановка задачи
4.3. Пример Фишера: классификация цветов ирисов
4.4. Обобщенный дискриминантный анализ

Глава 5. КЛАСТЕРНЫЙ АНАЛИЗ
5.1. Обзор метода
5.2. Постановка задачи, обзор методов
5.3. Модуль Кластерный анализ – технология, пошаговый разбор примера

Глава 6. РЕГРЕССИОННЫЙ АНАЛИЗ
6.1. Описание модели
6.2. Метод решения
6.3. Технология регрессионного анализа в STATISTICA
6.4. Пошаговые примеры
6.5. Примеры использования средства кисть для анализа данных
6.6. Задачи для самостоятельного решения

Глава 7. АНАЛИЗ ВЫЖИВАЕМОСТИ
7.1. Таблицы жизни
7.2. Оценки Каплана – Мейера
7.3. Сравнение выживаемости в группах
7.4. Регрессионные модели в анализе выживаемости

Глава 8. НЕЙРОННЫЕ СЕТИ
8.1. Основные парадигмы нейронных сетей
8.2. Математические модели
8.3. Обучение и кросс-проверка
8.4. Модель Розентблатта
8.5. Пошаговый пример: прогнозирование временных рядов
с помощью нейронных сетей

Глава 9. DATA MINING – ДОБЫЧА ДАННЫХ
9.1. Этапы работы в Data Mining
9.2. Меню STATISTICA Data Miner
9.3. Средства анализа STATISTICA Data Miner
9.4. Пример проекта в STATISTICA Data Miner

Глава 10. ВВЕДЕНИЕ В ТЕОРИЮ ВЕРОЯТНОСТЕЙ
10.1. Формула полной вероятности
10.2. Формула Байеса
10.3. Классическое вероятностное рассуждение
10.4. Вероятностные модели в биологии
10.5. Вероятностные модели в телекоме
10.6. Выборочный контроль качества
10.7. Занимательные вероятностные задачи
10.8. Вероятностный подход к задачам классификации

Глава 11. ДЕРЕВЬЯ КЛАССИФИКАЦИИ И РЕГРЕССИИ (CART-МОДЕЛИ)

Глава 12. ВВЕДЕНИЕ В ОПТИМИЗАЦИЮ
12.1. Алгоритмы оптимизации гладких функций

Глава 13. ФАКТОРНЫЙ АНАЛИЗ И МЕТОД ГЛАВНЫХ КОМПОНЕНТ
13.1. Математическая модель факторного анализа

Глава 14. ПРИМЕРЫ АНАЛИЗА ДАННЫХ
14.1. Задача обнаружения спама
14.2. Промышленные приложения

Приложение 1. ЯЗЫК STATISTICA VISUAL BASIC
Приложение 2. ПОДКЛЮЧЕНИЕ К БАЗЕ ДАННЫХ
Приложение 3. ОПЕРАЦИИ СТЕКИНГ И АНСТЕКИНГ
Приложение 4. ГАЛЕРЕЯ ГРАФИКОВ STATISTICA
Приложение 5. МЕТОДЫ ETL В АНАЛИЗЕ ПРОМЫШЛЕННЫХ ДАННЫХ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ