Рекомендуем

Популярное введение в современный анализ данных и машинное обучение на STATISTICAБоровиков В.П. Популярное введение в современный анализ данных и машинное обучение на STATISTICA
Технологии машинного обучения в сетевой безопасностиШелухин О.И., Ерохин С.Д., Полковников М.В. Технологии машинного обучения в сетевой безопасности
Классификация IP-трафика методами  машинного обученияШелухин О.И., Ерохин С.Д., Ванюшина А.В. Классификация IP-трафика методами машинного обучения

Книга

Методы машинного обучения в Data Mining пакета STATISTICA

Учебное пособие для вузов
2022 г.
260 стр.
Тираж 500 экз.
Формат 60х90/16 (145x215 мм)
Исполнение: в мягкой обложке
ISBN 978-5-9912-0975-5
ББК 32.973
УДК 004.9:519.25(075.8)
Гриф
Рекомендовано Ученым советом Федерального государственного бюджетного образовательного учреждения высшего образования «Кубанской государственный университет» (КубГУ) в качестве учебного пособия для студентов, обучающихся по направлениям подготовки: 01.03.02 – Прикладная математика и информатика, 09.03.03 – Прикладная информатика; 01.04.02 Прикладная математика и информатика (магистратура)
Аннотация

В настоящее время, благодаря совершенствованию технологий сбора и хранения данных в различных областях человеческой деятельности накоплены огромные массивы разнородных данных – количественных, качественных, текстовых, ограниченного и неограниченного объема. Поэтому в дополнении к методам многомерного анализа, как правило, основанных на парадигме среднего, появились современные технологии анализа данных, в частности Data Mining – добычи данных, или интеллектуального анализа данных. Методы машинного обучения Data Mining являются составной частью искусственного интеллекта (ИИ), проникающего практически во все сферы человеческой деятельности. Но ИИ – это программный продукт, разработанный человеком, и эффективность его работы зависит в том, числе и от того насколько правильно применены методы машинного обучения.

В издании освещены методы машинного обучения: деревья решений – общие деревья классификации и регрессии, CHAD-модели, интерактивные деревья, стохастический градиентный бустинг, случайные леса регрессии и классификации; процедуры обучения – методы опорных векторов, к-ближайших соседей, наивный байесовский классификатор; автоматизированные нейронные сети и программа DATA MINER. Книга написана на основе курсов, читаемых автором в Кубанском государственном университете. При описании методов использовались версии пакета STATISTICA 10, 13 (Tibco, USA).

Для студентов, изучающих математические и технические дисциплины, а также аспирантов, преподавателей вузов, специалистов в области Data Science, научных работников различных направлений, занимающихся анализом данных. Простая и доступная для широкого круга читателей форма изложения делает возможным использование пособия для самостоятельного изучения методов машинного обучения, реализованных в Data Mining пакета STATISTICA.

Халафян Алексан Альбертович – доктор технических наук, профессор кафедры анализа данных и искусственного интеллекта факультета Компьютерных технологий и прикладной математики Кубанского государственного университета. Специалист в области анализа данных. Автор более 200 научных и учебно-методических работ, в том числе ряда известных учебников и учебных пособий.

Оглавление

ВВEДEНИE

1. МЕТОДЫ ДEРEВЬЯ РEШEНИЙ
1.1. Общие деревья классификации и регрессии
1.2. CHAID-модели
1.3. Интерактивные деревья
1.4. Стохастический градиентный бустинг
1.5. Случайные леса регрессии и классификации

2. ОБОБЩEННЫE МEТОДЫ КЛАСТEРНОГО АНАЛИЗА

3. ПРОЦEДУРЫ ОБУЧEНИЯ
3.1. Метод опорных векторов
3.2. Метод k-ближайших соседей
3.3. Наивный байесовский классификатор

4. АВТОМАТИЗИРОВАННЫE НEЙРОННЫE
4.1. Классификация
4.2. Кластерный анализ
4.3. Временные ряды (регрессия)
4.4. Временные ряды (классификация)
4.5. Регрессия

5. ПРОГРАММА DATA MINER

Литература