Классификация, регрессия и другие алгоритмы Data Mining с использованием R
Шитиков В. К., Мастицкий С. Э.
2017-04-07
Аннотация
Шитиков В. К., Мастицкий С. Э. (2017) Классификация, регрессия, алгоритмы Data Mining с использованием R. - Электронная книга, адрес доступа: https://github.com/ranalytics/data-mining
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д. Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета caret для статистической среды R. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей. Отдельная глава посвящена методам многомерной ординации данных и различным алгоритмам кластерного анализа.
Описание методов статистического анализа сопровождается многочисленными примерами из различных областей на основе общедоступных исходных данных. Представлены несложные скрипты на языке R, дающие возможность читателю легко воспроизвести все расчеты.
Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений.
Данная работа распространяется в рамках лицензии Creative Commons “Атрибуция - Некоммерческое использование - На тех же условиях 4.0 Всемирная”. Согласно этой лицензии, Вы можете свободно копировать, распространять и видоизменять данное произведение при условии точного указания его авторов и источника. При изменении этого произведения или использовании его в своих работах, Вы можете распространять результат только по такой же или подобной лицензии. Запрещается использовать эту работу в коммерческих целях без согласования с авторами. Более подробная информация о лицензии представлена на странице https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ru
© 2017, Владимир Кириллович Шитиков, Сергей Эдуардович Мастицкий
Иллюстрация на обложке худ. А. Банных (г. Владимир)
Контактная информация:
В. К. Шитиков
Институт экологии Волжского бассейна РАН
г. Тольятти, ул. Комзина, 10
Самарская обл., 445003, Россия
E-mail:
stok1946@gmail.com,
rtutorialsbook@gmail.com
Сайты авторов:
http://www.ievbras.ru/ecostat/Kiril
http://r-analytics.blogspot.com