Список рекомендуемой литературы
- Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности М.: Финансы и статистика, 1989. 607 с.
- Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрии. М.: ЮНИТИ, 1998. 1022 с.
- Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А. О смысле ранговых распределений // Науч.-техн. информ. 1975. Сер. 2. №1. С. 9–20.
- Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. М.: Мир, 1982. 488 с.
- Барсегян А.А., Куприянов М.С., Холод И.И. и др. Анализ данных и процессов. СПб.: БХВ-Петербург, 2009. 512 с.
- Бирюкова С. Анализ последовательностей в R: TraMineR. НИУ ВШЭ. 2014. URL: https://www.hse.ru
- Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 1974. Вып. 1. 406 с.
- Бонгард М. М. Проблема узнавания. М.: Наука, 1967. 320 с.
- Вайнцвайг М. Н. Алгоритм обучения распознаванию образов “Кора”. // Алгоритмы обучения распознаванию образов. Ред. В. Н. Вапник. М.: Сов. радио, 1973. С. 110-116.
- Вапник В.Н. (ред.). Алгоритмы и программы восстановления зависимостей. М.: Наука, 1984. 816 с.
- Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974. 487 с.
- Венэбльз У.Н., Смит Д.М. Введение в R. Заметки по R: среда программирования для анализа данных и графики. Вер. 3.1.0. Москва, 2014. 109 с.
- Воробейчик Е.Л. О некоторых индексах ширины и перекрывания экологических ниш // Журн. общ. биологии. 1993. Т. 54, № 6. С. 706-712.
- Горбань А.Н., Дунин-Барковский В.Л., Миркес Е.М. и др. Нейроинформатика. Новосибирск: Наука. Сиб. предприятие РАН, 1998. 296 с.
- Горбач А.Н., Цейтлин Н.А. Покупательское поведение: анализ спонтанных последовательностей и регрессионных моделей в маркетинговых исследованиях. Киев: Освiта УкраЇны, 2011. 220 с.
- Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. Введение в статистическое обучение с примерами на языке R. Пер. С.Э. Мастицкого. М.: ДМК Пресс, 2016. 450 с.
- Джонгман Р.Г.Г., тер Браак С.Дж.Ф., ван Тонгерен О.Ф.Р. Анализ данных в экологии сообществ и ландшафтов. М.: РАСХН, 1999. 306 с.
- Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Финансы и статистика. Кн. 1, 1986. 366 с. Кн. 2, 1987. 352 с.
- Дэйвисон М. Многомерное шкалирование. Методы наглядного представления данных. М.: Финансы и статистика, 1988. 348с.
- Дюк В.А., Самойленко А.П. Data Mining: учебный курс. СПб.: Питер, 2001. 368 с. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: ИМ СО РАН, 1999. 270 с.
- Зайцев К.С. Применение методов Data Mining для поддержки процессов управления IT-услугами. М.: МИФИ, 2009. 96 с.
- Зарядов И.С. Введение в статистический пакет R: типы переменных, структуры данных, чтение и запись информации, графика. Москва: Изд-во РУДНБ, 2010а. 207 с.
- Зарядов И.С. Статистический пакет R: теория вероятностей и математическая статистика. Москва: Изд-во РУДНБ, 2010б. 141 с.
- Зиновьев А.Ю. Визуализация многомерных данных. Красноярск: КГТУ, 2000. 168 с.
- Кабаков Р.И. R в действии: Анализ и визуализация данных в программе. М.: ДМК Пресс, 2014. 580 с.
- Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. 736 с.
- Кендалл М., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973. 899 с.
- Ким Дж.-О., Мюллер Ч.У., Клекка У.Р. и др. Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989. 215 с.
- Классификация и кластер. / Под ред. Дж. Вэн-Райзина. М.: Мир, 1980. 390 с.
- Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: Физматлит, 2006. 816 с.
- Краскэл Дж.Б. Многомерное шкалирование и другие методы поиска структуры // Статистические методы для ЭВМ / Под ред. К. Энслейна, Э. Рэлстона, Г. С. Уилфа. М.: Наука, 1986. С. 301-347.
- Кудрин Б.И. Математика ценозов: видовое, ранговидовое, ранговое по параметру гиперболические Н-распределения и законы Лотки, Ципфа, Парето, Мандельброта // Математический аппарат структурного описания ценозов и гиперболические Н-ограничения. Ценологические исследования. М.: Центр системн. исслед., 2002. Вып. 19. С. 357-412.
- Кшнясев И.А. Анализ обилия организмов: мультимодельный вывод как альтернатива проверки нуль-гипотезы. // Биологические системы: устойчивость, принципы и механизмы функционирования. Сб. материалов III Всеросс. Науч.-практ. Конф. Нижний Тагил, 2010. С. 348-353. URL: https://www.ipae.uran.ru/user/69.
- Лбов Г.С. Методы обработки разнотипных экспериментальных данных. Новосибирск: Наука, 1981. 160 с.
- Ллойд Э., Ледерман У. (ред). Справочник по прикладной статистике. В 2-х т. М.: Финансы и статистика. Т. 1. 1989. 510 с., Т. 2. 1990. 526 с.
- Люк Д. Анализ сетей (графов) в среде R. Руководство пользователя. М.: ДМК Пресс, 2016.
- Мастицкий С.Э. Визуализация данных с помощью ggplot2. М.: ДМК Пресс, 2016.
- Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. М.: ДМК Пресс, 2015. 496 с. URL: http://ievbras.ru/ecostat
- Налимов В.В. Теория эксперимента. М.: Наука, 1971. 207 с.
- Огнева Д. Пакет “arules” системы R. МГУ им. Ломоносова. 2012. URL: <www.machinelearning.ru>
- Розенберг Г.С. Введение в теоретическую экологию. / В 2-х т.; Тольятти: Кассандра, 2013. Т. 1. 565 с. URL: http://ievbras.ru/ecostat
- Розенберг Г.С., Шитиков В.К., Брусиловский П.М. Экологическое прогнозирование (Функциональные предикторы временных рядов). Тольятти: ИЭВБ РАН, 1994. 185 c. URL: http://ievbras.ru/ecostat
- Самарский А.А. Что такое вычислительный эксперимент? // Наука и жизнь. 1979. № 3. С. 27-33.
- Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. М.: ДМК Пресс, 2015. 400 с.
- Форрестер Дж. Антиинтуитивное поведение сложных систем // Современные проблемы кибернетики. М.: Знание, 1977. С. 9-25.
- Хокинс Д., Блейксли С. Об интеллекте. М.: ООО «И.Д.Вильямс», 2007. 204 с.
- Храмов Д.А. Сбор данных в Интернете на языке R. . М.: ДМК Пресс, 2016.
- Хромов-Борисов Н.Н. Синдром статистической снисходительности или значение и назначение p-значения // Телеконференция по медицине, биологии и экологии, 2011. №4. URL: http://tele-conf.ru .
- Чубукова И.А. Data Mining. Курс лекций интернет-университета INTUIT, 2006. 328 с.
- Шипунов А.Б. и др. Наглядная статистика. Используем R! М.: ДМК Пресс, 2014. 298 с.
- Шитиков В.К. Экотоксикология и статистическое моделирование эффекта с использованием R. Тольятти: ИЭВБ РАН , 2016. 149 с. URL: http://ievbras.ru/ecostat
- Шитиков В.К., Зинченко Т.Д., Розенберг Г.С. Макроэкология речных сообществ: концепции, методы, модели. Тольятти: СамНЦ РАН, Кассандра, 2012. 257 с. URL: http://ievbras.ru/ecostat
- Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. Тольятти : Кассандра, 2014. 314 с. URL: URL: http://ievbras.ru/ecostat
- Эфрон Б. Нетрадиционные методы многомерного статистического анализа. М.: Финансы и статистика, 1988. 263 с.
- Abdi H., Williams L. Principal component analysis // WIREs Computational Statistics. 2010. V. 2 (4). P. 433-459. URL: http://onlinelibrary.wiley.com
- Agrawal R., Srikant R. Fast Discovery of Association Rules. // Proc. of the 20th Intern. Conf. on VLDB. Santiago, Chile, 1994.
- Agresti A. An introduction to categorical data analysis. Wiley. 2007. 372 р. Anderson D. R. Model-based inference in life sciences: A primer on evidence. Springer, 2008. 184 p.
- Banfield J., Raftery A. Model-Based Gaussian and Non-Gaussian Clustering. // Biometrics. V. 49. P. 803-821.
- Bates D.M., Watts D.G. Nonlinear Regression Analysis and Its Applications. New-York: John Wiley, 2007. 392 p.
- Bezdek J.C. Pattern Recognition with Fuzzy Objective Function Algorithms. New York: Plenum Press, 1981.
- Borcard D., Gillet F., Legendre P. Numerical Ecology with R. N.Y.: Springer, 2011. 306 p.
- Box G., Cox D.R. An analysis of Transformation // Journal of Royal Statistical Society B. 1964. V. 26. P. 211-243.
- Boyce R.L, Ellison P.C Choosing the best similarity index when performing fuzzy set ordination on binary data // Journal of Vegetation Science. 2001. V. 12. P. 711-720.
- Breiman L. Random forests // Machine Learning. 2001. V. 45 (1). P. 5-32.
- Breiman L., Friedman J.H., Olshen R.A. et al. Classification and Regression Trees. Belmont (CA): Wadsworth Int. Group, 1984. 368 p.
- Burnham K.P., Anderson D.R. Model selection and multimodel inference: a practical information-theoretic approach. N.Y.: Springer-Verlag, 2002. 496 p.
- Cameron A.C, Trivedi P.K. Regression Analysis of Count Data. Cambridge University Press, Cambridge. 2013.
- Chiu YW. Machine learning with R. Cookbook. Packt Publishing, 2015.
- Cristianini N., Shawe-Taylor J. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. Cambridge University Press, 2000.
- Davison A.C., Hinkley D.V. Bootstrap methods and their application. Cambridge: Cambridge University Press, 2006. 592 p.
- De’Ath G. Multivariate regression trees: a new technique for modeling species environment relationships // Ecology. 2002. V.83. P. 1105-1117.
- Delgado M.F., Cernadas E., Barro S., Amorim D. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems? // Journal of Machine Learning Research. 2014. V. 15. P. 3133-3181.
- Edgington E.S. Randomization tests. N.Y.:Marcel Dekker, 1995. 341 p.
- Everitt B.S., Howell D.C. Encyclopedia of Statistics in Behavioral Science. Chichester: Wiley & Sons Ltd., 2005. 2132 p.
- Faraway J.J. Extending the Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models. Chapman, Hall/CRC, 2006. 345 p.
- Fox J. Applied Regression Analysis and Generalized Linear Models, 2nd ed. Sage Publications, 2008.
- Gabadinho A., Ritschard G., Muller N.S., Studer M. Analyzing and Visualizing State Sequences in R with TraMineR. // Journal of Statistical Software. 2011. V.40 (4). p. 1-37. URL: http://www.jstatsoft.org/v40/i04/.
- Gabadinho A., Ritschard G., Muller N.S., Studer M. Mining sequence data in R with the TraMineR package: A user’s guide. University of Geneva, Switzerland. 2011а. URL: http://mephisto.unige.ch/traminer/
- Gibb S., Strimmer K. Differential protein expression and peak selection in mass spectrometry data by binary discriminant analysis. // Bioinformatics. 2015. 31(19), 3156–3162. URL: http://strimmerlab.org/software/binda
- Glur C. data.tree sample applications. 2016. URL: http://ipub.com/
- Goddard M.J., Hinberg I. Receiver operator characteristic (ROC) curves and non-normal data: An empirical study. // Statistics in Medicine. 1989. Vol. 9 (3). P. 325–337.
- Hahsler M., Grun B, Hornik K., Buchta C. Introduction to arules - A computational environment for mining association rules and frequent item sets. URL: https://cran.r-project.org
- Hand D. Classifier Technology and the Illusion of Progress // Statistical Science. 2006. V. 21. P. 1-14.
- Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference and Prediction. N.Y.: Springer-Verlag, 2009. 763 p.
- Hunt E.B., Marin J., Stone P.J. Experiments in Induction. New York: Academic Press, 1966.
- Kassambara A. Practical Guide to Cluster Analysis in R: Unsupervised Machine Learning. Statistical tools for high-throughput data analysis STHDA, 2017. URL: http://www.sthda.com/
- Kaufman L., Rousseeuw P.J. Finding Groups in Data. An Introduction to Cluster Analysis. Hoboken (NJ): Wiley & Sons Inc., 2005. P. 342.
- Kohonen T. Self-organized formation of topologically correct feature maps // Biological Cybernetics. 1982. № 43. P. 59-69.
- Kruskal J.B. Multidimensional Scaling by Optimizing Goodness-of-Fit to a Nonmetric Hypothesis. // Psychometrika. 1964. V. 29. P. 1–28.
- Kuhn M. Building Predictive Models in R Using the caret Package // Journal of Statistical Software. 2008. V. 5. P. 113-142. DOI 10.18637/jss.v028.i05
- Kuhn M. Predictive Modeling with R and the caret Package. 2013. URL: https://www.r-project.org/
- Kuhn M. Variable Selection Using The caret Package. 2012. URL: http://citeseerx.ist.psu.edu
- Kuhn M., Johnson K. Applied Predictive Modeling. Springer-Verlag New-York, 2013. 574 p.
- Kursa M., Rudnicki W. Feature Selection with the Boruta Package // Journal of Statistical Software. 2010. V.36 (11). P. 2-12.
- Le S., Josse J, Husson F. FactoMineR: An R Package for Multivariate Analysis // Journal of Statistical Software. 2008. V. 25 (1).
- Legendre P, Legendre L. Numerical Ecology. Amsterdam: Elsevier Sci. BV, 2012.
- Legendre P., Gallagher E. Ecologically meaningful transformations for ordination of species data // Oecologia. 2001. V. 129. P. 271-280.
- Leskovec J., Rajaraman A., Ullman J. The Mining of Massive Datasets. Cambridge University Press. 2014. URL: http://www.mmds.org/#book
- Loh W.-Y, Shih Y.-S. Split selection methods for classification trees. // Statistica Sinica1997. V. 7. Р. 815-840.
- MacQueen J. Some methods for classification and analysis of multivariate observations. // The Fifth Berkeley Symposium on Mathematical Statistics and Probability. eds L.M. Le Cam, J. Neyman. Berkeley, CA: University of California Press. 1967. P. 281–297.
- Maindonald J., Braun W.J. Data Analysis and Graphics Using R. Cambridge: University Press, 2010. 525 p.
- McArdle B.H., Anderson M.J. Fitting multivariate models to community data: a comment on distance-based redundancy analysis // Ecology. 2001. V. 82, № 1. P. 290-297.
- McCune B., Grace J.B., Urban D.L. Analysis of Ecological Communities. Gleneden Beach (OR): MjM Software, 2002. 285 p.
- Mitchell M. An Introduction to Genetic Algorithms. Cambridge, MA: MIT Press. 1996.
- Mount J., Zumel N. Exploring Data Science. Manning Publications Co., 2016. 184 p.
- Mount J., Zumel N. Practical Data Science with R. Manning Publications Co., 2014. 416 p.
- Myers W.L., Patil G.P. Multivariate Methods of Representing Relations in R for Prioritization Purposes: Selective Scaling, Comparative Clustering, Collective Criteria, and Sequenced Sets. N.-Y.: Springer, 2012. 297 р.
- Oksanen J., Blanchet F.G., Kindt R. et al. vegan: Community Ecology Package. R package version 2.0-2. 2011. URL: https://cran.r-project.org.
- Quinlan J.R. Induction of Decision Trees. // Mach. Learn. 1986. V. 1 (1). P. 81-106
- Ripley B.D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.
- Sakurai S. Theory and Applications for Advanced Text Mining. InTech Chapters published, 2012. URL: http://www.intechopen.com
- Serneels S., Van Espen P., De Nolf E. Spatial sign preprocessing: a simple way to impart moderate robustness to multivariate estimators. // J. Chem. Inf. Model. 2006. V. 46 (3). P. 1402-1409
- Shimodaira H. An approximately unbiased test of phylogenetic tree selection // Syst. Biol. 2002. V. 51. P. 492-508.
- Stanton JM. Introduction To Data Science. Syracuse University, 2013.
- Torgo L. Data mining with R : learning with case studies. Chapman & Hall/CRC, 2011. 272 p.
- Vapnik V.N. The Nature of Statistical Learning Theory. Springer, 1995
- Wang W., Yang J. Mining Sequential Patterns from Large Data Sets. N.-Y.: Springer, 2005. 162 р.
- Williams G. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. N.-Y.: Springer, 2011. 365 р.
- Williams G. Rattle: A Data Mining GUI for R // Journal of Statistical Software. 2009. V. 2(1). P. 45-55. URL: http://journal.r-project.org
- Wood S.N. Generalized Additive Models: An Introduction with R. Chapman, Hall/CRC, 2006. 410 p.
- Chiu Y-W. (Chiu D.). Machine Learning with R Cookbook. Packt Publising, 2015. 405 p.
- Zacharski R. A Programmer’s Guide to Data Mining. 2015. URL: http://guidetodatamining.com/
- Zafarani R., Abbasi M., Liu H. Social Media Mining. An Introduction. Cambridge University Press, 2014. URL: http://dmml.asu.edu/smm/
- Zaki M., Meira W. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014. URL: http://www.dataminingbook.info/
- Zeileis A., Kleiber C., Jackman S. Regression Models for Count Data in R. // Journal of Statistical Software. 2008. V. 27(8). URL: https://www.jstatsoft.org
- Zhao Y. R and Data Mining: Examples and case studies. Academic Press, 2012. 256 p.
- Zhao Y., Zhang C., Cao L. Post-Mining of Association Rules: Techniques for Effective Knowledge Extraction. Information Science Reference. 2009.
- Zhao Y., Cen Y. Data Mining Applications with R. Academic Press, 2014. 470 p.
- Zuur A. F., Ieno E.N., Walker N. et al. Mixed Effects, Models and Extensions in Ecology with R. Berlin: Springer Sci., 2009. 574 p. URL: http://www.highstat.com