Тольятти: «Кассандра», 2013. - 305 с. (Исправленная и дополненная
интернет-версия от 03.08.2013 г.)
В книге представлено описание широкой панорамы статистических
методов, как повсеместно используемых, так и не нашедших пока
должного применения в обработке данных экологического мониторинга.
Сюда вошли элементарная статистика, проверка гипотез, различные
подходы к оценке биоразнообразия, дисперсионный анализ, специальные
формы регрессии и оценки информативного набора предикторов моделей,
многомерные методы классификации, редукции и распознавания данных,
процедуры, использующие байесовский подход, анализ временной или
пространственной динамики и
т.д. Мы не ставили целью подробно описать теоретические аспекты всех этих методов, но широко иллюстрировали методику их применения на примерах биологического характера.
Совокупность представленных методов связывается двумя основополагающими идеями. Во-первых, в каждом примере мы пытались найти "изюминку" в виде использования нового класса компьютерно-интенсивных (computer-intensive) методов, в широком смысле относящихся к семейству различных процедур Монте-Карло. Наиболее детально представлен численный ресамплинг, который заключается в различных технологиях генерации повторных выборок, включающих рандомизацию, или перестановочный тест (permutation), бутстреп (bootstrap), метод "складного ножа" (jackknife) и кросс-проверку (cross-validation). Мы показываем, как с их помощью можно корректно проверить статистическую гипотезу или получить несмещенные характеристики искомого параметра: оценки математического ожидания, дисперсии, доверительного интервала, коэффициентов модели. Где это возможно, мы сравниваем полученные результаты с классическими асимптотическими методами, использующими то или иное стандартное предельное распределение выборочных статистик.
Вторая "красная нить" - возможность для читателей легко воспроизвести самим технику выполнения расчетов. Мы ориентировались на статистическую среду R, которая постепенно становится общепризнанным мировым стандартом при проведении научно-технических расчетов. В конце каждого раздела нами представлены тексты несложных скриптов в кодах R, позволяющих выполнить самостоятельно статистический анализ рассматриваемых примеров. В этой связи, представляемая монография может рассматриваться также как справочник по реализации различных алгоритмов обработки данных для исследователей, которых привлекла эта инструментальная среда.
Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений биологического профиля.
т.д. Мы не ставили целью подробно описать теоретические аспекты всех этих методов, но широко иллюстрировали методику их применения на примерах биологического характера.
Совокупность представленных методов связывается двумя основополагающими идеями. Во-первых, в каждом примере мы пытались найти "изюминку" в виде использования нового класса компьютерно-интенсивных (computer-intensive) методов, в широком смысле относящихся к семейству различных процедур Монте-Карло. Наиболее детально представлен численный ресамплинг, который заключается в различных технологиях генерации повторных выборок, включающих рандомизацию, или перестановочный тест (permutation), бутстреп (bootstrap), метод "складного ножа" (jackknife) и кросс-проверку (cross-validation). Мы показываем, как с их помощью можно корректно проверить статистическую гипотезу или получить несмещенные характеристики искомого параметра: оценки математического ожидания, дисперсии, доверительного интервала, коэффициентов модели. Где это возможно, мы сравниваем полученные результаты с классическими асимптотическими методами, использующими то или иное стандартное предельное распределение выборочных статистик.
Вторая "красная нить" - возможность для читателей легко воспроизвести самим технику выполнения расчетов. Мы ориентировались на статистическую среду R, которая постепенно становится общепризнанным мировым стандартом при проведении научно-технических расчетов. В конце каждого раздела нами представлены тексты несложных скриптов в кодах R, позволяющих выполнить самостоятельно статистический анализ рассматриваемых примеров. В этой связи, представляемая монография может рассматриваться также как справочник по реализации различных алгоритмов обработки данных для исследователей, которых привлекла эта инструментальная среда.
Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений биологического профиля.