Сравнительный анализ растительного покрова с помощью биоинформационных технологий



жүктеу 1.66 Mb.
бет1/14
Дата05.10.2018
өлшемі1.66 Mb.
түріДиссертация
  1   2   3   4   5   6   7   8   9   ...   14


Тихоокеанский государственный экономический университет

На правах рукописи

Горшков Михаил Владимирович

СРАВНИТЕЛЬНЫЙ АНАЛИЗ КОМПОНЕНТОВ РАСТИТЕЛЬНОГО ПОКРОВА НА ОСНОВЕ СХЕМНО-ЦЕЛЕВОГО ПОДХОДА И БИОИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ


Специальность 03.02.08 ЁC «экология»


Диссертация на соискание ученой степени кандидата биологических наук

Научный руководитель:

доктор биологических наук,

профессор Сёмкин Б.И.

Владивосток 2011

Содержание





Введение

Актуальность темы. Начиная с XX века (особенно его второй половины), в рамках многих научных направлений, таких как сравнительная флористика, геоботаника, экология и многих других можно отметить устойчивую тенденцию активного внедрения математических методов сравнительного анализа количественных показателей (Oosting, 1953; Greig-Smith, 1957; 1964; 1983; Savage, 1960; Sokal, Sneath, 1963; Kershaw, 1964; Lambert, Dale, 1964; Williams, Dale, 1965; Грейг-Смит, 1967; Roux, Roux, 1967; Peters, 1968; Александрова, 1969; Василевич, 1969; Cancella da Fonseca, 1969; Cheetham, Hazе1, 1969; Pielou, 1969; 1975; 1977; Сёмкин, 1973 а, б; 1975; 1977; 1987 а, б; Терентьев, 1975; Goodall, 1973; Sneath, Sokal, 1973; Шмидт, 1980; Юрцев, Сёмкин, 1980; Песенко, 1982; Legendre, Legendre, 1983; Kershaw, Looney, 1985; Digby, Kempton, 1987; Magurran, 1988; 2004; Миркин, Розенберг, Наумова, 1989; Мэгарран, 1992; Уланова, 1995; Юрцев и др., 1999; Малышев, 1987; 1999; Chao et al., 2000; Koleff, Gaston, Lennon, 2003; Шитиков, Розенберг, Зинченко, 2005; Diserud, Шdegaard, 2007 и др.), компьютерных методов обработки биологической информации, создания тематических биоинформационных систем и баз данных по компонентам биоразнообразия (Сёмкин, 1994; Сёмкин и др., 1995; Сёмкин, Варченко, Орешко, 1995; Сёмкин и др., 1997; КомпьютерныеЎK, 1995; 1997; Пяк, Зверев, 1997; Зверев, 1998; Марина, Марин, 1998; Юрцев, 1998; Малышев, 2002; Крестов, 2005 и др.).

Первые попытки формализации таксономического состава сообществ (флор, фаун и др.) множествами и определение с их помощью отношений (общности, сходства, различия, включения, невключения), отдельных фракций видов (общие виды двух флор (фаун), дифференциальных видов одной флоры (фауны) относительно другой, дифференциальных видов двух флор (фаун) и т.д.) были осуществлены ещё в 70-х годах прошлого века (Тамарин, Шмидт, 1975; Сёмкин, 1977; 1983 а, б; Юрцев, Сёмкин, 1980; Юрцев, 1982; 1987; Юрцев, Камелин, 1987 а, б; 1991). Эта проблема имеет большое значение для разработки количественных показателей необходимых для сравнительного анализа таксономических (главным образом видовых) списков, а также даёт возможность строгого обоснования биологических наук в целом за счёт строгой формализации связей системы. Любая система состоит из множества элементов, объединённых соответствующими связями, которые в совокупности дают структуру системы. В экологии и других науках в настоящее время отсутствуют адекватные методики исследования структуры биологических систем, которые бы учитывали особенности естественного континуума, требования теории измерений, включали бы полный цикл исследования (от постановки цели исследования до интерпретации результатов) и др. Многие количественные и качественные показатели и методы используются специалистами вне общих методик и методологии. В данной диссертационной работе нами приведены методология и методика сравнительного анализа биологических данных, учитывающие вышеперечисленные и многие другие проблемы математизации биологических наук.

Под растительным покровом нами понимается «совокупность особей зеленых автотрофных растений, населяющих сушу и акваторию нашей планеты» (Галанин, 1991). Внимание акцентировано, главным образом, на компонентах видового разнообразия растительных сообществ (флор, фитоценозов и др.). Отметим, что рассмотренные математические методы универсальны и могут успешно использоваться для сравнения и других биологических объектов (геномов, особей, экосистем, таксонов), т.к. основаны на теории измерений и формализации мер близости в биологии.

Современный уровень развития информационных технологий позволяет реализовать практически любой алгоритм, представленный с помощью математических методов. Сотрудничество биологии и математических методов в своё время породило биометрию, биоматематику, биоценометрию и другие аналогичные направления (Трасс, 1971 : 208), а на современном этапе ЁC биоинформатику. У этого научного направления довольно широкая область применения, включающая математическое и компьютерное моделирование живых систем, включая экосистемы, и эволюционных процессов в живой природе, распознавание и синтез изображений в биологических и медицинских исследованиях; развитие бионических подходов; создание информационных систем и баз биологических данных; интеллектуальные системы анализа и прогнозирования свойств биологических объектов и др.

Цель исследования. Цель данного исследования ЁC развитие общего подхода в исследованиях структурной организации растительного покрова с использованием биоинформационных технологий.

Задачи исследования:

Оптимизировать методику схемно-целевого подхода к сравнению компонентов растительного покрова и адаптировать её для программной реализации посредством создания биоинформационной системы «Биоразнообразие»;

На основе рассматриваемой методики получить новые результаты ботанического районирования дальневосточных альгофлор, выделения оригинальных флор, оценки антропогенного воздействия на флору, количественно подтвердить характер распределения субассоциаций вдоль градиента увлажненности почв, провести анализ временнуй структуры таксоцена.

Защищаемые положения:

Решена проблема выбора показателя для сравнения различных биологических спектров (нормированных дескриптивных наборов), разновеликих и равновеликих по числу признаков биологических объектов (ненормированных дескриптивных наборов);

Схемно-целевой подход позволяет обеспечить более точные интерпретации при исследовании структуры сообщества или отдельных таксоценов.

Научная новизна. Предложена современная методика сравнительного анализа видового состава компонентов растительного покрова в рамках схемно-целевого подхода: от постановки цели до интерпретации. На основе аксиоматического подхода и формализации отношений между объектами в виде аналитических интерпретаций осуществлена ревизия существующих мер близости, которые используются в биологических и смежных науках, описаны основные классы мер, которые позволяют упорядочить большинство известных мер близости и на этой основе решена проблема выбора меры близости для нормированных, разновеликих и равновеликих дескриптивных множеств. Алгоритм метода реализован в виде компьютерной программы.

На основе схемно-целевого подхода пересмотрены результаты альгофлористического районирования и выявлены центры видового разнообразия водорослей-макрофитов ДВ РФ, приведен метод непрямой ординации на основе n-арных мер для определения однородности условий увлажнения для серии описаний, рассчитана теоретико-графовая модель внутригодовой динамики таксоцена водорослей-макрофитов.

Практическая значимость работы. Результаты исследования могут быть применены в мероприятиях по сохранению биологического разнообразия растительных сообществ, для количественной оценки данных биологического мониторинга, оценки изменения видовой структуры сообщества при антропогенном воздействии, при геоботаническом районировании, для непрямой ординации описаний, для математико-картографического моделирования.

Рассматриваемые в работе методы были частично включены в учебные курсы «Экологический мониторинг», «Геоинформационные системы», «Статистическая обработка экологических данных», «Экосистемный анализ» для студентов специальностей «Экология» и «Природопользование».

Апробация работы. Основные положения и результаты работы обсуждались: на сессии ТИГ ДВО РАН (г. Владивосток, 2005 г.), на II-ом Молодежном конкурсе инновационных проектов по Дальневосточному федеральному округу (г. Владивосток, 2007 г.), на III экологическом форуме «Природа без границ» (г. Владивосток, 2008 г.), на научной конференции «Природопользование и охрана окружающей среды» (г. Пекин, 2008 г.), на Комаровских чтениях (г. Владивосток, 2008 г.).

Публикации. По теме диссертации опубликовано 14 печатных работ, в том числе 4 в изданиях из списка ВАК.

Личный вклад. Оптимизирована методика сравнительного анализа видового состава компонентов растительного покрова. Решена проблема выбора меры близости для нормированных, разновеликих и равновеликих дескриптивных множеств.

При личном участии автора создана биоинформационная система «Биоразнообразие», которая реализуется на конкретном биологическом материале. Автором лично создана программа для сравнительного анализа биологических данных «BioComparison». Все расчёты и графическое представление в работе произведены лично автором.

Структура и объём работы. Диссертация состоит из введения, 3 глав, заключения, библиографического списка источников (включает 581 источник, 174 на иностранных языках) и приложения. Работа изложена на 219 стр., содержит 161 стр. основного текста, 58 стр. приложений.

Объекты, материалы и методы исследования. Наше внимание акцентировано, главным образом, на компонентах видового разнообразия растительных сообществ (флор, фитоценозов). Взят материал по видовому составу ДВ альгофлор (Клочкова, 1997) и прирусловых лесов р. Амур (Ахтямов, 2001), сезонному распределению водорослей-макрофитов (Макиенко, 1975; Гусарова, 1988; Кафанов, Жуков, 1993).

Рассмотрены математические методы сравнительного анализа на основе общего аксиоматического подхода и теоретико-графовых методов, а также вопросы реализации данных методов с помощью информационных технологий.

Благодарности. Автор благодарит за всестороннюю поддержку и чуткое руководство своего учителя ЁC Б.И. Сёмкина. Автор выражает благодарность И.С. Гусаровой, А.П. Орешко, Л.И. Варченко за консультативную помощь в сложных вопросах, а также д.б.н., профессору Н.Г. Клочковой за предоставленный материал для математической обработки.


Глава 1. Схема анализа данных: основные методы

1.1 Историко-методологические аспекты сравнительного анализа в экологии

С начала XX века в биологические науки активно проникают количественные математические методы (Александрова, 1969; ПрименениеЎK, 1972; Трасс, 1976). В рамках настоящего исследования обратим внимание, главным образом, на внедрение количественных методов в тех научных направлениях, которые связаны с исследованием закономерностей в структуре растительных сообществ.

Несмотря на то, что исследование структуры биологических объектов ЁC одна из центральных проблем многих биологических наук, таких как экология, геоботаника, фитоценология и др., о создании общей содержательной концепции самого биологического исследования до сих пор идут споры. Когда дело касается количественных оценок, привлечение математических приемов неизбежно, особенно если исследователь работает в некой новой междисциплинарной области, особенно в случае изучения структуры таких сложных объектов природы, как сообщества.

П. Грейг-Смит в своей известнейшей работе «Количественная экология растений» (Грейг-Смит, 1967 : 13) писал: «Переход от качественного к количественному подходу характерен для развития любой отрасли науки. Когда достигается определённая степень понимания явлений в общих чертах, внимание исследователей естественно сосредотачивается на более тонких деталях структуры или поведения, наблюдаемые различия которых менее значительны и могут быть оценены лишь с помощью измерения. Не удивительно, что количественный подход развился раньше в большинстве отраслей наук о неживой природе, чем в биологической науке. По-видимому, одно из наиболее значительных различий между физикой и химией, с одной стороны, и биологией, с другой, состоит в том, что в первых обычно можно временно изолировать одну переменную величину для изучения, в то время как в биологии это редко бывает осуществимо».

Знаковой для количественной биологии, стала работа П. Жаккара (Jaccard, 1901). Этим швейцарским исследователем был предложен коэффициент флористической общности (coefficient de communaute; Gemlinschaftskoefficient), который и по настоящее время не потерял своей актуальности. В своём историческом исследовании, Х.Х. Трасс (75 лет спустя!) отметит: «Не без оснований Жаккара считают одним из первых представителей количественно-статистического направления в фитоценологии» (Трасс, 1976 : 155-156).

В дальнейшем, было опубликовано огромное количество теоретических разработок и работ, касающихся применения количественных методов в конкретных предметных областях. Они возникали независимо друг от друга в различных научных центрах. Особенно преуспели британские математики ЁC Р.Э. Фишер, К. Пирсон и В. Уэлдон, которых считают основателями биометрии (Лакин, 1990). В США работал палеонтолог Дж.Г. Симпсон, который среди прочего предложил широко известный коэффициент (Simpson, 1947). В Европе математические методы для исследования растительности разрабатывал и активно использовал, помимо вышеупомянутого П. Жаккара (Jaccard, 1901), легендарный французский ботаник Ж. Браун-Бланке (Braun-Blanquet, 1928). Больших успехов добились восточно-европейские ботаники ЁC Ж. Кульчинский, К. Флорек с сотрудниками и др. (Florek et al., 1951).

В нашей стране можно отметить работы А.А. Любищева (например, Любищев, 1923) с использованием коэффициента вариации и его критики, во многих отношениях интересную книгу по исследованию изменчивости Ю.А. Филипченко (Филипченко, 1929), публикации И.И. Шмальгаузена (Шмальгаузен, 1935). В некоторых работах отечественных ботаников изредка применялись коэффициенты общности, например в работах В.В. Алёхина, А.Е. Жадовского, В.Н. Сукачёва, В.Н. Беклемишева и др. (Жадовский, 1925; Беклемишев, 1931. Сукачёв, 1931; Алёхин, 1938). Но, как правило, отечественные исследователи использовали в основном описательную одномерную статистику. Это было связано с тем, что применение математических методов осуждалось и даже преследовалось благодаря деятельности Т.Д. Лысенко и его последователей (см., например, материалы электронного журнала «Биометрика»: http://www.biometrica.tomsk.ru/).

В то же время, за рубежом в 50-е годы активно развиваются математические методы (особенно методы многомерного статистического анализа), выходят первые обзоры по мерам близости (Oosting, 1953; Greig-Smith, 1957) и новым методам классификации растительности (Florek et al., 1951; Bray, Curtis, 1957). В отечественной биологической науке данный период отмечен публикациями А.А. Любищева (единственного члена Международного биометрического общества), да ещё, пожалуй, работами Р.Л. Берга в области стабилизирующего отбора, а также работами П.В. Терентьева о методе корреляционных плеяд (причём последние вышли уже в конце 50-х, когда влияние Т.Д. Лысенко значительно ослабло). Также отметим научную дискуссию математика А.Н. Колмогорова со сподвижниками Т.Д. Лысенко ЁC Н.И. Ермолаевой и Э. Кольманом.

В 60-70 годы в направлении количественной биологии можно отметить явный научный бум. Были опубликованы крупные зарубежные и отечественные обзоры по количественным методам в исследованиях растительности (Greig-Smith, 1964; Kershaw, 1964; Lambert, Dale, 1964; Roux, Roux, 1967; Грейг-Смит, 1967; Александрова, 1969; Василевич, 1969; Cancella da Fonseca, 1969; Pielou, 1969; 1975; 1977; Goodall, 1973; Hill, 1973), зоологии (Savage, 1960; Peters, 1968), таксономии (Sokal, Sneath, 1963; Williams, Dale, 1965), палеонтологии (Cheetham, Hazе1, 1969), а также некоторое количество работ посвящённых отдельным аспектам теории, введению и применению мер сходства и различия (Сёмкин, 1972 а, б; 1973 а, б; 1975).

Также хотелось бы также отметить ряд более поздних обзорных работ по количественным методам в биологических науках (Песенко, 1982; Greig-Smith, 1983; Legendre, Legendre, 1983; Kershaw, Looney, 1985; Digby, Kempton, 1987; Magurran, 1988; 2004; Миркин, Розенберг, Наумова, 1989; Мэгарран, 1992; Уланова, 1995; Chao et al., 2000; Koleff, Gaston, Lennon, 2003; Diserud, Шdegaard, 2007). Как будет показано далее, ни в одной современной работе по количественным методам нет адекватной математической основы. По этой причине особенно значимо наличие обобщающей теории, позволяющей адекватно использовать количественные методы в биологии, т.е. такие методы которые позволяют исследовать количественные биологические данные.

Благодаря совместным усилиям учёных различных научных направлений (математиков, экологов, систематиков, геоботаников, фитоценологов, зоологов и др.) в области применения количественных математических методов для биологических исследований постепенно оформилось несколько альтернативных научных направлений. В настоящее время можно отметить несколько основных подходов:

дедуктивный системно-целевой подход А.П. Левича (Левич, 1980);

индуктивно-дедуктивный подход Ж. Браун-Бланке (Braun-Blanquet, 1928; Александрова, 1969; Миркин, Наумова, Соломещ, 2002; Миркин, 2004);

индуктивно-плюралистический подход Ю.А. Песенко (Песенко, 1982; Песенко, Сёмкин, 1989);

индуктивный схемно-целевой подход Б.И. Сёмкина (Сёмкин, 1981; 1983 а; 1987а; Сёмкин, Орешко, Горшков, 2009 а).

Дедуктивные подходы отталкиваются от некой теоретической модели, которая проверяется на эмпирическом материале (это классическая статистическая методика). Индуктивные же подходы начинаются со сбора материала и уже в процессе изучения структуры определяются эмпирические закономерности.

В настоящее время в геоботанике и других науках о растительности наиболее распространён метод Браун-Бланке. Он основан на экспертном выделении более или менее единообразных комплексов растений по признаку «верности видов», т.е. степени тяготения вида к определённому синтаксону (Миркин, Наумова, 2009). Данный подход критикуется некоторыми видными экологами за субъективность, неопределённость критериев и правил классификации (Гиляров, 2005), но, несмотря на это, в настоящее время он является доминирующим. Следует отметить, что степень формализованности данного подхода крайне мала, что мешает строгому обоснованию метода, а выделение сообществ с помощью метода Браун-Бланке во многом зависит от опыта и научной интуиции исследователя.

Схемно-целевой подход возник в попытке ликвидировать разрыв между схемами сбора данных и схемами последующей математической обработки (Сёмкин, Усольцева, 1982; Сёмкин, 1983 а; 1987 а; Сёмкин, Орешко, Горшков, 2009 а). В приведённых работах была рассмотрена методология индуктивного анализа структур биоценотических систем. Предложены две схемы анализа: детерминистская и стохастическая. Приведём детерминистскую схему:

Постановка цели исследования.

Сбор данных:

Выбор элементарного описания;

Выбор серии описаний;

Представление данных в виде (первичной) матрицы объект-признак.

Анализ данных:

Попарное сравнение описаний и получение матрицы конвергенций (матрица абсолютных мер сходства или матрица пересечений);

Выбор мер включения и сходства;

Получение соответствующей несимметричной матрицы сходства (матрица включения);

Получение соответствующей несимметричной матрицы сходства (матрица включения);

Выбор алгоритмов упорядочивания данных;

Определение бинарных отношений и представление их в виде графов (дендрита, дендрограммы, ориентированных графов и т.д.).

Интерпретация данных.

Вероятностная схема анализа статистических отношений в общих чертах аналогична детерминистской схеме анализа отношений включения и сходства:

Постановка цели исследования.

Сбор данных:

Выбор схемы опыта;

Выбор полной совокупности попарно несовместимых событий;

Определение частот элементарных событий в результате эксперимента (наблюдения);

Представление данных в виде выборочной конечной схемы

Анализ данных:

Попарное сравнение описаний и получение матрицы конвергенций;

Выбор статистических мер (совместимости, зависимости и др.);

Расчёт статистических мер;

Статистическая оценка выборочных мер;

Получение матриц мер совместимости, зависимости и др.;

Выбор алгоритмов систематизации

Определение бинарных отношений.

Интерпретация данных.

Есть некоторые различия между этими схемами. Процедура сбора данных при анализе статистических отношений состоит в проведении статистического эксперимента и в получении выборочных конечных схем. При этом используются хорошо разработанные в теории вероятностей и математической статистике подходы к постановке подобных задач.

В дальнейшем была осуществлена попытка развития схемно-целевого подхода в статье Ю.А. Песенко и Б.И. Сёмкина (Песенко, Сёмкин, 1989). В этой работе, в частности, отмечены преимущества индуктивного подхода: «Индуктивный подход (в отличие от дедуктивного) не связан с какими-либо требующими проверки априорными предположениями о характере изучаемых явлений (и с построением соответствующей математической модели ЁC объясняющей или прогнозирующей), цель индуктивного подхода ЁC дать их адекватное описание» (Песенко, Сёмкин, 1989 : 134). В данной работе был сформулирован индуктивно-плюралистический подход, который активно развивается и поддерживается некоторыми современными исследователями, например, Г.С. Розенбергом (Шитиков, Розенберг, Зинченко, 2005) и который заключается в использовании максимального числа методов и показателей в исследовании, которые должны давать одинаковый результат.

Цель схемно-целевого подхода, как и многих других ЁC максимально полно охарактеризовать биологические объекты и получить их математическую модель. В настоящее время существует несколько научных дисциплин в рамках которых разрабатываются количественные математические методы для исследования биологических систем: биометрия (Плохинский, 1978; http://www.biometrica.tomsk.ru/), математическая популяционная генетика (Свирежев, Пасеков, 1982), количественная таксономия (Sokal, Sneath, 1963; Sneath, Sokal, 1973), биоценометрия (Фрей, 1969; Сёмкин, 1983; КоличественныеЎK, 2005) и др. Некоторые учёные обеспокоены таким «разнообразием»: «Биологам совместно с математиками следует выполнить значительную работу по устранению неоправданного разнообразия применяемых методов и выделению наиболее пригодных для рассматриваемых целей» (Винберг, 1981).

К сожалению, многие из вышеупомянутых дисциплин не получили на данный момент широкого признания, несмотря на активных популяризаторов этих направлений (например, Шитиков, Розенберг, Зинченко, 2005; Леонов, http://www.biometrica.tomsk.ru). В одних направлениях практически отсутствуют пути реализации математических алгоритмов посредством информационно-компьютерных технологий, а в других проблема иная ЁC отсутствует адекватный математический аппарат.

Мы, не опровергая значимости исследования структуры биологического разнообразия, предлагаем качественно новый подход к исследованию ЁC на основе схемно-целевого подхода Б.И. Сёмкина. На настоящий момент существует непротиворечивый математический аппарат (Сёмкин, 1987 б; Сёмкин, Горшков, 2008; Сёмкин, Горшков, 2009 а) и первые шаги его программной реализации (Сёмкин, Орешко, Горшков, 2007; 2009 а; Горшков, 2008; 2010). В общем можно отметить, что суть схемно-целевого подхода (в сравнении с конкурирующими подходами) заключается в использовании строгой (минималистской) схемы исследования, начиная с выбора цели исследования и заканчивая интерпретацией данных.

Рассмотрим схему исследования подробно. Очевидным является то, что любое исследование должно начинаться с постановки цели исследования. Практическая деятельность показывает, что лучше всего цель формулируется теми исследователями, которые имеют достаточно большой опыт работы с конкретными объектами, исследование которых проводится. Однако здесь мы постоянно сталкиваемся с субъективным фактором исследователей.

Аналогичные вышеупомянутым представления отмечены и у других исследователей (Crovello, 1970; Dale, 1970; Orloci, 1978). Предполагается, что прежде чем приступить к сбору и обработке данных необходимо обсудить ряд предварительных этапов научных исследований, включающих следующее (Orloci, 1978):



Достарыңызбен бөлісу:
  1   2   3   4   5   6   7   8   9   ...   14


©kzref.org 2017
әкімшілігінің қараңыз

    Басты бет