Функциональный анализ метагенома кишечника человека тема диссертации и автореферата по ВАК РФ 03.01.09, кандидат наук Тяхт, Александр Викторович

  • Тяхт, Александр Викторович
  • кандидат науккандидат наук
  • 2014, Москва
  • Специальность ВАК РФ03.01.09
  • Количество страниц 131
Тяхт, Александр Викторович. Функциональный анализ метагенома кишечника человека: дис. кандидат наук: 03.01.09 - Математическая биология, биоинформатика. Москва. 2014. 131 с.

Оглавление диссертации кандидат наук Тяхт, Александр Викторович

Оглавление

Оглавление

Список сокращений

Введение

Актуальность работы

Цель работы

Задачи работы

Научная новизна и практическая значимость

Апробация работы

Публикации по теме работы

Материалы трудов конференций

Структура и объем диссертации

1. Обзор литературы

1.1. Микробные сообщества и методы изучения их состава

1.1.1. Разнообразие микробных сообществ и их основные члены

1.1.2. Традиционные методы исследования

1.1.3. Современные молекулярные методы изучения микробиоты

1.2. Высокопроизводительное метагеномное секвенирование

1.3. Базовый анализ метагеномных данных

1.3.1. Форматы метагеномных данных и их предобработка

1.3.2. Данные по секвенированию последовательности гена 168 рРНК

2

1.3.3. Данные полногеномного секвенирования

1.4. Статистический анализ и моделирование в метагеномике

1.5. Микробиота кишечника человека

1.6. Антибиотикорезистентность

2. Материалы и методы

2.1. Сбор образцов

2.1.1. Контрольная группа

2.1.2. Группы пациентов

2.2. Пробоподготовка

2.3. Секвенирование

2.4. Внешние источники метагеномных данных

2.5. Программные пакеты для картирования ридов

2.6. Предобработка ридов

2.7. Определение функционального состава

2.8. Статистический анализ и визуализация

2.9. Аппаратные и программные средства, использованные вычислительным конвейером для анализа метагеномных данных

2.10. Сборка de novo метагеномных ридов и выявление генов, не входящих в референсный каталог генов

2.11. Расширение референсного каталога геномов путем идентификации неизвестных компонент с помощью дополнительных методов

2.12. Расширение каталога генов путем добавления генов из специфических геномов

2.13. Профилирование уровней генов антибиотикорезистентности

3. Результаты

3.1. Полногеномное секвенирование образцов микробиоты кишечника

3.2. Разработка алгоритма для профилирования функционального состава70

3.3. Реализация алгоритма в виде программного комплекса на параллельной вычислительной системе

3.4. Разработка Интернет-ресурса для анализа метагеномных данных по микробиоте кишечника

3.5. Определение влияния глубины секвенирования на оценку функционального состава

3.6. Функциональный состав микробиоты населения РФ

3.6.1. Контрольная группа

3.6.2. Воспалительные заболевания кишечника

3.6.3. Хроническая обструктивная болезнь легких

4. Обсуждение

5. Заключение

6. Выводы

7. Список литературы

8. Приложение

Список сокращений

АР - антибиотикорезистентность БД - база данных БК - болезнь Крона

ВЗК - воспалительные заболевания кишечника Гб - гигабайт

ДНК - дезоксирибонуклеиновая кислота

ЖКТ - желудочно-кишечный тракт

МК - микробиота кишечника

ОЗУ - оперативное запоминающее устройство

п.н. - пара нуклеотидов

О ТЕ - операционная таксономическая единица ПЦР - полимеразная цепная реакция РНК - рибонуклеиновая кислота рРНК - рибосомальная РНК СУБД - система управления базами данных ФС - функциональный состав ХОБЛ - хроническая обструктивная болезнь легких ARDB - Antibiotic Resistance Database, База Данных по Антибиотикорезистентности ВСА - between-class analysis, межклассовый анализ COG - Clusters of Orthologous Groups, Кластеры ортологичных групп FISH - fluorescence in situ hybridization, флюоресцентная гибридизация in situ MDS - multidimensional scaling, многомерное шкалирование PCoA - principal coordinates analysis, анализ главных координат T-RFLP - terminal restriction fragment length polymorphism, полиморфизм длин терминальных фрагментов рестрикции

DGGE - denaturing gradient gel electrophoresis, денатурирующий градиентный гель-электрофорез

TGGE - temperature gradient gel electrophoresis, температурный градиентный гель-электрофорез

WGS - whole-genome sequencing, полногеномное секвенирование

SAET - SOLiD Accuracy Enhancement Tool, инструмент увеличения точности

SOLiD

OTU - operational taxonomic unit, операционная таксономическая единица

RDP - Ribosomal Database Project, проект "Рибосомальная База"

BLAST - Basic Local Alignment Search Tool, простое средство поиска локальных

соответствий

GO - Gene Ontology, Онтология генов

НМР - Human Microbiome Project, проект "Микробиота Человека"

KEGG - Kyoto Encyclopedia of Genes and Genomes, Киотская энциклопедия генов

и геномов

КО - KEGG Orthology, Ортология KEGG

SVM - support vector machine, метод опорных векторов

Рекомендованный список диссертаций по специальности «Математическая биология, биоинформатика», 03.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Функциональный анализ метагенома кишечника человека»

Введение

Актуальность работы

Микробное сообщество (микробиота) кишечника человека играет важную

роль в поддержании гомеостаза организма человека, в том числе участвуя в

пищеварении, защите от патогенов и регуляции иммунитета. Технологии

высокопроизводительного ДНК-секвенирования позволяют количественно

оценить таксономический и функциональный (генный) состав микробиоты.

Стремительный рост глобального объема метагеномных данных требует

разработки удобных программных средств для их эффективного анализа на параллельных вычислительных системах.

В то время как таксономический состав микробиоты дает ответ на вопрос "какие рода содержатся в сообществе", он не отвечает на вопрос "что они делают". Поскольку близкие виды могут содержать довольно значительно различающиеся наборы генов, более важным становится выяснение функционального состава - количественное профилирование представленности генов, их групп и путей метаболизма. На уровне генов, их специфичные группы могут сильно влиять на роль конкретной бактерии в экологии всего сложного сообщества - например, будет ли она патогеном или пробиотиком. Среди целевых групп генов, представляющих особый интерес для исследования с биомедицинской точки зрения - детерминанты устойчивости к антибиотикам. По оценкам Всемирной Ассоциации здравоохранения, антибиотикорезистентность (АР) бактерий-возбудителей заболеваний - первостепенная угроза здоровью человечества [I]. Благодаря горизонтальному переносу в микробиоте кишечника гены АР могут передаваться от комменсальных бактерий к патогенам. Эта возможность позволяет рассматривать микробиоту человека как резервуар генов АР, в котором могут формироваться новые устойчивые виды бактерий-возбудителей социально-значимых заболеваний. Изучение микробиоты важно с точки зрения выработки эффективных подходов к профилактике и лечению инфекционных заболеваний. Помимо специфичных групп генов, на более высоком уровне иерархии, объединение уровней генов по метаболическим путям позволяет осмыслять крупномасштабные изменения совокупного метаболического потенциала микробиоты.

Важность микробиоты для здоровья человека обусловила тот факт, что вслед за подробным описанием структуры и функции микробиоты человека в норме, были исследованы ассоциации состава микробиоты с различными заболеваниями [2-6]. В результате были выявлены микробиотные маркеры заболеваний - как на уровне бактериальных родов и видов, так и генов. В данной работе для демонстрации возможностей разработанного программного комплекса и выявления функциональных особенностей микробиоты были выбраны две группы социально значимых заболеваний, актуальные для здравоохранения и медицины будущего: воспалительные заболевания кишечника и хроническая обструктивная болезнь легких.

Воспалительные заболевания кишечника (ВЗК), включающие язвенный колит и болезнь Крона, в настоящее время привлекают пристальное внимание исследователей метагенома [7]. Несмотря на высокий уровень жизни и гигиены, заболеваемость ВЗК в развитых странах мира стремительно растет с.середины 20 века [8]. Их этиология до конца не ясна, генетическая составляющая объясняет лишь ее меньшую часть. Патогенез связывается с изменениями в микробиоте, при этом не выявлено бактерии-возбудителя и случаи заражения неизвестны. Имеются данные об отдельных бактериях, имеющих положительную и отрицательную корреляцию с заболеваемостью, однако механизм микробной экологии до конца не прояснен [9].

Хроническая обструктивная болезнь легких (ХОБЛ) является четвертой ведущей причиной смерти в мире. В то время как микробиота кишечника напрямую не вызывает заболевание, острые приступы ХОБЛ ассоциированы с бактериальными инфекциями нижних дыхательных путей [10]. Типичная схема лечения при обострении включает прием антибиотиков, побочный ущерб от

которого включает в себя нарушение баланса кишечной микробиоты и рост представленности генов АР в ней. В связи с возможностью миграции бактерий, а также горизонтального переноса бактериальных генов между микробиотами разных частей тела, микробиота кишечника предположительно может играть роль в развитии обострения и формирования резистентности у патогенов в дыхательных путях. Метагеномный анализ микробиоты может указать как на глобальные особенности метаболического состава, которые обуславливают изменения во взаимодействии бактерий с организмом хозяина, так и на специфичные группы генов, в частности, определяющие антибиотикорезистентность.

Цель работы

Выполнить функциональный анализ микробиоты кишечника человека по образцам, полученным от пациентов с патологиями ЖКТ (воспалительные заболевания кишечника - болезнь Крона, язвенный колит) и легких (хроническая обструктивная болезнь легких) и от группы здорового населения Российской Федерации.

Задачи работы

Для достижения названной цели были поставлены следующие задачи:

1. Разработать алгоритм высокопроизводительного анализа функционального состава микробиоты кишечника на основании данных полногеномного секвенирования.

2. Реализовать его в виде программного комплекса на параллельной вычислительной системе. Создать базу данных для хранения результатов экспериментов по полногеномному секвенированию, а также графический интерфейс к ней.

3. Разработать Интернет-ресурс для функционального анализа микробиоты.

4. Применить созданный вычислительный конвейер для анализа микробиоты кишечника здорового населения РФ.

5. Применить созданный вычислительный конвейер для выявления особенностей функционального состава микробиоты пациентов с воспалительными заболеваниями кишечника и хронической обструктивной болезнью легких.

Научная новизна и практическая значимость

Созданный программный комплекс для хранения и автоматического анализа

метагеномных данных по микробиоте кишечника человека - эффективное

средство для массового автоматического анализа данных метагеномного

секвенирования. В настоящее время он используется для централизованной

обработки метагеномных наборов данных, получаемых в ходе нескольких

биомедицинских проектов по изучению связи микробиоты с заболеваниями в

НИИ физико-химической медицины, Казанском (Приволжском) федеральном

университете и Московском физико-техническом институте на вычислительном

кластере НИИ ФХМ (к настоящему моменту проанализировано более 400

метагеномов). Созданный на базе программного комплекса Интернет-ресурс

являлся первым общедоступным сайтом, предназначенным для сравнительного

анализа полногеномных данных по микробиоте кишечника человека; в частности,

впервые была включена поддержка формата данных платформы секвенирования

БОПО 4, 5500, 5500Ш.

С использованием разработанных алгоритмов и программных средств, был проведен полногеномный анализ микробиоты кишечника человека: для пациентов с ХОБЛ - впервые в мире, для пациентов с ВЗК - впервые в Российской Федерации; были выявлены особенности функционального состава,

ассоциированные с патогенезом. Была оценена представленность генов антибиотикорезистентности в микробиоте здорового населения Российской Федерации, а также у больных с ХОБЛ, схема лечения которых включает антимикробную терапию, для которых были выявлены значимые отличия от контрольной группы.

Апробация работы

Результаты работы были представлены на конференциях: European Conference

on Computational Biology (Швейцария, 2012), International Human Microbiome

Congress (Франция, 2012), "Постгеномные методы анализа в биологии,

лабораторной и клинической медицине" (Казань, 2012, 2014),

"Высокопроизводительное секвенирование в геномике" (Новосибирск, 2013).

Публикации по теме работы

1. Tyakht А.V., Kostryukova E.S., Popenko A.S., Belenikin M.S., Pavlenko A.V., Larin A.K., Karpova I.Y., Selezneva O.V., Semashko T.A., Ospanova E.A., Babenko V.V., Maev I.V., Cheremushkin S.V., Kucheiyavyy Y.A., Shcherbakov P.L., Grinevich V.B., Efimov O.I., Sas E.I., Abdulkhakov R.A., Abdulkhakov S.R., Lyalyukova E.A., Livzan M.A., Vlassov V.V., Sagdeev R.Z.,Tsukanov V.V., Osipenko M.F., Kozlova I.V., Tkachev A.V., Sergienko V.I., Alexeev D.G., Govorun V.M. Human gut microbiota community structures in urban and rural populations in Russia. // Nat. Commun. 2013. Vol. 4. eP. 2469.

2. Tyakht A.V., Popenko A.S., Belenikin M.S., Altukhov I.A., Pavlenko A.V., Kostryukova E.S., Selezneva O.V., Larin A.K., Karpova I.Y., Alexeev D.G. MALINA: a web service for visual analytics of human gut microbiota whole-genome metagenomic reads. // Source Code Biol. Med. 2012. Vol. 7. № 1. eP. 13.

3. Алексеев Д.Г., Кострюкова Е.С., Попенко А.С., Русаловский И.В., Тяхт А.В. Потенциальные возможности использования распределенных вычислительных систем при решении концептуальных проблем построения информационных комплексов обработки данных высокопроизводительного геномного секвенирования и глубокого протеомного профилирования. // Информатизация и связь 2012. №8. С. 10-14.

4. Tyakht A.V., Alexeev D.G., Popenko A.S., Kostryukova E.S., Govorun V.M. Rural and urban microbiota: To be or not to be? // Gut Microbes. 2014. T. 5. № 3. P. 351356.

Материалы трудов конференций

1. Тяхт А.В. Метагеномный анализ микробиоты населения РФ. // III Международная научно-практическая конференция «Постгеномные методы анализа в биологии, лабораторной и клинической медицине», Казань, 22-24 ноября 2012 г. С. 101.

2. Tyakht A.V., Kostryukova E.S., Popenko A.S., Alexeev D.G., Govorun V.M. Special traits of Russian gut microbiome: functional analysis and cross-national comparative study. // Международная конференция "Высокопроизводительное секвенирование в геномике", Новосибирск, 21-25 июля 2013 г. С. 49.

3. Tyakht A.V., Popenko A.S., Belenikin M.S., Altukhov I.A., Ischenko D.S., Alexeev D.G., Govorun V.M. Fine-level genotype variation and novel community types revealed by continent-wide human gut metagenomic study. //11th European Conference on Computational Biology, Базель, 9-12 сентября 2012 г. K35.

4. Tyakht A.V. Examining composition of Russian human gut microbiota by assessing relative abundance of functional and taxonomical units. // International Human Microbiome Congress, Париж, 19-21 марта 2012 г. P.163.

5. Тяхт A.B., Манолов A.C., Каныгина A.B., Коварский Б.А., Ракитина Д.А., Кострюкова Е.С., Алексеев Д.Г., Говорун В.М. Системный подход к выявлению роли энтеробактерий в патогенезе болезни Крона. // IV Международная научно-практическая конференция "Постгеномные методы анализа в биологии, лабораторной и клинической медицине", Казань, 29 октября-1 ноября 2014 г. С. 194.

Структура и объем диссертации

Диссертационная работа изложена на 131 странице, состоит из введения,

обзора литературы, материалов и методов, результатов и их обсуждения,

основных выводов, списка литературы и приложений. Диссертация содержит 11

таблиц и 17 рисунков.

1. Обзор литературы

1.1. Микробные сообщества и методы изучения их состава

1.1.1. Разнообразие микробных сообществ и их основные члены

Разнообразие жизни на Земле поражает воображение ученого-исследователя.

Примечательным по своей вездесущности являются организованные микробные

сообщества, населяющие фактически любую нишу (микробиота). В то время как

число их членов астрономически велико и они составляют порядка половины

биомассы на нашей планете, микробные сообщества обладают удивительной

многоликостью, истинные масштабы которой продолжают разворачиваться перед

исследователями.

Так, микробиота заселяет ниши с самыми экстремальными значениями физико-химических параметров - температуры, давления и солености, уровня кислотности и другим: внешняя поверхность космического корабля, гейзеры,

атомный реактор. В каждом из этих случаев выживает не единственный -наиболее приспособленный - вид, а смешанное сообщество, что явно указывает на наличие экологических связей между его членами. Концентрация

о

бактериальных клеток различается на порядки между средами: например, от 10 клеток на миллилитр воды в щелочных озерах до 109 в грамме почвы. При этом в состав микробиоты могут входить организмы из достаточно отдаленных ветвей дерева жизни - бактерии, археи, вирусы, а также простейшие. По степени сложности сообщества микробиоты бывают простыми (стоки кислотных шахт), средними (кишечник человека) и сложными (почва). В то время как многие бактерии на Земле являются свободноживущими, собственная специфичная микробиота населяет многоклеточные организмы различных классов.

1.1.2. Традиционные методы исследования

В конце 17 века Антони ван Левенгук впервые пронаблюдал бактерии с

помощью оптического микроскопа, положив тем самым начало эпохе изучения микробов и их сообществ. Важным этапом развития инструментария микробиологии стали методы, основанные на изолировании бактерии на селективной среде, получении штамма и его культивировании. Дальнейшее описание микроба производится как путем выявления морфологических характеристик (форма клетки, устройство стенки, характер движения, окрашивание по Граму, наличие жгутика и т.п.), так и биохимическими методами (такими, как анализ фосфолипидного состава) [11].

При том, что данные методы позволили описать особенности фенотипа изолированной бактерии, они имеют принципиальное ограничение при анализе бактериального сообщества. В то время как редукция задачи от изучения сложного объекта (микробиота) к изучению простому (изолят) является разумным

научным подходом, изоляция - трудоемкий процесс и, как оценивается, более 99% видов на Земле не поддаются культивированию. Среди последних технологических новшеств в области культуральньтх методов - микропанели для культивирования бактерий и гелевые микрокапли; их использование позволяет увеличить производительность эксперимента и культивировать ранее не поддававшиеся культивации виды. Однако все равно при изоляции обрываются сложные метаболические взаимосвязи целевой бактерии с другими членами сообщества, что ограничивает применимость новых методов.

1.1.3. Современные молекулярные методы изучения мнкробиоты

С 1990-х гг. существенно расширить понимание филогенетического состава

микробиоты, в том числе количественного, позволило развитие молекулярных методов изучения бактерий, опирающихся на их генетическую информацию. Успешность применения молекулярных методов не зависит от того, насколько хорошо каждый вид сообщества поддается культивированию, исходя из современного микробиологического арсенала; при этом они позволяют проводить анализ всего микробного сообщества.

Одним из первых молекулярных подходов стало изучение молярной доли в+С состава тотальной ДНК сообщества - он является количественным и охватывает низкопредставленные виды сообщества, но при этом обладает низким разрешением. Для оценки разнообразия сообщества значительно эффективнее использовать не совокупную генетическую информацию сообщества, а избранные фиксированные гены как носители филогенетического сигнала. Полимеразная цепная реакция (ПЦР) - широко используемый метод для избирательного увеличения концентрации фрагментов ДНК с помощью фермента ДНК-полимеразы и специфичных праймеров (олигонуклеотидов, комплементарных

концам целевого фрагмента). В то время как в качестве маркера с учетом специфики состава сообщества могут быть выбраны различные гены (например, mcrА - для метаногенных архей), наиболее универсальным и часто используемым целевым геном является ген 16S рРНК, поскольку он присутствует во всех бактериях и его последовательность содержит как высококонсервативные участки (что обеспечивает специфичности ПЦР), так и вариабельные области (что позволяет использовать как "эволюционные часы").

Анализ последовательностей генов позволяет количественно оценить представленность как отдельных бактериальных видов, так и всех членов сообщества. Так, с помощью метода ПЦР реального времени (англ. real-time PCR, qPCR) можно определить уровень представленности бактерий одного или близких видов за счет таксон-специфичных праймеров, при этом он является наиболее точным методом для определения общей концентрации бактерий в образце.

Переходя к тотальному анализу сообщества, ДНК-дактилоскопия сообщества (англ. community fingerprinting) дает полуколичественную оценку общего разнообразия бактериального сообщества исходя из того, сколько различных вариантов избранного гена присутствует в образце. К семейству ДНК-дактилоскопии относятся такие методы, как изучение полиморфизма длин терминальных фрагментов рестрикции (T-RFLP), а также денатурирующий и температурный градиентный гель-электрофорез (DGGE, TGGE). Хотя эти методы позволяют провести эксперимент по сравнению сообществ дешево и за короткое время, в целом ДНК-дактилоскопия является скорее качественным, нежели количественным методом: она не позволяют детектировать конкретные бактерии в образце, подвержена неравномерности ПЦР амплификации, при этом обладая

ограниченной чувствительностью к низкопредставленным компонентам сообщества [12].

Более точные методы для количественной характеризации филогенетического состава сообщества основаны на ДНК-гибридизации, при которой специфичные олигонуклеотидные зонды, комплементарные к избранным бактериальным таксонам, связываются с целевыми последовательностями бактериальной ДНК. При флюоресцентной гибридизации in situ (англ. FISH), зонды соединены с флюоресцентными метками; свечение, происходящее вследствие гибридизации, детектируется с помощью проточной цитометрии, что позволяет идентифицировать целевые бактериальные воды. Хотя это полуколичественный подход достаточно быстр, его недостаток в том, что он не позволяет детектировать неизвестные виды [13]. Более высокопроизводительным и точным является применение гибридизационных ДНК панелей (англ. DNA microarrays): на панели закреплено порядка 103 олигонуклеотидных зондов, которые позволяют проводить высокоточное филогенетическое профилирование микробиоты (точность до ~10"4 %). Однако, среди недостатков данных панелей стоит отметить возможность кросс-гибридизации (связывание зондов с последовательностью ДНК, отличной от целевой), неспособность детектировать неизвестные виды и необходимость разрабатывать и отлаживать свой специфтный профиль зондов для каждого типа среды (например, существуют специализированные ДНК-панели для изучения микробиоты почвы, кишечника, детекции патогенов и другие [14]).

1.2. Высокопроизводительное метагеномное секвенирование

Многие из недостатков вышеперечисленных методов были преодолены с

развитием новых высокоточных молекулярных методов исследования геномной

информации - ДНК-секвенирования (англ. DNA-sequencing), заключающегося в выявлении порядка нуклеотидов в последовательности ДНК. После предварительной пробоподготовки проводится секвенирование, результатом которого является массив данных, набор ридов (англ. reads - прочтений) — слов длиной от 35 до 10000 пар нуклеотидов (далее п.н.). После получения ридов, следующей не менее важной и трудоемкой частью геномного исследования является биоинформатический анализ ридов, направленный на воссоздание из этих относительно коротких прочтений представления об полных последовательностях избранных генов или геномов организмов, входивших в состав образца.

Изначально ДНК секвенирование применялось для изучения отдельных организмов. В 1976 г. была впервые определена полная геномная последовательность организма - бактериофага MS2 - с помощью РНК-секвенирования (ранней формы ДНК-секвенирования); длина его генома составила 3569 нуклеотидов [15], а год спустя первым секвенированным ДНК-геномом стал геном бактериофага <рХ174 [16]. Разработка методов для эффективного секвенирования гораздо более протяженных геномов прокариот и эукариот заняла значительное время; первым секвенированным бактериальным геномом стал геном Haemophilus influenzae (1,8 миллиона п.н.) в 1995 г. [17]. С тех пор развитие технологической базы и распространение приборов для секвенирования привело к лавинообразному накоплению геномных данных: в одной из наиболее полных общедоступных баз данных геномных последовательностей GenBank по состоянию на июль 2013 года содержатся более чем 165 миллионов геномных последовательностей от более чем 100000 организмов.

Практически первым глобально распространенным автоматизированным методом секвенирования стал метод обрыва цепи (англ. chain termination method), также называемый секвенированием по Сэнгеру, изобретенный в 1977 г. Фредериком Сэнгером [18]. Метод основан на присоединении прямого или обратного праймера к одноцепочечной последовательности ДНК и синтезе de novo комплементарной цепи с использованием дидезоксинуклеозидтрифосфатов в качестве терминаторов. После разделения синтезированных молекул разной длины с определённым дидезоксинуклеотидом на конце с помощью электрофореза, определяется исходная последовательность. Метод позволяет получать высококачественные ДНК прочтения длиной порядка 700-1000 п.н. Несмотря на то, что стоимость секвенирования по Сэнгеру слишком высока по сравнению с более современными методами и производительность метода ограничена, он до сих пор используется в качестве золотого стандарта с целью точечной валидации результатов, полученных с помощью современных платформ.

Распространение ДНК-секвенирования сделало возможным оценить геномное богатство сред без изолирования микроорганизмов. Это привело к рождению и становлению метагеномики - направления биологии, посвященного получению и изучению геномных последовательностей непосредственно из образцов среды, совокупность которых получила название метагеном [19]. Целями метагеномики является расширение представления об истинном многообразии микробиоты, функциях их членов, их экологических взаимодействиях и ко-эволюции - в самых разнообразных по богатству и условиям средах, от почвы и частей тела человека до поверхностей космических кораблей и больничного окружения.

Любой из методов ДНК-секвенирования предлагает два подхода к анализу геномных последовательностей образца. При первом подходе происходит прочтение последовательности не всей ДНК из образца, а лишь ампликонов -геномных фрагментов, выделенных посредством селективной амплификации. Длина прочтения ампликона достигает нескольких сотен пар нуклеотидов для некоторых платформ, что позволяет вместить в один рид большую часть типичного бактериального гена и таким образом получить объем информации для достаточно детальной филогенетической классификации бактерии. В случае метагеномики, наиболее часто в качестве ампликона - филогенетического маркера выбираются подпоследовательности гена 16S рРНК. Полученные риды не требуют предварительных процедур по удлинению и готовы для количественного филогенетического профилирования микробиоты. Данный формат метагеномного секвенирования достаточно дешев и наиболее часто используется. Одна из его важных черт состоит в том, что оно, фигурально выражаясь, дает ответ на вопрос "кто присутствует в сообществе?" (какие таксоны и в каких пропорциях), но не на вопрос "что они делают?" (поскольку не происходит секвенирования последовательностей других генов помимо 16S рРНК, а даже бактерии с идентичными последовательностями этого маркерного гена могут иметь значительное расхождение в наборе присутствующих в геноме функциональных групп генов). Первое метагеномное исследование, основанного на анализе последовательностей гена 16S рРНК, было посвящено микробиоте морского планктона [20] и восходит к первым экспериментам с клонированием ДНК из среды в 1980-х годах [21].

В качестве альтернативы ампликонному секвенированию, существует полногеномное секвенирование (англ. whole-genome sequencing, сокр. WGS). При этой схеме, прочитываются фрагменты тотальной ДНК, выделенной из образца.

Другим распространенным названием является "метод дробовика" (англ. shotgun sequencing), подразумевающее аналогию случайного характера прочтения того или иного фрагмента исходной ДНК с быстро расширяющимся псевдослучайным характером выстрела из дробовика. Вначале применявшийся для выяснения полной последовательности генома организмов, метод оказался полезным и для исследования бактериальных сообществ. В метагеномике этот формат пока что менее широко распространен, чем секвенирование 16S рРНК, ввиду своей высокой стоимости, однако его преимуществом является то, что он позволяет ответить и на вопрос "кто присутствует в сообществе?", и "что они делают?". Поскольку происходит случайное считывание последовательностей всех генов из всех членов микробиоты, возможно провести функциональное профилирование метагенома - получить количественную информацию об относительной представленности отдельных генов и их групп, степени заполненности метаболических путей; а также оценить вариацию последовательностей генов между видами и сообществами. Кроме того, полногеномное секвенирование более устойчиво к вариациям в методе пробоподготовки, чем секвенирование 16S рРНК. Первое полногеномное исследование относится к 2002 г., когда Breitbart с соавторами изучили вирусный состав микробиоты морской воды [22].

Что касается технологической базы, на ранних этапах развития метагеномики сообществ основным методом стал метод Сэнгера - он подходил как для секвенирования последовательностей 16S рРНК, так и полногеномного подхода. В частности, оно было использовано для первого по своему масштабу метагеномного исследования - в Глобальной Океанической Экспедиции (Global Ocean Sampling Expedition) [23]. Однако невысокая производительность метода Сэнгера ограничивала возможности его применения для метагеномных исследований: за один запуск можно секвенировать не более 96 образцов с

выходом порядка 106 п.н., чего не хватает ни для описательных, ни для сравнительных исследований микробиот средней и высокой степени сложности. Действительный прорыв в метагеномике произошел благодаря тому, что в течение нескольких последних лет на рынке биомедицинского оборудования был представлен ряд новых платформ ДНК-секвенирования, основанных на различных химических принципах и схемах детекции сигнала. В то время как поначалу они получили общее название "секвенаторы следующего поколения" (англ. next-generation sequencing, сокр. NGS), за первой волной технологий последовали несколько других, поэтому термин утратил актуальность и более уместным является собирательное понятие "высокопроизводительное секвенирование" (англ. high-throughput sequencing). Термин подчеркивает превосходство в объеме геномных прочтений, генерируемых за запуск прибора, на несколько порядков превосходящий выход при секвенировании по Сэнгеру и составляющий от 105 до 107 ридов (см. табл. 1). При этом цена секвенирования снизилась с 2400 (метод Сэнгера) до 0,07-10 долларов США за объем ридов суммарной длиной 1 млн. п.н. [24], при полном цикле секвенирования не более нескольких дней. Это повлекло за собой массовую установку высокопроизводительных секвенаторов в геномных лабораториях по всему миру и огромный скачок в объеме генерируемой информации. При этом все более насущной становится потребность в новых биоинформатических алгоритмах, которые обрабатывали бы нарастающий поток данных и автоматизировали те операции, которые производятся сейчас в ручном режиме (рис. 1).

Похожие диссертационные работы по специальности «Математическая биология, биоинформатика», 03.01.09 шифр ВАК

Список литературы диссертационного исследования кандидат наук Тяхт, Александр Викторович, 2014 год

7. Список литературы

1. WHO's first global report on antibiotic resistance reveals serious, worldwide threat to public health. [Электронный ресурс]. URL: http://www.who.int/mediacentre/news/releases/2014/amr-report/en/.

2. Karlsson F.H. и др. Symptomatic atherosclerosis is associated with an altered gut metagenome. //Nat. Commun. 2012. Т. 3. C. 1245.

3. Qin J. и др. A metagenome-wide association study of gut microbiota in type 2 diabetes. //Nature. 2012. T. 490. № 7418. C. 55-60.

4. Karlsson F.H. и др. Gut metagenome in European women with normal, impaired and diabetic glucose control. //Nature. 2013. T. 498. № 7452. C. 99-103.

5. Morgan X.C. и др. Dysfunction of the intestinal microbiome in inflammatory bowel disease and treatment. // Genome Biol. 2012. T. 13. № 9. C. R79.

6. Chatelier E. Le и др. Richness of human gut microbiome correlates with metabolic markers //Nature. 2013. T. 500. № 7464. C. 541-546.

7. Manichanh С. и др. The gut microbiota in IBD. //Nat. Rev. Gastroenterol. Hepatol. 2012. C. 1-10.

8. Molodecky N.A. и др. Increasing incidence and prevalence of the inflammatory bowel diseases with time, based on systematic review // Gastroenterology. 2012. T. 142. № 1.

9. Knights D., Lassen K.G., Xavier R.J. Advances in inflammatory bowel disease pathogenesis: linking host genetics and the microbiome. // Gut. 2013. T. 62. № 10. C. 1505-10.

10. Wenzel R.P., Fowler A. A., Edmond M.B. Antibiotic prevention of acute exacerbations of COPD. //N. Engl. J. Med. 2012. T. 367. № 4. C. 340-7.

11. Kirk J.L. h ap. Methods of studying soil microbial diversity // J. Microbiol. Methods. 2004. T. 58. C. 169-188.

12. Bent S J. if ap. Measuring species richness based on microbial community fingerprints: the emperor has no clothes. // Appl. Environ. Microbiol. 2007. T. 73. № 7. C. 2399-401; author reply 2399-401.

13. Frailer M.H., O'Toole P.W., Quigley E.M.M. Techniques used to characterize the gut microbiota: a guide for the clinician // Nat. Rev. Gastroenterol. Hepatol. 2012. T. 9. №6. C. 312-322.

14. Roh S.W. h jip. Comparing microarrays and next-generation sequencing technologies for microbial ecology research // Trends Biotechnol. 2010. T. 28. № 6. C. 291-299.

15. Fiers W. h ap. Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. //Nature. 1976. T. 260. № 5551. C. 500507.

16. Sanger F. h .zip. Nucleotide sequence of bacteriophage phi XI74 DNA. // Nature. 1977. T. 265. № 5596. C. 687-695.

17. Fleischmann R.D. h .zip. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. // Science. 1995. T. 269. № 5223. C. 496-512.

18. Sanger F., Nicklen S., Coulson A.R. DNA sequencing with chain-terminating inhibitors. // Proc. Natl. Acad. Sci. U. S. A. 1977. T. 74. № 12. C. 5463-5467.

19. Handelsman J. h ap. Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products. // Chem. Biol. 1998. T. 5. № 10. C. R245-R249.

20. Schmidt T.M., DeLong E.F., Pace N.R. Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing // J. Bacteriol. 1991. T. 173. № 14. C. 4371-4378.

21. Lane D.J. h ap. Rapid determination of 16S ribosomal RNA sequences for phylogenetic analyses. // Proc. Natl. Acad. Sci. U. S. A. 1985. T. 82. № 20. C. 6955-9.

22. Breitbart M. n ,ap. Genomic analysis of uncultured marine viral communities. // Proc. Natl. Acad. Sci. U. S. A. 2002. T. 99. № 22. C. 14250-14255.

23. Venter J.C. h flp. Environmental genome shotgun sequencing of the Sargasso Sea. // Science. 2004. T. 304. № 5667. C. 66-74.

24. Liu L. h ap. Comparison of next-generation sequencing systems // J. Biomed. Biotechnol. 2012. T. 2012.

25. Scholz M.B., Lo C.C., Chain P.S.G. Next generation sequencing and bioinformatic bottlenecks: The current state of metagenomic data analysis // Curr. Opin. Biotechnol. 2012. T. 23. № l.C. 9-15.

26. Caporaso J.G. n ,np. Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample. // Proc. Natl. Acad. Sci. U. S. A. 2011. T. 108 Suppl. № Supplement^. C. 4516-22.

27. Uchiyama T., Miyazaki K. Functional metagenomics for enzyme discovery: challenges to efficient screening // Curr. Opin. Biotechnol. 2009. T. 20. № 6. C. 616— 622.

28. Bouchot J.L. h ^p. Advances in Machine Learning for Processing and Comparison of Metagenomic Data // Computational Systems Biology: From Molecular Mechanisms to Disease: Second Edition.: Elsevier Inc., 2013. C. 295-329.

29. Caporaso J.G. ii ^p. QIIME allows analysis of high-throughput community sequencing data //Nat. Publ. Gr. 2010. T. 7. № 5. C. 335-336.

30. Quince C. ii ap. Accurate determination of microbial diversity from 454 pyrosequencing data. // Nat. Methods. 2009. T. 6. № 9. C. 639-641.

31. Chaisson M., Pevzner P., Tang H. Fragment assembly with short reads // Bioinformatics. 2004. T. 20. № 13. C. 2067-2074.

32. Butler J. h flp. ALLPATHS: de novo assembly of whole-genome shotgun microreads. // Genome Res. 2008. T. 18. № 5. C. 810-20.

33. Haas B.J. h jip. Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons // Genome Res. 2011. T. 21. № 3. C. 494-504.

116

34. Fox G.E., Wisotzkey J.D., Jurtshuk P. How close is close: 16S rRNA sequence identity may not be sufficient to guarantee species identity. // Int. J. Syst. Bacteriol. 1992. T. 42. № l.C. 166-170.

35. Wang Q. h ,ap. Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy. // Appl. Environ. Microbiol. 2007. T. 73. № 16. C. 5261-7.

36. DeSantis T.Z. h ap. Greengenes, a chimera-checked 16S rRNA gene database and workbench compatible with ARB // Appl. Environ. Microbiol. 2006. T. 72. № 7. C. 5069-5072.

37. Quast C. h ^p. The SILVA ribosomal RNA gene database project: Improved data processing and web-based tools //Nucleic Acids Res. 2013. T. 41. № Dl.

38. Cole J.R. h ap. The Ribosomal Database Project: Improved alignments and new tools for rRNA analysis //Nucleic Acids Res. 2009. T. 37. № SUPPL. 1.

39. Whittaker R. H. Vegetation of the Siskiyou mountains, Oregon and California // Ecol. Monogr. 1960. T. 30. № 3. C. 279-338.

40. Faith D.P. Conservation evaluation and phylogenetic diversity // Biol. Conserv. 1992. T. 61. № l.C. 1-10.

41. Chao A. Nonparametric estimation of the number of classes in a population // Scand. J. Stat. 1984. C. 265-270.

42. Chazdon R.L. h ap. Statistical methods for estimating species richness of woody regeneration in primaiy and secondary rain forests of Northeastern Costa Rica // Forest biodiversity research, monitoring and modeling: conceptual background and old world case studies / no,n pefl. F. Dallmeier, J.A. Comiskey. : Parthenon Publishing, 1998. C. 285-309.

43. Delmotte N. ii ap. Community proteogenomics reveals insights into the physiology of phyllosphere bacteria. // Proc. Natl. Acad. Sci. U. S. A. 2009. T. 106. № 38. C. 16428-16433.

44. Beals E.W. Advances in Ecological Research Volume 14. : Elsevier, 1984.

45. Lozupone C., Hamady M., Knight R. UniFrac~an online tool for comparing microbial community diversity in a phylogenetic context. // BMC Bioinformatics. 2006. T.7. C. 371.

46. Langille M.G.I. 11 ,np. Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences // Nat. Biotechnol. 2013. C. 1-10.

47. Segata N. n ,ap. Computational meta'omics for microbial community studies. // Mol. Syst. Biol. 2013. T. 9. № 666. C. 666.

48. Namiki T. h ap. MetaVelvet: An extension of Velvet assembler to de novo metagenome assembly from short sequence reads // Nucleic Acids Res. 2012. T. 40. № 20.

49. Boisvert S. h ,ap. Ray Meta: scalable de novo metagenome assembly and profiling. // Genome Biol. 2012. T. 13. № 12. C. R122.

50. Iverson V. h ,ap. Untangling genomes from metagenomes: revealing an uncultured class of marine Euiyarchaeota. // Science. 2012. T. 335. № 6068. C. 587-90.

51. Segata N. ii ap. Metagenomic microbial community profiling using unique clade-specific marker genes. // Nat. Methods. 2012. T. 9. № 8. C. 811^.

52. Haft D.H., Tovchigrechko A. High-speed microbial community profiling // Nat. Methods. 2012. T. 9. № 8. C. 793-794.

53. Bazinet A.L., Cummings M.P. A comparative evaluation of sequence classification programs // BMC Bioinformatics. 2012. T. 13. № 1. C. 92.

54. Apvveiler R. h flp. UniProt: the Universal Protein knowledgebase. // Nucleic Acids Res. 2004. T. 32. № Database issue. C. D115-D119.

55. Ashburner M. h jp. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. //Nat. Genet. 2000. T. 25. № 1. C. 25-29.

56. Ogata H. h ap. KEGG: Kyoto encyclopedia of genes and genomes // Nucleic Acids Res. 1999. T. 27. № 1. C. 29-34.

57. Tatusov R.L. ii The COG database: a tool for genome-scale analysis of protein functions and evolution. // Nucleic Acids Res. 2000. T. 28. № 1. C. 33-6.

58. Langmead B. h flp. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. // Genome Biol. 2009. T. 10. № 3. C. R25.

59. Li H., Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform // Bioinformatics. 2009. T. 25. № 14. C. 1754-1760.

118

60. Li R. h ¿ip. SOAP: Short oligonucleotide alignment program // Bioinformatics. 2008. T. 24. № 5. C. 713-714.

61. Qin J. h flp. A human gut microbial gene catalogue established by metagenomic sequencing. // Nature. 2010. T. 464. № 7285. C. 59-65.

62. Nelson K.E. h flp. A catalog of reference genomes from the human microbiome. // Science. 2010. T. 328. № 5981. C. 994-9.

63. Caspi R. h ap. The MetaCyc database of metabolic pathways and enzymes and the BioCyc collection of Pathway/Genome Databases // Nucleic Acids Res. 2014. T. 42. № Dl.

64. Nielsen H.B. h ^p. Identification and assembly of genomes and genetic elements in complex metagenomic samples without using reference genomes. // Nat. Biotechnol. 2014. T. 32. № 8. C. 822-828.

65. Vinga S., Almeida J. Alignment-free sequence comparison-a review. // Bioinformatics. 2003. T. 19. № 4. C. 513-523.

66. Schloissnig S. h ,np. Genomic variation landscape of the human gut microbiome. // Nature. 2013. T. 493. № 7430. C. 45-50.

67. Francis O.E. h ,ap. Pathoscope: Species identification and strain attribution with unassembled sequencing data// Genome Res. 2013. T. 23. № 10. C. 1721-1729.

68. White J.R., Nagarajan N., Pop M. Statistical methods for detecting differentially abundant features in clinical metagenomic samples. // PLoS Comput. Biol. 2009. T. 5. №4. C. el000352.

69. Segata N. h jip. Metagenomic biomarker discovery and explanation. // Genome Biol. 2011. T. 12. №6. C.R60.

70. Parks D.H., Beiko R.G. Identifying biologically relevant differences between metagenomic communities // Bioinformatics. 2010. T. 26. № 6. C. 715-721.

71. Paulson J.N. h ap. Differential abundance analysis for microbial marker-gene surveys. //Nat. Methods. 2013. T. 10. № 12. C. 1200-2.

72. Holmes I., Harris K., Quince C. Dirichlet multinomial mixtures: generative models for microbial metagenomics. // PLoS One. 2012. T. 7. № 2. C. e30126.

73. Rosa P.S. la h ap. Hypothesis Testing and Power Calculations for Taxonomic-Based Human Microbiome Data // PLoS One. 2012. T. 7. № 12.

74. Kohonen T. Self-organized formation of topologically correct feature maps // Biol. Cybern. 1982. T. 43. № 1. C. 59-69.

75. Knights D., Costello E.K., Knight R. Supervised classification of human microbiota. // FEMS Microbiol. Rev. 2011. T. 35. № 2. C. 343-59.

76. Abubucker S. h #p. Metabolic reconstruction for metagenomic data and its application to the human microbiome. // PLoS Comput. Biol. 2012. T. 8. № 6. C. el002358.

77. The Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. // Nature. 2012. T. 486. № 7402. C. 207-14.

78. Liu B., Pop M. MetaPath: identifying differentially abundant metabolic pathways in metagenomic datasets // BMC Proc. 2011. T. 5. № Suppl 2. C. S9.

79. Varemo L., Nielsen J., Nookaew I. Enriching the gene set analysis of genome-wide data by incorporating directionality of gene expression and combining statistical hypotheses and methods // Nucleic Acids Res. 2013. T. 41. № 8. C. 4378-4391.

80. R Development Core Team. R: A Language and Environment for Statistical Computing // Vienna Austria R Found. Stat. Comput. 2008. T. 1. C. 2673.

81. O'Hara A.M., Shanahan F. The gut flora as a forgotten organ. // EMBO Rep. 2006. T. 7. № 7. C. 688-693.

82. Eckburg P.B. h ap. Diversity of the human intestinal microbial flora. // Science. 2005. T. 308. № 5728. C. 1635-8.

83. Gill S.R. h ap. Metagenomic analysis of the human distal gut microbiome. // Science. 2006. T. 312. № 5778. C. 1355-9.

84. Kurokawa K. ii ,np. Comparative metagenomics revealed commonly enriched gene sets in human gut microbiomes. // DNA Res. 2007. T. 14. № 4. C. 169-81.

85. Aagaard K. h ap. The placenta harbors a unique microbiome. // Sci. Transl. Med. 2014. T. 6. № 237. C. 237ra65.

86. Jiménez E. n ap. Is meconium from healthy newborns actually sterile? // Res. Microbiol. 2008. T. 159. № 3. C. 187-93.

87. Matamoros S. n up. Development of intestinal microbiota in infants and its impact on health. // Trends Microbiol. 2013. C. 1-7.

88. Koenig J.E. h ap. Succession of microbial consortia in the developing infant gut microbiome. // Proc. Natl. Acad. Sci. U. S. A. 2011. T. 108 Suppl. C. 4578-85.

89. Yatsunenko T. h ^p. Human gut microbiome viewed across age and geography // Nature. 2012. № Ivic.

90. Li J. h ap. An integrated catalog of reference genes in the human gut microbiome. // Nat. Biotechnol. 2014. № July.

91. Arumugam M. n ,ap. Enterotypes of the human gut microbiome // Nature. 2011. C. 1-7.

92. Koren O. ii jip. A Guide to Enterotypes across the Human Body: Meta-Analysis of Microbial Community Structures in Human Microbiome Datasets // PLoS Comput. Biol. 2013. T. 9. № 1.

93. Caporaso J.G. n ^p. Moving pictures of the human microbiome // Genome Biol. 2011. T. 12. № 5. C. R50.

94. Faith J.J. h ,ap. The Long-Term Stability of the Human Gut Microbiota // Science (80-. ). 2013. T. 341. № 6141. C. 1237439-1237439.

95. Filippo C. De h jip. Impact of diet in shaping gut microbiota revealed by a comparative study in children from Europe and rural Africa. // Proc. Natl. Acad. Sci. U. S. A. 2010. T. 107. № 33. C. 14691-6.

96. Wu G.D. h ap. Linking Long-Term Dietary Patterns with Gut Microbial Enterotypes //Science (80-.). 201 l.T. 105.

97. Dethlefsen L., Relman D.A. Incomplete recovery and individualized responses of the human distal gut microbiota to repeated antibiotic perturbation. // Proc. Natl. Acad. Sci. U. S. A. 2011. T. 108 Suppl. C. 4554-4561.

98. Turnbaugh P.J. h ^p. An obesity-associated gut microbiome with increased capacity for energy harvest. //Nature. 2006. T. 444. № 7122. C. 1027-31.

99. Gevers D. и др. The treatment-naive microbiome in new-onset Crohn's disease. // Cell Host Microbe. 2014. T. 15. № 3. C. 382-92.

100. Cotillard А. и др. Dietary intervention impact on gut microbial gene richness // Nature. 2013. T. 500. № 7464. C. 585-588.

101. U.S. Department of Health and Human Services. Centers for Disease Control and Prevention. ANTIBIOTIC RESISTANCE THREATS in the United States, 2013. [Электронный ресурс]. URL: http://www.cdc.gov/drugresistance/threat-report-

2013/pdf/ar-threats-2013-508.pdf.

102. Wright G.D. The antibiotic resistome: the nexus of chemical and genetic diversity. //Nat. Rev. Microbiol. 2007. T. 5. № 3. C. 175-86.

103. Forslund К. и др. Country-specific antibiotic use practices impact the human gut resistome. // Genome Res. 2013. T. 23. № 7. С. 1163-9.

104. Rolain J.M. Food and human gut as reservoirs of transferable antibiotic resistance encoding genes // Front. Microbiol. 2013. T. 4. № JUN.

105. Dibner J.J., Richards J.D. Antibiotic growth promoters in agriculture: history and mode of action. // Poult. Sci. 2005. T. 84. № 4. C. 634-643.

106. Taur Y. и др. Intestinal domination and the risk of bacteremia in patients undergoing allogeneic hematopoietic stem cell transplantation. // Clin. Infect. Dis. 2012. T. 55. № 7. C. 905-14.

107. Langmead В., Salzberg S.L. Fast gapped-read alignment with Bowtie 2 //Nat. Methods. 2012. T. 9. № 4. C. 357-359.

108. Ondov B.D. и др. An alignment algorithm for bisulfite sequencing using the Applied Biosystems SOLiD System. // Bioinformatics. 2010. T. 26. № 15. C. 1901-2.

109. Quinlan A.R., Hall I.M. BEDTools: A flexible suite of utilities for comparing genomic features // Bioinformatics. 2010. T. 26. № 6. C. 841-842.

110. Patil K.R., Nielsen J. Uncovering transcriptional regulation of metabolism by using metabolic network topology. // Proc. Natl. Acad. Sci. U. S. A. 2005. T. 102. № 8. C. 2685-9.

111. Zhu W., Lomsadze A., Borodovsky M. Ab initio gene identification in metagenomic sequences. //Nucleic Acids Res. 2010. T. 38. № 12. C. 1-15.

122

112. Liu B., Pop M. ARDB—Antibiotic Resistance Genes Database. // Nucleic Acids Res. 2009. T. 37. № Database issue. C. D443-D447.

113. Zhao Y., Tang H., Ye Y. RAPSearch2: A fast and memory-efficient protein similarity search tool for next-generation sequencing data // Bioinformatics. 2012. T. 28. № l.C. 125-126.

114. Li H., Homer N. A survey of sequence alignment algorithms for next-generation sequencing. // Brief. Bioinform. 2010. T. 11. № 5. C. 473-83.

115. McMurdie P.J., Holmes S. Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible // PLoS Comput. Biol. 2014. T. 10. № 4.

116. Mahowald M. a h ,ap. Characterizing a model human gut microbiota composed of members of its two dominant bacterial phyla. // Proc. Natl. Acad. Sci. U. S. A. 2009. T. 106. № 14. C. 5859-64.

117. Martens E.G. h ap. Recognition and degradation of plant cell wall polysaccharides by two human gut symbionts. // PLoS Biol. 2011. T. 9. № 12. C. el001221.

118. Flint H.J., Scott K., Duncan S.H. Microbial degradation of complex carbohydrates in the gut // 2012. № August. C. 289-306.

119. Xu J. h ap. A genomic view of the human-Bacteroides thetaiotaomicron symbiosis. // Science. 2003. T. 299. № 5615. C. 2074-6.

120. Moriya Y. h ,ap. KAAS: An automatic genome annotation and pathway reconstruction server// Nucleic Acids Res. 2007. T. 35. № SUPPL.2.

121. Conesa A. h ap. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research // Bioinformatics. 2005. T. 21. № 18. C. 36743676.

122. Martinez-Medina M. u up. Molecular diversity of Escherichia coli in the human gut: New ecological evidence supporting the role of adherent-invasive E. coli (AIEC) in Crohn's disease // Inflamm. Bowel Dis. 2009. T. 15. № 6. C. 872-882.

123. Wattam A.R. h ap. PATRIC, the bacterial bioinformatics database and analysis resource // Nucleic Acids Res. 2014. T. 42. № D1.

124. Wilson R. Bacteria, antibiotics and COPD // Eur. Respir. J. 2001. T. 17. № 5. C. 995-1007.

125. Sarah J. Thurston, Davinder S. Garcha, Gavin C. Donaldson, Timothy D. McHugh J.A.W. Impact Of Antibiotic Exposure On The Development Of Antibiotic Resistance In COPD Patients // Microbiology. 2013.

126. Liu L. h ap. The human microbiome: a hot spot of microbial horizontal gene transfer. // Genomics. 2012. T. 100. № 5. C. 265-70.

127. Greenblum S., Turnbaugh P.J., Borenstein E. Metagenomic systems biology of the human gut microbiome reveals topological shifts associated with obesity and inflammatory bowel disease // PNAS. 2011.

128. Xiao S. h ap. A gut microbiota-targeted dietary intervention for amelioration of chronic inflammation underlying metabolic syndrome. // FEMS Microbiol. Ecol. 2013. C. 1-11.

129. Winter S.E. h ap. Host-derived nitrate boosts growth of E. coli in the inflamed gut. // Science. 2013. T. 339. № 6120. C. 708-11.

130. Elsborg L., Larsen L. Folate deficiency in chronic inflammatory bowel diseases. // Scand. J. Gastroenterol. 1979. T. 14. № 8. C. 1019-1024.

131. Yakut M. h jip. Serum vitamin B12 and folate status in patients with inflammatory bowel diseases. // Eur. J. Intern. Med. 2010. T. 21. № 4. C. 320-323.

132. Leddin D., Tamim H., Levy A.R. Is folate involved in the pathogenesis of inflammatory bowel disease? // Med. Hypotheses. 2013. T. 81. № 5. C. 940-941.

133. Kostic A.D., Xavier R.J., Gevers D. The microbiome in inflammatory bowel disease: Current status and the future ahead // Gastroenterology. 2014. T. 146. № 6. C. 1489-1499.

134. Koeth R. a h ap. Intestinal microbiota metabolism of L-carnitine, a nutrient in red meat, promotes atherosclerosis. //Nat. Med. 2013. T. 19. № 5. C. 576-85.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.