Метагеномное секвенирование микробиома кишечника что это
Микробиота. История изучения и методы исследования
Мы получили много комментариев к последней статье и решили с Атласом дополнить серию материалом о том, какие еще есть методы изучения микробиоты. В конце статьи добавили, что нужно помнить об исследованиях бактерий кишечника на сегодняшний день, чтобы они не навредили вашему здоровью.
Автор иллюстраций Rentonorama
С чего началось изучение микробиоты
Микробиоту кишечника называют новым органом в теле человека. О других органах мы более или менее знали давно, но о том, что бактерии выполняют важные для человека функции, стало известно только в конце XX века. Началось изучение микробиоты еще в XVII веке. Создатель микроскопа и «отец микробиологии» Антони Ван Левенгук впервые рассмотрел и описал бактерии полости рта и фекалий.
В 1828 году Кристиан Эренберг вводит новый термин Bacterium. В тот момент он изучал кишечную палочку (Escherichia coli) — вид бактерий без спор. Для спорообразующих бактерий Кристиан придумал термин Bacillus. Этот вид бактерий активно изучал Роберт Кох. Он же выявил взаимосвязь между патогенными представителями этого рода и заболеваниями, такими как сибирская язва и туберкулез.
Уже в XIX веке исследователям было понятно, что здоровье человека тесно связано с бактериями. Однако полноценно изучать микробиоту стало возможно после открытия технологии секвенирования генов Фредериком Сенгером. В чашках Петри способны жить и расти далеко не все виды, поэтому подробно классифицировать и определить функции бактерий было сложно.
Одновременно с развитием технологий в 70-х годах микробиолог Карл Вёзе предложил классифицировать микроорганизмы на основе секвенирования молекулы 16s рРНК, по которой удобно сверять нуклеотидные последовательности и определять степень родства. По данным анализа Карл разделил все микроорганизмы на археи, бактерии и эукариоты. Эта классификация используется и сейчас.
Эукариоты отличаются наличием ядра, а у бактерий и архей его нет. Археи — это простые одноклеточные микроорганизмы, которые живут в экстремальных условиях (в гейзерах, на дне морей и океанов). А еще они самые древние: археи существуют на Земле примерно 4 миллиарда лет. Также среди них нет паразитарных и патогенных микроорганизмов, а среди бактерий есть, хотя не так много как нам кажется — около 1%.
Бактерии живут в самых разных средах и мы контактируем с ними намного больше, чем с археями. Они отличаются рядом функций. Например, бактерии могут разрывать молекулы углеводов и производить жирные кислоты, а археи — нет.
Как изучают микробиоту
Перед тем как погружаться в исследования, давайте сначала освежим знания о работе ДНК, РНК и синтезе белка.
Для правильной работы организму нужны белки. Тканям кожи, чтобы поддерживать защитную функцию, — требуются одни; клеткам глаз, чтобы орган работал правильно, — другие. Иногда разным клеткам и тканям требуется один и тот же белок. Чтобы создавать белки, клетки используют ДНК как инструкцию.
Сначала определяется участок, в котором содержится нужная информация. Двуспиральная ДНК разматывается и копируется только одна ее сторона. Затем ДНК сматывается обратно, а копию ее одной стороны (РНК) подхватывает рибосома. Она считывает последовательность и строит по ней цепочку аминокислот, которая потом приобретает форму и становится белком.
Это можно сравнить с готовкой по старинной книге рецептов. Сначала мы выписываем рецепт, чтобы не использовать лишний раз хрупкую, но ценную книгу. Далее по рецепту мы соединяем разные продукты, как рибосома аминокислоты, чтобы получить готовое блюдо. Для клетки блюдо — белок, который она использует дальше для своих нужд. Кроме белка микроорганизмы производят другие соединения, например жирные кислоты, которые считаются метаболитами.
Для изучения микроорганизмов в основном используют четыре подхода: метагеномное — исследование ДНК, метатранскриптомное — изучение РНК, метапротеомика — изучение белков, метаболомика — изучение метаболитов.
Метагеномное секвенирование
Метагеном — набор генов всех организмов в изучаемой среде. Суть такого анализа в секвенировании гена 16s рРНК, который отвечает за работу рибосомальной РНК, или в секвенировании всей ДНК. Такое исследование отвечает на вопросы «какие организмы находятся в образце и какие функции они потенциально выполняют?» Подробно об этой технологии мы рассказывали в предыдущей статье, так как на ней строится тест «Генетика микробиоты».
Обычно под исследованием микробиоты имеют в виду именно этот тип анализа, потому что его первым стали масштабно использовать для изучения бактерий. После появления технологии секвенирования ДНК ученые запустили глобальный проект по изучению почв, морей, горячих источников. Благодаря метагеномному анализу, база данных микроорганизмов росла в геометрической прогрессии. Секвенирование позволяет изучать бактерии в естественной среде, тогда как в лабораторных условиях многие из них погибают.
В 2007 году исследователи США начали проект по изучению микробиома тела человека Human Microbiome Project. Он стал толчком к масштабному изучению состава бактерий кишечника на основе метагеномных данных. Вслед за HMP в Европе в 2008 году запустили похожий проект по изучению микробиоты человека — MetaHit.
Суть метагеномных исследований в том, чтобы понять, какие микроорганизмы живут в образце, сколько их там и какие функции они выполняют. Анализ не позволяет напрямую оценить, какие соединения производит сообщество бактерий. Однако, благодаря множеству метагеномных исследований, мы можем прогнозировать это опосредованно. Например, если у человека больше бактерий-производителей масляной кислоты — его микробиота, вероятно, хорошо ее вырабатывает.
Метагеномные исследования получили широкое распространение потому, что их проще провести в сравнении с другими методами. Для изучения РНК, белков и метаболитов требуется сложная очистка образцов и более трудоемкие анализы.
По метагеномным данным мы имеем больше всего результатов. Это наглядно видно по базе всех научных статей и клинических исследований PubMed. Поиск по запросу metagenomic microbiome выдает около 4500 различных статей, запрос metatranscriptomic microbiome — всего 225, metaproteomic microbiome — 100, metabolomic microbiome — 1600.
Метатранскриптомное секвенирование
Транскриптом — совокупность всех молекул матричной РНК (мРНК), которые синтезирует одна клетка или группа микроорганизмов. При метатранскриптомном анализе изучают непосредственно РНК, а не ген, который ее кодирует.
Бывает так, что бактерия есть, но она никак не участвует в жизни микробного сообщества: у нее есть неактивные гены, которые не копируются молекулой РНК. Метатранскриптомные исследования позволяют оценить именно активную часть микробиоты. Однако молекула РНК не так стабильна, как ДНК, и быстро распадается. Поэтому выделить и сохранить ее для анализов сложнее и дороже.
Часто транскриптомные исследования используют для изучения определенных функций генов. В таком случае результаты исследования РНК сверяют с метагеномными данными. Так ученые получают более полную информацию о работе микроорганизмов. Метатранскриптомные исследования микробиома могут быть полезны, чтобы более точно определить потенциал к синтезу различных метаболитов.
Метапротеомика
При таком подходе изучаются все белки, которые находятся в образце. Метапротеомика дает информацию о структуре, функциях и динамике микробного сообщества. Ученые узнают больше о том, как организмы взаимодействуют друг с другом, соревнуются за питание, производят метаболиты.
Сначала из образца выделяют белки. Часто для этого используют жидкостную хроматографию. Затем проводят дополнительный анализ для определения молекулярной массы — масс-спектрометрию. Так мы получаем информацию о фрагментах белка (пептидах), но не о белке целиком. Чтобы собрать осколки в единое целое, используется специальные программы, и ученые получают готовые данные.
Метопротеомика в настоящий момент менее популярна, чем исследование ДНК и РНК. Это связано со сложностью проведения исследований и высокой вероятностью ошибки. В образце может быть много белков человека или еды. Однако метапротеомика может помочь ученым пролить свет на взаимодействия между бактериями и нарушения работы микробиоты у людей с заболеваниями.
Метаболомика
При таком типе анализа исследуются метаболиты — вещества, которые бактерии производят. Это могут быть аминокислоты, липиды, сахара, жирные кислоты (в том числе масляная) и другие соединения. Сейчас описано около 40 000 метаболитов тела человека, и все они зафиксированы в большой базе данных.
В качестве образца для исследования метаболитов можно использовать любую жидкость из тела человека: кровь, слюну, мочу, кишечный лаваж (смыв) и даже спинномозговую жидкость. В среднем в плазме крови содержится около 4200 метаболитов, в моче — 3000, спинномозговой жидкости — 500, а слюне — 400. Однако для исследования микробиоты в качестве биоматериала используют лаваж.
Процедура исследования метаболитов похожа на анализ белков. С помощью той же жидкостной или газовой хроматографии сначала метаболиты выделяют, а затем измеряют их молекулярную массу с помощью масс-спектрометра.
Исследование метаболитов имеет свои ограничения. Например, на основе этого исследования мы не можем узнать точно, какие метаболиты выделяет именно микробиота кишечника, а какие мы получили с пищей.
Также по нему невозможно подсчитать, сколько тех или иных бактерий содержится в микробиоте. Поэтому для более полной картины данные по метаболитам сопровождаются результатами метагеномных анализов. Такой подход иногда используют, чтобы изучить, как микробиота и ее метаболиты участвуют в развитии заболеваний.
Что нужно запомнить
Пока ни один метод исследования микробиоты не используется в регулярной клинической практике. Иногда для полной картины врач может порекомендовать провести именно метагеномное исследование микробиоты, чтобы оценить состав бактерий кишечника.
Мы предупреждаем пользователей, что тест «Генетика микробиоты» подходит только в образовательных целях и разработан для здоровых людей, которым интересно познакомиться со своими бактериями. Если человек болен, то он сможет узнать состав бактерий, но рекомендации в этом случае будут не актуальны. Микробиота людей с заболеваниями сильно отличается, и для них «нормальный» профиль будет другим.
Мы не советуем проводить исследование детям, потому что по их микробиоте данных намного меньше. А лишнее вмешательство и ограничение рациона детей по результатам исследования — потенциально опасно, так как ребенок может недополучать необходимых нутриентов или пострадать от гипердиагностики.
Сегодня жителям России и стран СНГ предлагают исследование метаболитов микробиоты для детей и взрослых по образцу крови или слюны методом газовой хроматографии и масс-спектрометрии. По его результатам, как утверждают разработчики этого метода, можно оценить наличие и отсутствие воспалений в организме.
Однако в международных клинических гайдлайнах нет подобных рекомендаций. Диагностика воспалений и заболеваний должна проводиться методами, которые имеют высокий уровень доказательности, определенную степень чувствительности, низкую вероятность ложноположительных результатов и осложнений гипердиагностики.
Метагеномное секвенирование микробиома кишечника что это
Исследование видового состава бактерий, населяющих желудочно-кишечный тракт, проводимое при помощи идентификации и количественного подсчета их генетического материала, а также включающее составление на основании результатов анализа персонализированных рекомендаций по модификации питания.
Тест не предназначен для детей и беременных женщин.
Тест «Генетика микробиоты».
Какой биоматериал можно использовать для исследования?
Как правильно подготовиться к исследованию?
Общая информация об исследовании
В различных частях тела человека обитает огромное количество микроорганизмов, более половины из них заселяет разные отделы желудочно-кишечного тракта. При этом человек и микроорганизмы, постоянно населяющие кишечник, живут в симбиозе – взаимовыгодном сосуществовании. Бактерии способны переваривать сложные углеводы и другие вещества, не усваиваемые человеком, производить витамины и короткоцепочечные жирные кислоты (в том числе масляную), к синтезу которых неспособны клетки человеческого организма. Иными важными функциями кишечной микрофлоры являются тренировка иммунной системы и препятствие росту в кишечнике болезнетворных микроорганизмов. Видовой состав кишечной микрофлоры оказывает значительное влияние на возможность выполнения ею вышеперечисленных задач, при этом он сильно зависит от особенностей питания, образа жизни, сопутствующих хронических заболеваний и приема лекарственных препаратов. Все эти факторы могут приводить к изменению бактериального профиля кишечника и нарушению выполнения микробиотой своих функций. С другой стороны, изменение видового состава микрофлоры может служить предрасполагающим фактором и маркером развития некоторых заболеваний и состояний.
Учитывая большое разнообразие микробиоты кишечника, долгое время получить исчерпывающие сведения о ее составе у конкретного человека с помощью традиционных методик микробиологических исследований было невозможно. Изучение микрофлоры получило новый толчок к развитию после появления генетических методов исследования. Они основаны на выделении генетического материала бактерий, и, так как генетический код индивидуален у каждого вида микроорганизма, его выявление позволяет идентифицировать каждую бактерию. На основе данной методики были проведены многочисленные научные исследования, в ходе которых определен видовой состав микрофлоры кишечника, его зависимость от региона проживания и особенностей рациона, связь с развитием некоторых заболеваний и нарушений обмена веществ. Результаты данных исследований легли в основу разработанного в России теста «Генетика микробиоты».
При выполнении данного исследования из образца фекалий выделяют ДНК всех бактерий, по количеству выделенного генетического кода каждой отдельной бактерии оценивают ее долю в общем составе микробиоты. Полученный профиль микробиоты интерпретируется с позиций качественного состава и разнообразия, влияния на развитие некоторых заболеваний и нарушений обмена веществ, способности синтеза витаминов и короткоцепочечных жирных кислот.
Для чего используется исследование?
Когда назначается исследование?
Что означают результаты?
По результатам генетического исследования микробиоты составляется детализированный отчет, содержащий следующие разделы:
Качество микробиоты – это интегрированный показатель, определяемый на основании оценки четырех параметров: защищенность от заболеваний, способность бактерий вырабатывать масляную кислоту и витамины, разнообразие видового состава микрофлоры. Каждый из этих четырех параметров, как и интегрированный показатель качества микробиоты, оценивается по шкале от 1 до 10.
Защищенность от заболеваний. На основании исследования микробиоты кишечника у большого числа людей, в том числе страдающих определенными заболеваниями, были выделены характерные для них профили видового состава бактерий. Выявленный по результатам исследования профиль микрофлоры сравнивается с таковым при следующих заболеваниях: сахарный диабет 2-го типа, болезнь Крона, язвенный колит, ожирение, атеросклероз (в том числе ишемическая болезнь сердца). Уровень защищенности для каждого заболевания также оценивается по шкале от 1 до 10 (чем меньше выявленный у пациента профиль микробиоты похож на профиль при заболевании, тем выше защищенность).
Тип микробиоты представляет собой устойчивое сочетание бактерий, соответствующее определенному стилю питания человека. Всего существует три типа микробиоты. Его можно изменить путем коррекции рациона и режима питания.
Пищевые волокна и масляная кислота. Сложные углеводы, которые организм человека не может усваивать, бактерии кишечника расщепляют до более простых соединений – короткоцепочечных жирных кислот. К ним относится масляная кислота, которая является основным энергетическим материалом для клеток слизистой оболочки кишечника, а также проявляет противовоспалительные свойства. В данном разделе оценивается способность выявленного типа микробиоты расщеплять пищевые волокна и синтезировать масляную кислоту.
Синтез витаминов. Не все витамины могут синтезироваться в организме человека, некоторая их часть поступает с пищей и производится микроорганизмами, обитающими в кишечнике. В данном разделе оценивается способность микрофлоры к синтезу следующих витаминов: витамин В2 (рибофлавин), витамин В1 (тиамин), витамин К, витамин В9 (фолиевая кислота), витамин В5 (пантотеновая кислота), витамин В3 (никотиновая кислота), витамин В6 (пиридоксаль-5-фосфат) и витамин В7 (биотин). Потенциал микробиоты к синтезу каждого витамина оценивается по шкале от 1 до 10.
Разнообразие микробиоты – примерное число видов бактерий, обитающих в кишечнике человека. Чем больше видов бактерий, тем выше компенсаторный потенциал всей микробиоты – при исчезновении одного или нескольких видов бактерии вследствие приема антибиотиков или несбалансированного питания их функции могут начать выполнять другие бактерии. При низком видовом разнообразии в такой ситуации может развиться дисбиоз.
Гражданство бактерий. Люди, проживающие в одной географической локации, имеют не только похожий рацион, но и схожие профили кишечной микробиоты. Выявленный у пациента профиль микрофлоры кишечника может соответствовать таковому у большинства жителей Северной Америки, Западной Европы, Азии, Восточной Европы, Африки или Южной Америки.
Также отчет исследования содержит список всех выделенных бактерий, обнаруженных в кишечнике, структурированный по их семействам и родам.
Что может влиять на результат?
В наборе для исследования содержится подробная инструкция по сбору, хранению и транспортировке биоматериала.
Закрытый контейнер с собранным биоматериалом можно хранить при комнатной температуре, его не нужно ставить в холодильник.
Для корректирования рекомендаций по питанию и оценки их эффективности рекомендуется проводить повторные исследования; сравнение результатов тестов сможет продемонстрировать, как вместе с питанием меняется состав микрофлоры и уровень защищенности от различных заболеваний.
Данный тест не предназначен для детей, а также беременных женщин.
Рекомендации, отраженные в результатах исследования, необходимо обсудить с лечащим врачом. Назначение на их основании какой-либо лекарственной терапии и принятие медицинского решения должно проводиться исключительно доктором.
Генетический тест Атлас
Панель «Нутригенетика max»
Комбинированное обследование при воспалительных заболеваниях кишечника
Кто назначает исследование?
Гастроэнтеролог, диетолог, терапевт, врач общей практики.
ГЕНЕТИЧЕСКИЕ ТЕСТЫ НА МИКРОБИОМ
Компания «Генотест» — единственная на российском рынке предлагает широкий спектр вариантов генетических тестов по направлению «Микробиом».
Мы создали генетические панели для разных групп людей и направлений, для выдачи наиболее адресных и применимых в жизни рекомендаций.
Выберите продукт
Microbiome General
Для людей старше 7 лет.
Microbiome Onco
Предупреждение онкологических заболеваний и оценка их риска. Для людей старше 40 лет.
Microbiome Baby
Для детей от 1 месяца до 2 лет.
Microbiome Baby +
Для детей от 3 до 7 лет.
Таблица сравнения тестов «Микробиом»
Преимущества генетического анализа на микробиом
Анализ бактериального разнообразия производим при помощи секвенирования нового поколения (NGS)
Скорость выполнения
Индивидуальные рекомендации
Для любого возраста
Специализированные интерпретации
Консультация специалиста по результатам исследований
На что влияет микробиота
Пищеварение
Иммунитет
Здоровье мозга
Контроль уровня сахара в крови
Сердечно сосудистая система
Масса тела
Многие исследования показали связь между дисбактериозом кишечника или неблагоприятным балансом хороших и плохих микробов и ожирением. В экспериментах на грызунах им имплантировали микробиом от людей с ожирением, и они набирали больше веса, чем те, которые получили бактерии от худощавых людей. Эта закономерность соблюдалась, даже когда у них была одинаковая диета. Это далеко не исчерпывающий список, но надеюсь, вы получили представление о том, насколько важен кишечный микробиом для всех аспектов нашего здоровья.
Микробиом постоянно меняется
Микробиом человека: особенности использования данных секвенирования из открытых источников
Михаил Никитин, Наталья Захаревич, Алексей Ковтун, Ирена Артамонова
«Природа» №11, 2020
Об авторах
Михаил Сергеевич Никитин — аспирант Института общей генетики имени Н. И. Вавилова РАН (ИОГен РАН) и Физтех-школы биологической и медицинской физики Московского физико-технического института (национального исследовательского университета). Область научных интересов — биоинформатика и эволюционная геномика.
Наталья Владимировна Захаревич — кандидат биологических наук, старший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН. Область научных интересов — молекулярная генетика, биоинформатика, бактериальные серин-треониновые протеинкиназы, бифидобактерии, анализ микробных сообществ, в том числе кишечной микробиоты человека.
Алексей Сергеевич Ковтун — младший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН. Область научных интересов — биоинформатика, метагеномный анализ, микробиота кишечника человека, ось кишечник — мозг.
Ирена Игоревна Артамонова — кандидат биологических наук, старший научный сотрудник, руководитель группы биоинформатики отдела вычислительной системной биологии ИОГен РАН, старший научный сотрудник Института проблем передачи информации имени А. А. Харкевича РАН. Область научных интересов — биоинформатика, молекулярная эволюция, CRISPR-Cas системы прокариотического иммунитета, микробиом человека, геном человека.
До недавнего времени большинство геномных исследований было направлено на виды микроорганизмов, поддающиеся культивированию в лабораторных условиях, хотя их количество составляет лишь малую часть от всего существующего многообразия. Сейчас большой интерес представляет одновременный анализ генетического материала всех организмов, обитающих в определенной среде, — метагеном. Объектами метагеномных исследований служат самые разные экологические сообщества — совокупности микроорганизмов, живущих в почве [1], закрытых полостях океанических гейзеров [2] и т.д.
В фундаментальной медицине значительное внимание уделяется исследованиям микробиома человека, поскольку сообщество микроорганизмов, которые населяют наше тело на взаимовыгодных условиях (симбиоза), участвует во множестве важных функций — пищеварительной, регуляторной, защитной и т.д. * Некоторые исследователи даже рассматривают микробиом человека как один из его органов [3], при этом по суммарному количеству генов и общей длине метагеном этого сообщества превышает ДНК человека на несколько порядков [4].
Видовой состав микроорганизмов в разных полых органах (желудке, кишечнике, мочевом пузыре и т.д.) человека неодинаков. Так как эти органы не изолированы, состав их микробиома может меняться, но не скачком, а по непрерывному градиенту [5]. Мы сосредоточимся на микробиоме кишечника, так как считается, что он, во-первых, самый разнообразный по видовому составу [6] и, во-вторых, именно он оказывает наибольшее влияние на здоровье человека. Например, была установлена взаимосвязь между составом микробиома кишечника и секрецией гормона стресса [7], расстройствами аутистического спектра [8, 9], болезнями Альцгеймера [10] и Паркинсона [11] и т.д. Нет ничего удивительного в том, что исследованию именно этого подмножества полного человеческого микробиома посвящено такое большое число активно финансируемых проектов (и международных, и национальных), и к настоящему времени уже получен огромный массив данных, значительная часть которых находится в открытом доступе.
NGS и первичная обработка полученных данных
Открытием, позволившим метагеномике появиться и успешно существовать наряду с классическими исследованиями культивируемых микроорганизмов, стало развитие методов секвенирования (от англ. sequence — ‘последовательность’) нового поколения (next-generation sequencing, NGS). Буквально за несколько лет они резко увеличили производительность секвенаторов и уменьшили стоимость анализов на несколько порядков, причем с каждым днем они становятся не только дешевле, но и качественнее. Сейчас полногеномный «сиквенс» (результат секвенирования) микробиомных проб с качеством, достаточным для информативного исследования, уже доступен отдельным лабораториям при условии привлечения основных средств большого гранта. Однако для большинства небольших научных групп цена такого исследования пока довольно высока, и именно поэтому столь привлекательна идея использовать массив данных, уже полученных мировым сообществом в этом направлении.
Здесь пришло время кратко пояснить основные этапы современного процесса секвенирования и определить некоторые необходимые для дальнейшего изложения термины. Секвенирование метагеномов методами NGS происходит в следующей последовательности. Сначала из концентрата исходной пробы, взятой из исследуемой среды, выделяется тотальная ДНК и фрагментируется на относительно короткие участки, нуклеотидные последовательности которых «прочитываются» секвенатором. Затем с помощью вычислительных методов (в случае метагеномов методов сборки de novo, т.е. без опоры на какую-либо заранее известную, референтную, геномную последовательность) короткие последовательности собираются в контиги (от англ. contiguous — ‘непрерывный’) — более длинные непрерывно прочитанные участки геномов отдельных организмов, составляющих исходное сообщество. Короткие последовательности — непосредственный результат секвенирования — называют ридами (англ. read — ‘чтение’). Все риды в процессе одного «сиквенса» имеют, как правило, одинаковую длину, которая зависит от используемой модели секвенатора и часто вносит основной вклад в качество полученных контигов. Кроме непосредственно нуклеотидной последовательности секвенатор выдает и количественную оценку качества для каждого прочитанного нуклеотида, которая часто критически зависит от положения нуклеотида внутри читаемого фрагмента и уменьшается к концу рида.
Стандартный протокол обработки данных, полученных с секвенатора, заключается в следующем:
Масштабные исследования микробиома кишечника с открытым доступом к данным
Перечислим лишь наиболее репрезентативные проекты по секвенированию микробиома кишечника. Многие из них сопровождаются параметрическими характеристиками доноров проб.
Эпоха метагеномных исследований микробиома человека началась с двух глобальных проектов, инициированных почти одновременно в Европе и США. Эти проекты и по сей день остаются самыми масштабными в этом направлении. Европейский проект — «Метагеном кишечника человека» (Metagenome of Human Intestinal Tract, MetaHIT) — объединил усилия ученых из 15 институтов восьми стран. MetaHIT нацелен на построение каталога генов микробиома кишечника человека, а также разработку инструментов для анализа наличия и частоты появления выбранных генов у разных групп людей. Основные исследования проекта были проведены на двух различных группах доноров проб. Первая группа включала более 300 датчан из ранее организованной когорты Inter-99 [16]. Все доноры не имели заболеваний желудочно-кишечного тракта (ЖКТ) и не принимали антибиотики в течение полугода до сдачи проб. В состав второй группы вошли 39 испытуемых из Испании, часть которых страдала воспалительными болезнями ЖКТ в стадии клинической ремиссии, а остальных использовали в качестве контроля [17, 18]. Данные секвенирования обеих групп доступны в базе Европейского института биоинформатики (European Bioinformatics Institute, EBI), номера записей ERA000116 и ERP003612, соответственно. Секвенирование было произведено на платформе Illumina Genome Analyzer. Данные имеют длину ридов в 44, 75 и 90 нуклеотидов, в зависимости от группы и конкретного образца. Кроме того, для индивидуальных проб из первой группы до недавнего времени были доступны авторские сборки на сайте Европейской молекулярно-биологической лаборатории (The European Molecular Biology Laboratory, EMBL), но сейчас в открытом доступе они отсутствуют.
Американский проект «Микробиом человека» (Human Microbiome Project, HMP) с самого начала преследовал более глобальные цели исследования микробиомов различных органов человеческого тела. В качестве испытуемых были выбраны 300 человек в возрасте 18–40 лет без хронических заболеваний [5]. Для разных органов доступны образцы как 16S-, так и полногеномного секвенирования. В частности, данные о полногеномном секвенировании кишечного микробиома представляют собой 136 образцов. Риды доступны для скачивания с портала проекта, а характеристики доноров могут быть предоставлены по дополнительному запросу на сайте Национального центра биотехнологической информации США (National Center for Biotechnology Information, NCBI). Секвенирование метагенома кишечника проводилось на платформе Illumina MiSeq, и в результате были получены риды длиной в 95 нуклеотидов.
В открытом доступе также находятся данные нескольких более поздних национальных исследований микробиома человека. Одно из них посвящено изучению особенностей микробного состава кишечника здоровых японцев в сравнении с жителями других стран [19]. В качестве испытуемых выбрали 106 здоровых человек из Японии, видовой состав их микробиома сравнивали с таковым из других исследований в Америке, Европе и Китае. Благодаря тому, что секвенирование проводилось сразу на нескольких платформах — 454 GS FLX Titanium и FLX+ (Roche), Ion PGM и Ion Proton (Life Technologies), а также MiSeq (Illumina), были получены риды нескольких типов. Процессированные риды, после фильтрации по качеству, удаления адаптеров и картирования на геном человека, можно найти в Японской базе данных ДНК (DNA Data Bank of Japan, DDBJ) под номером PRJDB3601. Фенотипические данные испытуемых доступны в приложении исследования. Дополнительно, от некоторых индивидуумов пробы брались многократно с интервалом в несколько недель. Анализ этих данных сильно затрудняет использование многих платформ секвенирования в очень разных комбинациях для разных индивидуальных проб. Не все из индивидуальных множеств ридов проходят сравнение с общепринятыми сейчас порогами по качеству. Перечисленные свойства сильно ограничивают применимость этих данных в независимых исследованиях, поэтому мы отказались от их использования.
Другим примером использования микробиомных данных в национальных исследованиях можно считать эксперимент по сравнению видового состава микробиома жителей городской и сельской местности в России [20]. В исследовании приняло участие 96 человек (50 горожан и 46 сельских жителей) из восьми регионов России, не имеющих хронических заболеваний. Секвенирование проводилось на платформе SOLiD 4, в результате были получены риды длиной 50 нуклеотидов. Данные секвенирования размещены в Архиве последовательностей ридов (Sequence Read Archive, SRA) NCBI под номером SRA059011. В сравнении с остальными исследованиями, полученные риды имеют слишком короткую длину, что также затрудняет их независимое использование.
Последнее из национальных исследований, которое мы хотим здесь упомянуть, принципиально отличается от предыдущих, так как не предполагает общей характеристики здоровой микробиоты; его цель — сравнительное описание микрофлоры кишечника людей с диагностированным диабетом второго типа, а также поиск различных характерных маркеров для данного заболевания [21]. В этой работе проанализированы пробы от 368 доноров из Китая, 183 из которых были больны диабетом, а остальные вошли в контрольную группу. Секвенирование проведено на платформах Illumina GAIIx и HiSeq 2000 в две стадии, с итоговой длиной ридов в 75 нуклеотидов на первой стадии и 90 — на второй. Данные испытуемых также размещены в открытом доступе в NCBI SRA под номерами SRA045646 и SRA050230.
Качество данных
Секвенирование во всех перечисленных исследованиях сделано на различных приборах и достаточно давно. Напомним, что приборы и протоколы секвенирования нового поколения сейчас меняются очень быстро и качество прочитанных ридов растет. Соответственно, довольно быстро устаревают и стандарты, принятые в этой области. Качество данных из прошлых проектов становится критичным для использования в текущей работе.
В индивидуальных образцах последнего из перечисленных исследований, проведенного для диабета второго типа, риды обеих длин имеют приемлемое для сборки качество: оно выше порога после стадии фильтрации, в результате которой отбраковывается 10–20% ридов. После их удаления риды индивидуальных проб этого проекта готовы для сборки.
Риды из первых масштабных проектов значительно худшего качества: некоторые пробы из проекта MetaHIT не проходят формального сравнения с порогами по качеству ни до, ни после фильтрации ридов, несмотря на то, что их качество после этого значительно улучшается. Кроме того, для всех проб характерна слишком существенная потеря объема в результате фильтрации: количество ридов в индивидуальных множествах уменьшается на 30–90%. По нашему опыту, такая потеря информативности критична для сравнения параметров индивидуальных микробиомов. Если же задача не предполагает сборки индивидуальных метагеномов для каждого донора, а нацелена на описание общего разнообразия кишечной микрофлоры человека, то эти данные все еще пригодны для использования единым массивом (например, [22]). А для сравнения индивидуальных проб мы предлагаем изменить стандартный протокол обработки ридов (об этом см. следующий раздел).
Риды HMP оказались очень плохого качества при первой проверке до стандартного процессинга. Но в данном случае проблема кроется не в качестве прочтения отдельных нуклеотидов, а в большом количестве ридов, полностью или частично состоящих из непрочитанных нуклеотидов, обозначенных буквой N. После стандартного процессинга с помощью программы Trimmomatic (с включенной опцией фильтрации по «N» среди прочих) проблема решается. Общее количество отфильтрованных ридов достаточно высоко — для разных проб оно доходит до 50%, но 35–38% из них составляют риды, полностью состоящие из непрочитанных нуклеотидов (обозначенных буквами N) и изначально не несущие информации. В результате, с учетом достаточно большого размера индивидуальных множеств прочтений (до 25 млн ридов для каждой индивидуальной пробы, что приблизительно в два раза больше характерной пробы для проекта MetaHIT) и приличной длиной рида, этого вполне достаточно для информативной сборки хорошего качества.
Сравнение сборок для ридов плохого качества
Часто используемый протокол обработки данных секвенирования, повторим, предполагает укорачивание или удаление ридов плохого качества. Однако стадия фильтрации по качеству может быть заменена на стадию коррекции. Такой подход сильно ограничен по двум причинам: во-первых, для коррекции ридов нет достаточного количества эффективных программ (таких, например, как Quake [23]), а во-вторых, нет возможности оценить качество скорректированных ридов и сравнить его с качеством исходных.
В случае работы с общедоступными данными по микробиому человека для коррекции ридов удобно использовать программу BayesHammer, встроенную в MetaSPADes. Она была разработана для исправления ридов в протоколе одноклеточного секвенирования, но и для обычного секвенирования геномов, в том числе метагеномов, она оказалась высокоэффективной [24]. Выяснилось, что для данных проекта MetaHIT использование программы BayesHammer в процессе сборки программой MetaSPADes без стадии фильтрации по качеству, но с предварительным удалением адаптеров и ридов, картированных на геном человека, дает достаточно качественные сборки без потери основной доли информации в индивидуальных пробах.
Проиллюстрируем это на пяти случайно выбранных индивидуальных микробиомах из проекта MetaHIT. Для удобства сравнения мы выбрали все пять проб из подмножества с длиной ридов 75 нуклеотидов. Применение протокола к индивидуальным пробам с другой длиной ридов (44 или 90 нуклеотидов) дает аналогичный результат.
Для каждого индивидуального микробиома мы проанализировали все собранные контиги не короче 200 нуклеотидов, полученные в результате запуска программы MetaSPADes на множествах ридов до и после стадии фильтрации по качеству, с использованием одинаковых параметров программы. Для сравнения сборок мы выбрали суммарную длину всех контигов и параметр N50, чаще других используемый для оценки качества сборки. Для его определения нужно упорядочить все контиги по длине от большего к меньшему и суммировать их длину до достижения половины общей длины сборки — N50 равен длине текущего контига (результаты сравнения см. в табл. 1).
Таблица 1. Сравнение параметров сборок для пяти образцов из проекта MetaHIT
Помимо общих параметров полученные сборки целесообразно сравнить с известными геномами микроорганизмов. Для этого мы использовали выравнивание сборок, полученных до и после фильтрации, с последовательностями из нуклеотидного раздела базы данных GenBank [25] с помощью пакета программ BLAST [26]. Доли выравниваемых участков микробиома варьировали от пробы к пробе, но не различались существенно между сборками до и после фильтрации.
Сравнение сборок для ридов хорошего качества
Для иллюстрации протокола, использованного при анализе данных проекта MetaHIT, приведем результаты его применения к данным проекта HMP. Аналогично программе Trimmomatic, MetaSPADes тоже фильтрует исходные данные от ридов, полностью состоящих из букв N, на начальной стадии. Для сравнения были использованы три образца проекта HMP и параметры, использованные в предыдущем аналогичном сопоставлении (результаты см. в табл. 2). В данном случае описанный протокол несколько уступает стандартному по качеству и общей длине сборок.
Таблица 2. Сравнение параметров сборок для трех образцов из проекта HMP
В пробах HMP в среднем выявлена значительно более высокая доля ридов, сходных с известными геномами микроорганизмов, чем в пробах проекта MetaHIT. В этом случае индивидуальные сборки до и после фильтрации тоже не различаются существенно по доле таких ридов.
Среднее качество ридов значительно влияет на качество последующей сборки. При использовании стандартного протокола наряду с удалением адаптеров и ридов, заведомо не относящихся к исследуемым организмам, фильтрация ридов по качеству может слишком сильно сократить объем полученной при секвенировании информации. В такой ситуации изменение протокола обработки ридов с заменой фильтрации на коррекцию может существенно исправить положение.
При работе с доступными микробиомными данными такой подход позволил сохранить большую часть данных в индивидуальных пробах проекта MetaHIT и получить надежные результаты в описании практически важных индивидуальных характеристик микробиома. Но в случае более качественного секвенирования в проекте HMP такой подход оказался излишним — результаты его применения немного хуже, чем для стандартного протокола.
Таким образом, работа с микробиомом человека или любыми другими метагеномными данными, полученными в независимых исследованиях, требует тщательного контроля качества данных на разных этапах анализа. И, при выполнении этого условия, работа становится весьма продуктивной для получения нетривиальных выводов о структуре и индивидуальных характеристиках метагеномных проб.
Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 18-29-07087).
Литература
1. Daniel R. The metagenomics of soil // Nat. Rev. Microbiol. 2005; 3(6): 470–478. DOI:10.1038/nrmicro1160.
2. Sunagawa S., Coelho L. P., Chaffron S. et al. Structure and function of the global ocean microbiome // Science. 2015; 348(6237): 1261359. DOI:10.1126/science.1261359.
3. Baquero F., Nombela C. The microbiome as a human organ // CMI. 2012; 18: 2–4. DOI:10.1111/j.1469-0691.2012.03916.x.
4. Gill S. R., Pop M., Deboy R. et al. Metagenomic analysis of the human distal gut microbiome // Science. 2006; 312(5778): 1355–1359. DOI:10.1126/science.1124234.
5. Turnbaugh P. J., Ley R. E., Hamady M. et al. The human microbiome project // Nature. 2007; 449(7164): 804–810. DOI:10.1038/nature06244.
6. Lozupone C. A., Stombaugh J. I., Gordon J. I. et al. Diversity, stability and resilience of the human gut microbiota // Nature. 2012; 489(7415): 220–230. DOI:10.1038/nature11550.
7. Dinan T. G., Cryan J. F. Regulation of the stress response by the gut microbiota: implications for psychoneuroendocrinology // Psychoneuroendocrinology. 2012; 37(9): 1369–1378. DOI:10.1016/j.psyneuen.2012.03.007
8. Mulle J. G., Sharp W. G., Cubells J. F. The gut microbiome: a new frontier in autism research // Curr. Psychiatry Rep. 2013; 15(2): 337. DOI:10.1007/s11920-012-0337-0.
9. Averina O. V., Kovtun A. S., Polyakova S. I. et al. The bacterial neurometabolic signature of the gut microbiota of young children with autism spectrum disorders // J. Med. Microbiol. 2020; 69(4): 558–571. DOI:10.1099/jmm.0.001178.
10. Vogt N. M., Kerby R. L., Dill-McFarland K. A. et al. Gut microbiome alterations in Alzheimer’s disease // Sci. Rep. 2017; 7(1): 13537. DOI:10.1038/s41598-017-13601-y.
11. Scheperjans F., Aho V., Pereira P. A. et al. Gut microbiota are related to Parkinson’s disease and clinical phenotype // Mov Disord. 2015; 30(3): 350–358. DOI:10.1002/mds.26069.
12. Andrews S. et al. FastQC: a quality control tool for high throughput sequence data. 2010.
13. Bolger A. M., Lohse M., Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data // Bioinformatics. 2014; 30(15): 2114–2120. DOI:10.1093/bioinformatics/btu170.
14. Langmead B., Trapnell C., Pop M. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome // Genome biol. 2009; 10(3): R25. DOI:10.1186/gb-2009-10-3-r25.
15. Nurk S., Meleshko D., Korobeynikov A., Pevzner P. A. metaSPAdes: a new versatile metagenomic assembler // Genome Res. 2017; 27(5): 824–834. DOI:10.1101/gr.213959.116.
16. Glümer C., Jørgensen T., Borch-Johnsen K. Prevalences of diabetes and impaired glucose regulation in a Danish population: the Inter99 study // Diabetes care. 2003; 26(8): 2335–2340. DOI:10.2337/diacare.26.8.2335.
17. Qin J., Li R., Raes J. et al. A human gut microbial gene catalogue established by metagenomic sequencing // Nature. 2010; 464(7285): 59–65. DOI:10.1038/nature08821.
18. Le Chatelier E., Nielsen T., Qin J. et al. Richness of human gut microbiome correlates with metabolic markers // Nature. 2013; 500(7464): 541–546. DOI:10.1038/nature12506.
19. Nishijima S., Suda W., Oshima K. et al. The gut microbiome of healthy Japanese and its microbial and functional uniqueness // DNA Research. 2016; 23(2): 125–133. DOI:10.1093/dnares/dsw002.
20. Tyakht A. V., Kostryukova E., Popenko A. et al. Human gut microbiota community structures in urban and rural populations in Russia // Nat. commun. 2013; 4: 2469. DOI:10.1038/ncomms3469.
21. Qin J., Li Y., Cai Z. et al. A metagenome-wide association study of gut microbiota in type 2 diabetes // Nature. 2012; 490(7418): 55–60. DOI:10.1038/nature11450.
22. Karlsson F. H., Nookaew I., Nielsen J. Metagenomic data utilization and analysis (MEDUSA) and construction of a global gut microbial gene catalogue // PLoS Comput Biol. 2014; 10(7): e1003706. DOI:10.1371/journal.pcbi.1003706.
23. Kelley D. R., Schatz M. C., Salzberg S. L. Quake: quality-aware detection and correction of sequencing errors // Genome biol. 2010; 11(11): R116. DOI:10.1186/gb-2010-11-11-r116.
24. Nikolenko S. I., Korobeynikov A. I., Alekseyev M. A. BayesHammer: Bayesian clustering for error correction in single-cell sequencing // BMC genomics. 2013; 14(Suppl 1): S7. DOI:10.1186/1471-2164-14-S1-S7.
25. Benson D. A., Cavanaugh M., Clark K. et al. GenBank // Nucleic Acids Res. 2013; 41(Database issue): D36–D42. DOI:10.1093/nar/gks1195.
26. Altschul S. F., Madden T. L., Schäffer A. A. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs // Nucleic Acids Res. 1997; 25(17): 3389–3402. DOI:10.1093/nar/25.17.3389.
* Подробнее о роли микробиома в жизни человека см. публикации А. Н. Суворова в «Природе»: Полезные микробы — кто они? (2009. №7. С. 21–30); Микробиота человека и косметология (2010. №8. С. 22–25); Гонки с микробами: наши шансы (2011. №5. С. 13–24); Микробиота детей (2011. №8. С. 14–21); Мир микробов и человек (2015. №5. С. 11–19); Микробиота пожилых: истоки долголетия (2017. №1. С. 22–29); О нас и наших онколитических бактериях (2018. №8. С. 3–9); Давайте целоваться, это не только приятно (2019. №4. С. 54–57). — Примеч. ред.