Метагеномное секвенирование что это
Секвенирование геномов для «чайников»
Геномика: постановка задачи и методы секвенирования
Сергей Николенко, кандидат физико-математических наук, старший научный сотрудник лаборатории вычислительной биологии Санкт-Петербургского Академического Университета в серии статей говорит о некоторых задачах биоинформатики, связанных со сборкой и анализом геномов, делая акцент на математической, комбинаторной постановке задачи. В данном, вводном, тексте речь идет о том, как выглядят входные данные для сборки геномов и как их получают.
Как выглядит молекула ДНК?
Начнем с того, как выглядит молекула ДНК. Молекулы полимеров характеризуются первичной структурой, под которой понимается просто состав молекулы (в данном случае – последовательность букв A, C, G и T, которые и составляют геном), вторичной структурой, т.е. тем, какие именно химические связи устанавливаются между этими компонентами и какие в результате получаются базовые пространственные структуры (в данном случае – двойная спираль), и третичной структурой, т.е. тем, как вторичная структура «уложена» в пространстве. Вторичная структура ДНК представляет собой двойную спираль, состоящую из четырёх разных нуклеотидов.
Рисунок из Википедии
Нуклеотиды обозначаются по содержащимся в них азотистым основаниям: аденину (A), цитозину (C), гуанину (G) и тимину (T) (есть ещё урацил, который в РНК заменяет тимин), и в дальнейшем мы всегда будем пользоваться этими буквами. В двойной спирали эти нуклеотиды связаны друг с другом водородными связями, и связь устанавливается по принципу комплементарности: если в одной нити ДНК стоит A, то в комплементарной нити будет T, а если в одной нити C, то в другой будет G. Именно это позволяет относительно просто проводить репликацию (копирование) ДНК, например, при делении клетки: для этого достаточно просто разорвать водородные связи, разделив двойную спираль на нити, после чего парная нить для каждого «потомка» автоматически соберётся правильно. Важно понять, что ДНК – это две копии одного и того же «текста» из четырёх «букв»; «буквы» в копиях не идентичны, но однозначно соответствуют друг другу. Например:
Было бы, конечно, удобно, если бы нам удалось аккуратно «вытянуть» одну нить ДНК и спокойно, нуклеотид за нуклеотидом, «прочесть» эту нить от начала до конца. При таком, идеальном, методе секвенирования (чтения ДНК) никаких хитрых алгоритмов не понадобилось бы. К сожалению, на данном этапе такое невозможно, и приходится довольствоваться результатами того секвенирования, которое есть.
Что такое секвенирование?
Секвенирование (sequencing) – это общее название методов, которые позволяют установить последовательность нуклеотидов в молекуле ДНК. В настоящее время нет ни одного метода секвенирования, который бы работал для молекулы ДНК целиком; все они устроены так: сначала готовится большое число небольших участков ДНК (клонируется молекула ДНК многократно и «разрезается» в случайных местах), а потом читается каждый участок по отдельности.
Клонирование происходит либо просто выращиванием клеток в чашке Петри, либо (в случаях, когда это было бы слишком медленно или по каким-то причинам не получилось бы) при помощи так называемой полимеразной цепной реакции. В кратком и неточном изложении работает она примерно так: сначала ДНК денатурируют, т.е. разрушают водородные связи, получая отдельные нити. Затем к ДНК присоединяют так называемые праймеры; это короткие участки ДНК, к которым может присоединиться ДНК-полимераза – соединение, которое, собственно, и занимается копированием (репликацией) нити ДНК.
Рисунок из Википедии
На следующем этапе полимераза копирует ДНК, после чего процесс можно повторять: после новой денатурации отдельных нитей будет уже вдвое больше, на третьем цикле – вчетверо, и так далее.
Все эти эффекты достигаются в основном с помощью изменений температуры смеси из ДНК, праймеров и полимеразы; для наших целей важно, что это достаточно точный процесс, и ошибки в нём редки, а на выходе получается большое число копий участков одной и той же ДНК. Разные методы секвенирования отличаются друг от друга не методами клонирования, а тем, как потом прочесть получившийся «суп» из многочисленных копий одной и той же ДНК.
Секвенирование по Сэнгеру
Первым методом секвенирования, который учёные сумели применить для обработки целых геномов (в том числе генома человека), стало секвенирование по Сэнгеру (Sanger sequencing). Смысл таков: участок ДНК клонируется, после чего полученная смесь делится на четыре части. Каждая часть помещается в активную среду, где присутствуют:
Собственно, процесс практически идентичен клонированию ДНК, с которым мы встретились в предыдущем разделе. Разница только в том, что теперь в один из нуклеотидов подмешаны «ложные» нуклеотиды; они могут образовать точно такую же водородную связь, но не могут продолжить свою нить дальше.
В результате в каждой части образуется большое число копий префиксов исследуемого участка ДНК, которые имеют разную длину, но всегда заканчиваются на одну и ту же букву – в зависимости от того, когда повезёт взять в процесс клонирования «ложный» нуклеотид. Например, в пробирке, где все последовательности заканчиваются на Т, из нашего примера выше получилась бы смесь из следующих префиксов:
ATGCAGAACAGACGATCAGCGACACTTTA (образец)
AT
ATGCAGAACAGACGAT
ATGCAGAACAGACGATCAGCGACACT
ATGCAGAACAGACGATCAGCGACACTT
ATGCAGAACAGACGATCAGCGACACTTT
Как теперь, получив такую смесь, «прочесть» геномную последовательность? Заметим, что в сумме в четырёх пробирках мы получили все возможные префиксы интересующего нас участка. Это значит, что если мы сможем просто измерить длину каждого префикса (точнее говоря, даже не измерить, а просто упорядочить, узнав, кто из них длиннее), то мы сможем узнать и последовательность тоже. Предположим, что мы увидели, что в пробирках лежат префиксы вот такой длины (по порядку, от самого лёгкого 1 до самого тяжёлого 10):A C G T
1, 5, 7, 8, 10 4, 9 3, 6 2
Очевидно, что эта последовательность начинается с А (т.к. самый лёгкий префикс, из одной буквы, заканчивается на A); дальше идёт C, дальше опять A, и так далее. В результате можно прочесть исходный участок: ATGCAGAACA.
А чтобы измерить длину, можно, например, измерить массу всех префиксов во всех пробирках. Чтобы измерить массу, можно, например (разные секвенаторы использовали разные процедуры, но суть от этого не меняется), ионизировать эти молекулы и отправить их наперегонки к заряженному электроду в специальном геле, который создаст трение и замедлит продвижение молекул – этот метод называется электрофорезом. При одинаковом заряде более тяжёлые молекулы будут двигаться медленнее, и в результате получится примерно такая картинка.
Рисунок из Википедии
Видно, что (в идеальном случае) можно просто прочесть последовательность нуклеотидов от самого лёгкого префикса (т.е. префикса из одной буквы) к самому тяжёлому.
Результаты и ошибки сэнгеровского секвенирования
На выходе из сэнгеровского секвенатора получаются короткие участки ДНК, так называемые риды (reads). Для биоинформатики принципиальны две вещи: во-первых, какой длины получаются риды, во-вторых, какие в них могут быть ошибки и как часто (разумеется, на свете нет ничего идеального).
Сэнгеровские риды по этим критериям очень хороши: получаются риды длиной около тысячи нуклеотидов, причём качество начинает заметно падать только после 700-800 нуклеотидов. Сам процесс секвенирования по Сэнгеру, с которым мы познакомились в предыдущем разделе, предопределяет и эффект падения качества (труднее отличить молекулу массой 700 от молекулы массой 701, чем массу 5 от массы 6), и другой неприятный эффект – если в геноме встречается длинная последовательность из одной и той же буквы (…AAAAAAAA…), трудно бывает точно определить, какой она длины – все промежуточные массы попадут в одну и ту же пробирку, некоторые из них могут не встретиться, некоторые слиться друг с другом и т.д. Но всё же сэнгеровское секвенирование даёт отличные результаты с достаточно длинными ридами, которые потом относительно легко собирать. О том, как это делается, мы будем говорить в последующих текстах.
Именно при помощи сэнгеровского секвенирования был впервые расшифрован геном человека. Секвенирование по Сэнгеру применяется и сегодня, но его всё активнее вытесняют другие методы, и применяется оно всё реже. Кому же и почему оно уступило свои позиции?
Секвенаторы второго поколения: Illumina
Современные секвенаторы – это так называемые секвенаторы второго поколения (SGS, second generation sequencing). В них участки ДНК по-прежнему многократно клонируются, но процесс чтения устроен не так, как у Сэнгера. Существует много разных методов, отличающихся довольно существенно, поэтому мы рассмотрим только один из них, один из самых популярных на сегодня – секвенирование по методу Solexa (ныне Illumina; в смене названия не нужно искать глубокий смысл, просто одна компания купила другую).
Процесс секвенирования Illumina проиллюстрирован на рисунке; кроме того, можно посмотреть один из нескольких существующих видеороликов с анимацией этого процесса – в данном случае, действительно, лучше один раз увидеть, чем сто раз прочесть текст. Однако краткие комментарии тоже пригодятся; вот как происходит процесс секвенирования по методу Illumina.
В результате на каждом цикле мы прочитываем одновременно очень большое число нуклеотидов из разных последовательностей. Но за это приходится платить тем, что участки ДНК, которые мы можем прочесть, оказываются гораздо короче, чем в случае секвенирования по Сэнгеру – риды Illumina обычно получаются длиной около 100 нуклеотидов.
Парные риды и постановка задачи
Есть ещё одна важная деталь. Участки ДНК «присасываются» к подложке обоими концами, причём мы можем узнать, какие последовательности соответствуют одному и тому же участку. Это значит, что в реальности мы читаем один и тот же участок, длина которого нам приблизительно известна, сразу с двух сторон. В результате данные получаются примерно такого вида:
причём расстояние между известными строчками (число вопросительных знаков) известно не совсем точно. В зависимости от технологии, можно получить как очень длинные неизвестные фрагменты (около 1000 нуклеотидов), «обрамлённые» двумя ридами длины 100, так и короткие фрагменты, в которых неизвестны буквально два-три десятка нуклеотидов между ридами. И те, и другие могут очень помочь в сборке, и об этом мы тоже будем говорить в следующих сериях.
Итак, теперь мы можем формально поставить задачу сборки геномов. Она звучит так: по большому числу подстрок небольшой длины восстановить исходную длинную строку в алфавите из букв A, C, G, T. В случае секвенирования по методу Illumina – по большому числу пар коротких подстрок, разделённых в исходной строке приблизительно известным расстоянием. Поставив эту задачу, мы можем забыть про биологию, химию и медицину – перед нами чисто алгоритмическая задача. Однако, прежде чем перейти к математике, сделаем ещё несколько замечаний.
Ошибки и показатели качества в секвенаторах второго поколения
Как мы уже знаем, секвенирование всегда содержит ошибки. В секвенаторах Illumina и аналогичных ошибки, как правило, происходят на фазе, когда нужно распознать помеченные нуклеотиды, т.е. понять, каким цветом и с какой силой светятся кластеры из многократно клонированных участков ДНК. На рисунке – типичный пример такой фотографии, порождённой секвенатором Illumina.
Рисунок с сайта medicine.yale.edu
Проблема здесь заключается в том, что из-за неидеальности остальных этапов процесса кластеры никогда не светятся только одним цветом; это всегда смесь всех четырёх цветов с той или иной интенсивностью. Нужно выделить наиболее интенсивную компоненту и оценить, насколько вероятна ошибка в этой букве; эта задача называется base calling (распознавание нуклеотидов). Base calling – это целая наука, в подробности которой мы сейчас вдаваться не будем.
Для нас сейчас важно, что в результате каждому нуклеотиду каждого рида секвенатор ставит в соответствие вероятность того, что этот нуклеотид был распознан правильно. Эти вероятности тоже можно использовать при сборке, и секвенаторы выдают их вместе с собственно ридами.
В итоге типичный рид в так называемом fastq-формате, стандартном для секвенаторов второго поколения, выглядит примерно так:
@EAS20_8_6_1_3_25/1
GCAAAAAACTTACCCCGGAACAGGCCGAGCAGATCAAAACGCTACTGCAATACAGACCATCAAGCACCAACTCCCNNNCGTAGNNNNNNTATGTTNNNNG
+EAS20_8_6_1_3_25/1
HHHHHHHGHHHHHHHHHHHHHHHHHHHHEHHHHHHHHEGHHHHGHHGHEFD?A=A&FFBB>&::===@&@E@E>A#########################
Первая и третья строки содержат имя рида; вторая строка – сама последовательность нуклеотидов. Обратим внимание, что среди букв A, C, G, T встречаются и буквы N – это значит, что секвенатор не смог однозначно определить, какой здесь был нуклеотид, и сдался. А четвёртая строка кодирует, в логарифмическом масштабе, вероятности того, что тот или иной нуклеотид распознан правильно; например, H здесь соответствует вероятности ошибки около одной десятитысячной. Как правило, качество ухудшается к концу рида; в нашем примере, как видите, хвост рида и вовсе не удалось сколь-нибудь надёжно прочитать.
Другие методы секвенирования
Хотя мы подробнее всего рассмотрели секвенатор Illumina (Solexa), на самом деле на этом методе свет клином не сошёлся. Есть и другие секвенаторы второго поколения, с другими свойствами.
В секвенировании лигированием (sequencing by ligation) на фазе, когда уже нужно распознавать нуклеотиды, используют не ДНК-полимеразу и процесс репликации, а специальные короткие «зонды», которые присоединяются к комплементарным нуклеотидам, фиксируются, затем вымываются, и процесс повторяется снова. Так устроен секвенатор SOLiD от Applied Biosystems.
Пиросеквенирование (pyrosequencing) основано на хемилюминесцентных сигналах, которые подают специально модифицированные нуклеотиды, когда соединяются с комплементарным нуклеотидом в прочитываемой нити ДНК; на этом принципе работает, например, секвенатор 454 от 454 Life Sciences.
Принцип работы секвенатора PacBio (от Pacific Biosciences) очень похож на принцип работы Illumina, но у него по-другому устроен метод детектирования – специальные «решётки» позволяют уловить сигналы от отдельных молекул (метод получил название SMRT, single molecule real time sequencing). Это позволяет ускорить процесс, уместить больше ридов на одной подложке (нужно меньше клонировать ДНК, не нужно выращивать большие кластеры) и существенно увеличить длину надёжно прочитываемых ридов.
Недавно появившийся метод ионного полупроводникового секвенирования (на нём основан секвенатор IonTorrent) вместо всего этого просто детектирует соединения (ионы), которые выделяются при присоединении нового нуклеотида к нити ДНК. Это позволяет радикально сократить время и стоимость получаемых ридов, хотя процент ошибок становится больше, и больше становится ошибок в фрагментах из повторяющейся одной буквы.
Человеческая мысль не стоит на месте: методы секвенирования постоянно улучшаются. Однако практически все современные методы выдают относительно короткие риды, от 100 до 400 нуклеотидов; в этом цикле мы будем в основном говорить о том, как собирать именно короткие риды.
Sanger или Illumina?
Человеческий геном был впервые собран на сэнгеровских секвенаторах, причём алгоритмическая сторона того проекта была проработана гораздо меньше, чем сейчас, десять лет спустя. Алгоритмы, которыми собирали первый человеческий геном, значительно проще тех, о которых мы будем говорить в дальнейшем. Однако первый геном всё-таки собрали; может быть, весь алгоритмический прогресс – это никому не нужный миф, и вполне хватило бы старых программ?
Невероятно, но факт: «старые» секвенаторы (первого поколения, сэнгеровские) выдают значительно более подходящие для сборки данные, чем «новые» (второго поколения). Это в основном выражается в длине ридов (reads), тех участков ДНК, которые удаётся последовательно прочесть, и которые, собственно, и нужно собрать в одну большую строчку. Секвенаторы первого поколения выдавали риды длиной более пятисот нуклеотидов, обычно около тысячи. Современные секвенаторы выдают пары ридов, каждый из которых имеет длину около ста нуклеотидов.
На таком уровне становится важной и цена алгоритмической стороны вопроса. Чтобы сборка геномов не занимала дольше и не стоила дороже, чем само их секвенирование, нужно разработать очень быстрые алгоритмы для решения задачи сборки. Об этом пойдет речь в следующей статье.
СОДЕРЖАНИЕ
Лабораторный рабочий процесс
Типичный рабочий процесс mNGS состоит из следующих шагов:
Приложения
Метагеномные подходы использовались для выявления инфекций в древних останках, обнаружения новых вирусных патогенов и характеристики вирома человека как в здоровом, так и в болезненном состоянии, а также для судебной экспертизы.
В частности, применение клинической метагеномики на сегодняшний день включало диагностику инфекционных заболеваний для различных синдромов и типов образцов, анализ микробиома как в болезненном, так и в здоровом состоянии, характеристику реакции человеческого хозяина на инфекцию с помощью транскриптомики и идентификацию опухолеспецифических вирусов и их вирусов. геномная интеграция ситтес.
Помимо диагностики инфекционных заболеваний, внедрение mNGS (метагеномное секвенирование следующего поколения) в клинических лабораториях идет медленно, и большинство приложений еще не внедрены в повседневную клиническую практику. Тем не менее, широта и потенциальная клиническая полезность этих приложений, вероятно, в ближайшем будущем преобразят сферу диагностической микробиологии.
Диагностика инфекционных заболеваний
Целевой анализ выполняется путем обогащения отдельных генов или участков генома. Этот подход значительно увеличивает количество считываний патогенов в данных последовательности. Из-за этого чувствительность к обнаружению целевых микроорганизмов обычно увеличивается, но это связано с ограничением круга потенциальных патогенов, которые могут быть идентифицированы.
Традиционный метод заключается в постановке дифференциального диагноза на основе истории болезни пациента, клинической картины, результатов визуализации и лабораторных исследований. Но здесь предлагается другой способ диагностики; Метагеномное секвенирование следующего поколения (NGS) является многообещающим методом, поскольку с помощью одного анализа можно определить полный спектр потенциальных причин (вирусных, бактериальных, грибковых и паразитарных).
Ниже приведены некоторые примеры применения метагеномного секвенирования в диагностике инфекционных заболеваний.
Примеры
Диагностика менингита и энцефалита
Традиционный метод, который используется для диагностики инфекционных заболеваний, в некоторых случаях подвергается сомнению: нейровоспалительные заболевания, отсутствие диагностических тестов на редкие патогены и ограниченный объем и доступность образцов центральной нервной системы (ЦНС) из-за требований к инвазивные процедуры. Из-за этих проблем некоторые анализы предлагают другой способ диагностики, а именно метагеномное секвенирование следующего поколения (NGS); это многообещающий метод диагностики, поскольку с помощью одного исследования можно определить широкий спектр потенциальных причин (бактериальных, вирусных, грибковых и паразитарных). Подводя итог, можно сказать, что NGS может идентифицировать широкий спектр патогенов в одном тесте.
В некоторых статьях они оценивают клиническую полезность метагеномного NGS для диагностики неврологических инфекций параллельно с обычным микробиологическим тестированием. Было замечено, что самый высокий диагностический результат был результатом комбинации метагеномного NGS CSF и обычного тестирования, включая серологическое тестирование и тестирование типов образцов, отличных от CSF.
Более того, некоторые результаты различных исследований показали, что неврологические инфекции остаются недиагностированными у части пациентов, несмотря на обычное тестирование, и они демонстрируют потенциальную полезность клинического метагеномного тестирования NGS у этих пациентов.
Результаты метагеномного NGS также могут быть ценными, даже если они согласуются с результатами обычного тестирования, не только обеспечивая уверенность в правильности диагноза, полученного обычным способом, но и потенциально обнаруживая или исключая коинфекции, особенно у пациентов с ослабленным иммунитетом.
Изучение устойчивости к противомикробным препаратам
Функциональная метагеномика позволила открытие нескольких новых механизмов устойчивости к противомикробным препаратам и их родственных генов, один из таких примеров являются недавно обнаруженным тетрациклином механизма сопротивления от тетрациклина destructases.
В заключение важно учитывать не только последовательность и механизм гена устойчивости к противомикробным препаратам, но также геномный контекст, виды бактерий-хозяев и географическое положение ( метагеном ).
Клинические анализы микробиома
Недавно произошел переход от целевого секвенирования гена 16S рРНК к использованию mNGS для характеристики микробиома человека. Это идет рука об руку с повышением осведомленности о важной роли микробиома в различных состояниях болезней. Несмотря на то, что ни одно исследование на основе микробиома не было одобрено для диагностики или лечения заболевания. В основном это связано с неполным пониманием сложности микробиома и того, как он связан с определенными заболеваниями.
Анализ реакции человека-хозяина
Знание ответов хозяина имеет важное перспективное значение при диагностике инфекционных заболеваний. По этой причине одним из наиболее важных возможных приложений клинической метагеномики является характеристика реакции человека-хозяина на инфекцию с помощью транскриптомики и идентификация вирусов, ассоциированных с опухолью, и сайтов их геномной интеграции.
Анализ RNAseq имеет множество других целей и применений, таких как выявление новых или недооцененных взаимодействий между хозяином и микробом непосредственно из клинических образцов, постановка косвенного диагноза на основе патоген-специфической реакции человека-хозяина и различение инфекционных и неинфекционных причин острого заболевания. болезнь.
Приложения в онкологии
В онкологии полногеномные или направленные подходы NGS для идентификации мутировавших генов могут использоваться для одновременного обнаружения вирусов, связанных с раком (например, вирусов герпеса, папилломавирусов и полиомавирусов), и / или для сбора информации о взаимодействии между вирусом и его хозяином.
До сих пор Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA) одобрило клиническое использование двух панелей NGS для выявления действенных геномных аберраций в образцах опухолей. Добавление специфических вирусных зондов позволяет обнаруживать считывания, соответствующие как интегрированным, так и экзогенным вирусам. Собранные данные об интегрированных или активных вирусных инфекциях при раке важны для профилактического или терапевтического лечения целевыми противовирусными и химиотерапевтическими препаратами.
В будущем mNGS внеклеточной ДНК из жидкого биоптата, например плазмы, может быть полезен для выявления рака на ранних стадиях и диагностики инфекции у пациентов с ослабленным иммунитетом.
Вызовы
Клиническая полезность
Молекулярные диагностические тесты предоставляют достаточно экономичные и быстрые (около 2 часов рабочего времени) средства для диагностики наиболее распространенных инфекций. Однако почти все стандартные микробиологические тесты, используемые в настоящее время, выявляют только один или ограниченную группу патогенов за раз или требуют успешного культивирования микроорганизмов из клинического образца. Напротив, в то время как тесты NGS, используемые в настоящее время, не могут сравниться с обычными тестами в отношении скорости (только цикл секвенирования на стандартном приборе Illumina занимает> 18 часов), mNGS может активировать широкий спектр патогенов (вирусы, бактерии, грибки и / или паразиты). ) для идентификации из культуры или непосредственно из клинических образцов на основе однозначно идентифицируемых последовательностей ДНК и / или РНК.
На сегодняшний день несколько исследований дали представление о перспективах NGS в клинических условиях и в условиях общественного здравоохранения. Несмотря на это, большинство полученных данных о результатах метагеномики состоят из отчетов о случаях, которые опровергают растущий интерес к диагностической метагеномике. Например, NGS использовался для клинической диагностики нейролептоспироза у 14-летнего мальчика в критическом состоянии с менингоэнцефалитом; этот случай был первым, кто продемонстрировал возможную полезность метагеномного NGS (mNGS) в предоставлении клинически действенной информации, успешный диагноз побудил к соответствующему целевому лечению антибиотиками и возможному выздоровлению пациента.
Таким образом, аргумент в пользу клинической применимости метагеномных микроорганизмов в конечном итоге основывается только на наиболее трудно диагностируемых случаях или для пациентов с ослабленным иммунитетом, у которых спектр потенциальных патогенов шире. Соответственно, в клинической микробиологической лаборатории этот подход не получил широкого распространения, поскольку постановка диагноза с помощью метагеномики все еще в основном полезна только в контексте описания случая, но не для истинной повседневной диагностической цели.
Кроме того, в случае обнаружения потенциальных новых инфекционных агентов обычно публикуются только положительные результаты, хотя подавляющее большинство секвенированных случаев являются отрицательными, что приводит к очень предвзятой информации. Кроме того, в большинстве открытий, основанных на метагеномике, которые предшествуют текущей диагностической работе, даже упоминаются известные агенты, обнаруженные при скрининге нераскрытых случаев на совершенно новые причины.
Лабораторная валидность
На сегодняшний день большинство опубликованных тестов было проведено без проверки и без предоставления отчетов. «Стандартное микробиологическое тестирование», которому образцы подвергаются перед метагеномикой, является вариативным и не включает тестирование полимеразной цепной реакции с обратной транскрипцией (RT-PCR) на распространенные респираторные вирусы или стандартное тестирование 16S / ITS PCR.
Учитывая относительную стоимость проверки и проведения метагеномного тестирования по сравнению с тестированием ПЦР с 16S / ITS, второй вариант считается более простым и эффективным. Потенциальным исключением из теста 16S / ITS является кровь, учитывая огромное количество доступной последовательности 16S, что делает точные отсечки для диагностических целей проблематичными.
Кроме того, почти все организмы, обнаруженные метагеномикой, для которых существует связанное лечение и, таким образом, действительно поддаются действию, также обнаруживаются с помощью тестирования 16S / ITS (или 16S / ITS-NGS). Это ставит под сомнение полезность метагеномики во многих диагностических случаях.
Одним из основных моментов для достижения лабораторной валидности является наличие эталонных стандартов и контролей при выполнении анализов mNGS. Они необходимы для обеспечения качества и стабильности этой техники с течением времени.
Большинство доступных метагеномных эталонных материалов предназначены для конкретных приложений (например, ZymoBIOMICS Microbial Community Standard [1] для анализа микробиома и бактериальной и грибковой метагеномики) и / или ориентированы на более ограниченный спектр организмов (например, Национальный институт стандартов и технология (NIST) [2] справочные материалы для обнаружения смешанной микробной ДНК, которые содержат только бактерии) Таким образом, эти материалы могут быть неприменимы для нецелевых анализов mNGS.
Тем не менее, отсутствие общепринятых эталонов для mNGS затрудняет сравнение результатов анализа в разных лабораториях. Существует острая потребность в стандартизированных эталонных организмах и геномных материалах для облегчения таких сравнений и определения оптимальных методов анализа.
Чувство и чувствительность
В лабораториях клинической микробиологии количественное определение микробной нагрузки считается рутинной функцией, поскольку оно связано с серьезностью и прогрессированием заболевания. Для достижения хорошего количественного определения необходима высокая чувствительность метода.
Помимо проблем с мешающими веществами, особенно в области диагностики, важны точные количественные данные и чувствительность, поскольку путаница в результатах может повлиять на третье лицо, на пациента. По этой причине в настоящее время практикующие врачи должны быть хорошо осведомлены о проблемах с подменой индексов, связанных с секвенированием Illumina, что может привести к отслеживанию образцов с неправильным штрих-кодом.
Поскольку метагеномика обычно используется для пациентов, у которых все остальные тесты до настоящего времени были отрицательными, вопросы, связанные с аналитической чувствительностью, были менее уместными. Но для исключения причин инфекций, являющихся одной из наиболее важных ролей для клинической метагеномики, важно иметь возможность выполнять достаточно глубокое секвенирование для достижения адекватной чувствительности. Одним из способов могла быть разработка новых методов подготовки библиотек.
Соображения стоимости
Несмотря на то, что произошло существенное сокращение затрат на создание данных о последовательностях, общая стоимость реагентов для определения последовательности для секвенирования остается довольно высокой. Фактически, монополия Illumina на высококачественные реактивы для секвенирования нового поколения и потребность в точном и глубоком секвенировании в метагеномике означают, что одни только реактивы для секвенирования стоят больше, чем одобренные FDA панели синдромного тестирования. Также необходимо учитывать дополнительные прямые затраты на метагеномику, такие как извлечение, подготовка библиотеки и вычислительный анализ.
Это приводит к общей стоимости от нескольких сотен до тысяч долларов на анализируемый образец, что выше, чем у многих других клинических тестов.
В целом, метагеномное секвенирование наиболее полезно и экономически эффективно для обнаружения патогенов, когда выполняется хотя бы один из следующих критериев:
Нормативные аспекты
Каждая клиническая лаборатория должна быть строго регламентирована, а общие лабораторные и испытательные требования должны применяться ко всем молекулярным диагностическим тестам, сообщаемым для оказания помощи пациентам. Постоянный мониторинг особенно важен для анализов mNGS, чтобы проверить приемлемую производительность с течением времени и исследовать нетипичные результаты. Примерами важных шагов по обеспечению качества являются: первоначальные проверки качества образца, параметры библиотеки (концентрация и распределение по размеру), создание данных последовательности (плотность кластеров и Q-оценка), восстановление внутренних контролей и эффективность внешних контролей. Данные валидации, полученные в результате разработки и внедрения анализа, должны быть зарегистрированы и предоставлены лабораторным инспекторам или представлены на утверждение в регулирующие органы, такие как FDA в США или Европейское агентство по лекарственным средствам (EMA) в Европе.
Во время анализов mNGS мониторинг осуществляется с использованием образцов внутреннего контроля, внутрипробежных контрольных образцов, мазковых тестов на загрязнение и периодических проверок квалификации. Всегда необходимы дальнейшие исследования неожиданных или необычных результатов, и идентификация микроорганизмов, которые не были идентифицированы ранее в лаборатории, должна быть независимо подтверждена, обычно с помощью клинических справок или лабораторных исследований общественного здравоохранения. Кроме того, важно определить клиническое значение этих новых или атипичных организмов, и эти результаты должны быть сообщены и обсуждены с поставщиками медицинских услуг с учетом их потенциальной патогенности, а также для дальнейшего тестирования и вариантов лечения.
Будущие перспективы
Технологические достижения в методах подготовки библиотек, генерации последовательностей и вычислительной биоинформатики приводят к более быстрому и полному метагеномному анализу с меньшими затратами. В то время как существующие ограничения, такие как снижение чувствительности к обнаружению патогенов в клинических образцах с высоким фоном нуклеиновых кислот или с чрезвычайно низкими титрами патогенов, предполагают, что mNGS вряд ли заменит традиционные методы диагностики в краткосрочной перспективе, возможно, он может быть дополнительным или важный тест в определенных клинических ситуациях.
Более того, в мире, где постоянно появляются патогены, вполне вероятно, что тестирование на основе mNGS будет играть важную роль в мониторинге и отслеживании новых вспышек заболеваний. Поскольку сети наблюдения и платформы быстрой диагностики, такие как секвенирование нанопор, будут развернуты во всем мире, появится возможность обнаруживать и сдерживать вспышки инфекций на гораздо более ранней стадии, спасая жизни и снижая затраты.