Мусорное днк что это
Ученые выяснили, зачем нужна «мусорная» ДНК
Исследователи из Института наук о жизни при Университете Мичигана и Медицинского института Говарда Хьюза определили, как сателлитная ДНК, которая считалась «мусорной ДНК», играет важнейшую роль в сборке генома. Выводы ученых, опубликованные в журнале eLife, показывают, что генетический «мусор» играет жизненно важную функцию обеспечения правильного расположения хромосом внутри ядра клетки, что необходимо для выживания клеток. И эта функция, по всей видимости, сохранилась у многих видов.
Зачем нужна «мусорная» ДНК?
Перицентромерная сателлитная ДНК состоит из очень простой и часто повторяющейся последовательности генетического кода. И хотя на ее долю приходится значительная часть нашего генома, сателлитная ДНК не содержит каких-либо конкретных инструкций по созданию каких-либо конкретных белков. Более того, ее повторяющийся характер, как полагали, делает геном менее стабильным и более уязвимым для повреждений или болезней. До недавних пор ученые считали, что «мусорная», или «эгоистичная», ДНК не играет никакой роли и не служит никакой цели.
«Мы не могли просто так смириться с мыслью о том, что это просто геномный мусор», говорит Юкико Ямашита, профессор исследований в LSI и ведущий автор исследования. «Если она нам не нужна и мы не получаем от нее ничего, эволюция бы наверняка от нее избавилась. Но этого не произошло».
Ямашита и ее коллеги решили посмотреть, что произойдет, если эта клетки не будут использовать перицентромерную сателлитную ДНК. Поскольку она существует в виде длинных повторяющихся последовательностей, ученые не могут просто мутировать или вырезать всю ДНК из генома. Вместо этого они поручили дело белку D1, который связывается с сателлитной ДНК.
Ученые удалили D1 из клеток широко используемого для испытаний организма, Drosophila melanogaster (плодовая мушка). И тут же обнаружили, что зародышевые клетки — которые обычно превращаются в сперму или яйцеклетки — умирают.
Дальнейший анализ показал, что умирающие клетки формировали микроядра или крошечные почкования за пределами ядра, которые включали части генома. Без всего генома, инкапсулированного в ядро, клетки не могли выжить.
Ученые считают, что белок D1 связывается с сателлитной ДНК, собирая все хромосомы в ядре. Если белок D1 не может захватить сателлитную ДНК, клетка теряет способность образовывать полное ядро и умирает. Дальнейшие испытания показали, что сателлитная ДНК необходима для выживания клеток у разных видов, которые встраивают ДНК в ядро, включая и людей.
Ученые объяснили задачу «мусорной» ДНК
Новое исследование, проведенное в лаборатории члена Института Уайтхеда Юкико Ямаситы подтверждает, что «мусорная» ДНК играет ключевую роль в видообразовании.
Читайте «Хайтек» в
Более 10% нашего генома состоит из повторяющихся, считавшихся бессмысленными участков генетического материала, которые не кодируют никаких белков.
В серии работ за несколько лет член института Уайтхеда Юкико Ямасита и его коллеги доказали, что так называемая мусорная ДНК не такая бесполезная, как кажется на первый взгляд. На самом деле она играет важную роль в клетке: эта ДНК работает с клеточными белками, чтобы сохранить все отдельные хромосомы клетки вместе в одном ядре.
Во время своей работы авторы изучили, как эта часть ДНК влияет на фертильность и выживание видов, тогда у ученых появился первый намек на то, что эти повторяющиеся последовательности могут играть определенную роль в видообразовании.
Чтобы это проверить, исследователи удалили белок под названием Prod, который связывается с определенной последовательностью «мусорной» ДНК у плодовой мухи Drosophila melanogaster, в результате их хромосомы рассеялись за пределами ядра в крошечные шарики клеточного материала и насекомые погибли.
Если бы этот фрагмент «мусорной» ДНК был необходим для выживания одного вида, но отсутствовал у другого, это могло бы означать, что два вида мух со временем развили разные последовательности для одной и той же роли. И поскольку «мусорная» ДНК сыграла определенную роль в сохранении всех хромосом вместе, исследователи задались вопросом, могут ли эти эволюционные различия быть одной из причин, по которой разные виды репродуктивно несовместимы.
Чтобы понять, как различия в спутниковой ДНК могут привести к репродуктивной несовместимости, исследователи решили сосредоточиться на двух ветвях генеалогического древа плодовой мухи: классической лабораторной модели Drosophila melanogaster и ее ближайшего родственника, Drosophila simulans. Эти два вида разошлись друг от друга около 2-3 млн лет назад.
Исследователи могут скрестить самку Drosophila melanogaster с самцом Drosophila simulans, но в результате потомство либо бесплодно, либо умирает.
Авторы разводили мух, а затем изучали ткани потомства, чтобы понять, почему так происходит. Когда авторы посмотрели на гибридные ткани, то выяснили, что их фенотип был точно таким же, как если кто-то нарушил «мусорную» ДНК чистого вида. Хромосомы были разбросаны, а не инкапсулированы в одно ядро.
В результате авторы сделали вывод, что «мусорная» ДНК регулярно мутирует и буквально задает стратегию скрещивания для разных видов.
Что такое ДНК, или почему каждый из нас наполовину банан
Эту аббревиатуру мы слышим довольно часто, но мало кто пытается вникнуть и понять, что же такое ДНК. ДНК расшифровывается как дезоксирибонуклеиновая кислота, но понимания это особо не прибавляет. Будем разбираться дальше.
ДНК – это полимерная молекула. С точки зрения химии – это двойная спираль, которая складывается из нескольких блоков нуклеотидов, повторяющихся много-много раз. А две спирали связаны между собой водородными связями. На самом деле ДНК отнесли к разряду молекул только лишь для удобства, поскольку она во много раз больше стандартных молекул.
Существует всего 4 вида нуклеотидов: аденин, тимин, гуанин, цитозин. И именно в их последовательности и зашифрована генетическая «инструкция» для развития живого организма, то есть вся генетическая информация. Именно молекула ДНК сообщает каждой клетке нашего организма, какие белки и в каком количестве необходимо производить.
Цепочки ДНК закручиваются в спирали тоже неспроста. Это помогает уменьшить длину спирали в 5-6 раз, чтобы более компактно «упаковать» всю генетическую информацию. Ученые подсчитали, что если раскрутить спирали ДНК, то они растянутся на 16 млрд километров (это расстояние от Земли до Плутона и обратно). А если кто-то захочет напечатать геном человека, то на это уйдет 50 лет, если непрерывно набирать текст на компьютере по 8 часов каждый день.
В 99.9% ДНК всех людей на планете одинаковы, а наши различия обусловлены только 0,1%! Удивительно, не так ли? На этом примере очень хорошо понятно, какое огромное количество информации заложено в ДНК, если даже 0,1% отвечает за такое огромное количество различий между всеми людьми на планете. Да что там с людьми. Это покажется комичным, но 50% человеческого ДНК полностью схожа с ДНК банана, а число генов у человека ненамного больше генов у круглого червя.
Разумеется, одна, пусть даже очень большая двойная спираль, не может вместить в себя всю генетическую информацию о человеческом организме. Именно поэтому цепочки составляют пару, которая внешне напоминает букву «Х». Уникальная последовательность из нуклеотидов в одной из двух спиралей ДНК называется геном. Если даже незначительно изменить последовательность в нем, то ген будет поврежден или разрушен, в результате у человека может возникнуть генетическое заболевание.
Что такое ДНК человека
ДНК – что это такое простыми словами и как она устроена? Физически это макромолекула, которая не только хранит в себе наследственную информацию, но и является подробной инструкцией по развитию всего организма условно из одной универсальной клетки.
Если сравнить человека с компьютером, а все многообразие биологической жизни – с различными формами роботизированных компьютеров, ДНК в этом сравнении будет биологическим языком программирования. С той лишь разницей, что биологические виды устроены намного сложнее и совершеннее самых передовых компьютеров.
К примеру, все биологические виды обладают уникальной способностью деления и преобразования клетки. Фактически в ходе самовоспроизводства клетки биомасса не только материализуется сама из себя, но и физически преобразовывается под решение множества узкоспециализированных задач. А все многообразие живых видов, их форм, уникальных способностей исходит из деления одной универсальной клетки. Одно это уже уходит далеко за грань всех современных генетических достижений.
История открытия
Фактически открытие дезоксирибонуклеиновой кислоты произошло дважды. Первым открытие молекулы совершил Иоганн Фридрих Мишер в 1869 году. Будучи швейцарским биологом и физиологом, он из клеток, содержащихся в гное, смог выделить большую молекулу с высоким содержанием азота и фосфора. Свое открытие он назвал нуклеин, а позже – нуклеиновой кислотой, когда были открыты ее кислотные свойства.
Первоначально ученые считали, что основная функция нуклеиновой кислоты состоит в хранении фосфора. А предположения, что она может содержать в себе наследственную информацию, вызывали насмешки, поскольку структура молекулы казалась им слишком простой и однообразной для таких функций. Также считалось, что наличие дезоксирибонуклеиновой кислоты свойственно только животным клеткам, а в растениях содержится только РНК. Но в 1934–1935 годах советские ученые-биологи А. Н. Белозерский и А. Р. Кизель это наглядно опровергли и опубликовали результаты своих работ в советских и мировых научных журналах.
Повторное открытие ДНК уже в качестве носителя наследственной информации и не только было совершено в 1944 году. Группа исследователей, состоящая из Освальда Эвери, Колина Маклауда и Маклина Маккарти, проводила эксперименты с трансформацией бактерий и доказала, что основную роль в этом процессе играет дезоксирибонуклеиновая кислота.
Значение ДНК в медицине
Открытие ДНК в медицине, расшифровка этой кислоты – это события, значение которых трудно преувеличить. Большая часть современных прорывных технологий и исследований прямо или косвенно базируется на этом фундаментальном для науки открытии. Не знай мы про гены, не было бы многих современных методов лечения и диагностики, многих технических изобретений. По сути, не было бы и генетики как полноценной самостоятельной науки. Застопорилось бы изучение клетки и того, как она функционирует. А без этих знаний и множество открытий в этой области было бы невозможно.
На сегодняшний день знания о генах помогают многим людям:
Молекула ДНК
ДНК-определение, поиск ее места в уже систематизированном знании не так прост. По существу, к молекулам ДНК отнесли условно, для удобства. Молекула ДНК – это структура, превосходящая размером обычные молекулы. И она имеет уникальную спиральную структуру. В то время как физики и химики считают молекулами электрически нейтральные частицы, состоящие из одного и более атомов, связанных ковалентными связями. Либо же, по результатам международного съезда химиков 1860 года, молекулой считается наименьшая частица вещества, обладающая всеми его химическими свойствами.
Структура ДНК
У всех на слуху, что дезоксирибонуклеиновая кислота имеет двуспиральную структуру. В интернете, в фильмах, в рекламе – всюду можно встретить ее многократно увеличенное изображение. Но что ответить, если попросят объяснить подробнее. Это уже более сложный вопрос. Давайте разберемся лучше, из чего эта структура состоит:
В цепочках нуклеотидов присутствуют и совсем не изученные структуры, которые, на первый взгляд, никак не участвуют в физиологических процессах. Эти довольно обширные участки называют мусорными.
Состав ДНК
Если говорить о составе ДНК более подробно, то нуклеотиды – это базовый структурный элемент, кирпичики, из которых состоят обе цепи спирали. Нуклеотиды подразделяются на 4 разновидности: аденин, тимин, гуанин и цитозин. И всего четыре этих нуклеотида осуществляют запись всей наследственной информации и составляют все известные гены.
Закручиваются в спираль обе цепочки генов тоже не просто так. Из всех четырех различных нуклеотидов находиться напротив друг друга в разных цепочках они могут только двумя парами: аденин-тимин и гуанин-цитозин. В науке эти пары называются комплементарными.
Между парными нуклеотидами возникает крепкая водородная связь. При этом связь аденином и тимином немного слабее, чем между гуанином и цитозином. Но закручиваются цепочки в спираль по иным причинам:
Исследования показали, что скручивание помогает сократить длину цепочки генов в 5-6 раз. А во время суперспирализации (такое тоже бывает) длина цепочки может сократиться в целых 30 раз!
Помимо того, что пара цепочек генов закручена в спираль, существует и суперспирализация. За это явление отвечают гистоновые белки, которые имеют форму катушек для ниток. Уже закрученная двойная спираль наматывается на эти белки, как нитка. Что не оставляет сомнений в том, что спиральность как таковая специально служит тому, чтобы более компактно упаковать наследственную информацию в клетку.
Роль в клетке
Конечно, одна, даже большая двойная спираль не способна вместить в себя весь объем информации, необходимый для такого сложного проекта, как человеческое тело. Возможно, поэтому эти цепочки объединены в пары, что делает их похожими на букву «Х». Хромосомы, в свою очередь, тоже парные, и их у человека 46 пар.
Помимо того, что хромосома содержит в себе подробную инструкцию по функционированию клетки, она же путем активации актуальных моменту генов провоцирует клетку вырабатывать определенные белки с самыми различными свойствами. Например, в борьбе с опухолями активно участвует ген старости, который старит ее недоброкачественные клетки и не дает им бесконечно делиться.
Что такое нуклеотиды
Нуклеотиды – это четыре элемента, которые являются основой биоязыка программирования цепи ДНК, так же, как ноль и единица являются основой ассемблера (первого из языков программирования). Уникальная последовательность нуклеотидов в одной из двух цепочек ДНК является геном. Если хотя бы немного изменить эту последовательность, то ген уже будет поврежден или разрушен.
Синтез белка
Синтез белков – это ключевое таинство всей физиологии человека. Именно белки запускают и контролируют все процессы в организме на клеточном уровне. Если полностью изучить, какие гены и группы генов в каких случаях запускают синтез белков и сами эти белки, то наука научится полностью настраивать и перенастраивать весь человеческий организм.
На сегодняшний день нам известно, что, реагируя на различные раздражители, в двойной спирали дезоксирибонуклеиновой кислоты активируются гены или участки с генами. Информация с этих участков копируется на РНК (рибонуклеиновая кислота), и уже РНК переносит информацию из ядра клетки, в котором находятся хромосомы, в саму клетку. РНК выступает своего рода глашатаем, который читает указ всем работникам. Так РНК заставляет клетку вести себя тем либо иным образом и вырабатывать различные белки.
Что такое РНК
Если ДНК – это кабинет министров, которые всем управляют и принимают все решения, то РНК – это пресс-атташе. Она извещает всех о новых распоряжениях и указах и раздает инструкции на местах.
РНК – это рибонуклеиновая кислота, которая может копировать формы различных участков дезоксирибонуклеиновой кислоты и транспортировать их из ядра клетки в ее внутриклеточное пространство.
Расшифровка ДНК
ДНК-расшифровка стала возможна только благодаря открытию полимеразной цепной реакции, и происходит она следующим образом:
Проба, содержащая образцы дезоксирибонуклеиновой кислоты, быстро нагревается. Это необходимо, чтобы двойная спираль раскрутилась и распалась на две самостоятельные нити.
К интересующему исследователей участку цепи генов прилепляется полимераза. Эта процедура происходит при немного более низких температурах.
Полимераза активирует деление пойманного участка – так происходит синтез необходимых для изучения участков генов.
Участки пропитываются специальной краской, которая светится при воздействии направленного пучка лазера. Так получают картину гена, которую можно изучать и расшифровывать.
Таким образом, изучение ДНК стало доступным инструментом, который позволяет людям узнать о себе много нового и может помочь сохранить здоровье, избавиться от уже имеющихся заболеваний, похудеть, сохранить молодость и улучшить качество своей жизни!
Второй язык ДНК
Второй язык ДНК
ДНК не то, чем кажется. И то, чем кажется, тоже. Но не всегда.
иллюстрация автора статьи
Автор
Редакторы
Статья на конкурс «Био/Мол/Текст»: ДНК — основа жизни. В «сердце» клеточного ядра, в самом главном «узле» замысловатых путей метаболизма, в основании потока генетической информации покоится эта молекула — хранилище данных. Но только ли покоится? И ограничивается ли такое крупное и очень раннее изобретение эволюции «инертной» функцией хранения информации? Чтобы разобраться с этими вопросами, мы рассмотрим различные аспекты организации этой молекулы. Каждый из них может «выйти на первый план» при смене ролей ДНК — она может быть и матрицей для копирования, и местом хирургически точной посадки белков или сложных и динамичных взаимодействий с ними. В центре нашего внимания — свойства промоторов, участков, на которых начинается процесс транскрипции — «переписывания» ДНК в форму РНК. Место действия — крошечный геном бактериофага Т7 и его минималистические, очень похожие и такие различные промоторы.
Конкурс «Био/Мол/Текст»-2020/2021
Эта статья участвовала в конкурсе «Био/Мол/Текст»-2020/2021 в номинации «Своя работа» и будет опубликована в журнале «Природа».
Генеральный партнер конкурса — ежегодная биотехнологическая конференция BiotechClub, организованная международной инновационной биотехнологической компанией BIOCAD.
Спонсор конкурса — компания SkyGen: передовой дистрибьютор продукции для life science на российском рынке.
Спонсор конкурса — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.
Место ДНК в клетке и обществе
Представления о ДНК сейчас есть у любого. Рэперы упоминают ее в своих текстах, sci-fi-фильмы и сериалы показывают нам ДНК разноцветной и вращающейся, а ее имя и образ мелькают в дизайне и рекламе — виртуальных и уличных. Не столько с сожалением, сколько с иронией отметим: образ, порой напрочь потерявший асимметрию желобков и правильное число оснований на виток, не говоря уже о правозакрученности. А ведь есть еще и ДНК стиля или бренда. Действительно, двухспиральный, копирующийся, таящий информацию о самом сокровенном образ плотно «лег в руку» творческих людей. Но самое, пожалуй, неопровержимое доказательство врастания ДНК в культуру и язык — ее собственная пиктограмма. Мессенджеры даже предлагают данный значок для обозначения слова «наука» наряду с учеными в белых халатах, пробирками и телескопами (рис. 1).
Рисунок 1. Пиктограммы ДНК в различных мессенджерах и социальных сетях сделают разговоры о генетике короткими и образными. Важно только не забывать — ДНК не всегда длиной в несколько витков и не сугубо «слева направо вверх».
Всё это радует и служит популяризации науки, однако не стоит забывать что в жизни — в биологической жизни — ДНК — это, чаще всего, правозакрученная двойная спираль, шаг которой охватывает примерно 10 нуклеотидов.
В тени молекулярной догмы
Итак, дезоксирибонуклеиновая кислота чрезвычайно важна и хранит информацию — а именно генетическую информацию. Чтобы ее ценное содержимое не оставалось «вещью в себе», ДНК необходимо записывать, копировать и считывать. Такие «информационные связи» ДНК были емко сформулированы Фрэнсисом Криком в его центральной догме молекулярной биологии (обозначим кратко — ЦДМБ) вскоре после установления знаменитой двухспиральной структуры молекулы в 1953 г. Согласно этой «научной догме» информация, сохраненная в последовательности нуклеотидов ДНК, может:
И уже РНК далее способна (хотя и не обязательно — может просто функционировать в клетке сама по себе):
или в особом, описанном позже, случае
Рисунок 2. Центральная догма молекулярной биологии
Простая и легко запоминающаяся схема ЦДМБ имеет всего 3 блока (соответствуют трем типам биополимеров) и 4 стрелки (соответствуют процессам, связанным с переносом информации). Она действительно стала столпом в центре молекулярной биологии, придала генетике новый смысл и оказалась «точкой роста» бесчисленных метаболических путей биохимии. И в центре центральной догмы — молекула ДНК! Однако рассматривая в ней блок ДНК, стоит помнить: «ДНК» здесь — это не вся и не всякая ДНК. Речь идет только о кодирующей ДНК, нуклеотидной последовательности которой предстоит быть транскрибируемой, а далее еще и транслируемой (причем не всегда). Репликация, впрочем, копирует всю молекулу, не разбирая областей разного типа. Зато точки ее начала — óриджины (от англ. origin — «начало») — имеют вполне определенное положение.
Что же осталось в тени процессов, объединенных информационными потоками центральной догмы? Что бы это ни было, ему есть где развернутся. На некодирующие области приходится большая часть эукариотических геномов (в случае человека — увесистые 98%). У прокариот их поменьше — в среднем, 20%. По началу такие области, не содержащие послание для передачи в РНК, называли мусорной ДНК (junk DNA) [1] и относились к ним с пренебрежением. Прошли годы, методики совершенствовались, знания неуклонно копились. И теперь мы знаем: в этом сумраке таится много полезного. Что же именно и в какой пропорции?
В некодирующей области ДНК есть, скажем, мобильные генетические элементы (прежде всего, способные перемещаться по геному транспозоны [2]), тандемные повторы разного сорта (от сателлитов до микросателлитов) [3] и прочее. Наконец, огромное значение имеют области ДНК, нужные для регуляции. Действительно, помимо блоков, ЦДМБ имеет еще и стрелки — они обозначают процессы передачи информации, вполне конкретные биохимические процессы.
Их делают возможными ферменты, по своей природе — белки. Целый «ансамбль» белков требуется для молекулярной хореографии при репликации, РНК-полимераза и ее свита необходимы при транскрипции и т.д. Важно помнить: ДНК — также активный и деятельный участник этих процессов [4].
Что регулирует эти сложные процессы, что управляет ими? Специфичное, хорошо оркестрованное взаимодействие ДНК и ДНК-связывающих белков. Дело в том, что в живой клетке (ткани, природе. ) все должно быть динамично и управляемо. Это жизненно необходимо и для разумного реагирования на удары судьбы (стрессы), и для разного рода взаимодействий клеток, и для индивидуального развития (онтогенеза).
И ДНК в этих межмолекулярных взаимодействиях подойдет не всякая: вряд ли транскрипция случайного участка генома станет разумной стратегией. В этом месте кажущаяся монотонной бесконечной ниткой с бусинами-нуклеотидами ДНК должна заиграть в нашем воображении новыми красками. В фокусе нашего внимания оказываются участники регуляции «со стороны ДНК» — ориджины репликации, промоторы, сайты формирования нуклеосом и т.п. И здесь ДНК не отделается снисходительным «позволением себя считать». Ее специализированные области регуляции чувствительны и деятельны. Они «ощущают» происходящее вокруг них — могут изменять свое состояние при изменении условий среды или при приближении «нацеленного» на них белка [5].
Притча о слепых белках и ДНК
Безусловно, ДНК далеко до структурного разнообразия белков с их неисчислимыми фолдами, укладками и т.п. Однако и у нее можно выделить иерархию уровней организации: от первичной (последовательность нуклеотидов) через небольшое разнообразие вторичных и третичных структурных блоков до четвертичной. Последняя представляет собой надмолекулярные объединения — как между разными молекулами ДНК, так и между ДНК и ДНК-связывающими белками.
Кодирующая функция той части ДНК, которая служит «матрицей» для синтеза других биополимеров, связана с особой организацией. А именно — информативные части генов руководствуются особыми «правилами грамматики» генетического кода:
и некоторыми другими.
Все эти законы не действуют на некодирующей части генома. А действуют совсем другие и для каждого типа последовательности они, в общем, свои.
Итак, работа ДНК как матрицы реализуется на уровне ее нуклеотидной последовательности. Она сводится к прочтению последовательности нуклеотидов в качестве своеобразного сигнала — такая информация может рассматриваться в отрыве от «физической сущности», самой молекулы ДНК. Об этом очень емко сказал Леонард Адлеман: «ДНК по своей сути что-то цифровое» (DNA is essentially digital). Разумеется, такому хранилищу байтов безразличны более сложные уровни организации — здесь ДНК лучше вытянуться в нитку и быть одномерной.
Таковы принципы кодирования и хранения генетической информации, изображенные в виде блоков ЦДМБ. А как насчет способов ее воплощения, то есть перевода информации одного биополимера в другой, а также всех последующих этапов экспрессии генов? Что стоит за стрелками на схеме догмы, соединяющей квадраты? Большая биохимическая работа и сложные структурные основы. Эти процессы протекают во вполне физической реальности — на них согласованно работают многие ферменты, факторы. Вовлечены в эту 3D-хореографию и специализированные области ДНК. Что же делает их такими специализированными?
В первом приближении — им следует связывать белковые молекулы. Для этого служат опять-таки разные уровни организации регуляторных ДНК: особая последовательность, структура и физико-химические свойства.
С первичной структурой (другой способ обозначить ее — сказать «нуклеотидная последовательность») все вроде проще. Если ДНК-связывающий белок находит целевой сигнал (особую последовательность нуклеотидов), то для начала связывается в этой локации. Такой сигнал может быть строгим и однозначным, как, например, в случае рестриктаз с вполне определенным сигналом из небольшого числа нуклеотидов и четким же положением, по которому происходит расщепление ДНК относительно него (в чем, собственно, и состоит задача этих эндонуклеаз) (рис. 3).
Рисунок 3. Сайт специфичного и точного связывания важной рестриктазы EcoRI и место разреза — расщепления ДНК
рисунок автора статьи
С белками вроде факторов транскрипции (TF) все посложнее. Уровень аффинности — то, насколько конкретные регулирующие уровень транскрипции белки активно связывают участок ДНК, — значительно разнится. Области ДНК, в принципе способные вызвать интерес фактора транскрипции, должны соответствовать некоторому нестрогому «фотороботу» последовательности. В результате сайтами их связывания может стать целый спектр различных первичных структур. В ряде положений им следует иметь вполне конкретный нуклеотид, в других — можно позволить себе некоторую свободу замены, в третьих — нет особой разницы, что за мономер находится в данном положении. Такие местами-строгие-местами-не-очень требования к участку ДНК описывают позиционными весовыми матрицами и изображают в виде логотипов последовательности. В них высота соответствующей буквы отражает вероятность нахождения здесь данного нуклеотида либо долю сайтов с этим мономером для рассматриваемого набора (рис. 4).
Рисунок 4. Сайт связывания фактора транскрипции CEBPB
видят ДНК совершенно по-разному.
Картина напоминает притчу о слоне и трех слепых мудрецах. Кому-то достался бок, кому-то хвост или хобот. Однако ДНК-связывающих «мудрецов» в клетке существует огромное разнообразие, и спорить кто прав им ни к чему — это сугубо человеческое занятие.
Пo мере того, как ученые вникали в интимные стороны взаимодействий ДНК и ДНК-связывающих белков, они стали различать прямое (direct) и непрямое прочтения (indirect readout) нуклеотидной последовательности. В случае прямого прочтения распознавание и связывание двух биомолекул определяется теми парами оснований, которые, собственно, контактируют с белком. Здесь все понятно. Но уже довольно давно биологи стали отмечать: не вовлеченные в прямые взаимодействия нуклеотиды определяют стабильность и специфичность связывания. В этом и состоит непрямое прочтение.
В числе первых этот аспект распознавания описан на примере такого важного фактора транскррипции, как TATA-связывающий белок (TATA-binding protein, TBP). После этого последовало множество других примеров непрямого прочтения [6].
Но и этого мало: выделили также прочтение формы (shape readout) — оно определяется трехмерной формой дуплекса ДНК. В основе этого нового видения той же ДНК — вандерваальсовы и электростатические взаимодействия. Напомним, что прямое прочтение ДНК белком зависит от водородных связей, образованных конкретными нуклеотидами и аминокислотными остатками [7].
Едем дальше: поскольку для специфического связывания ДНК и белков им нужно найти друг друга в плотном и подвижном клеточном супе, начинать надо издалека. Для этого служат различные физико-химические параметры дуплекса, причем с довольно широким контекстом — влияние физики простирается довольно далеко. В определенных случаях — на тысячи пар оснований! Список важных для регуляторных ДНК качеств следует дополнить более крупномасштабной электростатикой, исходной изогнутостью и склонностью «прогибаться» под белком, термостабильностью и многими-многими (не преувеличение) другими.
Следующий пункт. Важность великого множества одних только физико-химических и структурных свойств (не забывая и первичную структуру!) связано с тем, что, скажем, транскрипция — процесс многостадийный, и на разных этапах одни параметры ДНК могут быть важнее других. Даже инициация транскрипции насчитывает несколько этапов: посадка белков, образование закрытого комплекса, плавление дуплекса (то есть расхождение цепей) с образованием открытого комплекса и т.д. Кстати, именно инициация транскрипции — в особенности на примере прокариотических промоторов и простых РНК-полимераз, — служит элементарной системой для изучения всей сложной кухни молекулярного узнавания [8], [9].
Игра «найди промотор»
Помимо развития фундаментальной науки — включая структурную биологию и молекулярную генетику — интерес к структурным и физическим основам ДНК-белковых взаимодействий растет и из насущной практической задачи. Речь об автоматизированной аннотации геномов: применении методов биоинформатики для предсказания положения участков ДНК различного типа. Данные на входе такого анализа сейчас как из рога изобилия сыплются из секвенаторов нового поколения (NGS) [10], и их нередко замедляют затруднения «сухой» части аннотирующего конвейера. Безусловно, неоценимую помощь ученым оказывают машинное обучение и анализ данных [11]. Однако проблема не только в их несовершенстве. Дело в том, что прямой учет последовательности («текста» и «букв») четко позволяет узнать кодирующие последовательности, организованные в виде триплетов. А вот с регуляторными участками все сложнее — структура и физико-химия ДНК определяются последовательностью в широком контексте, подчас неявно и противоречиво. Рассчитав профили разных свойств ДНК, настроив надлежащий размер скользящего окна и других параметров расчета вроде условий в клетке, мы можем лучше предсказывать «размытые» и плохо предсказываемые сайты для ДНК-связывающих белков. Из таких задач самые насущные — предсказание промоторов (давняя, но едва ли решенная проблема биоинформатики) и факторов транскрипции [8], [9], [12], [13].
«Бактериофаг системы Т7»
Прогресс в науках о живом знает немало научных революций и периодов прорывного развития. Такие вдохновляющие эпохи не всегда определялись новой концепцией или гениальным пророком. Иногда он был связан с находкой новой модельной системы, которая очень хорошо подходит для исследования определенного круга проблем. «Биомолекула» посвятила настенный календарь 2020 года таким «супермоделям» — эпохальным для науки исследуемым ею живым системам. Так, Neurospora grassa — плесневый гриб, имеющий гаплоидный набор хромосом и оттого немедленно фенотипически выдающий любые мутации; маленькая аквариумная рыбка Danio rerio — удобный объект для изучения развития позвоночных и т.д. Хорошей живую модель делает простота организации, удобство в содержании и «прозрачность» — легкость, с которой мы можем наблюдать интересующий нас целевой процесс или явление. В идеале в этом модельном объекте хотелось бы еще «что-то подкрутить и поломать», чтобы узнать, для чего же оно там было исходно.
На каком примере стоит изучать ДНК-белковые взаимодействия и дополнительные к кодирующим свойства ДНК? Хороший вариант — транскрипция, первая «стрелка» на пути от ДНК «вниз по центральной догме». В ней в ходе сложных и согласованных взаимодействий сразу многих молекул происходит инициация на вполне определенных и находящихся в положении «ВКЛ» в данный момент промоторах. А факторы транскрипции участвуют в этом на правах регуляторов процесса, садясь на некоторые сайты посадки либо покидая их. Эта вакханалия подставляет великое множество примеров молекулярного узнавания и иерархической регуляции.
Пожалуй, хотелось бы вариант попроще. Для этого стоит взяться за транскрипцию прокариот. Дело в том, что ситуация в мудреном случае ядерных пугает. У них (и, стало быть, у нас) есть как минимум три РНК-полимеразы, в растениях и вовсе пять, и для их инициации и последующей элонгации нужно немало вспомогательных белков-факторов. Бактерии же обнадеживают: РНК-полимераза у них единственная, всего лишь «о пяти субъединицах» (самая ходовая эукариотическая Pol II имеет 12) и снабжена комплектом сигма-субъединиц. Эти «пристегивающиеся» модули определяют специфичность прокариотической РНК-полимеразы — то, какие промоторы могут ее заинтересовать прямо сейчас. Дежурный из этих факторов, используемый чаще прочих на фазе роста культуры, — сигма-70.
Но и это не предел. Меньше бактерий только вирусы, в том числе, бактериофаги. Эти «пожиратели» прокариотических жертв имеют соответствующий генетический аппарат. И он может на фоне исключительной изобретательности таких наноразмерных паразитов поражать небывалой простой. Обратимся в качестве удобного и ну совсем элементарного примера полимер-полимерного узнавания и роли физико-химии ДНК в инициации ДНК к бактериофагу Т7. Это последний в ряду исходно описанных фагов, поражающих Escherichia coli (рис. 5).
Рисунок 5. Бактериофаг Т7 — срез через вирион (слева) и общий вид
Сложно представить себе что-то более просто устроенное, чем Т7. Вирион бактериофага или, скажем, комплекс поры ядра клетки — примеры того, как наноразмерные биологические структуры могут превзойти любого фантаста. Тут и икосаэдрическая вирусная частица, и хвостовые нити, и система «вбрасывания» чужеродной ДНК в клетку хозяина. Настоящий роботизированный зонд-подрывник!
Его жертва — кишечная палочка E. coli — самый популярный прокариотический объект для исследований. И Т7 — инфекционный агент — внедряется внутрь ее клетки. Точнее будет сказать «в клетку внедряется его геном» — он вбрасывается через канал в основании вирусной частицы, в то время как пустой «скафандр» остается на поверхности. Его задачей была доставка генома и специфическое связывание с E. coli. После этого начинается самое захватывающее — жизненный цикл бактериофага Т7.
Биография Т7 от начала до конца. До 3′-конца
Что же попало внутрь ничего не подозревающей и гигантской по сравнению с Т7 кишечной палочки? Молекула ДНК длиной около 40 тыс. пар оснований (килобаз), имеющая обе комплементарные цепочки. У вирусов бывает и совсем по-другому — на чем и основана система Балтимора. Не замкнутая в кольцо, а линейная ДНК, — в этом отношении тоже «всякое бывает». В 40 килобазах — и сам бактериофаг Т7 (в этот момент ничего больше у него не имеется), и история его жизни. У генома фага есть интересная особенность: его «левые» области (расположены ближе к 5′-концу) работают раньше, чем расположенные в середине и, тем более, прилегающие к 3′-концу. Получается, что Т7-ДНК «прочитывается» в правильном порядке слева направо. Поэтому ее разделяют на три последовательно «включающиеся» области. Пробежимся кратко по всем (рис. 6).
Рисунок 6. Геномная карта бактериофага Т7 — это и история его жизни «слева направо»
Ранняя область ближе всего в 5′-концу и включается первой. Она населена соответствующими ранними генами. Для их транскрипции не захвативший собственную РНК-полимеразу фаг «угоняет» таковую у E. coli. Для этого у Т7 имеются подходящие «посадочные площадки» — стандартные бактериальные промоторы. Пожалуй, разве что сильнее привлекающие прокариотическую РНК-полимеразу, чем ее собственные. Прием успешного паразита, отметим мы, — будь то бактериофаг или кукушка. К тому же многие из них «столпились» вместе у самого 5′-конца. В результате фазы I коварного плана бактериофаг изменяет состояние бактерии «под себя» и появляется его собственная Т7-РНК-полимераза, которая и берет дальнейшую транскрипцию (генов II и III класса) на себя.
Далее включается область генов II класса и соответствующих промоторов. Их задача — активная наработка ДНК бактериофага (ее репликация), а также синтез лизоцима — антибактериального фермента, с помощью которого потомкам бактериофага предстоит выбраться из гибнущей клетки. Стандартный сценарий для такого литического фага, как Т7.
Наконец, область генов и промоторов III класса. Их задача — обеспечить созревание фаговой ДНК, сборку новых вирусных частиц и затем упаковать одно в другое.
На этом жизненный цикл Т7 заканчивается литической и трагической концовкой. Весь экшн занимает обычно 17 мин, по минутам же расписано переключение между его фазами [13], [14]. Но остается довольно животрепещущий вопрос: что переключает активность областей этого элементарного генома?
Промоторы — промотируют, полимераза — полимеразит
Мы уже упоминали, что раннюю область Т7-ДНК транскрибирует «хозяйская» РНК-полимераза бактерии, а далее эту работу берет на себя фагоспецифичная Т7-РНК-полимераза. Стало быть, на одной небольшой ДНК соседствуют сильно различающиеся промоторы для этих двух ферментов. «Собственные» промоторы генома Т7 меньше: они имеют длину всего 19 нуклеотидов. Ферменты и сами не одного калибра: фагоспецифичная полимераза «весит» около 100 килодальтонов (кДа), бактериальная втрое увесистее. При этом транскрипционный дуэт «РНК-полимераза Т7 + промотор Т7» связывается очень точно и специфично, что пригодится в условиях, когда можно влезть в транскрипцию соседнего похожего фага.
Вопрос возникает в связи с тем, что промоторы Т7 из разных классов или даже внутри одного класса очень похожи по своей последовательности. Многие промоторы класса III и вовсе идентичны. Напомним: речь, идет о последовательностях рекордно малой длины — всего 19 нуклеотидов. Очень напоминают они по своей последовательности и таких фагов, как SP6 или, особенно, Т3. Каким же образом Т7-РНК-полимера различает «свои» промоторы и среди своих — те, которые пришла пора связать? Различать вроде как особенно нечего. (рис. 7).
Рисунок 7. Едва различимые последовательности очень непохожих по своим свойствам нативных промоторов бактериофага T7
Здесь на сцену выходят физико-химические свойства дуплекса промоторных областей. Они могут объяснить, как РНК-полимераза Т7 распознает их и специфично, и переключаемо. Для этого процесса молекулярного узнавания важнее именно уровень физико-химических свойств ДНК — что особенно явственно в случае предельно простой транскрипционной системы Т7 [14].
Какими же параметрами ДНК могут направляться взаимодействия биомолекул?
Задолго до прямого контакта молекулярному узнаванию промотора и полимеразы может способствовать электростатический потенциал. Действительно, если мы вспомним, что каждый ее мономер-нуклеотид имеет заряженную отрицательно фосфатную группу, станет понятно — на ДНК есть к чему притянутся положительному заряду. В полном соответствии со школьным законом Кулона. Действительно, ДНК-связывающие белки с этой целью снабжены положительно заряженными участками. В случае же промоторов Т7 присутствуют и особые мотивы распределения заряда [15]. Если мы рассчитаем значение заряда вдоль оси ДНК (на основе известной последовательности нуклеотидов), то получим характерные профили (рис. 8). Заметим, что свой профиль есть и у промоторов II и III класса — по ним, в частности, фаговая РНК-полимераза их и различает.
Рисунок 8. Профили электростатического потенциала для промоторов Т7: ранних, II класса и III класса
Следующее важное свойство ДНК — дестабилизация при скручивании. Сложно подобрать простое название этому параметру, так что приведем какое есть: вызванная суперспирализацией дестабилизации дуплекса ДНК (Stress-Induced Duplex Destabilization). Если коротко, модель SIDD — это способ описать, что будет с ДНК, если на нее как следует надавить, а точнее — скрутить. Дело в том, что одни последовательности в такой напряженной ситуации могут легко расплавиться (так называют расхождение цепей ДНК), другие — выстоят, третьи — плавятся совсем не там, где от них ждешь. Это свойство важно для взаимодействия ДНК с белками и, в частности, хорошо зарекомендовало себя для предсказания промоторов [9]. Как же обстоят дела с SIDD у промоторов Т7?
Рисунок 9. Профиль SIDD для генома Т7
рисунок автора статьи
Посмотрим на профиль SIDD для всего генома бактериофага Т7. Его действительно лучше рассматривать в крупном масштабе. Дело в том, что SIDD может быть очень чувствителен к изменениям последовательности, причем довольно непредсказуемым образом. Создатели этой модели продемонстрировали: небольшое изменение последовательности может резко изменить способность плавиться при суперспирализации участка ДНК, отдаленного от «мутации» на многие сотни пар оснований. По-видимому, такие эффекты использует и природа.
Из набора промоторов Т7 SIDD показывает следующий тренд. Если промотор представляет класс III, то он гораздо более легкоплавкий — цепи дуплекса такого участка ДНК расходятся при меньшей температуре и более низкой суперспирализации. Это неплохо соотносится с экспериментальными данными о том, что промоторы разных классов активны при разных условиях окружающей среды — включая как раз таки показатель суперспиральности [4], [9].
Другая закономерность затрагивает репликацию, для которой Т7-ДНК также является хорошей моделью. Этот геном имеет специализированный ориджин (точку начала репликации), отдаленный от 5′-конца на 17% длины генома. Однако его копирование может начинаться также в ряде других точек — и это как раз таки некоторые промоторы. Удивительно, но именно они относятся к числу дестабилизированных. Удивительно и осмысленно, поскольку репликация также может требовать особых физико-химических свойств дуплекса. В частности, легкость плавление дуплекса ДНК здесь точно не помешает [5].
Безусловно, на электростатике и SIDD важные физико-химические свойства ДНК не кончаются. Изучают и термостабильность, и изогнутость, энтропию, энергию стекинга (складывания нуклеотидов «тарелками» друг на друга) и бесчисленные другие [8].
Подобные закономерности физико-химических различий промоторов ранее оказались важны для бактерии — внутриклеточного паразита Mycoplasma gallisepticum. Ее геном содержит гены семейства vlhA, собственно, делающие этого патогена патогенным — способным «обходить» иммунную защиту хозяина за счет быстрой смены репертуара поверхностных антигенов. Выяснилось: гены vlhA снабжены промоторами [16], разительно отличающимися по физико-химии дуплекса от остальных промоторов генома [17].
Исчерпывающие мутанты
Сложный характер зависимости промоторной активности от физико-химических свойств ДНК и от нуклеотидной последовательности требует полных или по меньшей мере больших данных. Вот если бы получить все или почти все возможные варианты промотора Т7 и узнать, насколько они активны. А ведь в постгеномную эпоху и век дешевых NGS это как раз таки реализуемо! И уже проделано в отношении промотора Т7. В работе [17] использована высокопроизводительная методология: в небольшие фрагменты ДНК встроили почти 8 тысяч случайным образом измененных последовательностей промотора фага Т7, а также последовательности-метки (баркоды) — чтобы потом разобрать, кто есть кто. Далее напрямую замерили их промоторную активность. Имея в распоряжении полные последовательности (промотор + небольшой контекст), нетрудно и рассчитать те физико-химические параметры дуплекса, которые не требуют значительных участков ДНК на входе (SIDD здесь, к сожалению, отпадает — ведь для расчета этого параметра дуплекса нужны очень крупные фрагменты ДНК).
Что показала данная работа и последующий анализ данных о последовательности, физико-химии и величине промоторной активности? Прежде всего, она подтвердила многие выводы о важности отдельных нуклеотидов в конкретных положениях и согласованности таких замен. Нетривиальный результат: ранее для этого ученые не одно десятилетие скрупулезно изучали геном T7 с помощью доступных тогда методов. И теперь мы знаем, что высокопроизводительный, основанный на NGS подход — хороший способ разобраться в устройстве других промоторов и вообще вовлеченных в регуляцию областей ДНК. В том числе в новых, не исследованных геномах, которые нам поставляют бесчисленные секвенаторы.
В отношении теоретической стороны вопроса промоторно-полимеразного узнавания эти работы также дали интересный результат. Оказалось, что положение –2 промотора (если считать за единицу точку старта транскрипции), которому уделялось сравнительно мало внимания при описании структурных основ инициации, очень важно для физико-химических свойств ДНК. Действительно, замена данного нуклеотида способна резко изменить профиль электростатического потенциала или склонности к изгибам. В этом положении промоторы бактериофагов (не только Т7, но и нескольких других сходной «конструкции») почти всегда находятся нуклеотиды A либо T, в единичных промоторах из десятков — G или C (рис. 7). В пределах же промоторов Т7-ДНК нахождение А или Т определяется как раз принадлежностью к «противопоставленным» друг другу группам — классам II и III. Означает ли это особую миссию –2 положения промотора Т7 или нет? Мы надеемся, что эксперименты вскоре помогут это установить [18], [19].