Новые методы анализа генома позволили выявить у млекопитающих более полутора тысяч неизвестных ранее генов. Эти гены кодируют не белки, а большие молекулы РНК, выполняющие различные регуляторные функции. Новооткрытые гены демонстрируют высокий уровень сходства (консервативности) у разных млекопитающих, что свидетельствует об их важном функциональном значении. Ранее было известно лишь около десятка таких генов. Как выяснилось, большие регуляторные РНК выполняют в клетках млекопитающих широкий круг задач — от регуляции клеточных делений до управления свойствами стволовых клеток.
В последнее время появилось множество данных, свидетельствующих о том, что в клетках млекопитающих подвергаются «прочтению» (транскрипции) не только те участки генома, которые кодируют белки или известные функциональные молекулы РНК (рРНК, тРНК, микроРНК и др.), но и многие другие участки, не содержащие, казалось бы, никакой полезной информации.
Иными словами, клетка зачем-то производит множество транскриптов (молекул РНК, синтезированных на матрице ДНК), функции которых совершенно непонятны. Многие эксперты предполагали, что эти транскрипты — не более чем «мусор», случайный побочный результат работы ферментов РНК-полимераз, ответственных за транскрипцию (см.: Изучение генома человека вступает в новую фазу, «Элементы», 20.06.2007).
Лишь у десятка больших некодирующих молекул РНК (они получили название large intervening non-coding RNAs, lincRNAs) были обнаружены какие-либо функции. Оказалось, что они участвуют в регуляции работы генов и транспорта веществ из цитоплазмы в ядро, помогают инактивировать «лишнюю» Х-хромосому у самок и осуществлять геномный импринтинг. Зачем нужны все остальные некодирующие транскрипты, до сих пор оставалось загадкой.
В последнем номере журнала Nature большая группа американских ученых сообщила о разработке эффективного метода, позволяющего проводить широкомасштабный поиск генов функциональных lincRNA. Метод основан на анализе структуры гистона H3 — одного из белков, на который «наматывается» ДНК в ядре эукариотической клетки (см. хроматин). Исследователи обнаружили, что все гены, считываемые ферментом РНК-полимеразой II (этот фермент транскрибирует подавляющее большинство генов у эукариот), можно идентифицировать по особым «меткам» (см. chromatin remodeling), которые клетка ставит на молекулах гистона H3. Те молекулы H3, на которые намотана промоторная область гена, метятся путем метилирования остатка аминокислоты лизина, занимающего 4-ю позицию в молекуле гистона. Кроме того, вдоль всей транскрибируемой части гена в молекулах H3 метилируется другой лизин, занимающий 36-ю позицию.
Эти метки можно обнаружить при помощи специально выведенных антител, которые распознают метилированные молекулы H3 в составе хроматина и присоединяются к ним (см. Immunoprecipitation). Обнаруженный таким образом ген можно потом отсеквенировать (определить последовательность нуклеотидов).
При помощи этого метода можно выявить все гены, транскрибируемые РНК-полимеразой II. Понятно, что бoльшая их часть — это давно известные гены, кодирующие белки или функциональные РНК. Но если из общего числа выявленных таким способом генов отбросить все ранее известные (а в мышином геноме вряд ли остались неизвестные белок-кодирующие гены), то оставшиеся, скорее всего, и будут искомыми генами lincRNA.
При помощи этого метода исследователи нашли в геноме мыши около 1600 предполагаемых новых генов длиной не менее 5000 нуклеотидов каждый (более мелкие гены просто игнорировались) и определили их нуклеотидные последовательности.
Теперь нужно было доказать, что это действительно рабочие гены, то есть что клетка их реально транскрибирует. Для этого из нескольких типов мышиных клеток выделяли РНК и проверяли, есть ли среди них молекулы, соответствующие по последовательности нуклеотидов найденным новым генам (см. DNA microarray). Результат оказался положительным — следовательно, найденные гены работают.
Следующим шагом стал поиск похожих последовательностей в геномах других млекопитающих. Результат тоже оказался положительным, причем выяснилось, что гены lincRNA отличаются довольно высокой консервативностью. Это значит, что они мало менялись в ходе эволюции млекопитающих. Консервативность является признаком того, что данный участок ДНК важен для организма, и большинство возникающих в нём мутаций отсеивается отбором. Уровень консервативности новых генов оказался примерно таким же, как у десятка найденных ранее генов lincRNA. Этот уровень ниже, чем у белок-кодирующих генов, но значительно выше, чем у всех прочих участков некодирующей ДНК, не имеющих известных функций. Консервативность генов функциональных РНК в целом ниже, чем у белок-кодирующих генов, потому что функциональные молекулы РНК более толерантны к изменениям своей нуклеотидной последовательности, чем белки — к изменению своей аминокислотной последовательности. Иными словами, мутации генов функциональных РНК гораздо реже оказываются вредными, чем мутации белок-кодирующих генов.
Промоторы генов lincRNA, как выяснилось, имеют точно такую же степень консервативности, как и промоторы белок-кодирующих генов. Это и понятно, ведь все эти гены считываются одним и тем же ферментом РНК-полимеразой II, которому нужно прикрепиться к промотору, чтобы начать транскрипцию.
Какие же функции выполняют в организме млекопитающих многочисленные lincRNA? Установить это напрямую крайне трудно, поэтому исследователи пошли обходным путем. Они проанализировали характер экспрессии генов lincRNA в разных органах и тканях и на разных стадиях эмбрионального развития. Известно, что «обычные», то есть белок-кодирующие гены сильно различаются по своей активности в разных клетках и в разное время. Одни наборы генов включаются, например, только во время клеточного деления, другие — только в клетках печени, третьи — при закладке какого-то определенного органа в эмбриогенезе и т. д. Оказалось, что гены lincRNA ведут себя точно так же. Были выявлены группы генов lincRNA, которые активизируются одновременно с определенными функциональными группами белок-кодирующих генов. Таким способом было показано, что lincRNA, по-видимому, участвуют в регуляции клеточных делений, в работе иммунной и нервной системы, в дифференцировке эмбриональных стволовых клеток, во многих других процессах эмбриогенеза, в образовании гамет (половых клеток), в росте мышц и т. д.
В ряде случаев функции lincRNA удалось продемонстрировать более определенно при помощи сложных экспериментов. Например, было известно, что белок p53 играет важную роль в исправлении повреждений в молекулах ДНК. Однако как именно он это делает, было неизвестно. Теперь выяснилось, что p53 распознает промоторы нескольких генов lincRNA и прикрепляется к ним, что ведет к резкому росту активности этих генов. Повреждение ДНК приводит к активизации 39 генов lincRNA, однако если отключить в клетках ген, кодирующий белок p53, то повреждение ДНК перестает стимулировать их активность. Каким образом lincRNA помогают чинить поврежденную ДНК, пока не ясно, но то, что они принимают в этом какое-то участие, не вызывает сомнений.
Механизмы действия lincRNA — то есть то, каким именно образом они влияют на клеточные процессы, — пока неизвестны, однако есть веские основания полагать, что многие из них участвуют в регуляции активности других генов. На это указывает, например, то обстоятельство, что среди белок-кодирующих генов, расположенных по соседству с генами lincRNA, резко повышен процент генов, кодирующих регуляторы транскрипции (транскрипционные факторы; белки, осуществляющие метилирование гистонов, и т. п.). Возможно, lincRNA каким-то образом «сотрудничают» с регуляторными белками — например, направляют их деятельность на те или иные участки геномной ДНК.
В последнее время новые функции молекул РНК открываются постоянно (см. ссылки внизу). Это очень хорошо согласуется с «теорией РНК-мира», согласно которой на ранних этапах эволюции жизни все функции, выполняемые ныне белками, выполнялись молекулами РНК. Если это действительно так и было, то следует ожидать, что и в современных клетках для РНК могло остаться много самых разных дел. Что и подтверждается многочисленными открытиями последних лет.