Сегодня - 16.09.2019

Тайная жизнь «мусорной» ДНК

26 декабря 2013

Недавно учеными найдены гены, воздействие на которые приводит к гибели раковых клеток. Они располагаются в той части ДНК, которая долгое время считалась мусорной. На лекции в рамках научного кафе «Эврика!» сотрудник Института систем информатики им. А.П. Ершова СО РАН Дмитрий Николаевич Штокало рассказал, как происходило это открытие, и объяснил, что мешает уже сейчас применять его в медицине.

Клетки крови человекаКлетка как завод с книгой судеб

«Каждая из клеток человеческого организма представляет собой очень сложную систему. Ее можно сравнить с заводом по производству какой-либо высокотехнологичной продукции, — начал свой рассказ Дмитрий Николаевич. — Как и любое предприятие, она имеет свою специализацию — может  отвечать за работу мозга, печени, кожи и т.д. В центре клетки находится ядро — такой штат управления завода, в котором хранится 23 пары толстых книг с инструкциями для рабочих. В них содержатся чертежи по производству деталей, алгоритм их сборки в продукцию, руководство, как реагировать на внешние сигналы, и т.д».

Вы уже, наверное, догадались, что книги — это хромосомы, каждая из которых представляет собой сильно упакованную линейную молекулу ДНК. Та, в свою очередь, состоит из четырех типов нуклеотидов —аденина, цитозина, гуанина и тимина (А,С, G, T). Их последовательность определяет те инструкции, которым следует завод. Именно от них зависит, что человек будет человеком, а мышь — мышью.

Работают хромосомы следующим образом: ДНК расплетается в нужном месте, и там на нее посредством специальных белков — транскрипционных факторов — садятся РНК-полимеразы и начинают двигаться вдоль ДНК в заданном направлении. В процессе они наращивают другую линейную молекулу — РНК, которая также  состоит из четырех типов нуклеотидов (А, С, G, U). Их последовательность в точности повторяет последовательность A, C, G, T в ДНК (только здесь вместо тимина — урацил), то есть, код просто-напросто копируется. Затем эта РНК разрезается на части, некоторые кусочки, называемые интронами, выбрасываются, остальные — экзоны  — сшиваются последовательно, причем может быть несколько вариантов соединения. То есть, один ген может являться шаблоном для производства различных продуктов.

«Другими словами, работу ДНК можно описать таким образом: руководство открывает книгу заводоуправления на нужной странице, прочитывает ее содержание и переписывает его на отдельный листочек. Затем оно отдает эту бумажку инженерам, и те начинают ее редактировать — разрезают на отдельные части, некоторые из них выбрасывают, а остальные сшивают в чертеж, по которому впоследствии наконвейере собираются детали», — рассказывает Дмитрий Николаевич.

Интересно, что кодируют белок, то есть участвуют в формировании «заводских деталей», всего 2% ДНК. Остальные 98% в этом процессе напрямую не задействованы, поэтому долгое время большая часть ДНК считалась «мусорной», ее функция была неясна.

В 2012 году международный консорциум ENCODE опубликовал сенсационные данные: оказалось, что до 80% ДНК, которые раньше считались бесполезными, является биологически активной материей с неизвестной функцией — так называемой «тёмной материей».

На сегодняшний день известно, что 26% из 98% «мусорной ДНК» кодирует интроны (те части, которые сначала вроде бы транскрибируются в ДНК, но затем в процессе составления чертежей вырезаются и выбрасываются). Примерно 12%— это прочие уникальные последовательности, их функция еще не ясна. Около 8% занимает гетеро хроматин, который, как считается, нужен для того, чтобы стабилизировать работу хромосом. 8% — это повторы, в том числе и простые. «Забавно: представьте, вы открыли книгу на заводе, а там написано — «га-га-га-га-га», и так — несколько страниц. Зачем они нужны — непонятно», — объясняет Дмитрий Штокало. Большая часть ДНК  (приблизительно 36%) кодирует транспозоны (гены, способные размножать, копировать себя— то есть, странички в книге, которые могут перескакивать с места на место). И, наконец, 8% ДНК — это LTR-повторы — результат происходящей миллионы лет вставки ДНК вирусов в нашу.


Интересен также факт, что по той части ДНК, которая кодирует белок, человек и мышь на 80% похожи, то есть, по сути, они на 4/5 состоят из одинаковых деталей. Существует гипотеза, что человек выглядит человеком, а мышь мышью именно из-за того, что сильно различается «мусорная» часть ДНК.


Апоптоз, обусловленный воздействием этопозида на клетки рака простаты из клеточной линии DU145. Последовательность изображений получена из 61-часовой покадровой видеосъёмки с использованием фазово-контрастной микроскопии. Оптическая толщина передаётся с помощью цвета: от серого до жёлтого, красного, фиолетового и, наконец, чёрного.Как заставить раковую клетку покончить с собой?

Команда ученых из Новосибирска, США и Франции решила подробно изучить поведение «мусорной ДНК» с помощью технологии секвенирования нового поколения.  Роль Института систем информатики им. А. П. Ершова СО РАН в этом проекте заключается в разработке специальных программ и методов математического анализа для экспериментов.

Секвенирование происходит  по следующему принципу: сначала из клетки извлекается ДНК, режется на маленькие фрагменты (исследовать ее целиком пока невозможно) и загружаются в специальную машину — секвенатор.  Там они прочитываются, и на выходе получаются слова — последовательности A,C,G,T, соответствующие той ДНК, которая плавала в клетке. Затем решается обратная задача — восстанавливается исходная последовательность ДНК. РНК разбирается по такому же принципу.

С помощью секвенатора было расшифровано РНК большого количества образцов крови и получено около 10 миллиардов слов, длиной от 18 до 65 букв каждое (в совокупности они занимают примерно 300 ГБ на жестком диске, а в результате анализа данные разбухают раз в 10 —до 3-х терабайт, чтобы работать с таким количеством данных, нужны специальные методы).

Затем эти слова были выравнены на последовательность ДНК. Считается, что она известна и имеет длину в 3 миллиарда букв. С помощью специальных алгоритмов ученые определили места, где последовательности ДНК и РНК совпадают. Благодаря этому стало возможным посчитать для каждой группы генома так называемую цифровую экспрессию гена — узнать, сколько раз тот или иной нуклеотид перекрылся вырванными словами из РНК, то есть, был прочитан в процессе работы клетки.

«Когда мы это сделали, мы увидели, что 36% РНК выравнивается на ту часть генома, которая кодирует белок, а остальное — на «темную материю». Из них 21% — исходит из межгенного пространства.  Именно в этой массе были обнаружены vlinc-гены (very long intergenic noncoding) — участки, которые в «пустыне» незадействованной в активной работе ДНК дают оазис транскрипций.  Всего их было найдено 2147, в совокупности они занимают примерно 10% генома человека», — рассказывает Дмитрий Николаевич.


Открытие непосредственно vlink-генов (2010 г.) принадлежит русскоговорящему американцу, ведущему сотрудникуИнститута Сен-Лорен (штат Род-Айленд, США) Филиппу Капранову. На их примере он одним из первых показал, что в некодирующих РНК  человеческих клетках  происходит широкомасштабный синтез.


Более того, было замечено, что в злокачественныхклеточных линиях и в эмбриональных стволовых клетках активность vlinc-РНК значительно выше, так же, как и больше доля тех из них, которые активируются остатками вирусов.

Ученые решили поставить следующий эксперимент: 20 РНК они заблокировали  с помощью малых интерферирующих РНК (siRNA). В 12 случаях из 20 это привело к самоубийству раковых клеток, что по-научному называется апоптозом.


Что такое siRNA? Это РНК небольшой долины (21-25 нуклеотидов), которая может по принципу комплиментарности залипать на другую РНК — свою мишень. Это служит сигналом для специальных белков клетки, чтобы ее уничтожить. То есть, siRNA —это такая «черная метка», которая идет по точному адресу.


Полученный результат интересен еще и тем, что процесс апоптоза, как правило, очень инертный. В нем участвует примерно 800 генов и это обеспечивает стабильность системы — если вы искусственно увеличите или понизите концентрацию какого-либо белка, то за счет большого количества положительных и отрицательных связей генная сеть вернет его в обратное, нормальное положение. Именно поэтому открытие волшебного действия siRNA на vlinc-РНК выглядит удивительно и, с первого взгляда, даже неправдоподобно.

Далеко ли до лекарства нового поколения?

«Разработка лекарств нового поколения занимает обычно не менее 15 лет, — утверждает Дмитрий Штокало. — Сначала берется мишень (vlinc-РНК), затем ищется вещество, способное на нее воздействовать (siRNА), затем подбирается средство доставки. В нашем случае можно сделать вирусную конструкцию, которая будет кодировать siRNА. Самое сложная стадия, в которой очень часто наступает разочарование, — это доклинические испытания  — тест на токсичнсоть. Около 95% разработок проваливается здесь, поскольку либо действующие вещества, либо средства  доставки оказываются неприемлемыми. Это может быть проблемой и для нас, поскольку молекула siRNА способна залипать не только на нужные мишени, но и на другие, в том числе полезные. Например, если она вдруг прикрепится к гену, который производит белок инсулин, то мы получим в качестве побочного эффекта диабет».

Обнадеживает тот факт, что vlinc-РНК имеет очень большие размеры — больше 50 тыс. нуклеотидов. Чем крупнее мишень, тем больше комбинаторная емкость для того, чтобы подобрать siRNА, которая будет воздействовать именно на нее. Если удастся решить эту проблему, можно будет перейти к стадии клинических испытаний.

Сейчас перед учеными стоят следующие задачи:

Во-первых, нужно определить, ингибирование каких из полученных 2147 vlinc-генов приводит к апоптозу, ведь на данный момент изучено всего 20 из них. Один такой эксперимент с siRNА стоит 300 долларов. Чтобы провести его с 2000 vlinc-РНК, нужно потратить примерно 700 тыс. долларов. «Нам — математикам — сейчас  необходимо расклассифицировать их на 2 группы: на те, которые имеют потенциал к апоптозу в результате ингибирования, и на те, у которых его нет, — рассказывает Дмитрий Николаевич.  — В этом нам помогут средства машинного учения. К каждому из vlinc-РНК приписывается вектор биологических характеристик, компьютер анализирует их и из всего многообразия выбирает те, по которым можно делать подобные «предсказания». Пользуясь случаем, хочу похвастаться, что в этом направлении (правда, с другими данными) мы уже достигли хороших результатов».

Во-вторых, важно понять, какие из vlinc-РНК специфичны для каких типов рака. Для этого изучается таблица их цифровой экспрессии в большом количестве клеточных линий и тканей. «Нам нужно подобрать пороги, сказать, например, что если экспрессия больше 3-х, то у пациента такой тип рака, если от2-х до 3-х — такой, а если меньше 2-х — то он вообще здоров», — утверждает ученый.

Следующие две задачи интересны с научной точки зрения.Их решение может в будущем улучшить технологии диагностики и лечения. А именно:  перед исследователями стоят очень хорошие вопросы: чем регулируются vlinc -РНК и за что они отвечают.

Рассматривая второй из них, ученые обнаружили, что среди генов, взаимодействующих с vlinc-РНК, очень большой процент тех, которые кодируют передачу нервных импульсов. А среди тех, кто коррелируют с  ними негативно, многие участвуют в апоптозе. Этот факт в какой-то мере подтверждает мнение, что все болезни — от переживаний. То есть, если нервная система работает под нагрузкой, это вызывает экспрессию vlinc-РНК, которые подавляют гены, ответственные за апоптоз, в результате чего клетка становится раковой (однако это пока только предположение, причинно-следственная связь еще не выявлена).

«На вопрос, чем регулируются vlinc-РНК,  у нас тоже есть некоторый ответ, который пока еще не подтвержден, — рассказывает Дмитрий Штокало. — Мы видим, что, скорее всего, они активируются транскрипционными факторами гомеобокс, которые обычно действуют на ранних стадиях эмбрионального развития».


В итоге биологи  хотят получить от математиков-программистов определенную микросхему,  которая бы расписывала всю клетку, каждый процесс, происходящий в ней, в виде взаимосвязи белков, генов, кодирующих РНК и т.д.


Как утверждает Дмитрий Николаевич, проблема системной биологии сейчас в том, что пока что не существует эффективных математических методов для анализа подобных сетей. Это при всем том, что в них используются только белки, результат работы всего 2% ДНК. «Страшно себе представить, какой информационный взрыв может случиться, если туда включить оставшиеся 98%. Многие исследователи не спешат этого делать, потому что непонятно, как тогда вообще анализировать такие гигантские сети. Однако, по данным последних экспериментов видно, что роль «мусорной ДНК» в медицине растет и, скорее всего, будет расти и дальше», — считает ученый — Как любое другое свежее открытие, в будущем результат, полученный нами, может либо затеряться, либо стать основой для развития новой популярной теории».

Диана Хомякова

Фото: 1 — Bruce Wetzel, Harry Schaefer (общественное достояние, wikipedia.org), 2 — Egelberg (лицензия: Creative Commons, wikipedia.org), 3 — Ю. Позднякова
 

Ваша оценка: Нет Средняя: 4.7 (13 votes)
Поделись с друзьями: 
 

comments powered by HyperComments

Система Orphus