Где и как читают геном

За дверями одного из коридоров ФИЦ Институт цитологии и генетики Сибирского отделения РАН находится центр геномных исследований — одно из мест где работают специлисты института, которые занимаются секвенированием —  чтением биологических последовательностей. Обычно сюда могут попасть только сами ученые, но специально для участников фестиваля науки EUREKA!FEST-2016 специалисты провели экскурсию и объяснили, как и с какими устройствами они работают.

 — Перед нами хороший пример того, как организована молекулярная лаборатория под конкретную задачу,  — говорит научный сотрудник лаборатории эволюционной биоинформатики и теоретической генетики  ИЦИГ СО РАН Алексей Дорошков, показывая самый важный прибор в комнате — секвенатор. 
 
Секвенирование используется не только для прочтения отдельных генов и целых геномов. Например, чтобы понять, работает ген в определённой ткани или нет. Как? Один из способов — узнать количество его микро-РНК: чем ее больше, тем больше может синтезироваться определенного белка и тем активнее ген исполняет свою функцию. Например, миостатин из  циркулирует в крови и «следит», чтобы мышцы не росли слишком большими. Но сам ген этого белка лежит в ДНК и ничего не делает — работают его производные. 
 
 
 — Секвенируя биоматериал, мы измеряем уровень экспрессии генов — именно во множественном числе, а не одного! Это полезно, если вы не знаете точно, какой ген ищете. Например, есть пятеро больных и пятеро здоровых людей, тогда вы можете померить экспрессию всех генов у каждого и сравнить, — объясняет Алексей Дорошков.
 
Существует три поколения технологий секвенирования — под ним понимают очень разнородный набор процессов, приводящий к узнаванию последовательности, свойственной тому или иному объекту. Впервые цепочку нуклеотидов ДНК начали расшифровывать двумя очень близкими методами — Сенгера и Максама—Гилберта. Готовят набор фрагментов ДНК, меченых на одном конце и разрубленных, что называется, по одной из букв, то есть азотистому основанию — А (аденин), Ц (цитозин), Т (тимин) или Г (гуанин). Затем каждый из четырех комплектов отрезков при помощи тока прогоняют на геле и считывают нуклеотидную последовательность определенного участка. 
 
 — Это очень изящные методы, гениальные для своего времнеи, но неизбежно возникает проблема — а как секвенировать сразу много последовательностей? В итоге разработали аппараты нового поколения — один из них и стоит в Центре, — Алексей Дорошков указывает на прибор. — Эта конкретная технология называется ионным полупроводниковым секвенированием. Идея в том, чтобы из одной молекулы вырастить молекулярную колонию на подложке или грануле — в результате получается частица, с которой свисает множество хвостов-молекул.
 
 — Раствор с такими частицами наносится на чип секвенатора, —  ученый показывает пластинку размером в два сантиметра. — Одновременно на нем секвенируется 10 миллионов последовательностей. Матрица чипа работает так же, как в цифровом фотоаппарате, только ее задача  — ловить не фотоны, а протоны. 
 
Ячейки  поэтапно обрабатываются разными «буквами» — теми же А, Ц, Т и Г — и присоединяющими их ферментами. Так, например, вводится раствор с тимином. Фермент ловит его и начинает синтез в тех ячейках, которым он комплементарен — сколько есть таких последовательностей, ко всем присоединяется буква Т. В тех ячейках, где произошел синтез, изменяется водородный показатель, потому что отщепляется протон — и это фиксирует секвенатор, записывая порядок присоединения, как снимки с матрицы. Получается, что вы читаете одновременно эти последовательности, и на выходе получаете набор данных.
 
Методы нового поколения хороши тем, что можно секвенировать смесь разных фрагментов. А также делать предподготовку и заранее уменьшить число последовательностей. Например, выделить только мРНК генов, ассоциированных с раковыми заболеваниями, с целью найти в них ошибки или измерить уровень экспрессии. 
 
Алексей Дорошков (слева) и Алексей Пиндюрин (справа)
 
 — Однако если вы секвенируете методами первого поколения, вы получаете сиквенс одной последовательности — от начала и до конца. На этой машине по-другому: представьте, вы читаете текст книги, и вам сначала нужно собрать ее из вот таких кусочков, — Алексей Дорошков показывает ящик, полный нарезанных шредером полосок бумаги, который специально для экскурсии принес в лабораторию. — Вы берете 20 одинаковых книжек, каждый лист запихиваете в шредер и получаете риды, то есть прочтения. Так, чтобы освоить «Войну и мир», вам нужно купить двадцать копий, по-разному их порвать, а потом по 400 букв из них склеивать, причем в некоторых буквах встречаются ошибки. Тем не менее, эти методы гораздо быстрее тех, которые применяли в первом поколении — даже наша машина, не самая производительная, в сотни раз быстрее приборов, секвенирующих по Сенгеру.
 
Непосредственная работа секвенатора — ключевой, но не самый сложный этап. Львиная доля действий биологов приходится на подготовку материала, а в лаборатории геномных исследований есть оборудование для всего цикла расшифровки конкретного биополимера. 
 
 — Третье, новейшее поколение технологий секвенирования, не заменяющее двух предыдущих, позволяет читать последовательности на порядки большие по длине — подытоживает Алексей Дорошков . — В этом случае  последовательности получаются длинные, но с большим количеством ошибок — больше 10%. Представьте,  вы бы заставили кого-нибудь прочитать «Войну и мир» от начала и до конца — но на этот раз слушаете его через радиосигнал с помехами. Какие-то слова вы бы слышали, какие-то недопонимали, но в итоге смогли бы восстановить общий смысл — при секвенировании «третьего поколения» тот же принцип. 
 
Александра Евтушенко
 
Фото Алексея Слепенкова, Фотоклуб НГУ