Сегодня - 08.03.2021

Первые результаты работы ЦКП «Биоинформатика»

10 февраля 2021
 
Специалисты из Курчатовского геномного центра ФИЦ «Институт цитологии и генетики СО РАН» рассказали о роли ЦКП «Биоинформатика» в работе по секвенированию геномов сельскохозяйственных культур и разработке технологии компьютерного фенотипирования растений.
 
Суперкомпьютер ЦКП «Биоинформатика»
   Суперкомпьютер ЦКП «Биоинформатика»
 
«Бурное развитие наук о жизни, произошедшее в последние десятилетия, привело к увеличению количества данных, с которыми работают ученые. Основной причиной этого служит уменьшение стоимости проведения экспериментов: сегодня даже небольшая лаборатория может приобрести секвенатор ДНК, выделить пробы для интересных им организмов и перевести полученную информацию в электронный вид. Но дальше возникает вопрос — где хранить собранные данные и на каких мощностях их анализировать? Именно для выполнения таких задач создан наш Центр коллективного пользования “Бионформатика”, — прокомментировал начальник ЦКП “Биоинформатика” ФИЦ ИЦиГ СО РАН Дмитрий Александрович Рассказов. — У нас достаточно ресурсов, чтобы хранить и анализировать полученную учеными информацию, кроме того, мы можем удаленно предоставлять доступ к ней различным пользователям, поэтому имеется возможность сотрудничать с исследователями со всего мира, чем наш центр активно пользуется». 
 
Одна из основных задач, стоящих перед ЦКП, — создание новых сортов растений с заданными свойствами, — которую можно решить с помощью экспериментальной технологии генетического редактирования. Но сперва необходимо определить конкретные гены, чтобы в будущем привить генам устойчивость к болезням или засухам или другие полезные признаки. «В рамках нашей работы мы секвенируем геномы, но не только у одного сорта растений, а сразу у нескольких ближайших родственников. Это делается для того, чтобы получить возможность на основе сравнения геномных последовательностей популяций оценить вариабельность генома, определить, какие мутации присутствуют и как они ассоциированы с различными важными признаками. Однако сегодня секвенирование геномов и скрининг мутаций является довольно дешевой и быстрой технологией, при этом определение проявившихся признаков — фенотипа — зачастую делается вручную. Поэтому мы занялись поиском способа получить большой массив данных по фенотипу, который потом можно было бы сопоставить с генотипом. Сегодня нами развиваются методы, основанные на анализе двумерных и трехмерных изображений при помощи вычислительных компьютерных технологий», — рассказал заведующий лабораторией эволюционной биоинформатики и теоретической генетики ФИЦ ИЦиГ СО РАН кандидат биологических наук Дмитрий Аркадьевич Афонников.
 
В результате ученые разработали две новые технологии, уже применяющиеся селекционерами и генетиками. Исследователи создали мобильное приложение, которое, анализируя фотографию, распознает характеристики (форму, длину, ширину и площадь) зерен из одного колоса и считает их. «Вторая технология кроме перечисленных параметров также сможет определить урожайность колоса, но для этого зёрна не нужно будет даже отделять от стебля. Сейчас мы занимаемся глубоким машинным обучением — чтобы алгоритмы заработали, необходимо огромное количество обучающих данных, которые мы храним на серверах ЦКП. Я надеюсь, что внедрение наших технологий сделает их массовыми, позволит существенно экономить временные затраты и устранит необходимость участия квалифицированных специалистов в подобной рутиной работе», — добавил Дмитрий Афонников. 
 
Сибирские ученые при помощи суперкомпьютерного центра проводят также работы с человеческой ДНК. Одна из проблем, решаемых исследователями, — сборка полного человеческого генома. Обычно после секвенирования биологического образца на выходе получается фрагмент генома, называемый прочтением. Он гораздо меньше, чем гены, содержащиеся в геноме, поэтому из них необходимо собрать более длительные последовательности. «Размер человеческого генома примерно 3 ГБ — это 3 миллиарда нуклеотидов. Мы берем какой-то биологический образец и секвенируем его, получая на выходе коротенький фрагмент — всего лишь 100 нуклеотидов. Для того чтобы из этих коротких фрагментов собрать, например, хромосомы, нам и нужны ресурсы суперкомпьютера. Благодаря доступным нам вычислительным мощностям мы менее ограничены в работе с ДНК и можем эффективнее работать — предсказывать гены в последовательностях, определять мутации, смотреть на различные структурные вариации и так далее», — прокомментировал старший научный сотрудник лаборатории эволюционной биоинформатики и теоретической генетики ФИЦ ИЦиГ СО РАН кандидат биологических наук Михаил Александрович Генаев.
 
«Наука в Сибири»
 
Фото Анастасии Федотовой
 
Поделись с друзьями: 

Система Orphus