Ученые ФИЦ «Институт цитологии и генетики СО РАН» и Новосибирского государственного университета представили новый подход для сбора, хранения и анализа информации о морфометрических характеристиках колоса пшеницы. Созданная специалистами компьютерная информационная система SpikeDroidDB позволит хранить цифровые изображения колоса и обрабатывать их фенотипические характеристики по 14 важным признакам и предоставляет гибкую систему запросов для доступа к данным.
Структура колоса — один из важнейших признаков злаков, связанный с такими их хозяйственно ценными качествами, как продуктивность, устойчивость к факторам внешней среды и вредителям, легкость обмолота. Колосья различаются по форме, размерам, плотности, остистости, цвету и т.д.
Для селекционеров и генетиков большое значение имеют такие параметры, как число зерен в колосе, масса тысячи зерен и другие. Эти характеристики тесно связаны с продуктивностью растений. Полезным селекционным признаком является форма зерновки и такие характеристики колоса, как его тип, длина, профиль, наличие или отсутствие остей, число плодоносных и стерильных колосков (то есть озерненность), ломкость, свойства колосковой чешуи. Собирать и описывать эти признаки вручную — процесс трудоемкий и длительный.
«Научные сотрудники нашей лаборатории давно занимаются решением важной задачи, направленной на то, чтобы заменить измерительные способы генетиков и селекционеров с линейки на компьютер или мобильный телефон. Мы хотели бы сделать так, чтобы ученым больше не надо было бы вручную измерять параметры растений, а просто сделать фотоснимок колоса пшеницы, соблюдая при этом ряд технических условий, и затем получить интересующую их информацию, загрузив это фото в нашу базу данных. Создавая ее, мы работали с обычным анализом изображений, то есть с цифровым зрением, и применили глубокое машинное обучение в части распознавания изображений с помощью нейросетей, выделения отдельных признаков и классификации», — рассказал ведущий научный сотрудник лаборатории эволюционной информатики и теоретической генетики ФИЦ ИЦиГ СО РАН, сотрудник кафедры информационной биологии Факультета естественных наук Новосибирского государственного университета доктор биологических наук Дмитрий Аркадьевич Афонников.
В системе SpikeDroidDB с каждым колосом можно соотнести несколько изображений. Для каждого из них указывается протокол, с помощью которого оно было получено. Для съемки разработчики использовали два протокола получения цифровых изображений зрелых колосьев. Они выбрали синий фон, как наиболее контрастный к цвету колосьев и позволяющий легко отделить объект от фона. Съемка колосьев проводилась в двух вариантах: в первом колос располагается вертикально перед синим фоном, второй вариант съемки предусматривает горизонтальное положение колосьев на стекле над синим фоном.
«В своей базе данных мы собрали более 10 тысяч цифровых изображений колосьев и описали их структуру и свойства, чтобы ученые-генетики могли по фотографии получить все необходимые им данные — размеры колоса, его толщину, ширину, наличие остей, цвет колосьев и прочее, фактически заменив привычные измерения на анализ изображений. В итоге мы получаем больше характеристик, к тому же они отличаются повышенной точностью. С помощью компьютерного анализа цифровых изображений мы можем определять сотни параметров колосьев — как основных, так и их производных, и далее использовать их для разработки методов и классификаций, а также оценки продуктивности. Такие технологии обеспечивают высокую степень автоматизации сбора информации, ее хранение в базах данных, интеграцию с данными о генотипе и параметрах окружающей среды, создают основу для интеллектуального анализа полученной информации. Имеется и еще одно важное преимущество: цифровое описание колоса и его изображение будут храниться в базе данных сколь угодно долго, тогда как высушенный колос, помещенный в бумажный конверт, может рассыпаться, сменить цвет или испортиться, и образец будет утрачен», — пояснил Дмитрий Афонников.
Он отметил, что селекционеры и генетики, занимающиеся выведением новых сортов пшеницы, проявляют большой интерес к разработке и высказывают заинтересованность в работе с ней, чтобы автоматизировать кропотливые и длительные рутинные процессы, требующие точности и концентрации внимания. Кроме того, система SpikeDroidDB позволит избежать субъективных оценок, ошибок и неточностей при фенотипировании образцов колосьев.
Работа над проектом выполнена при поддержке Российского научного фонда, проект № 23-14-00150.
Пресс-служба НГУ