Игорь Бычков
Научный руководитель Иркутского научного центра СО РАН и директор Института динамики систем и теории управления им. В. М. Матросова СО РАН академик Игорь Вячеславович Бычков отметил, что современность тесно связана с хранением данных и их обработкой. «Мы живем в мире, где генерируется огромное количество цифровых данных, например, даже когда мы ничего не делаем с нашими мобильными телефонами, они всё равно определяют нашу геопозицию и таким образом создают большой массив информации», — сказал Игорь Бычков. Он обозначил ряд направлений, где особенно актуально стоит проблема работы с большими данными: отслеживание районов возгорания для предотвращения лесных пожаров, оптимизация транспортной системы с учетом переформатирования городской среды и так далее. «Закон Мура ставит перед нами сложные задачи, в первую очередь — возникает двоякая система: большие объемы данных требуют технологий для работы с ними, с другой стороны — технологии, которые разрабатываются, создают огромное количество информации для обработки», — считает Игорь Бычков.
Участники дискуссии обозначили ряд сфер, где сейчас уже применяются большие данные и есть перспектива для более широкого их использования. В частности, вице-президент по развитию цифрового и нового бизнеса ПАО «Вымпелком» Джордж Хелд рассказал об использовании данных мобильных телефонов в поиске заблудившихся в лесу людей совместно с поисково-спасательным отрядом «Лиза Алерт». Начальник Центра коллективного пользования «Биоинформатика» ФИЦ «Институт цитологии и генетики СО РАН» Дмитрий Александрович Рассказов обозначил широту применения цифровых данных в исследованиях по биологии на разных уровнях: от отдельных молекул до целых популяций. Он привел пример работы искусственного интеллекта для выявления рака молочной железы: «Правильность предсказаний нейросети — 90 %, тогда как у человека в районе 40—50 %, — сказал он. — Биология — то, что активно использует большие данные и активно генерирует их. Если раньше можно было обрабатывать информацию вручную, то сейчас это не получается, необходимы новые подходы, которые применяли бы искусственный интеллект и машинное обучение, нужны специалисты, которые умеют работать с этими методами». Руководитель отдела «Машинное отделение» Центра финансовых технологий Иван Комаров дополнил, что перспективы использования этих технологий есть и в бизнесе. По его словам, машинное обучение позволяет бизнесу чувствовать себя более уверенно: на смену интуиции приходят решения, основанные на анализе большого объема данных. «Машинное обучение позволяет исследовать продукты и поведение клиентов по-новому. Кроме того, это — аппарат оценки, с помощью которого можно понять, насколько эффективен тот или иной процесс», — сказал он. Научный сотрудник Института ядерной физики им. Г. И. Будкера СО РАН кандидат физико-математических наук Александр Аркадьевич Король обозначил роль больших данных в работе крупных научных установок, например таких, как источник синхротронного излучения «Сибирский кольцевой источник фотонов» — СКИФ. Он пояснил, что сейчас запланировано создание локального вычислительного комплекса, но его мощностей на предполагаемый срок работы установки не хватит: «Локальный вычислительный комплекс требует порядка двух петабайт для хранения и пяти петафлопс вычислительной мощности. Однако этого объема хватит центру на месяц функционирования».
Игорь Черных
Руководитель Сибирского суперкомпьютерного центра Института вычислительной математики и математической геофизики СО РАН кандидат физико-математических наук Игорь Геннадьевич Черных рассказал о ресурсах для научных целей, которые сейчас есть в Сибири. «Индустрия продвинулась в сфере высокопроизводительных вычислений и обработки данных. Например, появились “контейнеры”, которые дают возможность поместить в них данные пользователя и запустить на любом оборудовании. Если раньше код необходимо было адаптировать под разные машины, то теперь этого делать не нужно».
Андрей Юрченко
Первый заместитель директора Института вычислительных технологий СО РАН кандидат физико-математических наук Андрей Васильевич Юрченко в совместном докладе с врио директора ИВМиМГ СО РАН доктором физико-математических наук Михаилом Александровичем Марченко рассказал о проекте «Сибирский национальный центр высокопроизводительных вычислений, обработки и хранения данных» — СНЦ ВВОД, который планируется реализовать в рамках программы «Академгородок 2.0». «Наука и ученые обладают необходимыми компетенциями для решения задач с большими данными, в том числе и по их размещению и использованию, — подчеркнул он. — Если раньше проанализировать информацию можно было вручную, глядя на экран, то сейчас это невозможно. Необходимы автоматические инструменты обработки и анализа». Андрей Юрченко отметил, что строительство СНЦ ВВОД в Академгородке обусловлено большим количеством крупных научных установок, которые будут нуждаться в высокопроизводительных вычислениях. «Новосибирск — центр сибирской науки и должен иметь такой ресурс, — считает А. Юрченко. — Проект включит в себя и образовательно-методический центр, который будет направлен на обучение пользователей». Вклад Сибири в развитие работ по большим данным подчеркнул и Джордж Хелд: «Традиционно самые хорошие математики из Новосибирска». Отвечая на вопросы из зала, Андрей Юрченко отметил, что при условии своевременного выделения необходимого финансирования СНЦ ВВОД начнет работу в конце 2022 года.
«Наука в Сибири»
Фото Юлии Поздняковой