Ученые из Института геологии и минералогии им. В. С. Соболева СО РАН (Новосибирск), Института геохимии им. А. П. Виноградова СО РАН (Иркутск) и Минералогического музея им. А. Е. Ферсмана РАН (Москва) представили веб-приложение ArDI (Advanced spectRa Deconvolution Instrument) с набором инструментов, который кардинально упрощает идентификацию микрокристаллов минералов во флюидных и расплавных включениях. ПО анализирует спектр, полученный с помощью широко используемого метода спектроскопии комбинационного рассеяния света. Такой метод позволяет идентифицировать структуру и состав вещества без разрушения образца. Новейшей разработке российских ученых посвящена статья в одном из ведущих мировых научных изданий Journal of Raman Spectroscopy.
Для расшифровки сложных по составу включений в приложение ArDI были интегрированы нейросетевые технологии, методы индексного поиска Faiss и алгоритмы разделения сложного исходного спектра КРС на составляющие его компоненты. Благодаря использованию сразу нескольких инструментов ArDI существенно упрощает процесс идентификации минералов размером от первых до нескольких десятков микрон, даже если они скрыты внутри других кристаллов, газов или жидкостей.
Авторы идеи создания приложения и его первые разработчики — кандидат физико-математических наук Роман Юрьевич Шендрик (ИГХ СО РАН), доктор геолого-минералогических наук Сергей Захарович Смирнов (ИГМ СО РАН) и доктор геолого-минералогических наук Павел Юрьевич Плечов (Минералогический музей им. А. Е. Ферсмана РАН).
Сергей Смирнов за работой на КР-спектрометре Horiba LabRam HR 800 в ИГМ СО РАН
Что собой представляют включения в минералах?
Все горные породы состоят из минералов. Их быстрая и надежная диагностика является важной задачей практической работы геологов. Каждый минерал — это фиксированный набор атомов химических элементов, сложенных в строго определенном геометрическом порядке, называемом кристаллической структурой. Даже результаты макроскопической диагностики позволяют ученому с уверенностью рассуждать о том, каким было первоначальное вещество, из которого образовывалось сообщество, или, как говорят геологи, ассоциация минералов, на каких глубинах и при каких температурах это происходило.
«Когда минерал крупный, осязаемый, его можно определить, просто научившись отличать от других. Многие макроскопические качества, например цвет черты, блеск, позволяют большинство минералов определить прямо на глаз, — объясняет заместитель директора по научной работе ИГМ СО РАН доктор геолого-минералогических наук Сергей Захарович Смирнов, — но мы работаем с более мелкими размерами, где уже методы макродиагностики применить невозможно».
Флюидные и расплавные включения представляют собой микроскопические капельки и пузырьки в минерале-хозяине. Эти включения содержат газы, жидкости и продукты их затвердевания, в которых могут присутствовать кристаллики разных других минералов размером в сотые и тысячные доли миллиметра, — маленькие «капсулы времени», способные миллионы лет хранить в законсервированном состоянии флюиды (высокотемпературные плотные газы) и расплавы, захваченные минералом в процессе его роста. На основе анализа включений становится возможным определять, как формировались руды, как эволюционировала магма, а исходя из этих данных — прогнозировать, где могут быть скрыты новые месторождения меди, свинца, лития, золота и других важных для страны металлов.
Флюидное включение в кристалле кварца под микроскопом. Размер включения приблизительно 0,7 миллиметра. Внутри него виден пузырек газа и ряд очень мелких кристалликов, находящихся в жидком водном растворе. Размеры микрокристаллов варьируются от 50 до 3—5 микрон
Методы геохимического анализа и спектроскопия КРС
Определение структуры и состава таких мельчайших объектов представляет собой серьезную проблему. Для ее решения ученому нужен очень точный и деликатный инструмент. Существуют различные методы геохимического анализа, но большинство из них не подходят для исследования одиночных редких микроскопических зерен минералов, которые еще и находятся внутри других минералов. Распространенные методы или требуют разрушения всего образца для извлечения включения, или уничтожают его в процессе анализа, или в принципе не в состоянии хорошо работать с объектами очень малых размеров.
Спектроскопия КРС — аналитический метод, основанный на взаимодействии когерентного монохроматического света с электронными оболочками химически связанных атомов, составляющих исследуемый объект, в данном случае — минерал. В результате часть света, проходя через изучаемый минерал, изменяет свои частотные характеристики. Эти изменения регистрируются, и исследователь получает распределенный по длинам волн рисунок сигналов — спектр взаимодействовавшего с веществом света. Распределение сигналов по длинам волн и взаимные соотношения их интенсивностей являются уникальными для конкретных атомов в конкретном структурном состоянии и позволяют с высокой степенью достоверности идентифицировать сам минерал.
Ключевым преимуществом метода является то, что разрушение исследуемого вещества не требуется, а использование микроскопов в конструкции новейших спектрометров позволяет сфокусировать световой пучок в объеме в несколько десятков кубических микрометров. Современные приборы даже из таких крохотных объемов извлекают высококачественные данные.
Тем не менее такой анализ осложняется рядом факторов. Во-первых, спектры минералов во включениях и вмещающего их кристалла (минерала-хозяина) накладываются. Ученому необходимо правильно распознать наложения и разъединить их. Во-вторых, рисунок спектров КРС может зависеть от ориентации кристалла и индивидуальных особенностей состава и структуры каждого из минералов. Следовательно, вариантов рисунка одного и того же минерала может быть несколько, что еще больше усугубляет первую проблему. В-третьих, в процессе получения полезного сигнала всегда будет присутствовать шум и артефакты, искажающие сигнал, которые также необходимо учитывать. Кроме этого, для точной идентификации нужно иметь образец спектра, с которым можно сравнить изучаемый объект. Поэтому исследователи во всем мире создают базы эталонных спектров разных минералов.
На выполнение работы по расшифровке спектра исследователь может потратить несколько дней и более. В случае, если спектр сложный и расшифровать его достоверно не получается, ученый вынужден делать дополнительные анализы объекта исследования другими методами.
«В свое время, работая с включениями, мы с коллегами из ИГХ СО РАН открыли совершенно необычный тип водных растворов флюидных включений в минералах. Всегда считалось, что растворы, которые заключены в минералах, имеют хлоридный состав. Это понятно: если у нас океаны содержат соль, то очевидно, что и эндогенные флюиды (высокотемпературные плотные газы, которые находятся в недрах земли. — Прим. ред.) тоже должны ее содержать в растворенном состоянии. Однако когда мы исследовали включения в пегматитах (горные породы, образованные насыщенной летучими веществами магмой в толще земной коры, которые отличаются специфической структурой с крупными и иногда гигантскими размерами слагающих их кристаллов и обогащены редкими минералами. — Прим. ред.), то обнаружили, что там хлора может не быть совсем, зато очень много бора. Благодаря применению спектроскопии КРС для исследования микровключений в минералах мы нашли в них мельчайшие кристаллики ортоборной кислоты — сассолина, и открыли совершенно иной геохимический тип флюидов. Это открытие — предмет гордости нашего института и моей личной, — рассказывает Сергей Смирнов. — Тем не менее в тот период мы очень много времени потратили на распознавание спектров, рассчитывали все и сравнивали вручную. В нашей статье в журнале Journal of Raman Spectroscopy мы показали, как приложение за несколько минут справляется с той же задачей, которую мы решали на протяжении месяцев, при этом оно демонстрирует результат очень высокой степени достоверности».
Разложение КР-спектра, снятого в точке d3 (показана стрелкой), во флюидном включении из пегматитового кварца в сочетании с последующей процедурой фазового анализа на базе нейросетевых технологий в ArDI. Это исследование показало, что крохотный кристаллик является редким минералом раманитом-Rb
ArDI — инструмент для решения рутинных задач
Приложение ArDI создано для автоматизации рутинных задач профессионального минералога. Выделить в спектре пиковые значения отдельных минеральных фаз и разложить его на простые компоненты позволяет алгоритм фазового анализа (RPA). Для быстрого поиска соответствий по базам данных разработчики внедрили в систему индексного поиска Faiss — самую распространенную на сегодняшний день библиотеку алгоритмов, позволяющих преобразовывать какие-либо данные в числовой формат и осуществлять их группировку по заданным параметрам. Для распознавания сложных спектров исследователи интегрировали в систему нейросетевые технологии и применили методы машинного обучения (искусственный интеллект). Гибридная система распознавания позволяет достигать точности в идентификации минералов до 96,3 %.
Онлайн-платформа бесплатная и использует для поиска несколько баз данных, включая всемирно известную RRUFF и ROD. Собственная база ArDI, в которой все загружаемые спектры прошли тщательнейшую проверку на качество, уже содержит порядка 3 800 эталонных спектров более 1 000 природных и искусственных веществ.
«Когда задумали ArDI, у нас была первая мысль — создать базу данных, которая будет существенно отличаться от имеющихся. Даже самая распространенная база рамановских спектров RRUFF на сегодняшний день содержит далеко не все спектры и в ряде случаев не удовлетворяет нас по качеству. Роман Шендрик проводит очень тщательный отбор загружаемых в базу ArDI эталонных образцов. В частности, при загрузке спектра требуется внести информацию про исследованный минерал. Откуда он, где в данный момент находится изученный образец, у кого. Если по минералу есть информация о составе, она должна быть загружена. Если по нему есть публикация — требуется приложить копию статьи», — комментирует Сергей Смирнов.
Разработка российских ученых позволит сократить расходы на сложные анализы, ускорить время, необходимое для идентификации минералов в сложных ассоциациях, с нескольких месяцев работы до нескольких минут. Также приложение может быть потенциально полезным для исследований вещества на поверхности планет земной группы, каменных спутников газовых гигантов в Солнечной системе, а также астероидов и комет. Приборы, осуществляющие анализ методом рамановской спектроскопии, отличаются компактностью и ими можно оснащать космические аппараты. В свою очередь, приложение ArDI способно с высокой точностью быстро расшифровывать полученные спектры.
С момента появления первой информации о запуске проекта ArDI в журнале «Новые данные о минералах» в 2024 году ArDI воспользовались уже более 3 000 человек. Зарегистрированными пользователями приложения стали ученые из более чем 20 организаций. Сюда входят ведущие академические институты, вузы и представители индустриального сектора экономики России, университеты и компании различных зарубежных стран на всех континентах. ArDI размещено в реестре отечественного программного обеспечения.
В настоящее время пополнение базы данных обеспечивается в основном информацией, полученной разработчиками в своих научных исследованиях, а также за счет спектров минералов из коллекции Минералогического музея им. А. Е. Ферсмана РАН, насчитывающей более 4 000 минеральных видов, и Центрального Сибирского геологического музея ИГМ СО РАН, содержащей около 1 600 минеральных видов. Ученые приглашают к сотрудничеству специалистов для дальнейшего пополнения базы эталонных спектров. Сегодня в работу включились отечественные и зарубежные научные организации, ведущие исследования в области наук о Земле. По количеству эталонных спектров в базе данных (более 3 800) ArDI опережает все подобные разработки в мире, кроме RRUFF, при этом база содержит спектры 900 минералов, из которых 850 в RRUFF отсутствуют.
Приложение ArDI уже доказало свою эффективность в распознавании сложных ассоциаций микроминералов и продолжает развиваться. Команда разработчиков планирует дальше расширять базу данных, добавлять новые алгоритмы обработки спектральной информации для решения прикладных минералогических задач, расширять возможности интеграции и совместного использования данных, полученных другими аналитическими методами.
Текст и иллюстрации пресс-службы ИГМ СО РАН