Найден новый способ выделения «сущности» химических реакций

28
Лаборатория


Группа ученых из Сколтеха, МГУ и Университета «Сириус» предложила новый метод визуализации химических реакций. Разработанный инструмент позволяет специалисту обозреть глобальное пространство реакций для разработки новых или более эффективных путей синтеза органических соединений. Для этого нейросетевой метод проецирует химические реакции на плоскость в виде точек, группируя их по сходству. Работа исследователей была представлена в журнале ACS Omega.

Химики постоянно ищут новые пути синтеза ценных органических соединений: лекарств, пестицидов, топливных присадок, красителей и пигментов, материалов органических светодиодов и др.

«Химик просматривает выдачу на поисковый запрос к базе данных и группирует реакции похожего вида, получая таким образом представление о структуре пространства синтеза, но для этого нужна мощная химическая интуиция, и всё равно есть риск субъективной оценки», — объясняет руководитель исследования Сергей Соснин из Сколтеха.

Ученые упростили и стандартизировали описанный процесс так, что новый способ смог выделять «сущность» химических реакций и наносить их на график, тем самым облегчая весь процесс анализа.

«Намного удобнее смотреть на картинку, а не на длинный список реакций. А визуализируем мы реакции на основании того, какие у них исходные соединения и продукты», — добавляет Соснин.

Предложенный метод преобразовывает каждую молекулу в численное представление (бинарный вектор). Затем алгоритм извлекает сущность реакции путем вычитания векторов исходных веществ из векторов продуктов.

«Получается вектор, который в каком-то смысле соответствует тому, что в ходе реакции изменилось. При этом он не зависит от конкретных реагирующих веществ, — Поэтому данный вектор является прозрачным и эффективным представлением реакции», – комментирует работу Соснин.

Единственная проблема с векторами реакций состоит в том, что для человека они абсолютно невразумительны, если вы, конечно, не приучены мыслить в 1024 измерениях.

Со слов исследователя векторы, недоступные прямому восприятию, визуализируются при помощи подхода под названием параметрический t-SNE. Таким образом, нейросеть проецирует каждый многомерный вектор на плоскость как точку с некоторыми координатами.

Сколтех
Рисунок 1. Представления химических реакций, спроецированные на плоскость в виде точек, которые группируются интуитивно понятным образом. Источник: Михаил Андронов и др./ACS Omega

Химик на полученном рисунке видит стандартные типы реакций, представленные скоплениями точек, например теми, которые выделены тремя пронумерованными ромбами (рис. 1). Допустим, вас интересуют пути синтеза дарунавира (фиолетовые круги) — антиретровирусного лекарства против ВИЧ и для профилактики СПИД — или лекарства от астмы монтелукаста (серые круги). По визуализации можно понять, какие типы реакций в первую очередь используются для получения этих веществ, а какие почему-то используются редко или вовсе не применяются, быть может, вопреки интуитивным ожиданиям специалиста.

Коллектив подчеркивает объективность такой визуализации. Она чем-то похожа на классификацию животных только по ДНК, без какого бы то ни было внимания к их внешнему облику.


ИСТОЧНИКСколтех