ИТМО
Никита Серов инженер химико-биологического кластера ИТМО

Учеными химико-биологический кластера Университета ИТМО найден алгоритм, который по изображению наночастицы, в том числе и по ее рисунку, может автоматически определять ее свойства и находить похожие в базе данных. Алгоритм осуществляет также и обратный дизайн: по заданным свойствам предлагает способ получения вещества, сообщает пресс–центр университета. 

В настоящее время системного подхода для описания частиц нет. Все происходит вручную через анализ большого количества статей, а свойства зачастую описывают усредненно, на качественном уровне или же вообще не берутся в расчет. Информации о поверхностной морфологии частиц также практически нет. В связи с этим алгоритмам машинного обучения сложно обработать информацию, сделать выводы и улучшить работу.

Исследователи ИТМО смогли решить все эти проблемы. Предложенный алгоритм анализирует изображения частиц с электронного микроскопа и выделяет из них информацию о признаках в количественном формате.

«Описанный в нашей статье алгоритм на основе массива чисел, выделенного из изображения и описывающего его свойства, находит по базе похожие частицы. Он понимает, что такое распределение по морфологии (размеру, форме, структуре) и определяет другие параметры. Например, когда мы пытались искать кубические структуры в нашей базе, алгоритм выдавал результаты, действительно наиболее похожие на запрос», — комментирует работу инженер химико-биологического кластера Никита Серов, один из авторов исследования.

Новый метод был проверен также на наночастицах золота. Материал очень распространен в фотонике и доставке лекарств, так как в этих направлениях структура играет ключевое значение. Данные для исследования ученые взяли из научных статей — алгоритм сработал!

«По сути наш подход работает, как поиск в Google или Яндекс: по информации из запроса алгоритм меньше чем за минуту находит похожий наноматериал и предлагает способ его получения, то есть синтетические процедуры. Тем не менее мы продолжаем оптимизировать алгоритм для более быстрой работы на больших объемах данных», — добавляет Никита Серов.

Подход ученых позволит в автоматизированном режиме получать данные о частицах для их дальнейшего изучения, сравнения с другими веществами, разработки новых соединений. Например, морфология влияет на поведение частицы в живом организме: форма — на иммунитет и метаболизм клеток, структура — на оптические свойства. Все эти знания можно использовать в биомедицине, фотонике и многих других областях.

Фото пресс–центра Университета ИТМО