Исследовательская группа

Прикладное машинное обучение и глубокое обучение

Представления химических молекул, основанные на грамматиках.

April 23

Генерация химических молекул всегда была очень важной задачей машинного обучения в химии, необходимой для создания, например, нового лекарства с нужными свойствами. Зачастую в качестве формата для представления молекул, который сможет обработать модель генерации, используется формат SMILES - классический и универсальный способ кодировки молекулы как строки. К сожалению, это не самый удобный формат для генеративных моделей - множество полученных с помощью них строк являются некорректными и не могут быть декодированы в обычный молекулярный граф. Таким образом основной сложностью для модели будет являться не создание молекулы с нужными свойствами, а генерация корректного графа с правильными кольцами и ветвями и с правильными валентностями. Для облегчения этого процесса были придуманы новые методы кодировки молекул, которые с помощью грамматик позволяют большему классу строк в таком формате быть синтаксически и химически корректными.

На семинаре будут рассмотрены различные методы представления молекул для моделей машинного обучения с помощью грамматик, их плюсы и минусы. В частности, мы разберём Grammar VAE, которые представляет молекулу в качестве набора продукций обычной грамматики SMILES, И SELFIES, использующие специальную грамматику для контроля химической корректности закодированной молекулы.

Докладчик: Александр Федотов.

Язык доклада: русский.

Дата и время: 23-е апреля, 20:00-21:30.

Место: https://zoom.us/j/217320533

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Материалы