Прикладное машинное обучение и глубинное обучение
Представления химических молекул, основанные на грамматиках.
Генерация химических молекул всегда была очень важной задачей машинного обучения в химии, необходимой для создания, например, нового лекарства с нужными свойствами. Зачастую в качестве формата для представления молекул, который сможет обработать модель генерации, используется формат SMILES - классический и универсальный способ кодировки молекулы как строки. К сожалению, это не самый удобный формат для генеративных моделей - множество полученных с помощью них строк являются некорректными и не могут быть декодированы в обычный молекулярный граф. Таким образом основной сложностью для модели будет являться не создание молекулы с нужными свойствами, а генерация корректного графа с правильными кольцами и ветвями и с правильными валентностями. Для облегчения этого процесса были придуманы новые методы кодировки молекул, которые с помощью грамматик позволяют большему классу строк в таком формате быть синтаксически и химически корректными.
На семинаре будут рассмотрены различные методы представления молекул для моделей машинного обучения с помощью грамматик, их плюсы и минусы. В частности, мы разберём Grammar VAE, которые представляет молекулу в качестве набора продукций обычной грамматики SMILES, И SELFIES, использующие специальную грамматику для контроля химической корректности закодированной молекулы.
Докладчик: Александр Федотов.
Язык доклада: русский.
Дата и время: 23-е апреля, 20:00-21:30.
Место: https://zoom.us/j/217320533
Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars