Исследовательская группа

Прикладное машинное обучение и глубокое обучение

Medical Transformer: Gated Axial-Attention for Medical Image Segmentation

May 11

В задаче сегментации медицинских изображений наилучших результатов достигают модификации архитектуры UNet. Однако, полагаясь исключительно на свертки, подобные сети принимают решение для каждого пикселя основываясь лишь на небольшой его окрестности. Данное ограничение авторы предлагают обойти с помощью механизма self-attention, как части encoder'a модели.


Представленная модель(MedT) учитывает ограничение на небольшой размер датасета, типичный для возможных приложений. Для учета отношений между различными участками изображения вводится новая стратегия обучения(LoGo) — совместное использование двух похожих по архитектуре частей сети: локальной(для небольших областей) и глобальной(для всего изображения).

На семинаре обсудим архитектуру модели, особенности выбранного self-attention механизма, а также альтернативные методы для подобной сегментации.

Докладчик: Кирилл Чернышев.

Язык доклада: русский.

Дата и время:  11 мая, 18:30.

https://us02web.zoom.us/j/217320533?pwd=TzllQzNld1ExUVJUdENXdzZsblBhUT09

Meeting ID: 217 320 533

Passcode: 021675