Исследовательская группа

Прикладное машинное обучение и глубокое обучение

Multitask learning and benchmarking with clinical time series data

December 8

Часто для оценки результатов работы моделей машинного обучения используют набор общепринятых для данной предметной области датасетов. В здравоохранении их наличие позволило бы привлечь больше исследователей и ускорить процесс применения современных методов к соответствующим задачам медицины. Создание такого датасета и постановка задач с приведением baseline решений является целью статьи.

Представленный авторами датасет на основе записей из базы данных MIMIC-III состоит из почасовых измерений медицинских показателей пациентов в отделении интенсивной терапии (ICU). Процесс тщательной обработки признаков, восполнение пропущенных и некорректных значений в процессе его создания также будут упомянуты на семинаре.

В качестве моделей при построении решений были использованы логистическая регрессия и LSTM-архитектуры, модифицированные под особенности задачи. Разнородность данных позволила исследователям применить эти модели, в частности, к задачам предсказания летального исхода и регрессии времени пребывания в ICU. Утверждается, что наилучшие показатели демонстрирует метод, пытающийся решить все рассматриваемые задачи одновременно.

Докладчики: Евгений Сахно, Чернышев Кирилл.

Язык доклада: русский.

Дата и время: 8-е декабря, 18:30-20:00.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Для получения рассылки о семинаре (со ссылкой на Zoom) - пишите Алексею Шпильману на alexey@shpilmаn.com.