Исследовательская группа

Прикладное машинное обучение и глубинное обучение

Extracting Training Data from Large Language Models

February 9

Уважаемые коллеги, приглашаем Вас посетить семинар "Extracting Training Data from Large Language Models".

Современные языковые модели показывают впечатляющие результаты на задачах, связанных с обработкой текста. Однако развитие таких моделей неожиданно привело к возникновению некоторых рисков.

Одним из таких рисков является возможность извлечения из языковых моделей данных, на которых обучались эти модели. Если в тренировочном датасете содержались персональные данные, а языковая модель стала общедоступной, то есть вероятность, что эти данные могут быть раскрыты. Поэтому важно уметь находить подобные утечки.

На семинаре изучим простой и эффективный метод извлечения тренировочных данных из языковых моделей и рассмотрим пример работы такого метода на модели GPT-2.

Докладчик: Артем Пермяков.

Язык доклада: русский.

Дата и время: 9-е февраля, 20:00.

https://us02web.zoom.us/j/430117051?pwd=TzdKNGRaUCsyMUZBL1UwWTlsOW8yZz09

Meeting ID: 430 117 051

Passcode: 025987