Прикладное машинное обучение и глубинное обучение
Extracting Training Data from Large Language Models
Уважаемые коллеги, приглашаем Вас посетить семинар "Extracting Training Data from Large Language Models".
Современные языковые модели показывают впечатляющие результаты на задачах, связанных с обработкой текста. Однако развитие таких моделей неожиданно привело к возникновению некоторых рисков.
Одним из таких рисков является возможность извлечения из языковых моделей данных, на которых обучались эти модели. Если в тренировочном датасете содержались персональные данные, а языковая модель стала общедоступной, то есть вероятность, что эти данные могут быть раскрыты. Поэтому важно уметь находить подобные утечки.
На семинаре изучим простой и эффективный метод извлечения тренировочных данных из языковых моделей и рассмотрим пример работы такого метода на модели GPT-2.
Докладчик: Артем Пермяков.
Язык доклада: русский.
Дата и время: 9-е февраля, 20:00.
https://us02web.zoom.us/j/430117051?pwd=TzdKNGRaUCsyMUZBL1UwWTlsOW8yZz09
Meeting ID: 430 117 051
Passcode: 025987