JetBrains Research — наука, меняющая мир

An Overview and Analysis of Reading Comprehension Datasets

Понимание прочитанного (Reading Comprehension) – вариант вопросно-ответного поиска (question answering), когда в ответ на вопрос система должна вернуть фрагмент документа. В последнее время задача стала популярной благодаря развитию нейросетевых методов и появлению большого количества датасетов. В связи с этим отдельной задачей становится анализ качества датасетов.


На семинаре рассмотрим несколько популярных датасетов и подходы к оценке их качества. В завершение доклада будет рассказано о единственном на данный момент русскоязычном датасете SberQuAD, его характеристиках и том, какие результаты можно получить с помощью известных моделей.

Докладчик: Павел Ефимов.

Язык доклада: русский.

Дата и время: 2-е марта, 20:00-21:30.

Место: Таймс, аудитория 405.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars