Исследовательская группа

Лаборатория машинного обучения и организации информации

Существует два различных аспекта больших данных среди так называемых четырех "V". Достоверность (Veracity) и многообразие (Variety) требуют сложного статистического анализа, в том числе машинного обучения, в то время как объем (Volume) и скорость (Velocity) невозможны без эффективных технических решений. Наши научные интересы распространяются по этим направлениям, и большая часть нашего опыта исходит из области информационного поиска и баз данных. В настоящее время мы уделяем наибольшее внимание следующим темам:

Теоретическое машинное обучение:

  • Tree models, анализ последовательности, множества
  • Машинное обучение с применением GPU

Поисковые системы и информационный поиск:

  • Машинное обучение для ранжирования, анализ поведения пользователя поисковых систем, их производительность и оценка
  • Хранение и обработка научных, графических и пр. данных

Организация информации:

  • Обработка потоков, декларативные вычисления в среде больших данных
  • Эффективные системы хранения данных и индексные структуры (например, базы данных, представленные в виде столбцов)
  • Оптимизация и выполнение декларативных запросов и рабочих процессов
  • Целостная настройка и оптимизация приложений
  • Качество данных
  • Согласованность и высокая надежность

Помимо исследовательских проектов, мы проводим специальные курсы:

Мы приглашаем студентов, интересующихся областями наших научных исследований, присоединиться к Лаборатории. Самый лучший способ узнать больше о нашей деятельности — поступить на курсы или посещать открытые семинары (которые появятся в скором будущем). Регулярно запускаются новые проекты, иногда также можно присоединиться к уже существующему и расширить тем самым его границы. Вы всегда можете обратиться к руководителю конкретного проекта для получения большей информации.

Все желающие присоединиться к нам студенты должны быть сильны в статистике или программировании, предпочтительнее — и в том, и в другом. Самым успешным кандидатам будет предложено стать постоянным членом команды одного из проектов.