Исследовательская группа

Лаборатория машинного обучения и организации информации

Существует два различных аспекта больших данных среди так называемых четырех "V". Достоверность (Veracity) и многообразие (Variety) требуют сложного статистического анализа, в том числе машинного обучения, в то время как объем (Volume) и скорость (Velocity) невозможны без эффективных технических решений. Наши научные интересы распространяются по этим направлениям, и большая часть нашего опыта исходит из области информационного поиска и баз данных. В настоящее время мы уделяем наибольшее внимание следующим темам:

Теоретическое машинное обучение:

  • Tree models, анализ последовательности, множества
  • Машинное обучение с применением GPU

Поисковые системы и информационный поиск:

  • Машинное обучение для ранжирования, анализ поведения пользователя поисковых систем, их производительность и оценка
  • Хранение и обработка научных, графических и пр. данных

Организация информации:

  • Обработка потоков, декларативные вычисления в среде больших данных
  • Эффективные системы хранения данных и индексные структуры (например, базы данных, представленные в виде столбцов)
  • Оптимизация и выполнение декларативных запросов и рабочих процессов
  • Целостная настройка и оптимизация приложений
  • Качество данных
  • Согласованность и высокая надежность

Помимо исследовательских проектов, мы проводим специальные курсы:

Мы приглашаем студентов, интересующихся областями наших научных исследований, присоединиться к Лаборатории. Самый лучший способ узнать больше о нашей деятельности — поступить на курсы или посещать открытые семинары (которые появятся в скором будущем). Регулярно запускаются новые проекты, иногда также можно присоединиться к уже существующему и расширить тем самым его границы. Вы всегда можете обратиться к руководителю конкретного проекта для получения большей информации.

Все желающие присоединиться к нам студенты должны быть сильны в статистике или программировании, предпочтительнее — и в том, и в другом. Самым успешным кандидатам будет предложено стать постоянным членом команды одного из проектов.

Публикации

  • George Chernishev, Vyacheslav Galaktionov, Valentin Grigorev, Evgeniy Klyuchikov, Kirill Smirnov
    In Proceedings of the Second Conference on Software Engineering and Information Management. Saint Petersburg, Russia. CEUR Workshop Proceedings, 1864,
  • Nikita Bobrov, Anastasia Birillo, George Chernishev.
    Proceedings of the Second Conference on Software Engineering and Information Management. Saint Petersburg, Russia,
  • G. Chernishev, M. Akhin, B. Novikov, and V. Itsykson
    Message from the editors
    CEUR Workshop Proceedings, 1864,
  • Nikita Bobrov, George Chernishev, and Boris Novikov
    In Marite Kirikova, Kjetil Nørvåg, George A. Papadopoulos, Johann Gamper, Robert Wrembel, Jérôme Darmont, and Stefano Rizzi, editors, New Trends in Databases and Information Systems - ADBIS 2017 Short Papers and Workshops, AMSD, BigNovelTI, DAS, SW4CH, DC, Nicosia, Cyprus, September 24-27, 2017, Proceedings, volume 767 of Communications in Computer and Information Science, pages 275–284. Springer,
  • Nikita Bobrov, George Chernishev, Dmitry Grigoriev, and Boris Novikov
    In Yassine Ouhammou, Mirjana Ivanovic, Alberto Abelló, and Ladjel Bellatreche, editors, Model and Data Engineering - 7th International Conference, MEDI 2017, Barcelona, Spain, October 4-6, 2017, Proceedings, volume 10563 of Lecture Notes in Computer Science, pages 208–222. Springer,
  • George Chernishev, Viacheslav Galaktionov, Valentin Grigorev, Evgeniy Klyuchikov, Kirill Smirnov
    PosDB: a Distributed Column-Store Engine
    In Proceedings of A.P. Ershov Informatics Conference (the PSI Conference Series, 11th edition), Moscow, Russia,
  • G. Shalygina and B. Novikov
    CEUR Workshop Proceedings, 1864,
  • George Chernishev, Viacheslav Galaktionov, Valentin Grigorev, Evgeniy Klyuchikov, Kirill Smirnov
    PosDB: A Survey of Architecture
    Programming and Computer Software,
  • George Chernishev
    The design of an adaptive column-store system
    Journal of Big Data, 4:5,,
  • Vyacheslav Galaktionov, George Chernishev, Boris Novikov, and Dmitry Grigoriev
    Selected Papers of the XVIII International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2016), Ershovo, Moscow Region, Russia,
  • Valentin Grigorev and George Chernishev
    In Proceedings of the 2016 International Conference on Management of Data (SIGMOD '16). ACM, New York, NY, USA, 2251-2252.,
  • George Chernishev, Viacheslav Galaktionov, Valentin Grigorev, Evgeniy Klyuchikov, Kirill Smirnov, Andrey Terekhov
    In Proceedings of DAMDID / RCDL'2016 (local), pages 132–137, Ershovo,
  • Ilya Shkuratov and George Chernishev
    A parallel R-tree bulk-loading for shared-memory architecture
    In proceedings of CIMSP'15,
  • Chernishev George
    Towards Self-management in a Distributed Column-Store System
    In: Morzy T., Valduriez P., Bellatreche L. (eds) New Trends in Databases and Information Systems. ADBIS 2015. Communications in Computer and Information Science, vol 539. Springer, Cham.,
  • Chernishev, G., Sevostyanov, V., Smirnov, K., and Shkuratov, I.
    In Selected Papers of XVI All-Russian Scientific Conference "Digital libraries: Advanced Methods and Technologies, Digital Collections Dubna, Russia,
  • Smirnov Kirill, Chernishev George, Fedotovsky Pavel, Erokhin George, Cherednik Kirill
    The Study of Multidimensional R-Tree-Based Index Scalability in Multicore Environment
    In: Voronkov A., Virbitskaite I. (eds) Perspectives of System Informatics. PSI 2014. Lecture Notes in Computer Science, vol 8974. Springer, Berlin, Heidelberg,
  • Kirill Smirnov, George Chernishev, Pavel Fedotovsky, George Erokhin and Kirill Cherednik
    R-tree re-evaluation effort: a report
    Technical report,
  • Fedotovsky P.V., Cherednik K.E., Chernishev G.A.
    To sort or not to sort: the evaluation of R-Tree and B+-Tree in transactional environment with ordered result requirement
    Труды Института системного программирования РАН. – Т. 26. – №. 4.,
  • Chernishev G.
    To Sort or not to Sort: The Evaluation of R-Tree and B+-Tree in Transactional Environment with Ordered Result Set Requirement
    SYRCoDIS. – Т. 1031. – С. 27-34.,
  • Федотовский П. В., Чернышев Г. А., Смирнов К. К.
    Реализация уровня изоляции Read Committed для древовидных структур данных
    Материалы третьей межвузовской научной конференции по проблемам информатики СПИСОК-2012,
  • Kirill K. Smirnov, Georgiy A. Chernishev
    ACM SIGMOD Programming Contest: an opportunity to study distinguished aspects of database systems and software engineering (in Russian)
    Компьютерные инструменты в образовании, 6,
  • Smirnov K., Chernishev G.
    Benchmarking Inter and Intra Operator Parallelism on Contemporary Desktop Hardware
    SYRCoDIS. – С. 62-67.,
  • Kirill Smirnov, George Chernishev
    On two methods of star query execution (in Russian)
    In proceedings of SPISOK conference p. 253-257.,
  • Smirnov K. K., Chernishev G. A.
    Networking and multithreading architectural aspects of distributed DBMS (in Russian)
    Программные продукты и системы. – №. 1.,
  • Smirnov K., Chernishev G.
    Empirical study of parallel SQL query execution
    Труды Института системного программирования РАН. – Т. 21.,
  • Kirill Smirnov, George Chernishev
    Distributed Database Query Engine”
    Contest Poster, ACM SIGMOD/PODS 2010, Indianapolis.,
  • George Chernishev, Kirill Smirnov
    ScienceDirect goes social: a social network for scientists integrated with online digital library
    Contest Poster, ACM SIGIR 2010, Geneve.,