Исследовательская группа

BioLabs

Исследовательские проекты

  • Epigenetic changes in aging human monocytes — совместный проект по исследованию здорового старения человека с  лабораторией Максима Артемова в университете Вашингтона в Сент-Луисе. Лаборатория занимается биоинфоматическом анализом, создает вычислительные пайплайны и разрабатывает новые алгоритмы и методы анализа эпигенетических данных.
  • Immune system aging — проект, в рамках которого изучается старение иммунной системы мышей и человека с применением методов единичных клеток для комплексного анализа развития клеточных популяций.
  • Лонгитюдный анализ здорового старения человека — исследование здорового старения человека, направленное на поиск основных факторов старения на основе лонгитюдных данных мультиомики.

Инструменты

  • SPAN Peak Analyzer — это универсальный инструмент для поиска пиков с применением частичного обучения с учителем, способный обрабатывать данные экспериментов ChIP-seq, ATAC-seq и single-cell ATAC-seq. SPAN эффективно обрабатывает шум в экспериментальных данных за счет использования ручной аннотации малого размера.
  • JBR Genome Browser — это быстрый универсальный геномный браузер с поддержкой интегрированного подхода к поиску пиков на основе частичного обучения с учителем (совместно с алгоритмом для анализа пиков SPAN).
  • SnakeCharm — плагин для ряда IDE на базе платформы IntelliJ, обеспечивающий широкие возможности редактирования и рефакторинга для Snakemake и расширенную интеграцию с экосистемой этого языка программирования.
  • Pubtrends — инструмент для анализа научных публикаций, позволяющий исследовать интеллектуальную структуру научной области, а также искать подобные работы. Мы применяем методы библиометрии для анализа графа цитирования и методы обработки естественного языка для анализа текстов. Сервис позволяет находить наиболее цитируемые статьи и темы в области, визуализировать графы цитирований и сходства статей, а также автоматически создавать обзоры литературы.
  • Fishbone ARM — это гибридный алгоритм data mining для изучения скрытых зависимостей в данных, полученных из наблюдений. Он сочетает в себе метод обучения ассоциативным правилам и теорию информации для автоматического построения диаграммы Исикавы, что помогает визуализировать сложные взаимосвязи и предоставляет возможности для интерактивного анализа данных.

Библиотеки

  • Viktor — это кроссплатформенная библиотека с открытым исходным кодом на языке Kotlin, предназначенная для идиоматического представления многомерных массивов и эффективных векторных вычислений на CPU с использованием современных векторных команд процессора.
  • big — поддержка BigWIG, BigBED и TDF для JVM. BigWig и BigBED форматы используются в биоинформатике для обработки и визуализации позиционных геномных данных. Библиотека поддерживает операции чтения и записи.
  • npy — поддержка NPY и NPZ для JVM. NPY и NPZ — это форматы данных, внедренные NumPy – популярный пакет для научных вычислений в Python, который обеспечивает чтение и запись объектов многомерного массива.
  • bioinf-commons — биоинформатическая библиотека с открытым исходным кодом на языке Kotlin. Библиотека используется в различных проектах, таких как SPAN, JBR и другие проекты группы. Среди реализованных функций поддерживается формат библиотеки Pandas для Kotlin, а также API для работы с объектами Genome, Sequence, Genes, Ontologies. Модуль для статистических вычислений содержит утилиты для анализа различных статистических распределений, скрытых марковских моделей и проверки гипотез, включая поправку на множественную проверку статистических гипотез. Кроме того, bioinf-commons содержит различные утилиты для параллельных вычислений, логирования и многое другое.

Пайплайны

  • washu — Воспроизводимые и масштабируемые пайплайны для обработки ChIP-Seq и RNA-Seq.
  • chipseq-smk-pipeline — Пайплайн ChIP-Seq Snakemake: от сырых ридов до поиска пиков.
  • scatac-smk-pipeline — Single cell ATAC-Seq Snakemake пайплайн: от сырых ридов до транскрипции генов.

Другое

  • sysbio-workshops — Материалы воркшопов по системной биологии.
  • sc-atacseq-explorer — Предобработка single cell ATAC-Seq для Single Cell Explorer — глубокий анализ датасетов 10x Cell Ranger ATAC.
  • galaxy-applications — обертка Galaxy для SPAN.