ИКРБС
№ 222042700015-5Мета-анализ полногеномных данных на основе выявления и аннотации различных структурно-функциональных типов сайтов связывания транскрипционных факторов в составе композиционных элементов
23.03.2022
Разработан программный комплекс (ПК) MCOT (Motif Co-Occurrence Tool) для поиска совместно встречающихся мотивов (композиционных элементов, КЭ) со спейсером и с перекрыванием мотивов на основе одного набора данных эксперимента ChIP-seq. Мотивы интерпретируются как сайты связывания целевого (якорного) или других (партнёры) транскрипционных факторов (ТФ). Применение ПК MCOT для экспериментов ChIP-seq по ТФ млекопитающих показало, что количество потенциальных КЭ с перекрыванием мотивов более чем в два раза превышает количество КЭ со спейсером. Анализ наборов данных экспериментов ChIP-seq для ТФ человека имеющих наибольшее число белок-белковых взаимодействий (ББВ) с другими ТФ показал, что для более 60% якорных ТФ обнаружено значимое обогащение КЭ (пар «якорь» - партнёр»), для которых между ТФ в парах экспериментально доказаны ББВ. Ранее опубликованный контрольный набор экспериментально подтвержденных КЭ показал, что ПК MCOT существенно превосходит по точности предсказания доступных ранее ПК. Разработан алгоритм расчета значимости обогащения асимметричных КЭ с большей консервативностью одного из участвующих мотивов. Анализ наборов данных ChIP-seq для ТФ человека показал, что почти для всех семейств целевых ТФ совместная встречаемость пар мотивов с более консервативными мотивами партнёрских ТФ значительно выше, чем встречаемость пар с более консервативными мотивами якорных ТФ. Разработаны реализации ПК MCOT для запуска из командной строки https://gitlab.sysbio.cytogen.ru/academiq/mcot-kernel, а также веб-интерфейс https://webmcot.sysbio.cytogen.ru/. Интерфейс визуализирует результаты в виде диаграмм, отражающих структуру КЭ в зависимости от взаимного расположения и ориентаций двух мотивов; лого, показывающих частоты нуклеотидов в разных позициях КЭ, и тепловых карт, выявляющих асимметрию консервативностей якорного и партнёрского мотивов в составе КЭ. Веб сервер позволяет производить сортировку КЭ с партнёрскими мотивами разных ТФ по значимости совместной встречаемости. Мы разработали версию de novo для модели мотива SiteGA, которая учитывает зависимости нуклеотидов в пределах сайтов. Мы разработали версию MCOT для готовых профилей любой модели мотива, включая традиционную модель позиционной весовой матрицы (ПВМ) и нетрадиционные модели BaMM и SiteGA. Мы разработали версию MCOT для оценки совместной встречаемости кластеров из трёх и более мотивов с учётом их возможных перекрываний и расположений со спейсерами. Мы разработали конвейер MultiDeNA для совместного применения различных моделей поиска мотивов de novo с целью выявления различных структурных типов якорных мотивов в данных ChIP-seq. Функциональность нескольких КЭ была верифицировна in vivo методом направленного мутагенеза.
ГРНТИ
34.23.03 Теоретическая генетика
Ключевые слова
однонуклеотидные полиморфизмы
генная онтология
пермутационный тест
композиционные элементы
перекрывание мотивов
позиционные весовые матрицы
поиск мотивов de novo
сайты связывания траскрипционных факторов
массовое секвенирование
иммунопреципитация хроматина
Детали
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "РОССИЙСКИЙ ФОНД ФУНДАМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ"
Исполнитель
Федеральное государственное бюджетное научное учреждение «Федеральный исследовательский центр Институт цитологии и генетики Сибирского отделения Российской академии наук»
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 11 600 000 ₽
Похожие документы
Мета-анализ полногеномных данных на основе выявления и аннотации различных структурно-функциональных типов сайтов связывания транскрипционных факторов в составе композиционных элементов
0.935
НИОКТР
Мультимодельный подход к эффективному картированию сайтов связывания транскрипционных факторов по данным ChIP-seq экспериментов
0.932
Диссертация
«Программный комплекс для поиска синергии мотивов в данных полногеномного картирования сайтов связывания транскрипционных факторов ChIP-seq (MetArea) / Software package for motif synergy search in whole-genome transcription factors binding sites mapping ChIP-seq data (MetArea)»
0.910
РИД
Программный комплекс для предсказания совместной встречаемости мотивов с учетом их перекрывания на основе данных массового секвенирования ChIP-seq (ПСВМ) /The software package for prediction of motifs co-occurrence with account of their overlap for analysis of the next generation ChIP-sequencing data (MCOT)
0.909
РИД
Поиск, декомпозиция и верификация регуляторных модулей, обеспечивающих формирование пространственно-временных паттернов экспрессии генов (промежуточный)
0.896
ИКРБС
Модели мотивов в нуклеотидных последовательностях для анализа ДНК-белкового узнавания в задачах регуляторной геномики высших эукариот
0.891
ИКРБС
Геномный и транскриптомный мета-анализ опухолей различных локализаций: идентификация драйверных нарушений, потенциальных мишеней для таргетной терапии и факторов оценки её эффективности (итоговый)
0.887
ИКРБС
Интегративное моделирование укладки нуклеосом в хроматине на основе данных Micro-C
0.881
ИКРБС
ОТЧЕТ о научно-исследовательской работе по теме «Построение интерактомной карты человека» (Грант РФФИ № 18-34-00879)
0.877
ИКРБС
Поиск, декомпозиция и верификация регуляторных модулей, обеспечивающих формирование пространственно-временных паттернов экспрессии генов (промежуточный)
0.876
ИКРБС