РИД
№ 624061100065-1

Программа для кластеризации метагеномных последовательностей

11.06.2024

Программа предназначена для кластеризации метагеномных последовательностей, полученных в ходе сборки метагенома - метагеномных контигов. Включает инструмент для фрагментации метагеномных последовательностей с заданным размером окна, инструмент для подсчёта тетрамеров - возможных комбинаций четырёх нуклеотидов - в последовательностях . На основании данных картирования прочтений, проводимого на фрагментированные последовательности , определяется среднее покрытие последовательности . Полученные данные нормализуются и посредством снижения числа размерностей данных и последующей кластеризации фрагменты последовательностей относят к тому или иному кластеру либо некластеризованным последовательностям . Фрагменты одной последовательности , идущие подряд и относящиеся к одному кластеру, объединяются в одну последовательность . Программа получает входные файлы в следующих форматах: в формате FASTA - метагеномные последовательности , в формате FASTQ - метагеномные прочтения. Выходные данные представлены в табличном формате. Визуализация кластеров представлена в графическом формате PNG. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Linux, macOS.
ГРНТИ
20.53.15 Средства ввода информации
20.53.19 Средства обработки и поиска информации
31.15.15 Исследования строения и свойств молекул и химической связи
Ключевые слова
МЕТАГЕНОМ
ГЕНОМНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ
ОБРАБОТКА ГЕНОМНЫХ ДАННЫХ
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
База данных может использоваться специалистами в области биоинженерии, молекулярной биологии и биоинформатики.
Ожидается
Исполнитель
Исполнители
федеральное государственное бюджетное учреждение "Национальный исследовательский центр "Курчатовский институт"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ