РИД
№ 625012806630-9

Программа автоматизированного извлечения и анализа структурированных данных с веб-ресурсов нуклеотидных последовательностей ДНК и РНК

28.01.2025

Программа предназначена для автоматизации сбора и структурирования информации с веб-страниц открытых баз данных нуклеотидных последовательностей ДНК и РНК в табличный формат. Программа может применяться в научных исследованиях и образовательной деятельности. Программа разработана с использованием фреймворков для работы с веб-ресурсами и обработки данных. Используя Selenium WebDriver, программа инициализирует виртуальный браузер и загружает указанный URL. Программа имитирует действия пользователя с помощью точной идентификации элементов страницы через XPath, CSS селекторы, ID. Программа извлекает данные из строк кода, содержащих информацию о полиморфизме искомого гена в определенной популяции. Для этого используется библиотека BeautifulSoup в связке с lxml для разбора HTML и XML структур. Извлечённые данные о полиморфизмах генов структурируются и сохраняются в табличный формат CSV.
ГРНТИ
76.03.59 Медицинская кибернетика
76.03.39 Медицинская генетика. Медико-генетическое консультирование
Ключевые слова
популяция
ген
виртуальный браузер
фреймворк
структурирование
базы данных нуклеотидных последовательностей
Детали

НИОКТР
Тип РИД
Программа для ЭВМ
Сферы применения
Научные исследования и образовательная деятельность
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ НАУЧНОЕ УЧРЕЖДЕНИЕ "ДАЛЬНЕВОСТОЧНЫЙ НАУЧНЫЙ ЦЕНТР ФИЗИОЛОГИИ И ПАТОЛОГИИ ДЫХАНИЯ"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
Программа для оценки количественных характеристик геномных последовательностей
0.887
РИД
Программа для создания базы данных патогенных вариантов для анализа носительства моногенных заболеваний человека
0.879
РИД
Программа для обработки данных высокопроизводительного секвенирования
0.875
РИД
КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ ФАЙЛОВ АННОТИРОВАННЫХ ДНК-ПОСЛЕДОВАТЕЛЬНОСТЕЙ
0.874
РИД
Интерактивная система анализа экспрессии генов с элементами машинного обучения
0.864
РИД
NGS-data-Genome
0.864
РИД
Структурная аннотация генов сельскохозяйственных животных и объектов товарной аквакультуры
0.862
РИД
Опытный образец программного модуля для анализа научных публикаций, проектов и патентов с целью сбора данных о химических соединениях и их свойствах, биологической активности лекарственных препаратов и биологически активных молекул
0.861
РИД
Опытный образец программного модуля для сбора и анализа химических структур (включая текстовые и графические представления) из научных публикаций, патентов и проектов
0.861
РИД
-Разработка программного модуля для точной аннотации полиморфизмов человеческого генома на портале Генокарта.рф
0.860
НИОКТР