ИКРБС
№ 225061816739-8«Разработка модуля подключения системы к ресурсам вычислительной инфраструктуры для сбора журналов событий средствами API-подключения. Сбор реального датасета для наполнения векторного хранилища с инфраструктуры, используемой в продуктивном режиме. Разработка модуля автоматизации использования векторного хранилища RAG для работы LLM на реальных данных. Тестирование опытного образца на ресурсах базовой инфраструктуры в составе: кластер виртуализации/VDI.» (промежуточный)
05.06.2025
Целью работы является доработка и тестирование опытного образца программного обеспечения автоматизации аварийного восстановления ИТ-инфраструктуры с использованием алгоритмов выявления аномалий на основе больших языковых моделей с использованием векторного хранилища.
Основными объектами исследования в ходе НИОКР являются модели и алгоритмы детектирования аномалий, подходы к построению модели LLM с использованием RAG, методы оптимизации работы большой языковой модели и векторного хранилища, а также их программная реализация
Методами исследования НИОКР являются как классические методы построения систем аналитики, предназначенных для выявления аномалий в журналах работы ИТ-системы, так и их авторская модификация с использованием больших языковых моделей и векторного хранилища, которые определяются как совокупность компонентов, асинхронно получающих и обрабатывающих поступающие события.
Областью применения является решение управленческих задач, связанных с предупреждением фактов и снижением длительности вынужденного простоя информационных систем вследствие аварийных ситуаций при эксплуатации ИТ-инфраструктуры.
Актуальность работы заключается в том, что существующие инструменты выявления аномалий работы инфраструктуры в журналах событий с помощью ключевых слов, триггеров, классических методов машинного обучения AIOps, LLM моделей обладают ограниченными возможностями по точности, корректности (отсутствию ложно-положительных срабатываний), скорости конфигурирования ключевых триггеров (в ряде систем это требуется делать в ручную по списку ключевых слов), возможности реагирования на ранее не возникавшие события (например, сообщения об ошибках, отсутствующих в исходном датасете при обучении модели). Журналы событий, принадлежащие различным системам и компонентам как правило обладают высокой вариативностью и уникальностью и задача проведения анализа становится сложной из-за объема, разнообразия и скорости поступления логов. Это дополнительно усложняется отсутствием или недоступностью аномальных записей логов для разработки обученных моделей машинного обучения или искусственного интеллекта для этих целей. Данные недостатки могут быть устранены путем использования большой языковой модели с поддержкой RAG, которая использует векторную базу данных для обнаружения аномалий в логах. Объем генерируемой информации в журналах работы ИТ-инфраструктуры в современной компании среднего размера может составлять десятки и сотни гигабайт в час, что не позволяет полагаться на административный персонал и оповещения из систем мониторинга для корректного и своевременного выявления аномалий в работе инфраструктуры, потенциально приводящих к сбоям и простоям в работе систем.
По итогам выполнения первого этапа НИОКР были получены следующие результаты:
- Разработан модуль подключения системы к ресурсам вычислительной инфраструктуры для сбора журналов событий средствами API-подключения.
- Проведен сбор реального датасета для наполнения векторного хранилища с инфраструктуры, используемой в продуктивном режиме.
- Разработан модуль автоматизации использования векторного хранилища RAG для работы LLM на реальных данных.
- Выполнено тестирования опытного образца на ресурсах базовой инфраструктуры в составе: кластер виртуализации/VDI.
Результаты выполнения первого этапа НИОКР признаем успешными. Работы выполнены в срок и в соответствии с техническим заданием.
Дальнейшими направлениями исследований и работ, которые будут выполнены на втором этапе НИОКР являются: доработка опытного образца с учетом результатов тестирования, разработка модулей оптимизации, ранжирования, сжатия, квантования LLM-модели для работы на CPU, разработка модуля анализа корректности функционирования инфраструктуры, модуля выявления аномалий, тестирование разработанных модулей на ресурсах расширенной инфраструктуры в составе: кластер виртуализации/VDI, подсистема СУБД, подсистема удаленного доступа.
ГРНТИ
20.15.13 Информационные службы на предприятиях и в учреждениях
Ключевые слова
Обнаружение аномалий в логах
Log anomaly detection
непрерывная работа ИТ-инфраструктуры
поддержка принятия решений с помощью ИИ
большая языковая модель
специализированные языковые модели (БЯМ)
Large language model (LLM)
RAG (Retrieval Augmented Generation)
генерация с дополненной выборкой
Детали
НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ИКС СИСТЕМНЫЕ ТЕХНОЛОГИИ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 2 400 000 ₽
Похожие документы
«Доработка опытного образца с учетом результатов тестирования. Разработка модулей оптимизации, ранжирования, сжатия, квантования LLM-модели для работы на CPU. Разработка модуля модуля анализа корретности функционирования инфраструктуры, модуля выявления аномалий. Тестирование разработанных модулей на ресурсах расширенной инфраструктуры в составе: кластер виртуализации/VDI, подсистема СУБД, подсистема удаленного доступа.»
(промежуточный)
0.982
ИКРБС
Реализация поддержки протокола OpenTelemetry в опытном образце. Разработка механизма динамических линий нормального поведения системы. Разработка модуля мониторинга мобильных приложений. Проектирование системы детектирования аномалий на основе многомерных временных рядов. (промежуточный)
0.919
ИКРБС
Доработка и тестирование опытного образца программного комплекса для мониторинга информационных систем и ИТ-инфраструктуры с предиктивным анализом сбоев и аварийных ситуаций на основе алгоритмов машинного обучения (заключительный)
0.917
ИКРБС
Отчет о выполнении НИОКР по теме "Разработка и тестирование прототипа программного комплекса для мониторинга информационных систем и ИТ-инфраструктуры и предиктивного анализа сбоев и аварийных ситуаций в режиме реального времени на основе нейросетевых алгоритмов" (Договор 50ГС1ИИС12-D7/72196 от 20.12.2021). Этап №1 "Определение основных критериев стабильной работы информационных систем. Проектирование и разработка модуля сбора и хранения данных мониторинга. Разработка функций распределенной трассировки транзакций. Доработка модуля мониторинга производительности приложений. Разработка алгоритмов предиктивного мониторинга по выявлению аномалий и прогнозированию отказов. Разработка модуля информирования о сбоях." (промежуточный)
0.916
ИКРБС
Отчет о выполнении НИОКР по теме "Разработка и тестирование прототипа программного комплекса для мониторинга информационных систем и ИТ-инфраструктуры и предиктивного анализа сбоев и аварийных ситуаций в режиме реального времени на основе нейросетевых алгоритмов" (Договор 50ГС1ИИС12-D7/72196 от 20.12.2021) Этап №2 "Разработка модуля мониторинга инфраструктуры информационных систем. Разработка модуля предиктивного мониторинга. Тестирование прототипа программного комплекса. Устранение выявленных ошибок и несоответствий в работе прототипа программного комплекса. (заключительный)
0.914
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: «Разработка и тестирование прототипа модуля для управления проектами с помощью системы мультиагентов, основанных на больших языковых моделях (LLM-MA)» (договор №252ГС1ИИС12-D7/101261 от 10.10.2024)
Этап №1 «Разработка мультиагентного фреймворка.
Разработка специализированных инструментов для использования агентами.
Разработка механизма Retrieval Augmented Generation (RAG).
Разработка чата для взаимодействия пользователя с системой.»
(промежуточный)
0.908
ИКРБС
Разработка системы мониторинга и аналитики информационного ландшафта на основе искусственного интеллекта. Заключительный: разработана компонентная база для системы мониторинга и аналитики информационного ландшафта на основе искусственного интеллекта, разработан пользовательский интерфейс на основе библиотеки компонентов, разработан интерфейс администратора на основе библиотеки компонентов, сформирован набор данных из открытых источников сети Интернет (датасет) и выполнена настройка Системы, разработано ядро системы, а также разработана программа и методика испытаний для REST API системы и аналитики. Разработаны алгоритмы машинного обучения. Разработана подсистема автоматического парсинга. Разработана подсистема семантического анализа. Разработана документация системы. Проведены испытания системы. Доработана система по результатам испытаний. Доработана документация системы по результатам испытаний.
0.905
ИКРБС
Разработка подсистемы обнаружения аномалий. Разработка подсистемы хранения размеченного трафика аномалий. Разработка подсистемы обучения системы анализа трафика. Разработка подсистемы обновлений.
0.905
ИКРБС
«Разработка и тестирование прототипа платформы для поиска актуального тематического новостного контента в Интернет с применением технологии искусственного интеллекта.» (договор №129ГС1ИИС12-D7/76683 от 14.06.2022).
Этап №1 «Исследование прогнозирования актуальности новостного контента из СМИ и социальных медиа по набору косвенных признаков. Разработка бэкенд-архитектуры онлайн-сервиса и парсера публикаций из Telegram. Разработка ключевых элементов пользовательского интерфейса прототипа платформы для поиска актуального тематического новостного контента. Тестирование разработанных модулей прототипа платформы для поиска актуального тематического новостного контента.»
0.903
ИКРБС
Исследование и выбор методов подготовки, трансформации, интеграции и анализа данных.
Разработка архитектуры прототипа интеллектуальной платформы для анализа данных.
Разработка компонентов для подключения к различным источникам данных.
Разработка no-code конструктора процессов подготовки и трансформации данных.
Тестирование подключения к источникам данных, выполнения операций подготовки и трансформации данных и работоспособности no-code конструктора процессов.
Анализ результатов тестирования и доработка подключения к источникам данных, выполнения операций подготовки и трансформации данных и работоспособности no-code конструктора процессов.
0.902
ИКРБС