Модель и метод расчета структурно-сетевых параметров балансировки нагрузки в распределенных системах тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Сухоплюев Данил Игоревич

  • Сухоплюев Данил Игоревич
  • кандидат науккандидат наук
  • 2026, Таджикский национальный университет
  • Специальность ВАК РФ00.00.00
  • Количество страниц 160
Сухоплюев Данил Игоревич. Модель и метод расчета структурно-сетевых параметров балансировки нагрузки в распределенных системах: дис. кандидат наук: 00.00.00 - Другие cпециальности. Таджикский национальный университет. 2026. 160 с.

Оглавление диссертации кандидат наук Сухоплюев Данил Игоревич

Введение

Глава 1. Постановка проблемы и актуальность исследования

1.1. Современные подходы к анализу производительности TCP

1.1.1 Модель Гилберта-Эллиота

1.1.2. Цепи Маркова

1.1.3. Алгоритмы поиска кратчайшего пути

1.1.4. Инструменты моделирования и эмуляции

1.1.5. Анализ существующих платформ мониторинга

1.1.6. Обоснование выбора модели сетевой топологии

1.2. Цели и задачи исследования

1.2.1 Разработка графовой основы модели

1.2.1 Интеграция динамических характеристик сети

1.2.2 Учет особенностей TCP Reno

1.2.3 Интеграция модели с современными системами

1.2.4 Математические критерии надёжности и отказоустойчивости

1.3 Выводы по первой главе

Глава 2. Математическая модель анализа производительности TCP в нестабильных сетях

Глава 2.1 Модель сети на основе подграфов

2.2 Модель потерь пакетов на основе модели Гилберта-Эллиотта

2.3 Математическое моделирование для сетей TCP

2.4 Основные свойства математической модели

2.4.1 Критерии адекватности модели

2.4.2 Оценка полноты модели

2.4.2.1 Полнота структурного описания

2.4.2.2 Полнота динамического аспекта

2.5 Интеграция особенностей протокола TCP

2.6 Математическое расширение для учёта корреляций и зависимостей

2.7 Учёт погрешностей и неопределённостей измерений

2.8 Универсальность модели

Глава 2.8.1 Масштабируемость и вычислительная эффективность

2.8.2 Практическая применимость и ценность

2.9 Ограничения модели

2.10 Выводы по второй главе

Глава 3. Реализация модели отказоустойчивости и её интеграция в облачную инфраструктуру

3.1.1 Общая структура и слои вычисления

3.1.2 Специфика реализации ядра СДУ

3.1.3 Особенности структуры TcpState

3.1.4 Итоговая формула пропускной способности

3.1.5 Производительность и масштабирование

3.2 Моделирование поведения модели в сетях TCP

3.2.1 Влияние скачкообразного RTT

3.2.2 Влияние RTT после скачкообразного увеличения

3.2.3 Влияние RTT после скачкообразного увеличения

3.2.4 Влияние параметра X на устойчивость модели

3.2.5 Влияние дисперсии шума а

3.2.6 Влияние таймаута RTO на пропускную способность

3.2.7 Влияние шага дискретизации на устойчивость модели

3.2.8 Реакция модели на плавные изменения параметров

3.3 Оценка адекватности модели пропускной способности

3.4 Выводы по третьей главе

Глава 4. Практическая оценка устойчивости и отказоустойчивости в условиях сетевых деградаций

4.1 Испытательная среда и платформа

4.1.1 Серверная платформа

4.1.2 Клиентская сторона тестирования

4.2 Методика и протоколы испытаний

4.2.1 Система наблюдения

4.2.2 Методика сбора и анализа данных

4.2.3 Источники наблюдаемых данных

4.3 Методы анализа

4.3.1 Учет погрешностей

4.3.2 Методы анализа

4.4 Результаты по нагрузочным профилям

4.4.1 Кратковременные всплески нагрузки

4.4.2 Постоянно растущая нагрузка

4.4.3 Ступенчатая нагрузка

4.5 Анализ устойчивости модели в условии отказов

4.5.1 Сбой канала

4.5.2 Деградация канала связи

4.5.3 Сбой одного пода

4.5.4 Сбой одного узла

4.5.5 Потери по типу отказа и длительности

4.6 Сравнительный анализ сценариев деградации и восстановления

4.7 Практические рекомендации

4.8 Выводы по главе четыре

Заключение

Список сокращений и условных обозначений

Список литературы

Приложение 1 - Модуль вычисления пропускной способности

Приложение 2 - Стохастическое ядро

Введение

Актуальность темы. Современные высоконагруженные приложения, от логистических платформ до банковских систем, требуют обеспечения высочайшего уровня производительности и отказоустойчивости. Для решения этой задачи в качестве архитектурного стандарта всё чаще применяются распределённые системы, которые, однако, в силу своей сложной структуры и работы с большими потоками данных в реальном времени, сами становятся источником нетривиальных проблем, связанных с поддержанием стабильности.

Ключевой недостаток традиционных подходов к мониторингу заключается в их ориентации на метрики прикладного уровня. Такой подход не позволяет выявить корневые причины деградации производительности. Успешный НТТР-ответ или статус «работает» могут маскировать серьезные аномалии на сетевом уровне: от высокой вероятности повторных передач пакетов до проблем с согласованностью данных в системах, создавая разрыв в понимании реального состояния системы.

Стремительное внедрение систем оркестрации, в первую очередь Kubemetes, дополнительно усложняет диагностику. Динамическая маршрутизация и абстрактные сетевые политики, управляемые оркестратором, создают среду, в которой локальные проблемы, такие как «узкие места» в балансировщиках нагрузки, способны вызывать каскадную деградацию всей системы. В условиях высоконагруженных платформ, где цена даже незначительного сбоя чрезвычайно высока и может привести к потере данных или нарушению целостности бизнес-процессов, такая непредсказуемость недопустима.

Вышеописанные проблемы определяют актуальность научной задачи по

переходу от реактивного мониторинга к предиктивному анализу состояния

системы. Решению данной задачи и посвящена настоящая диссертационная

5

работа, в рамках которой предлагается модель, способная прогнозировать потенциальные сбои на основе анализа метрик сетевого уровня.

Степень разработанности. Современные исследования надёжности распределённых телекоммуникационных сетей базируются на различных математических подходах, в числе которых доминирующее место занимают модели случайных графов [23] и стохастические процессы [47]. Эти модели позволяют формировать строгие оценки таких характеристик сетей, как связность, диаметр и время восстановления после отказов. Важными исследованиями в области вероятностных подходов и методов статистической диагностики являются работы W. Ahmed и соавторов по моделированию надёжности коммуникационных сетей [36], Д. В. Кузнецова по прогнозированию отказов телекоммуникационного оборудования [37], а также Е. А. Басыни с коллегами по разработке самоорганизующихся систем управления трафиком вычислительных сетей [38].

Детальный алгоритмический расчёт структурно-сетевых параметров для телекоммуникационных сетей с высокими требованиями к качеству обслуживания (QoS) представлен в работах А. Н. Назарова [39]. Важным шагом вперёд стал предложенный А. Б. Фокиным универсальный метод вычисления коэффициентов готовности с учётом резервирования, который расширяет классический графовый анализ, интегрируя динамическую репликацию сервисов и использование резервных каналов [29, 50, 55].

Комплексный подход к оценке надёжности трактов, узлов и направлений связи изложен в монографии А. А. Зацаринного, А. И. Гаранина и С. В. Козлова [124], где рассматриваются как структурные, так и поведенческие аспекты функционирования ИТКС. Особое внимание уделяется анализу надёжности систем в защищённом исполнении, а также применению эквивалентных схем для количественной оценки готовности элементов сети.

Значительное развитие математическое моделирование и алгоритмы повышения отказоустойчивости получили в диссертационных исследованиях последних лет. Например, В. В. Кокшенёв предложил математические модели процедур управления потоками в условиях высоких нагрузок на транспортные соединения [7]. Исследования Ю. К. Гликмана посвящены алгоритмам многопутевой маршрутизации с целью повышения отказоустойчивости IP-сетей [20]. Е. С. Градов рассмотрел вопросы отказоустойчивости вычислительных систем с автоматическим распределением ресурсов, что актуально для современных распределённых платформ.

Анализ проблем «взрывных» потерь пакетов и коррелированных ошибок в IP-магистралях активно ведётся зарубежными исследователями, такими как G. Hasslinger и O. Hohlfeld [25]. Их работы дополняются исследованиями потоковых моделей и интенсивностных характеристик сетевого трафика [42, 48].

Особый интерес представляет изучение надёжности облачной и контейнерной инфраструктур, в том числе оценка доступности облачных сервисов при динамическом масштабировании [41], моделирование отказов распределённых облаков [43], метрики готовности кластеров Kubernetes [45], а также предсказание сбоев в микросервисных архитектурах [46]. Влияние корреляции отказов и резервирования каналов в центрах обработки данных (ЦОД) изучается в работах [50, 55], а автоматизированный анализ журналов отказов с использованием машинного обучения представлен в [57].

Важным направлением исследований является программно-конфигурируемые сети (SDN/SD-WAN). Для них предложены графовые методы оптимизации маршрутизации и методики комплексной оценки QoS в мультидоменных средах [44, 51]. Анализ устойчивости сервис-ориентированных систем рассмотрен в [52], а применение моделей Маркова к состояниям SDN-контроллеров - в [54]. Современные метрики устойчивости распределённых и

кибер-физических систем развиваются в работах [49, 56], подчёркивая необходимость учёта не только структурных, но и поведенческих характеристик при проектировании надёжных сетей.

Значительный вклад в развитие теории случайных графов и её прикладных аспектов в области анализа надёжности сетей внесла монография А. М. Райгородского [28].

Несмотря на отмеченный существенный прогресс — от строгих теоретических основ до инженерных методик оценки РоБ и готовности — до сих пор не создана комплексная модель, одновременно учитывающая топологию сети, временную корреляцию ошибок и динамику поведения транспортного протокола, что подтверждает актуальность и необходимость развития данного направления. Настоящая диссертационная работа направлена на решение указанных задач, используя наработки предшествующих исследований и их интеграцию в единый аналитический аппарат для оценки и управления надёжностью высоконагруженных КиЬегпе1е8-кластеров и аналогичных распределённых платформ.

Цель работы заключается в повышении эффективности процессов планирования, проектирования и развития распределённых систем за счет разработки и использования моделей и методов расчета их структурно-сетевых параметров, базирующейся на новейших инфокоммуникационных технологиях.

Научная задача, которая решена в диссертации, заключается в разрешении противоречия между сложностью процессов структурно-сетевого синтеза распределённых систем на новейших инфокоммуникационных технологиях и их элементов и неразвитостью их модельного и алгоритмического обеспечения на основе разработки комплекса моделей, методов, алгоритмов, проведения численных исследований и расчетного обоснования структурно -сетевых параметров распределённых систем, предназначенного для решения с

системных позиций широкого класса прикладных задач планирования, проектирования и развития распределённых систем.

Задачи исследования:

1. Провести анализ существующих подходов к моделированию производительности и отказоустойчивости распределённых систем, включая:

• Анализ классических моделей сетевых топологий (Эрдеша-Реньи, Уоттса-Строгаца, Барабаши-Альберт, Стохастическая блочная модель) для обоснования выбора структурной основы.

• Изучение вероятностных моделей пакетных потерь и их ограничений.

• Проанализировать существующие подходы к моделированию поведения протокола TCP в нестабильных сетях.

2. Разработать комплексную математическую модель для предиктивного анализа, обеспечивающую синтез трёх ключевых аспектов сетевого взаимодействия:

• Объединить модель топологии сети с моделью Гилберта-Эллиотта для описания как структурных, так и динамических характеристик сети.

• Интегрировать в модель особенности поведения протокола TCP, включая алгоритмы контроля перегрузки, механизм скользящего окна и таймеры повторной передачи.

• Формализовать математические зависимости и уравнения, описывающие взаимодействие между структурой сети, динамикой каналов связи и поведением протокола TCP.

3. Разработать и теоретически обосновать метод анализа сетевых взаимодействий, основанный на предложенной модели, и адаптировать его для применения в системах контейнерной оркестрации.

4. Сформировать методические рекомендации для адаптивного управления репликацией, использующие предиктивные метрики (прогноз пропускной способности и вероятности потерь) в качестве основы для принятия решений по оптимизации размещения и синхронизации данных.

5. Алгоритмически обосновать и провести практическую верификацию разработанных теоретических положений:

• Численная верификация модели является важным этапом исследования, обеспечивающим её корректность и практическую применимость, а также докажет критерии адекватности и полноты.

• Провести всесторонние экспериментальные испытания модуля на стенде в условиях управляемых сетевых отказов и различных профилей нагрузки для подтверждения адекватности, точности и практической применимости модели.

Объект исследования являются распределённые системы, в которых процессы взаимодействия между компонентами зависят от состояния сети, а отказоустойчивость и доступность определяются структурными и динамическими характеристиками сетевых соединений.

Предметом исследования являются методы и модели мониторинга отказоустойчивости и управления репликацией в распределённых системах, которые интегрируют структурные и динамические аспекты сетевых взаимодействий.

Методы и средства исследования. Научные результаты диссертации были получены с использованием теории вероятностей, теории графов, а также методов анализа и моделирования динамических систем. В рамках работы применялись методы численного моделирования, позволяющие оценивать отказоустойчивость распределённых систем на основе вероятностных характеристик и структурных свойств сети. Использовались методы

статистического анализа для обработки экспериментальных данных и верификации разработанной модели, а также методы вычислительной математики для решения задач оптимизации сетевых взаимодействий.

Для анализа сетевых топологий и оценки их доступности использовались методы теории графов, включая поиск связанных компонент, оценку вероятности связности подграфов и моделирование потоков данных. При исследовании динамики сетевых процессов применялись модели марковских цепей и методы расчёта коэффициентов готовности.

Научная новизна диссертационной работы.

1. Разработана комплексная математическая модель для предиктивного анализа отказоустойчивости, которая, в отличие от существующих подходов, обеспечивает синтез трёх ключевых аспектов сетевых взаимодействий в распределённых системах. Модель интегрирует структурное описание гетерогенной топологии микросервисных архитектур на основе Стохастической блочной модели (SBM), динамическое моделирование вероятностного характера пакетных потерь и протокольный аспект, учитывающий нелинейную реакцию алгоритмов контроля перегрузки TCP Reno.

2. Предложен и исследован метод анализа сетевых взаимодействий, адаптированный для современных систем контейнерной оркестрации. Метод формализует последовательность шагов: от построения структурной модели сети на основе данных мониторинга до её обогащения динамическими характеристиками и последующего расчёта прогнозных метрик, что позволяет количественно оценивать влияние топологии и вероятности отказов на доступность системы.

3. Получены методические рекомендации для адаптивного управления репликацией, которые используют предиктивные метрики, генерируемые

моделью (прогноз пропускной способности и вероятности потерь), в качестве управляющих сигналов. Это позволяет перейти от эвристических подходов к научно обоснованной оптимизации размещения реплик в наиболее стабильных сетевых сегментах.

4. Разработана и экспериментально верифицирована алгоритмическая основа стохастической модели, воплощённая в виде программного модуля. Практическая реализация и интеграция данного модуля с промышленными инструментами наблюдаемости (eBPF) доказывает работоспособность предложенных теоретических решений и их применимость для предиктивного анализа в реальных условиях.

Теоретическая значимость диссертационной работы заключается в развитии подходов к анализу отказоустойчивости и доступности распределённых систем на основе синергии графового и вероятностного моделирования. Предложенная математическая модель обеспечивает новое представление о взаимодействии структурных характеристик сети и её динамических свойств, таких как потери пакетов, задержки и интенсивность отказов. Это позволяет развить теоретический анализ и синтез процессов, происходящих в сетях, и формализовать адекватные требованиям предметной области методы их анализа.

Работа вносит вклад в развитие методов прогнозирования и планирования состояния сети, где учёт временных зависимостей и коррелированных отказов становится ключевым элементом. Полученные результаты могут быть использованы для дальнейшего исследования теоретических основ мониторинга, управления репликацией данных и адаптивного распределения нагрузки в сложных сетевых системах. Вследствие этого, диссертация способствует развитию методического аппарата, необходимого для описания и анализа современных распределённых систем на основе новейших инфокоммуникационных технологий.

Практическая значимость диссертационной работы заключается в том, что внедрение в процессы планирования, проектирования и развития современных распределённых систем на основе новейших инфокоммуникационных технологий результатов проведенного исследования позволит существенно повысить качество построения и функционирования таких систем. Полученные результаты способствуют развитию теории и практики синтеза современных распределённых систем на основе новейших инфокоммуникационных технологий, создании модели и подходов, которые могут быть использованы для мониторинга и управления отказоустойчивостью распределённых систем. Разработанная модель создаёт алгоритмические основы разработки средств инструментального анализа текущего состояния сети, прогнозирования возможных сбоев и оптимизации сетевых взаимодействий. Это особенно актуально для распределённых систем, работающих в условиях высокой нагрузки и динамических изменений, таких как Kubemetes-кластеры и облачные инфраструктуры.

Реализация алгоритмики модели в виде программного модуля на современных средствах программирования позволяет интегрировать её в существующие системы мониторинга и управления, что открывает возможности для практического использования в реальных условиях. Такой модуль может применяться для адаптивного управления репликацией данных на практике, что снижает риск потери информации и повышает производительность реальных систем. Использование метрик сетевого уровня в сочетании с данными мониторинга улучшает практически значимую диагностику сетевых проблем, позволяя выявлять и устранять узкие места до того, как они повлияют на производительность приложений.

Предложенные решения могут быть полезны для разработчиков систем управления распределёнными вычислениями, обеспечивая научное и

алгоритмическое обоснование создания инструментов для анализа и оптимизации сетевой инфраструктуры. Кроме того, работа предоставляет подходы, которые могут быть применены в индустрии для повышения надёжности и доступности сервисов, что имеет практическое значение в широком спектре областей, включая финтех, телекоммуникации и системы обработки больших данных. В силу этого, результаты работы находят применение как в исследовательской, так и в прикладной деятельности, направленной на улучшение качества работы современных распределённых систем.

Положения, выносимые на защиту:

1. Комплексная математическая модель для предиктивного анализа отказоустойчивости, которая, в отличие от существующих подходов, обеспечивает синтез трёх ключевых аспектов распределённой системы:

• структурного, описывающего гетерогенную топологию микросервисных архитектур на основе стохастической блочной модели;

• динамического, моделирующего вероятностный характер потерь пакетов на каналах связи;

• протокольного, учитывающего нелинейную реакцию алгоритмов контроля перегрузки TCP Reno на состояние сети. Такая интеграция позволяет получать комплексную оценку производительности и прогнозировать её деградацию.

2. Метод анализа сетевых взаимодействий, основанный на предложенной модели и адаптированный для современных систем контейнерной оркестрации, таких как Kubernetes. Метод включает последовательность шагов: построение структурной модели сети на основе данных о взаимодействии сервисов, её обогащение динамическими характеристиками каналов и последующий расчёт прогнозных метрик производительности, что позволяет количественно

оценивать влияние топологии и вероятности отказов на общую доступность системы.

3. Методические рекомендации для адаптивного управления репликацией, использующие предиктивные метрики, генерируемые моделью (прогноз пропускной способности и вероятности потерь, в качестве управляющих сигналов. Данный подход позволяет оптимизировать размещение реплик в наиболее стабильных, с точки зрения прогноза, сетевых сегментах и принимать обоснованные решения о режиме синхронизации данных, повышая тем самым общую отказоустойчивость и производительность системы.

4. Программно реализованная и экспериментально верифицированная алгоритмическая основа стохастической модели, воплощённая в виде высокопроизводительного вычислительного модуля. Практическая интеграция данного модуля с современными промышленными инструментами наблюдаемости (eBPF, Prometheus) и его испытания на стенде в условиях управляемых сетевых отказов подтверждают работоспособность предложенных в диссертации результатов, решений и их применимость для предиктивного анализа в реальных распределённых системах.

Соответствие паспорту специальности. Диссертационная работа соответствует направлению исследований 9. Модели, методы, алгоритмы, облачные технологии и программная инфраструктура организации глобально распределенной обработки данных паспорта специальности 2.3.5 "Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей".

Достоверность полученных результатов обеспечивается: Обоснованность и достоверность полученных результатов подтверждается использованием математических моделей, адекватных характеру исследуемых процессов, а также применением корректных численных методов,

соответствующих современным подходам к анализу надёжности распределённых систем. Верификация и воспроизводимость моделирования обеспечивались сопоставлением результатов с эмпирическими данными, полученными в контролируемых условиях при имитации отказов и деградации.

Апробация результатов исследования осуществлялась в рамках участия в ряде международных научно-технических мероприятий. Ключевые положения диссертационной работы докладывались и обсуждались на конференциях «Systems of Signais Generating and Processing in the Field of on Board Communications» (2023, 2024), E3S Web of Conferences (WFCES 2023), а также на форуме «Wave Electronics and its Application in Information and Telecommunication Systems (WECONF)» в 2024 году. Полученные отзывы подтвердили как научную, так и прикладную значимость предложенного подхода. Разработанные компоненты модели также использовались при построении экспериментальной платформы для анализа отказов в распределённых телекоммуникационных системах.

Публикации. Основные положения диссертации опубликованы в 7 работах, 4 из них — в ведущих рецензируемых научно-технических журналах, входящих в перечень ВАК [21, 58, 62, 105], и 3 — в изданиях, индексируемых в базе данных Scopus [59, 61, 125]. Все публикации отражают ключевые этапы построения математической модели, разработку алгоритмов прогнозирования, а также результаты практической апробации в условиях имитации деградации и восстановления распределённых систем.

Личный вклад автора. Все выносимые на защиту научные результаты получены соискателем лично. Автор принимал непосредственное участие в планировании и проведении работы, обработке и обсуждении полученных результатов, подготовке публикаций.

Структура работы и объём: Диссертация состоит из введения, четырёх

глав, заключения, списка сокращений и условных обозначений, списка литературы и приложения. Основное содержание изложено на 155 страницах машинописного текста, включает 42 рисунка и 17 таблиц. Список литературы содержит 125 источников. В приложении приведён код программного модуля, который реализует ключевые компоненты разработанной модели.

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Модель и метод расчета структурно-сетевых параметров балансировки нагрузки в распределенных системах»

Глава 1. Постановка проблемы и актуальность

исследования

Ключевой проблемой современных высоконагруженных приложений, от стриминговых платформ до банковских систем, заключается в том, что стандарт де-факто для их построения — распределённая архитектура — сам становится источником фундаментальных проблем со стабильностью. Гибкость и масштабируемость, которые дают такие системы, достигаются ценой значительного усложнения их топологии и сетевых взаимодействий, что превращает мониторинг в нетривиальную задачу.

Фундаментальная проблема традиционных подходов к мониторингу кроется в их концентрации на метриках прикладного уровня. Системы наблюдаемости, такие как Prometheus [11] или Grafana [12], зачастую оперируют агрегированными данными, создавая опасную иллюзию благополучия. Успешный код ответа «HTTP 200 OK» не говорит ничего о том, что творится «под капотом»: он может маскировать высокую частоту повторных передач TCP-пакетов [6], аномальные задержки или проблемы с согласованностью компонентов. Это создает «слепую зону», которая не позволяет связать деградацию пользовательского опыта с её первопричиной на сетевом уровне.

Эту «слепую зону» значительно расширяет повсеместное внедрение систем оркестрации, в первую очередь Kubernetes [8]. Динамическая маршрутизация, балансировка нагрузки и сложные сетевые политики создают настолько изменчивую среду, что отследить путь одного пакета становится практически невозможно. Механизмы вроде ECMP [20], распределяющие трафик по нескольким маршрутам [117], могут приводить к нарушению порядка доставки пакетов, что провоцирует их повторную передачу [118] и снижает общую пропускную способность. В такой динамичной среде локальная проблема в одном из компонентов сети способна вызвать последовательный отказ всей

18

системы.

Существующие инструменты не справляются с этой комплексной задачей из-за своей узкой специализации. С одной стороны, системы анализа сетевых потоков, такие как NetFlow [10], предоставляют данные о трафике, но полностью изолированы от контекста приложений. С другой стороны, системы мониторинга приложений, как уже отмечалось, лишены низкоуровневой сетевой информации. Эта сегментация инструментов не позволяет администраторам получить целостную картину и эффективно диагностировать проблемы.

Прорыв в решении этой проблемы наметился с появлением технологий наблюдаемости на уровне ядра ОС, таких как eBPF [14, 115] и построенных на них систем вроде Cilium [13]. Технология eBPF позволяет с минимальными накладными расходами собирать детальные метрики непосредственно из ядра: время прохождения пакетов (RTT) [9], размер окна перегрузки TCP, факты потерь и повторных передач. Это дает беспрецедентно глубокое понимание того, что на самом деле происходит в сети.

Однако просто собирать эти данные недостаточно. Их объем и сложность требуют разработки новых моделей и процедур для их интерпретации в реальном времени. Необходимо не просто фиксировать рост RTT или потери пакетов, но и понимать, как эти события коррелируют между собой и как на них реагируют сложные адаптивные механизмы TCP. Следовательно, актуальной научной задачей становится разработка комплексного подхода, который бы объединял детальные метрики сетевого уровня с состоянием приложений для предиктивного анализа и предотвращения сбоев. Именно созданию такой модели и посвящена данная работа.

1.1. Современные подходы к анализу производительности TCP

Высокая сложность современных сетей фактически обесценивает

традиционные инструменты мониторинга, которые ориентированы

19

исключительно на прикладной уровень. Это создает фундаментальную проблему: мы можем детально анализировать работу самого приложения, но остаемся в неведении относительно реального поведения сетевых каналов, которое и определяет итоговую производительность. Даже подробный разбор прикладных алгоритмов балансировки, представленный в [59], не решает этой проблемы, поскольку он не затрагивает аномалии, возникающие на транспортном уровне. Таким образом, возникает острая необходимость в моделях, способных описывать и прогнозировать именно поведение сети

1.1.1 Модель Гилберта-Эллиота

Одним из ключевых направлений является анализ существующих -подходов, таких как модель Гилберта-Эллиотта [4,5]. Эта модель представляет собой базовый инструмент для описания потерь в сетях, особенно в условиях нестабильных каналов связи. Рассмотрение её возможностей, ограничений и адаптаций для сложных распределённых систем позволяет выявить области для дальнейшего совершенствования методов мониторинга и интеграции новых процедур, которые будут учитывать динамические характеристики современных сетей.

Модель Гилберта-Эллиотта представляет собой один из наиболее популярных подходов для описания потерь пакетов в сетях. Она широко используется благодаря своей простоте и способности учитывать переменные состояния каналов связи, такие как стабильные и нестабильные периоды. Эта модель основана на представлении канала связи в виде двух состояний:

• "хорошее"(Good, G)

• "плохое" (Bad, B).

Переходы между состояниями описываются как марковский процесс с

заданными вероятностями:

• ръ - вероятность перехода из состояния 0 в состояние в.

• рё - вероятность перехода из состояния в в состояние 0. Матрица переходов для данной модели выглядит следующим образом:

А =Л - р> Л Рг 1-Ря

Рисунок 1.1 - Граф переходов модели Гилберта-Эллиотта. Стационарные вероятности пребывания канала в состояниях 0 ив определяются как:

По =■

К в =

_ Рь

Рь + " + Рь Модель Гилберта-Эллиотта обладает рядом преимуществ, которые делают её полезным инструментом для анализа сетевых каналов. Её основное достоинство заключается в способности описывать переменные состояния канала, что особенно актуально для сетей, где периоды стабильности сменяются нестабильностью. Эта характеристика позволяет моделировать такие явления, как временные увеличения потерь пакетов, возникающие из-за перегрузок или сбоев оборудования [28].

Однако, несмотря на свою полезность, модель имеет и ограничения. Её ключевой недостаток заключается в упрощённом подходе к описанию динамики

потерь, поскольку она предполагает, что потери зависят только от текущего состояния канала. В реальных сетях потери пакетов часто имеют сложные временные зависимости, которые модель не учитывает. Ещё одной проблемой является то, что модель не интегрирует реакции транспортного уровня, такие как динамическое изменение окна отправителя или повторные передачи, характерные для протокола TCP. Эти аспекты играют значительную роль в анализе сетей, особенно в условиях современных распределённых систем с их сложной маршрутизацией [119] и балансировкой нагрузки.

Модель GE может быть интегрирована в процедуры мониторинга для оценки надёжности сетей. Например, вероятность успешного соединения между узлами. Если сетевой маршрут состоит из N каналов, вероятность успеха передачи данных может быть представлена как (уравнение 1.1) [120]:

N

Psuccess ~ П — Pbad,i) (1.1)

i=1

где Pbadi - вероятность потери пакетов на i -ом канале, рассчитанная с использованием модели GE.

Так же GE может использоваться для анализа временных интервалов, в течение которых состояние канала остаётся в "хорошем" или "плохом" состоянии, что полезно для прогнозирования деградации соединений.

Однако её ограниченность в учёте транспортного уровня и сложных топологий делает необходимым её доработку и интеграцию с более сложными подходами для мониторинга современных распределённых систем.

1.1.2. Цепи Маркова

Цепи Маркова [114] представляют собой мощный математический

инструмент для моделирования процессов, где вероятности будущих событий

зависят только от текущего состояния, а не от предшествующих. Это свойство,

22

известное как "марковское", делает такие модели удобными для описания поведения сетей, где состояния соединений, такие как «активно», «с перебоями» или «отказ», могут изменяться во времени в зависимости от определённых условий.

В контексте сетевого анализа цепи Маркова широко применяются для описания переходов между различными состояниями канала связи. Каждое состояние может быть ассоциировано с определёнными характеристиками, например, низкой или высокой вероятностью потерь пакетов. Например, если рассматривать сетевой канал с тремя состояниями: «хорошее соединение», «частичные сбои» и «полный отказ», переходы между этими состояниями можно описать с помощью матрицы переходов (уравнение 1.2):

Р =

( Рх1 Рх 2 РиЛ

Р21 р22 р23 V Р31 Р32 рзз)

(1.2)

где Рц обозначает вероятность перехода из состояния I в ц. При этом сумма

вероятностей в каждой строке равна 1, что отражает факт полного распределения вероятностей по всем возможным переходам.

Используя свойства матрицы переходов, можно вычислить стационарное распределение состояний, которое показывает, с какой вероятностью канал будет находиться в каждом из возможных состояний в долгосрочной перспективе. Это стационарное распределение л удовлетворяет уравнению (уравнение 1.3):

пР = л (1.3)

где л = \лх, л2, л3 ], а сумма компонентов вектора л так же равна 1.

Хотя марковские цепи и являются мощным инструментом для оценки надёжности сетей, их базовое предположение о независимости событий ограничивает их применимость в современных динамических системах. Классическая модель не учитывает сложные зависимости и временные

23

корреляции, которые критически важны для точного анализа, что подтверждается рядом современных исследований [15-18]. В связи с этим научный интерес смещается в сторону более сложных подходов, таких как скрытые марковские модели [116], позволяющих преодолеть ограничения традиционных методов.

1.1.3. Алгоритмы поиска кратчайшего пути

Алгоритмы кратчайшего пути играют ключевую роль в анализе и моделировании сетевых взаимодействий, особенно в контексте маршрутизации данных в распределённых системах. Они позволяют находить оптимальные маршруты между узлами в сети, минимизируя определённый критерий, например, задержки, стоимость передачи данных или количество промежуточных узлов. Эти алгоритмы находят применение как в теоретическом анализе сетевых топологий, так и в практических задачах маршрутизации, включая моделирование отказов и прогнозирование нагрузки.

Одним из наиболее известных алгоритмов является алгоритм Дейкстры. Он находит кратчайший путь от одного источника ко всем другим узлам графа с положительными весами рёбер. Его базовая идея заключается в итеративном выборе узла с минимальной стоимостью пути и обновлении значений для соседних узлов. Математически алгоритм Дейкстры можно описать следующим образом:

1. Инициализация:

• Для каждого узла V: й (V) = , где й(V) - минимальная стоимость пути от источника до узла V.

• Для источника 5 : й (s) = 0.

2. Повторение:

• Выбор узла и с минимальным значением й(и) из ещё не

посещённых узлов.

• Для каждого соседа V узла и: обновление стоимости пути й(V) = тт(й(V), й(и) + w(v, и)), где w(v, и) - вес ребер между и и

V .

3. Завершение:

• Процесс продолжается, пока все узлы не будут посещены. Результатом работы алгоритма Дейкстры является массив минимальных

расстояний от источника ко всем узлам графа, что делает его полезным для задач, где требуется оценить доступность и надёжность соединений.

о

Рисунок 1.2 - Алгоритм Дейкстры.

Алгоритм Беллмана-Форда [19] представляет собой ещё один метод поиска кратчайших путей, который, в отличие от Дейкстры, может работать с графами, содержащими рёбра с отрицательными весами. Этот алгоритм использует итеративный подход для обновления значений минимальных расстояний, повторяя этот процесс \¥\ -1 раз, где VI - количество узлов в графе. Для каждого ребра (и, V) выполняется проверка и обновление (уравнение 1.4):

й (у) = тт(й (у), й (и) + м?(и, у))

(1.4)

б

5

2 --а-» 4

7

О

6

1

3

9

Рисунок 1.3 - Алгоритм Беллмана-Форда.

В основе анализа сетевых топологий лежат классические графовые алгоритмы. Однако выбор конкретного алгоритма определяет саму возможность прогнозирования сбоев. Так, алгоритм Дейкстры, несмотря на свою вычислительную эффективность, ограничен работой с положительными весами рёбер, что делает его пригодным в основном для статического анализа уже существующих маршрутов. В противовес ему, алгоритмы вроде Беллмана-Форда, хоть и медленнее, способны оперировать отрицательными весами. Эта возможность критически важна для моделирования динамических сценариев: например, отказ узла или внедрение новой сетевой политики можно представить как изменение весов рёбер, в том числе и в отрицательную сторону. Таким образом, эти алгоритмы позволяют не просто реагировать на сбои, а заранее вычислять последствия потенциальных отказов, что является ключевой задачей мониторинга в современных распределённых системах.

Математический аспект применения заключается в возможности оценки стабильности маршрутов. Если р - вероятность сохранения доступности ребра между узлами 1и ] , то вероятность доступности маршрута между двумя узлами может быть выражена как произведение вероятностей доступности рёбер на этом

маршруте (уравнение 1.5):

Ppath = П Puv (1-5)

(u,v)e path

Фундаментальное ограничение классических алгоритмов поиска кратчайшего пути заключается в их статической природе. Они рассчитаны на неизменный граф, в то время как топология современных распределённых систем находится в постоянном движении из-за отказов узлов, балансировки нагрузки или изменения сетевых политик. Более того, эти алгоритмы полностью игнорируют «физику» транспортного уровня — они не учитывают, как протоколы вроде TCP реагируют на перегрузку или потери пакетов. Этот отрыв от реальности делает их «сырые» результаты малопригодными для точного анализа. Таким образом, они перестают быть самостоятельным решением и могут рассматриваться лишь как базовый компонент, требующий обязательной интеграции в более сложные, динамические модели мониторинга.

1.1.4. Инструменты моделирования и эмуляции

ECMP это метод маршрутизации, который распределяет сетевой трафик между несколькими путями с одинаковой метрикой стоимости. Основная идея ECMP заключается в том, чтобы эффективно использовать доступные ресурсы сети, одновременно увеличивая её пропускную способность и обеспечивая отказоустойчивость. Этот метод получил широкое применение в современных распределённых системах, таких как Kubernetes, где высокая нагрузка и сложные топологии требуют динамического распределения трафика.

Рисунок 1.4 - CNI плагин Kubemetes на основе технологии ECMP(Cilium). ЕСМР основывается на том, что при наличии нескольких маршрутов с одинаковой стоимостью между источником и получателем трафик может быть распределён равномерно или по заданной политике. Ключевым элементом ЕСМР является хэширование заголовков пакетов, которое позволяет определить, какой маршрут будет использован для каждого конкретного пакета. Обычно используются такие поля заголовка, как:

• Ш-адрес источника и назначения,

• номер порта источника и назначения,

• идентификатор протокола.

Хэш-функция преобразует эти поля в числовое значение, которое

сопоставляется с одним из доступных маршрутов. Следовательно, пакеты одного

28

потока (определяемого уникальной комбинацией 1Р-адресов и портов) направляются по одному и тому же маршруту, что исключает проблемы с нарушением порядка доставки.

ЕСМР представляет собой обманчиво простой подход к масштабированию сетевой инфраструктуры. Теоретически, распределяя трафик по нескольким равноценным маршрутам, он одновременно решает задачи увеличения пропускной способности и обеспечения отказоустойчивости.

Однако на практике его главный недостаток — «слепота» к реальному состоянию сети — сводит на нет многие из этих преимуществ. Статичное хэширование без учета текущей загрузки каналов создает риск возникновения «узких мест», в то время как распараллеливание потоков одного ТСР-соединения провоцирует нарушение порядка доставки пакетов, что ведет к деградации производительности.

Таким образом, хотя ЕСМР и решает проблему физической избыточности, он делает это ценой создания непредсказуемости и проблем на транспортном уровне, что требует разработки более интеллектуальных, контекстно-зависимых механизмов управления трафиком.

Ещё одним вызовом является масштабирование ЕСМР в условиях сложных топологий. В распределённых системах, таких как кластеры Kubemetes, маршруты могут часто изменяться из-за динамической маршрутизации или изменения нагрузки. Это требует обновления хэш-таблиц, что может быть вычислительно затратным и вызывать временные сбои в маршрутизации.

С точки зрения анализа, эффективность ЕСМР можно оценивать через равномерность распределения трафика. Пусть N - количество маршрутов с одинаковой стоимостью, а Т - объём трафика, передаваемый по I -му маршруту. Для идеального распределения выполняется (уравнение 1.6):

Т =, Ч- е (1,2,..., N}

Т

Ж

(1.6)

где Т1Ш1 - общий объём трафика. Отклонение реального распределения от идеального можно описать через дисперсию (уравнение 1.7):

Меньшее значение О указывает на более равномерное распределение нагрузки.

Для учёта отказов маршрутов вероятность успешной доставки данных можно описать через вероятность доступности маршрута РраЛ. Если маршруты

работают независимо, суммарная вероятность доступности определяется как (уравнение 1.8):

где РраЛ^ - вероятность успешной работы I -го маршрута. Этот подход помогает оценивать влияние отказов маршрутов на общую надёжность системы.

Эффективность механизма ЕСМР, направленного на повышение пропускной способности и отказоустойчивости, остается «чёрным ящиком» без специализированных процедур мониторинга. Чтобы оценить реальное положение дел, необходимо анализировать как равномерность распределения трафика по путям, так и динамические метрики каждого маршрута, включая задержки и потери.

Проактивный подход к мониторингу в таких сетях также подразумевает обязательное моделирование отказов — например, анализ последствий для всей системы при гипотетическом выходе из строя одного из каналов. Этот анализ позволяет превратить мониторинг из инструмента фиксации проблем в инструмент их предотвращения. Следовательно, разработка и интеграция таких ECMP-ориентированных процедур является необходимым шагом для построения по-настоящему отказоустойчивых систем.

1 м Т О = — V (Т — Т оа )2

О NN >

(1.7)

(1.8)

1.1.5. Анализ существующих платформ мониторинга

Помимо теоретических моделей, для полноты картины необходимо проанализировать существующие промышленные и open-source решения в области наблюдаемости, чтобы определить их сильные стороны и выявить незанятую нишу для предлагаемого в работе подхода. Современный рынок инструментов можно условно разделить на три категории: комплексные коммерческие платформы, специализированные решения на базе технологии eBPF и сборные стеки на основе компонентов с открытым исходным кодом.

Таблица 1.1 - Сравнение индустриальных решений по мониторингу.

Критерий Коммерческие платформы Специализированные eBPF-решения Сборные Open Source решения

Основной подход "Всё в одном", готовое решение Глубокий сбор данных как сервис "Собери сам" из лучших компонентов

Примеры Datadog, New Relic, Dynatrace, отечественные аналоги отсутствуют Cilium Hubble, Pixie, отечественные аналоги отсутствуют Prometheus + Grafana + Jaeger + Cilium, отечественные аналоги отсутствуют

Аналитический движок Встроенный, проприетарный ("черный ящик") Базовый или отсутствует Отсутствует. Пробел для собственной реализации

Сложность внедрения Низкая Средняя Высокая

Гибкость/ Кастомизация Средняя Высокая (в рамках своей задачи) Максимальная

Для кого лучше всего подходит Компаний, которым нужно быстрое, комплексное и поддерживаемое решение. Команд, которым нужен самый детальный уровень сетевых данных для интеграции. Экспертных команд, которым нужен полный контроль и кастомизация без зависимости от поставщика.

Как следует из проведённого анализа, несмотря на развитые возможности по сбору и агрегации данных, у существующих решений отсутствует прозрачный и научно обоснованный аналитический движок для предиктивного анализа. Коммерческие платформы предлагают проприетарные AI/ML-модели, работающие по принципу "черного ящика", в то время как open-source стеки предоставляют лишь базовые инструменты визуализации, оставляя задачу глубокого анализа и прогнозирования пользователю. Особую актуальность данной задаче придает тот факт, что ведущие коммерческие платформы с проприетарными аналитическими движками являются разработками западных компаний, что в условиях санкционных ограничений существенно затрудняет или делает невозможным их приобретение и поддержку. Это формирует острую потребность в создании отечественных, прозрачных и научно обоснованных инструментов предиктивного анализа. Предлагаемая в диссертации модель призвана заполнить именно эту нишу, предоставляя не закрытый алгоритм, а верифицируемый математический аппарат для прогнозирования отказоустойчивости.

1.1.6. Обоснование выбора модели сетевой топологии

Фундаментом любой сетевой модели является адекватное описание её топологии. Выбор математического аппарата для представления структуры сети напрямую влияет на точность и релевантность всех последующих динамических расчётов. В теории графов существует несколько канонических моделей, каждая из которых отражает определённые свойства реальных сетей. Для обоснованного выбора необходимо провести их сравнительный анализ в контексте задачи моделирования микросервисных архитектур, что представлено в таблице 1.2.

Таблица 1.2 - Модели топологии сети.

Параметр Модель Эрдеша-Реньи (ЭР) Модель Уоттса-Строгаца (УС) Модель Барабаши-Альберт (БА) Стохастическая блочная модель (СБМ)

Топологическая характеристика Стохастическая однородность Эффект "малого мира" Масштабная инвариантность Модульность (структура сообществ)

Коэффициент кластеризации Низкий (С ~ р) Высокий Выше, чем у ЭР Высокий (внутриблочный)

Анализ показывает, что для адекватного описания сетевых взаимодействий в системах на базе Kubemetes, характеризующихся чёткой модульной структурой, наиболее релевантной является стохастическая блочная модель (СБМ). В отличие от модели Эрдеша-Реньи с её предположением о гомогенности, СБМ напрямую отражает реальность, где поды сгруппированы в сервисы. Её фундаментальное понятие "сообществ" позволяет с высокой точностью моделировать интенсивный внутрисервисный трафик и более разреженные межсервисные коммуникации. Модель Барабаши-Альберт, хоть и является эволюционной, описывает закон роста ("богатые богатеют"), который не всегда соответствует управляемой логике масштабирования в оркеструемых или облачных средах.

Таким образом, именно концептуальная основа SBM была выбрана в качестве структурного базиса для гибридной модели, разрабатываемой в настоящей диссертации.

1.2. Цели и задачи исследования

Целью настоящей диссертационной работы является разработка комплексной математической модели для оценки и прогнозирования отказоустойчивости распределённых систем. Модель основана на интеграции

графовых методов анализа топологии с вероятностным описанием динамических процессов на сетевом и транспортном уровнях.

Для достижения поставленной цели в работе были определены и решены следующие ключевые задачи:

1. Разработать графовое представление сетевой структуры, формально описывающее топологические особенности и связи между узлами системы.

2. Интегрировать в модель вероятностные метрики для адекватного описания динамических событий, таких как потери пакетов, возникновение задержек и восстановление соединений.

3. Проанализировать и учесть в модели влияние ключевых механизмов протокола TCP (на примере TCP Reno) на состояние сети при динамических изменениях её характеристик.

4. Адаптировать предложенную модель для применения в современных средах контейнерной оркестрации (на примере Kubernetes) и продемонстрировать возможность её интеграции с существующими инструментами мониторинга.

1.2.1 Разработка графовой основы модели

Сеть представляется в виде графа, где узлы соответствуют компонентам системы (серверам, маршрутизаторам, балансировщикам нагрузки), а рёбра — соединениям между ними. Графовая структура позволяет описывать топологию сети и её связанность. Основное внимание уделяется вероятности связности подграфов, которая зависит от состояния отдельных рёбер. Например, вероятность доступности маршрута между двумя узлами можно выразить через произведение вероятностей доступности рёбер, входящих в этот маршрут.

Для оценки общей доступности сети используются методы, основанные на

теории вероятностей и графов. Одним из ключевых подходов является

34

вычисление коэффициента готовности сети, который учитывает, как физическую связанность компонентов, так и их состояние в произвольный момент времени.

1.2.1 Интеграция динамических характеристик сети

Для формального описания динамики сетевых соединений на транспортном уровне введем базовый вероятностный подход. Поведение соединения можно смоделировать как процесс с двумя состояниями, характеризуемый интенсивностью отказов (Я) и интенсивность восстановления (l). В этом случае, вероятность безотказной работы соединения в течение времени t описывается классической функцией надёжности: (уравнение 1.9):

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Сухоплюев Данил Игоревич, 2026 год

Список литературы

1. Desnoyers, M. User-Level Implementations of Read-Copy Update / M. Desnoyers, P. E. McKenney, A. Stern, M. R. Dagenais, J. Walpole // IEEE Transactions on Parallel and Distributed Systems. - 2012. - Vol. 23, no. 2. -P. 375-382. - DOI: 10.1109/TPDS.2011. 159..

2. Maruyama, G. Continuous Markov processes and stochastic equations / G. Maruyama // Rendiconti del Circolo Matematico di Palermo. - 1955. - Vol. 4. - P. 48-90.

3. Padhye, J. Modeling TCP Reno performance: a simple model and its empirical validation / J. Padhye, V. Firoiu, D. Towsley, J. Kurose // IEEE/ACM Transactions on Networking. - 2000. - Vol. 8, no. 2. - P. 133145. - DOI: 10.1109/90.842137.

4. Gilbert, E. N. Capacity of a Burst-Noise Channel // The Bell System Technical Journal. - 1960. - Vol. 39, no. 5. - P. 1253-1265. - DOI: 10.1002/j.1538-7305. 1960.tb03959. x.

5. Elliott, E. O. Estimates of error rates for codes on burst-noise channels / E. O. Elliott // The Bell System Technical Journal. - 1963. - Vol. 42, no. 5. - P. 1977-1997. - DOI: 10.1002/j.1538-7305. 1963.tb01473.x

6. Татарникова, Т. М. Выявление аномалий сетевого трафика методом глубокого обучения / Т. М. Татарникова, Ф. Бимбетов, П. Ю. Богданов // Известия СПбГЭТУ ЛЭТИ. - 2021. - №№ 4. - С. 36-41. - EDN SHMWTD.

7. Кокшенёв, В. В. Математические модели процедур управления потоком высоконагруженных транспортных соединений: дис. канд. техн. наук: 05.13.11 / Кокшенёв Владимир Владимирович. - Томск, 2014. - 175 с.

8. Вьяс, Дж. Kubernetes изнутри / Дж. Вьяс, К. Лав; пер. с англ. А. Н. Киселева. - Москва: ДМК-Пресс, 2022. - 378 с.

9. Измерение временных задержек передачи и обработки данных в

сетевых системах управления / И. Ю. Лепехин, П. А. Голубев, В. Г. Промыслов, К. В. Семенков // Управление развитием крупномасштабных систем (MLSD'2021) : Труды Четырнадцатой международной конференции, Москва, 27-29 сентября 2021 года / Под общей редакцией С.Н. Васильева, А.Д. Цвиркуна. - Москва: Институт проблем управления им. В.А. Трапезникова РАН, 2021. - С. 1355-1362. - DOI 10.25728/1293.2021.20.27.001.

10. Земзеров, П. А. Анализ и визуализация сетевого трафика на основе технологии экспорта потоков NetFlow / П. А. Земзеров, С. В. Суворов // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и технические науки. - 2020. - № 1. - С. 78-86.

11. Пивотто Ж., Бразил Б. Запускаем Prometheus: мониторинг инфраструктуры и приложений / пер. с англ. А. Н. Киселёва. — М.: ДМК-Пресс, 2023. — 392 с

12. Лазарева, Н. Б. Оптимальный выбор системы мониторинга для различных типов ИТ-инфраструктур / Н. Б. Лазарева // Инженерный вестник Дона. - 2022. - № 4(88). - С. 60-69.

13. Cilium - eBPF-based Networking, Observability, Security [Электронный ресурс]. - Cilium.io, 2025. URL: https://cilium.io/ (дата обращения: 05.03.2024).

14. Уваров, В. Е. Анализ неполных последовательностей, описываемых скрытыми марковскими моделями / В. Е. Уваров, А. А. Попов, Т. А. Гультяева // Искусственный интеллект и принятие решений. - 2017. - № 2. - С. 17-30.

15. Королюк, В. С. Процессы марковского восстановления в задачах надёжности систем / В. С. Королюк, А. Ф. Турбин. - Киев: Наук. думка, 1982. - 236 с.

16. Моттль В. В., Мучник И. Б. Скрытые марковские модели в структурном анализе сигналов. — М.: Физматлит, 1999. — 352 с.

17. Борисов А. В. Анализ состояний скрытых марковских моделей, порожденных специальными скачкообразными процессами // Теория вероятностей и ее применения. - 2007. - Т. 51, № 3

18. Укрупненная полумарковская и скрытая марковская модели технической системы на основе сигналов от подсистем / Ю. Е. Обжерин, С. М. Сидоров, М. М. Никитин, С. Н. Федоренко // Прикаспийский журнал: управление и высокие технологии. - 2023. - № 1(61). - С. 120126. - DOI 10.54398/20741707_2023_1_120.

19. Кормен Т.Х., Лейзерсон Ч.Э., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ. - 3-е изд. - М.: Вильямс, 2013. - 1328 с.

20. Гликман Ю. К. Разработка метода и алгоритмов многопутевой маршрутизации для повышения отказоустойчивости IP-сетей: дис. ... канд. техн. наук: 05.13.01. - СПб., 2005. - 119 с.

21. Сухоплюев, Д. И. Моделирование устойчивости в распределенных системах на основе обобщенной модели Эрдёша - Реньи и модели Гилберта - Эллиотта / Д. И. Сухоплюев, А. Н. Назаров // Computational Nanotechnology. - 2025. - Т. 12, № 1. - С. 79-88. - DOI 10.33693/2313-223X-2025-12-1 -79-88

22.. Велиева Т. Р., Королькова А. В., Кулябов Д. С., Сантуш Б. А. Модель управления очередями на маршрутизаторах // Вестник РУДН. Серия «Математика, информатика, физика». - 2014. - № 2. - С. 81-9

23. Hablinger, G. The Gilbert-Elliott model for packet loss in real time services on the internet / G. Hablinger, O. Hohlfeld // 2008 14th GI/ITG Conference on Measuring, Modelling and Evaluation of Computer and Communication Systems, MMB 2008, Dortmund, 31 марта - 02 2008 года. - Dortmund,

2008. - P. 5755057. - EDN SSWAZB.

24. Hasslinger G., Hohlfeld O. The Gilbert-Elliott Model for Packet Loss in Real-Time Services on the Internet // Proc. 19th GI/ITG Workshop "Measurement, Modelling and Evaluation of Computer and Communication Systems (MMB 2008)". — Kaiserslautern, 2008. — P. 1-15.

25.Pieper J., Voran S. Relationships between Gilbert-Elliot Burst Error Model Parameters and Error Statistics. — NTIA Technical Memorandum TM-23-565. — Boulder (CO), 2023. — 29 с.

26.Lapidoth A., Wang L. Rate and Nearly-Lossless State over the Gilbert-Elliott Channel // Entropy. — 2025. — Vol. 27, № 5. — Art. 494. — DOI 10.3390/e27050494.

27. Мальцева Г. Н., Джумкова В. В. Аддитивная граница вероятности ошибки в дискретном канале передачи информации с помехоустойчивым кодированием и группированием ошибок // Информационно-управляющие системы. — 2020. — № 4. — С. 78-86. — DOI 10.31799/1684-8853-2020-4-78-86.

28. Mushkin M., Bar-David I. Capacity and Coding for the Gilbert-Elliott Channels // IEEE Transactions on Information Theory. — 1989. — Vol. 35, № 6. — P. 1277-1290.

29.Райгородский А. М. Модели случайных графов. — Дубна: Физико-мат. Центр, 2019. — 108 с.

30. Фокин, А. Б. Метод расчета вероятностей связности (коэффициентов готовности) телекоммуникационной сети, поддерживающей механизмы обеспечения отказоустойчивости / А. Б. Фокин // Информационные системы и технологии. - 2023. - № 4(138). - С. 83-91.

31. Владимиров С. С. Реализация четырехпараметрической модели канала Гилберта-Эллиотта в среде Octave/Matlab // Информационные

технологии и телекоммуникации. — 2014. — № 4 (8). — С. 88-96.

32. Balakrishnan H., Rahul H., Seshan S. An Integrated Congestion Management Architecture for Internet Hosts // Proc. ACM SIGCOMM. - 1999. - P. 175187.

33. Pieper J., Voran S. Relationships between Gilbert-Elliott Burst Error Model Parameters and Error Statistics. — NTIA Technical Memorandum TM-23-565. — Boulder (CO), 2023. — 29 с.

34. Goldsmith A., Varaiya P. Capacity of fading channels with channel side information // IEEE Transactions on Information Theory. - 1997. - Vol. 43, No. 6. - P. 1986-1992.

35. Mushkin M., Bar-David I. Capacity and Coding for the Gilbert-Elliott Channels // IEEE Transactions on Information Theory. — 1989. — Vol. 35, № 6. — P. 1277-1290.

36. Ahmed, W. Reliability Modeling and Analysis of Communication Networks [Электронный ресурс] / W. Ahmed, O. Hasan, U. Pervez, J. Qadir // arXiv.org. - 2016. - 25 с. - Режим доступа: https://arxiv.org/abs/1612.08910 (дата обращения: 21.06.2022)

37. Кузнецов, Д. В. Прогнозирование отказов телекоммуникационного оборудования на основе данных системы телеметрии / Д. В. Кузнецов // Наука XXI века: технологии, управление, безопасность: Материалы II национальной научной конференции, Курган, 21 апреля 2022 года / Отв. редактор Е.Н. Полякова. - Курган: Курганский государственный университет, 2022. - С. 78-85. - EDN RNFWNX.

38. Басыня, Е. А. Самоорганизующаяся система управления трафиком вычислительной сети / Е. А. Басыня, Г. А. Французова, А. В. Гунько // Доклады Томского государственного университета систем управления и радиоэлектроники. - 2014. - № 1(31). - С. 179-184.

39. Назаров А. Н. Модели и методы расчёта структурно-сетевых параметров сетей ATM. — М.: Горячая линия-Телеком, 2002. — 256 с.

40. Шелухин О. И., Тенякшев А. М., Осин А. В. Фрактальные процессы в телекоммуникациях. - М.: Радиотехника, 2003. - 480 с.

41. Сопин, Э. С. Анализ показателей качества функционирования систем облачных вычислений с гистерезисным управлением / Э. С. Сопин, М. О. Таланова, Ю. В. Гайдамака // T-Comm: Телекоммуникации и транспорт. - 2015. - Т. 9, № 9. - С. 54-60.

42. Павлова, М. М. Математическая модель передачи потоковых данных прикладного уровня по беспроводным каналам связи / М. М. Павлова, А. В. Абилов // T-Comm: Телекоммуникации и транспорт. - 2013. - Т. 7, № 11. - С. 142-146.

43. Hossain H., Hassan M. R. Reliability modeling of distributed cloud infrastructures // IEEE Trans. Cloud Computing. — 2024. — Vol. 12, No. 3.

— P. 450-463.

44. Болодурина, И. П. Разработка методов и алгоритмов маршрутизации динамических потоков данных приложений и сервисов в гетерогенной облачной платформе / И. П. Болодурина, Д. И. Парфенов // Фундаментальные исследования. - 2016. - № 12-1. - С. 24-30.

45. Долматов, Р. А. Оптимизация масштабируемости и отказоустойчивости микросервисов с применением Kubemetes / Р. А. Долматов, С. Э. Сараджишвили // Системный анализ в проектировании и управлении: Сборник научных трудов XXVIII Международной научно-практической конференции. В 2-х частях, Санкт-Петербург, 27-29 июня 2024 года. -Санкт-Петербург: Санкт-Петербургский политехнический университет Петра Великого, 2024. - С. 542-547. - DOI 10.18720/SPBPU/2/id24-557.

- EDN VAPEJS.

46. Klymova E., Ryabov A. Failure prediction in containerized microservice architectures // Proc. 17th Int. Conf. Distributed Computing Systems (ICDCS 2023). — Bologna, 2023. — P. 312-321.

47. Чакрян, В. Р., Бутакова, М. А. Технология и алгоритмы стохастического моделирования потоков сообщений в беспроводных телекоммуникационных сетях / В. Р. Чакрян, М. А. Бутакова // Информатика, телекоммуникации и управление. - 2009. - Вып. 1 (72). -С. 34-41.

48. Цимбал, В. А. Математическое моделирование процессов информационного обмена дискретными сообщениями по каналам связи на основе производящих функций вероятности случайной величины / В. А. Цимбал, С. Е. Потапов, И. Д. Потапова // Цифровая обработка сигналов. - 2021. - № 3. - С. 17-23.

49. Xu Y., Chen J. Graph-theoretic resilience metrics for federated cloud systems // ACM Computing Surveys. — 2022. — Vol. 55, No. 7. — Art. 139.

50. Миронов, О. Ю. Разработка и исследование алгоритмов динамического резервирования канального ресурса защищённых корпоративных мультисервисных сетей связи: дис. канд. техн. наук: 05.12.13 / О. Ю. Миронов. - Москва, 2020. - 148 с

51. Pham, T. A. Q. Global QoS Policy Optimization in SD-WAN [Электронный ресурс] / T. A. Q. Pham, S. Liu, T. H. Luan, D. Niyato, P. Wang // arXiv.org. - 2023. - Режим доступа: https://arxiv.org/abs/2304.05473 (дата обращения: 08.09.2024)

52. Papazoglou M., van den Heuvel W.-J. Service-oriented computing: state of the art and research challenges // IEEE Computer. — 2020. — Vol. 53, No. 5. — P. 38-50.

53. Аллакин, В. В. Общий подход к построению перспективных систем

мониторинга распределенных информационно-телекоммуникационных сетей / В. В. Аллакин, Н. П. Будко, Н. В. Васильев // Системы управления, связи и безопасности. - 2021. - № 4. - С. 125-227. - DOI 10.24412/2410-9916-2021 -4-125-227.

54. Применение ортогональных моделей тензорного анализа для исследования QoS в SDN / В. И. Закиров, А. А. Ковалева, А. С. Третьяков [и др.] // Международный научно-исследовательский журнал.

- 2017. - № 3-4(57). - С. 40-46. - DOI 10.23670/IRJ.2017.57.146.

55. Буслаев, А. П. Динамические системы и математические модели трафика информации / А. П. Буслаев, Д. А. Кучелев, М. В. Яшина // T-Comm: Телекоммуникации и транспорт. - 2018. - Т. 12, № 3. - С. 22-38.

- DOI 10.24411/2072-8735-2018-10049.

56. Yang S., Tomsovic K. Quantifying resilience in cyber-physical power systems // IEEE Trans. Smart Grid. — 2021. — Vol. 12, No. 1. — P. 30-39.

57. Zhu, J., He, S., Liu, J., He, P., Xie, Q., Zheng, Z., Lyu, M. R. Tools and Benchmarks for Automated Log Parsing [Электронный ресурс] / J. Zhu et al. // arXiv.org. - 2018. - Режим доступа: https://arxiv.org/abs/1811.03509 (дата обращения: 19.02.2024)

58. Сухоплюев Д. И., Назаров А. Н. Мониторинг отказоустойчивости в распределенных системах // Computational Nanotechnology. — 2024. — Т. 11, № 4. — С. 94-106. — DOI 10.33693/2313-223X-2024-11-4-94-106.

- EDN GHFEEC.

59. Sukhoplyuev D. I., Nazarov A. N. Analysis of Application-Level Load Balancing Algorithms // Systems of Signals Generating and Processing in the Field of on-Board Communications. — 2023. — Vol. 6, No. 1. — P. 477480. — DOI 10.1109/IEEECONF56737.2023.10092019. — EDN CIESCC.

60. Sukhoplyuev D., Nazarov A. Methods for Analyse Performance in

Distributed Systems // E3S Web of Conferences: V International Scientific Forum on Computer and Energy Sciences (WFCES 2023), Almaty, Kazakhstan, 18-19 мая 2023 г. — Almaty: EDP Sciences, 2023. — P. 01029.

— DOI 10.1051/e3sconf/202341901029. — EDN VEUXVW.

61. Sukhoplyuev D. I., Nazarov A. N. Stochastic Analysis of Cyber Threats in Information Systems // Wave Electronics and Its Application in Information and Telecommunication Systems. — 2024. — Vol. 7, No. 1. — P. 316-320.

— DOI 10.1109/WECONF61770.2024.10564601. — EDN YYCFIZ.

62. Сухоплюев Д. И., Назаров А. Н. Стохастические подходы к обеспечению устойчивости распределённых систем репликации // ИТ-Стандарт. — 2025. — № 2(43). — С. 78-92.

63. Mathis M., Semke J., Mahdavi J., Ott T. The Macroscopic Behavior of the TCP Congestion Avoidance Algorithm // Computer Communication Review. - 1997. - Vol. 27, № 3. - Pp. 67-82.

64. Mathis M., Semke J., Mahdavi J., Ott T. The Macroscopic Behavior of the TCP Congestion Avoidance Algorithm // Computer Communication Review.

— 1997. - Vol. 27, No. 3. - P. 67-82.

65. ГОСТ 27.002-2021. Надёжность в технике. Термины и определения. — М.: Стандартинформ, 2021. — 48 с.

66. Градов, Е. С. Обеспечение отказоустойчивости вычислительной системы с автоматическим распределением ресурсов: специальность 05.13.15 "Вычислительные машины, комплексы и компьютерные сети": диссертация на соискание ученой степени кандидата технических наук / Градов Евгений Сергеевич. - Москва, 2004. - 178 с.

67. Chen, H., Xia, Y. A Normality Test for High-dimensional Data based on a Nearest Neighbor Approach [Электронный ресурс] / H. Chen, Y. Xia // arXiv.org. - 2019. - Режим доступа: https://arxiv.org/abs/1904.05289 (дата

обращения: 17.02.2025).

68. Лемешко, Б. Ю. Сравнительный анализ критериев проверки отклонения распределения от нормального закона / Б. Ю. Лемешко, С. Б. Лемешко // Метрология. - 2005. - № 2. - С. 3-24.

69. Окольнишников, В. В. Разработка средств распределенного имитационного моделирования для многопроцессорных вычислительных систем: специальность 05.13.18 "Математическое моделирование, численные методы и комплексы программ" : диссертация на соискание ученой степени доктора технических наук / Окольнишников Виктор Васильевич. - Новосибирск, 2006. - 227 с. -EDN NORQRR.

70. ISO/IEC 14882:2020. Programming Language C++. — Женева: ISO, 2020. — Ч. 33, §33.5 Atomic Operations.

71. Абросимова, М. А. Использование Python при работе с большими данными / М. А. Абросимова, Л. С. Власова // Информационные технологии. Проблемы и решения. - 2020. - № 3(12). - С. 53-59.

72. Гусев В. Н. Математическая статистика и анализ данных. — 3-е изд. — СПб.: Питер, 2022. — 608 с.

73. Crucitti, P., Latora, V., Marchiori, M. A model for cascading failures in complex networks [Электронный ресурс] / P. Crucitti, V. Latora, M. Marchiori // arXiv.org. - 2003. - Режим доступа: https://arxiv.org/abs/cond-mat/0309141 (дата обращения: 12.10.2024)

74. Jacobson V. Congestion Avoidance and Control // Proc. ACM SIGCOMM '88. — Stanford Univ., 1988. — P. 314-329.

75. Исследование fork-join системы с марковским входным потоком и распределением времени обслуживания фазового типа / В. М. Вишневский, В. И. Клименок, А. М. Соколов, А. А. Ларионов //

Проблемы информатики. - 2023. - № 4(61). - С. 29-56. - DOI 10.24412/2073-0667-2023-4-29-56.

76. Intel® 64 and IA-32 Architectures Optimization Reference Manual. — Intel Corp., 2024. — 1 348 p. [Электронный ресурс]. URL: https: //www. intel. com/content/www/us/en/developer/articles/technical/intel-sdm.html (дата обращения: 05.03.2025).

77. Робисон А. Threading Building Blocks: Patterns for Parallel Programming / пер. С англ. В. Фармаковского. — М.: ДМК-Пресс, 2022. — 384 с.

78. The Kubernetes Authors. Kubernetes Autoscaling Concepts. — v1.29 Documentation. — [Электронный ресурс]. URL: https: //kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/ (дата обращения: 12.12.2024).

79. gRPC Core Concepts. — The Linux Foundation, 2025. — [Электронный ресурс]. URL: https://grpc.io/docs/ (дата обращения: 18.02.2025).

80. Fielding R. T. Architectural Styles and the Design of Network-based Software Architectures: PhD Thesis. — Univ. of California, Irvine, 2000. — 212 p.

81. Google. Protocol Buffers v3 Language Guide. — [Электронный ресурс]. URL: https://protobuf.dev/ (дата обращения: 07.06.2023).

82. xsimd — C++ wrappers for SIMD intrinsics. — 2025. — [Электронный ресурс]. URL: https://github.com/xtensor-stack/xsimd (дата обращения: 11.04.2025).

83. ISO/IEC 14882:2020 Programming Language C++. — Женева: ISO, 2020. — Ч. 33 §33.4 Threads; доп. TBB concurrent_queue — см. Источник № 30.

84. Chittamuru S. et al. Learning eBPF. — Sebastopol, CA: O'Reilly, 2024. — 294 p.

85. The Kubernetes Authors. Kubernetes API Reference: Deployment. —

v1.29. — [Электронный ресурс].Ц^:

https://kubernetes.io/docs/reference/generated/152ubernetes/api/v1.29/#depl oyment-v1-apps (дата обращения: 27.01.2024).

86. Guerrieri L. Load-testing HTTP services with wrk and k6 // Linux Journal. — 2023. — № 312. — С. 22-29.

87. Donenfeld, J. WireGuard: Next Generation Kernel Network Tunnel [Электронный ресурс]. -2021. - 10 с. - Режим доступа: https://www.wireguard.com/papers/wireguard.pdf (дата обращения: 15.11.2023)

88. Hemminger S. Network Emulation with netem // Linux Conference Au Proceedings. — 2021. — P. 1-8. [Электронный ресурс]. URL: https://www.linux.org/docs/netem (дата обращения: 17.06.2024).

89. N. Parvez, A. Mahanti and C. Williamson, "An Analytic Throughput Model for TCP NewReno," in IEEE/ACM Transactions on Networking, vol. 18, no. 2, pp. 448-461, DOI: 10.1109/TNET.2009.2030889.

90. Cardwell N., Savage S., Anderson T. E. Modeling TCP Latency // Proc. IEEE INFOCOM 2000. — Tel-Aviv, 2000. — P. 1742-1751.

91. Ширяев А. Н. Вероятность. — 4-е изд., испр. и доп. — М.: МЦНМО, 2023. — 664 с.

92. Гихман И. И., Скороход А. В. Введение в теорию стохастических процессов. — 4-е изд. — Киев: Наукова думка, 2008. — 568 с.

93. Jacobson V., Braden R., Borman D. Computing TCP's Retransmission Timeout // RFC 6298. — IETF, 2011. — 15 p.

94. Анализ статистических зависимостей характеристик качества речевой информации в трафике IP-сетей / К. А. Батенков, А. В. Королев, М. В. Илюшин, В. В. Новиков // Вестник Брянского государственного технического университета. - 2019. - № 6(79). - С. 92-97. - DOI

10.30987/article_5d10852029ec46.45558801.

95. Allman M., Paxson V., Blanton E. TCP Congestion Control // RFC 5681. — IETF, 2009. — 19 p.

96. 0ksendal B. Stochastic Differential Equations. An Introduction with Applications. — 6th ed. — Berlin: Springer, 2019. — 408 p.

97. Kloeden P. E., Platen E. Numerical Solution of Stochastic Differential Equations. — 3rd ed. — Berlin: Springer, 2013. — 723 p.

98. Karatzas I., Shreve S. E. Brownian Motion and Stochastic Calculus. — 2nd ed. — New York: Springer, 1991. — 470 p.

99. Розов, А. К. Стохастические дифференциальные уравнения и их применение / А. К. Розов. - Санкт-Петербург: Политехника, 2016. - 306 с. - ISBN 978-5-7325-1092-8.

100. Ha S., Rhee I., Xu L. CUBIC: A New TCP-Friendly High-Speed TCP Variant // ACM SIGOPS Operating Systems Review. — 2008. — Vol. 42, № 5. — С. 64-74.

101. Cardwell N., Cheng Y., Gunn C. S. et al. BBR: Congestion-Based Congestion Control // ACM Queue. — 2016. — Vol. 14, № 5. — 18 p.

102. Кормен Т. Х., Лейзерсон Ч. Э., Ривест Р. Л., Штайн К. Алгоритмы. Построение и анализ. — 4-е изд., испр. и доп. — М.: Вильямс, 2022. — 1 312 с. (Гл. 25.2 «Алгоритм Флойда-Уоршелла», с. 776-781).

103. Floyd R. W. Algorithm 97: Shortest Path // Communications of the ACM. — 1962. — Vol. 5, № 6. — P. 345.

104. Левек Р. Дж. Численные методы конечно-объёмных схем для гиперболических уравнений / пер. с англ. В. Я. Камышева. — М.: МЦНМО, 2011. — 624 с. — Гл. 6 «Условие Куранта».

105. Сухоплюев, Д. И. Эффективная реализация стохастической модели TCP на C++/AVX для анализа производительности распределенных

систем / Д. И. Сухоплюев, А. Н. Назаров // Computational Nanotechnology. - 2025. - Т. 12, № 2. - С. 68-74. - DOI 10.33693/2313-223X-2025-12-2-68-74. - EDN QVVYTE.

106. Low S. H., Paganini F., Doyle J. C. Optimization Flow Control, I: Basic Algorithm and Convergence // IEEE/ACM Transactions on Networking. — 2002. — Vol. 10, № 4. — С. 513-527.

107. Kelly F. P., Maulloo A. K., Tan D. K. H. Rate Control for Communication Networks: Shadow Prices, Proportional Fairness and Stability // Journal of the Operational Research Society. — 1998. — Vol. 49. — С. 237-252.

108. Go. [Электронный ресурс].URL: https://github.com/golang/go (дата обращения: 22.10.2024).

109. Goetz B., Eckstein R. An Introduction to Real-Time Java Technology: Part 1, The Real-Time Specification for Java (JSR 1). Oracle, 2008.

110. Hemminger S. Network Emulation with netem // Proceedings of Linux.conf.au 2005. — Canberra, 2005. — P. 1-8.

111. Clarke R. Linux Advanced Routing & Traffic Control HOWTO. — Version 2.2.2016. — The Linux Documentation Project, 2016. — 192 p.

112. Azakharenko, A. Имитируем сетевые проблемы в Linux: задержки, потери, джиггер с помощью tc [Электронный ресурс] / A. Azakharenko // Хабр. - 30.01.2020. - Режим доступа: https://habr.com/ru/articles/486136/ (дата обращения: 14.09.2023).

113. Cheswick W. R., Bellovin S. M., Rubin A. D. Firewalls and Internet Security: Repelling the Wily Hacker. — 3rd ed. — Boston: Addison-Wesley, 2022. — 832 p.

114. Дынкин Е. Б. Марковские процессы: монография. — М.: ГИФМЛ, 1963. — 861 с.

115. eBPF для наблюдаемости Kubernetes: обзор практик [Электронный

ресурс] // Хабр. — URL: https://habr.com/ru/articles/746080/ (дата обращения: 20.06.2023).

116. Акчурина, Л. В. Сравнительный анализ применения цепей Маркова и сетей Петри для моделирования защищенных информационных процессов в телекоммуникационных сетях / Л. В. Акчурина, А. Н. Бабкин, С. П. Алексеенко // Вестник Воронежского института МВД России. - 2024. - № 1. - С. 79-85.

117. Equal-cost multi-path routing // Википедия.Электронный ресурс - URL: https : //en. wikipedia. org/wiki/Equal-cost_multi-path_routing (дата обращения: 12.03.2024).

118. RFC 9000, QUIC: A UDP-Based Multiplexed and Secure Transport. IETF, 2021. URL: https://datatracker.ietf.org/doc/html/rfc9000 (дата обращения: 12.09.2024)

119. Goyal P., Shah P., Zhao K. и др. Backpressure Flow Control [Электронный ресурс] // arXiv.org. - 2019. - URL: https://arxiv.org/abs/1909.09923 (дата обращения: 20.06.2025).

120. Каштанов В. А., Медведев А. И. Теория надёжности сложных систем: учеб. пособие. — 2-е изд., перераб. — М.: Физматлит, 2010. — 608 с.

121. Черникова, Е. И. Анализ сетевого трафика с использованием метода машинного обучения / Е. И. Черникова // Аллея науки. - 2019. - Т. 1, № 6(33). - С. 921-925.

122. Gregg B. Systems Performance: Enterprise and the Cloud. 2nd ed. Addison-Wesley, 2020. 928 p.

123. ISO/IEC 20000-1:2018. Information technology — Service management — Part 1: Service management system requirements. International Organization for Standardization, 2018.

124. Зацаринный, А. А. Научно-практические аспекты обеспечения

надёжности информационно-телекоммуникационных сетей: монография / А. А. Зацаринный, А. И. Гаранин, С. В. Козлов. - М.: Горячая линия - Телеком, 2017. - 200 с. - ISBN 978-5-9912-0684-1.

125. Sukhoplyuev, D. I. Methods of Descriptive Statistics in Telemetry Tasks / D. I. Sukhoplyuev, A. N. Nazarov // Systems of Signals Generating and Processing in the Field of on-Board Communications. - 2024. - Vol. 7, No. 1. - p. 457-461. - DOI 10.1109/IEEECONF60226.2024.10496798.

Приложение 1 - Модуль вычисления пропускной способности

// throughput_estimator.hpp #pragma once

#include <cstdint>

#include <cmath> // Необходимо для std::sqrt

#include <algorithm> // Необходимо для std::max

struct TcpState {

double rtt; // в секундах

double rto; // в секундах

double loss_p; // вероятность потерь p(t)

double mss; // MSS (байты)

};

class ThroughputEstimator {

public:

/**

* @brief Оценка пропускной способности (в байтах/секунду)

* * Реализует формулу (3.3) из диссертации (модель Падье/Мэтьюса для TCP Reno).

* @param state Текущее состояние TCP-соединения.

* @netum Прогнозируемая пропускная способность в байтах/секунду.

*/

static double Estimate(const TcpState& state) {

// Защита от нулевых или отрицательных значений const double p = std::max(1e-9, state.loss_p); const double rtt = std::max(1e-6, state.rtt); const double rto = std::max(1e-6, state.rto); const double mss = state.mss;

// Компоненты знаменателя формулы Падье

const double terml = rtt * std::sqrt(2.0 * p / 3.0);

const double term2 = rto * 3.0 * std::sqrt(3.0 * p / 8.0) * p * (1.0 + 32.0 * p * p); // Финальный расчет с защитой от деления на ноль

const double denominator = term1 + term2; if (denominator < 1e-9) { return 0.0;

}

return mss / denominator;

}

/**

* @brief Батчевая обработка группы TCP-соединений (скалярная версия).

* @param inputs Указатель на массив состояний.

* @param outputs Указатель на массив для результатов.

* @param count Количество элементов для обработки.

*/

static void EstimateBatch(const TcpState* inputs, double* outputs, std::size_t count) { for (std::size_t i = 0; i < count; ++i) { outputs[i] = Estimate(inputs[i]);

}

}

Приложение 2 - Стохастическое ядро

#include <immintrin.h> #include <cmath> #include <random> #include <vector> #include <algorithm> #include <iostream>

// ц и а (стохастические коэффициенты)

inline float mu(float p, float t) { return 0.1f * p; }

inline float sigma(float p, float t) { return 0.2f * std::abs(p); }

// Параметры

const int N = 8; // Размерность вектора (AVX = 8 x float)

const float T = 1.0f; // Всего времени

const float initial_dt = 0.01f;

const float dt_min = 1e-4;

const float dt_max = 0.05f;

const float grad_threshold = 0.2f;

// Euler-Maruyama с AVX и адаптивным dt

void euler_maruyama_avx(float* P, float t0, float T, float initial_dt) { std::mt19937 gen(42);

std::normal_distribution<float> norm(0,1); float t = t0; float dt = initial_dt; float last_grad[N];

for(int i=0;i<N;++i) last_grad[i] = mu(P[i], t); // нач. градиенты while (t < T) {

// Считаем коэффициенты

_m256 p_vec = _mm256_loadu_ps(P);

_m256 t_vec = _mm256_set1_ps(t);

float mu_arr[N], sigma_arr[N], dW_arr[N], grad_arr[N]; for(int i=0; i<N; ++i) {

mu_arr[i] = mu(P[i], t); sigma_arr[i] = sigma(P[i], t); dW_arr[i] = norm(gen) * std::sqrt(dt);

}

_m256 mu_vec = _mm256_loadu_ps(mu_arr);

_m256 sigma_vec = _mm256_loadu_ps(sigma_arr);

_m256 dW_vec = _mm256_loadu_ps(dW_arr);

// Основной шаг

_m256 dt_vec = _mm256_set1_ps(dt);

_m256 dP = _mm256_add_ps(

_mm256_mul_ps(mu_vec, dt_vec), _mm256_mul_ps(sigma_vec, dW_vec)

);

p_vec = _mm256_add_ps(p_vec, dP); _mm256_storeu_ps(P, p_vec);

// Оцениваем локальную вариацию (градиент after step) for (int i=0; i<N; ++i) grad_arr[i] = mu(P[i], t+dt); float max_grad_diff = 0; for (int i=0; i<N; ++i) {

max_grad_diff = std::max(max_grad_diff, std::abs(grad_arr[i] - last_grad[i]));

}

// адаптивно подкручиваем шаг

if (max_grad_diff > grad_threshold) dt = std::max(dt / 2.0f, dt_min); else if (max_grad_diff < grad_threshold/2.0f) dt = std::min(dt * 2.0f, dt_max); for (int i=0; i<N; ++i) last_grad[i] = grad_arr[i]; t += dt;

}

}

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.