Методы и алгоритмы интеллектуализации решения задач технического зрения в автоматизированных системах управления железнодорожным подвижным составом тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Федоров Владимир Анатольевич

  • Федоров Владимир Анатольевич
  • кандидат науккандидат наук
  • 2026, «Уральский федеральный университет имени первого Президента России Б.Н. Ельцина»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 167
Федоров Владимир Анатольевич. Методы и алгоритмы интеллектуализации решения задач технического зрения в автоматизированных системах управления железнодорожным подвижным составом: дис. кандидат наук: 00.00.00 - Другие cпециальности. «Уральский федеральный университет имени первого Президента России Б.Н. Ельцина». 2026. 167 с.

Оглавление диссертации кандидат наук Федоров Владимир Анатольевич

ВВЕДЕНИЕ

Глава 1. ПРОБЛЕМАТИКА ТЕХНИЧЕСКОГО ЗРЕНИЯ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

1.1 Проблема повышения уровня автоматизации АСУ ЖД ПС

1.2 Анализ существующих методов обнаружения объектов техническим зрением

1.2.1 Классические методы обнаружения объектов на основе цифровой обработки изображений

1.2.2 Интеллектуальные методы обнаружения объектов на основе глубокого обучения

1.3 Анализ существующих технических решений для обнаружения объектов в технологических процессах железнодорожного транспорта

1.4 Выводы по первой главе и постановка задач исследования

Глава 2. МЕТОД И АЛГОРИТМЫ ФОРМИРОВАНИЯ БАНКА ДАННЫХ ДЛЯ ТЕХНИЧЕСКОГО ЗРЕНИЯ В СОСТАВЕ АСУ ЖД ПС

2.1 Классификация требований к техническому зрению в составе

АСУ ЖД ПС

2.2 Классификация объектов для обнаружения техническим зрением в составе АСУ ЖД ПС

2.3 Организация экспериментов для сбора визуальных данных

2.4 Формирование банка визуальных данных

2.5 Программное обеспечение для расширения банка данных

2.6 Выводы по второй главе

Глава 3. МЕТОД СТРУКТУРИРОВАНИЯ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ

3.1 Выбор и обоснование архитектуры базовой сверточной

нейронной сети

3.2 Разработка усовершенствованной версии архитектуры УОЬОу1 1 для задач технического зрения в АСУ ЖД ПС

3.3 Выводы по третьей главе

Глава 4. МЕТОД И АЛГОРИТМЫ ОРГАНИЗАЦИИ АППАРАТНО-ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ

4.1 Обучение разработанной версии модели УОЬОу11в1ш

4.2 Аппаратные средства бортовой системы технического зрения

АСУ ЖД ПС

4.2.1 Блок видеокамер

4.2.2 Блок вычислительный

4.2.3 Блок информирования

4.3 Определение расстояния до объектов с использованием стереоскопического зрения

4.3.1 Определение координат обнаруженных объектов

4.3.2 Калибровка видеокамер

4.4 Отслеживание обнаруженных объектов в видеопотоке

4.5 Программное обеспечение системы технического зрения

4.5.1 Программное обеспечение для калибровки видеокамер

4.5.2 Рабочее программное обеспечение

4.6 Оценка производительности и качества сегментации объектов разработанной СТЗ

4.7 Выводы по четвертой главе

ЗАКЛЮЧЕНИЕ

СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ

СПИСОК ЛИТЕРАТУРЫ

Приложение А. Классификация объектов в банке данных для обнаружения и

сегментации

Приложение Б. Свидетельство о регистрации программы для ЭВМ

Приложение В. Акт о внедрении результатов диссертационной работы

Приложение Г. Результаты обучения разработанной модификации сверточной

нейронной сети У0Ь011б1ш

Приложение Д. Примеры обнаружения и сегментации объектов моделью УОЬОуШт

ВВЕДЕНИЕ

Актуальность темы исследования

Современный российский стандарт ГОСТ Р 72010-2025 задает четыре уровня развития автоматизированных систем управления железнодорожным подвижным составом (АСУ ЖД ПС). В настоящее время реализуется второй уровень автоматизации УА2, при котором АСУ ЖД ПС обеспечивает соблюдение скоростного режима и предотвращает движение на запрещающие сигналы светофоров за счет непрерывного контроля параметров движения и реализации функций автоматического служебного торможения. Переход к более высоким уровням УАЗ и УА4 предусматривает постепенное исключение локомотивной бригады из процессов управления подвижным составом, что позволяет минимизировать операционные ошибки, связанные с человеческим фактором. Ключевым условием такого перехода является интеллектуализация систем управления.

Актуальность повышения уровня автоматизации систем управления подвижным составом обусловлена необходимостью увеличения пропускной способности железнодорожных линий и объемов перевозок при одновременном повышении безопасности движения. АСУ ЖД ПС высокого уровня автоматизации должна при этом обеспечивать минимальные временные интервалы между проходящими грузовыми составами благодаря реализации автоматизированной технологии интервального регулирования движения поездов. В соответствии с ГОСТ Р 70732-2023 особые требования предъявляются к техническим средствам и программному обеспечению автоматизированных систем управления технологическими процессами железнодорожного транспорта, к которым относят безопасное передвижение поездов на всех участках (железнодорожные станции и перегоны, переезды и сортировочные горки). Автоматизация технологических процессов

железнодорожного транспорта предусматривает централизацию диспетчерского контроля.

Снижение человеческого фактора при повышении уровня автоматизации достигается за счет снятия части функций контроля и управления с машиниста, что способствует безопасному движению. Так, по данным за 2023 год, около 10,3 % всех происшествий на железнодорожном транспорте были связаны с человеческим фактором, из них 2,4 % произошли из-за действий машиниста.

Существенным фактором интеллектуализации АСУ ЖД ПС является использование прогрессивных систем технического зрения, способных в режиме реального времени анализировать окружающую обстановку, распознавать объекты железнодорожной инфраструктуры и обнаруживать возможные препятствия на пути.

Актуальность темы диссертационного исследования подтверждается не только экономическими и техническими преимуществами автоматизированного управления, но также и положениями Указа Президента Российской Федерации от 10 октября 2019 года № 490 «О развитии искусственного интеллекта в Российской Федерации». В документе подчеркивается важность исследования, создания и внедрения передовых технологий искусственного интеллекта в различных отраслях производства, включая транспорт. Таким образом, в контексте национальных приоритетов Российской Федерации разработка методов и алгоритмов интеллектуализации решения задач технического зрения, их испытание и внедрение в АСУ ЖД ПС является актуальной научно-технической задачей.

Степень разработанности темы исследования

В последнее десятилетие российские специалисты активно публикуют результаты исследований, посвященных техническому зрению и методам обнаружения объектов железнодорожной инфраструктуры. Особого внимания заслуживает совместная работа исследователей Санкт-Петербургского

политехнического университета Петра Великого (Н. М. Гаврилова, И. А. Дейлид, С. А. Молодяков) и АО «НИИАС» (Е. О. Болтенкова, Д. А. Никитин, А. В. Озеров, Л. А. Охотников, П. А. Попов). Результаты исследований были использованы в системе технического зрения маневрового локомотива серии ТЭМ7А на станции Лужская и в системе технического зрения электропоезда серии ЭС2Г «Ласточка» на Московском центральном кольце. Другая значимая отечественная разработка принадлежит группе исследователей из ООО «ТМХ Интеллектуальные Системы» (В. А. Гросс, П. Е. Мащенко, А. М. Романчиков, П. П. Ширяев). Результаты их исследований были использованы в системе технического зрения «Qrl@Visюn 100» на маневровом локомотиве серии ТЭМ5Х. Зарубежными исследователями также успешно решаются задачи обнаружения и инспекции объектов железнодорожной инфраструктуры преимущественно в режиме постобработки видеоданных.

Несмотря на прогресс в разработке и практической реализации систем технического зрения для железнодорожного транспорта, к настоящему времени остаются нерешенными важные задачи создания интеллектуальных систем, интегрирующих методы обнаружения и анализа объектов на единой автоматизированной платформе. Особенно острой становится проблема разработки методов и алгоритмов интеллектуализации технического зрения для магистральных грузовых электровозов и тепловозов, для которых на данный момент отсутствуют готовые прикладные решения.

Цель и задачи исследования

Целью диссертационной работы является повышение эффективности и интеллектуализация решения прикладных задач технического зрения в автоматизированных системах управления железнодорожным подвижным составом с использованием сверточных нейронных сетей. Для достижения поставленной в диссертационной работе цели необходимо решить следующие задачи исследования:

1. Выполнить сравнительный анализ методов и средств для решения задач технического зрения в автоматизированной системе управления железнодорожным подвижным составом с учетом специфики и проблематики грузоперевозок.

2. Разработать метод, алгоритмы и программное обеспечение для формирования специализированного банка данных, обеспечивающего эффективное обучение и применение сверточных нейронных сетей в системе технического зрения АСУ ЖД ПС.

3. Разработать метод структурирования сверточной нейронной сети для интеллектуальной обработки изображений видеопотока в режиме реального времени системой технического зрения АСУ ЖД ПС с повышенным качеством и пониженными требованиями к вычислительным ресурсам.

4. Разработать метод организации аппаратно-программного обеспечения бортовой системы технического зрения АСУ ЖД ПС и алгоритмы, поддерживающие интегрированное решение задач обнаружения объектов железнодорожной инфраструктуры и определения расстояния до обнаруженных объектов.

5. Реализовать разработанные алгоритмы и методы в аппаратно-программном обеспечении системы технического зрения, провести тестовые испытания в производственных условиях АСУ ЖД ПС, оценить производительность и качество созданной системы.

Объект и предмет исследования

Объектом исследования является система технического зрения для обнаружения объектов железнодорожной инфраструктуры и препятствий в АСУ ЖД ПС.

Предметом исследования являются компьютерные методы обработки и анализа данных, представленных в графическом виде, автоматизированной

системой обнаружения объектов с ограниченными вычислительными ресурсами.

Научная новизна

Научная новизна диссертационной работы заключается в получении следующих новых результатов исследования:

1. Разработано информационное обеспечение системы технического зрения АСУ ЖД ПС; в соответствии с предложенным подходом к классификации объектов сформирован обширный набор визуальных данных о железнодорожных объектах для системы технического зрения АСУ ЖД ПС, содержащий 10 классов и 40 подклассов аннотированных объектов и состоящий из 20 000 изображений; созданный банк данных отличается географическим разнообразием и актуальной структурой.

2. Разработано алгоритмическое и программное обеспечение для генерации дополнительных изображений с вариацией погодных условий, которое позволяет расширить существующий набор визуальных данных и повысить качество обучения сверточных нейронных сетей.

3. Предложен интеллектуальный метод обнаружения и сегментации объектов железнодорожной инфраструктуры на основе глубокого обучения, который использует усовершенствованную модель YOLOvllsim (simple), созданную на базе модели сверточной нейронной сети YOLOv11; предложенная модель отличается эффективной архитектурой вычислений, что позволяет применять ее в бортовых системах технического зрения АСУ ЖД ПС с ограниченными вычислительными ресурсами.

4. Разработан комплексный подход к интеграции алгоритмического, программного и аппаратного обеспечения для обнаружения объектов железнодорожной инфраструктуры бортовой системой технического зрения в составе АСУ ЖД ПС, который позволяет повысить уровень автоматизации и безопасности грузоперевозок.

Теоретическая и практическая значимость

Теоретическая значимость диссертационной работы заключается в развитии и обосновании нового методологического подхода к структурированию алгоритмического и программного обеспечения технического зрения с учетом ресурсных ограничений автоматизированной системы управления, который может быть применен на платформе модели сверточной нейронной сети YOLOv11 в различных устройствах, работающих в режиме реального времени.

Практическая значимость результатов диссертационной работы состоит в успешной реализации разработанных алгоритмов при создании аппаратно-программного обеспечения, что подтверждается успешным испытанием разработанной системы технического зрения в производственных условиях и ее готовностью к использованию на текущем уровне автоматизации в качестве вспомогательного средства контроля, повышающего безопасность движения.

Методология и методы исследования

Для решения поставленных задач исследования в диссертационной работе использованы теоретические и инженерные методы анализа, включая методы системного анализа и цифровой обработки сигналов, методы алгоритмизации и программирования, методы математического моделирования и машинного обучения, методы искусственного интеллекта. Опытно-конструкторская часть работы выполнена с применением аттестованных компонентов и устройств.

Положения, выносимые на защиту

1. Метод эффективной организации информационного обеспечения АСУ ЖД ПС и банк аннотированных данных для глубокого обучения сверточной нейронной сети, который отражает железнодорожную инфраструктуру РФ и структурирован с учетом необходимости обнаружения бортовой системой технического зрения АСУ ЖД ПС ключевых объектов, маркирующих путь следования подвижного состава с последующим определением относительного

местоположения потенциальных препятствий и других классифицированных объектов железнодорожной инфраструктуры.

2. Метод интеллектуализации решения прикладных задач технического зрения АСУ ЖД ПС и компактная модель сверточной нейронной сети YOLOvllsim с редуцированной архитектурой вычислений и пониженной вычислительной сложностью для сегментации и обнаружения объектов в режиме реального времени бортовой системой технического зрения, предназначенной для установки на магистральных грузовых локомотивах.

3. Программное обеспечение модулей бортовой системы сбора и обработки данных АСУ ЖД ПС, реализующее разработанные алгоритмы для повышения качества обучения сверточной нейронной сети за счет расширения набора данных путем генерации изображений с различными погодными эффектами и для повышения точности определения местоположения объектов за счет калибровки видеокамер, применения стереоскопического зрения и учета траектории движения объектов.

4. Метод комплексной организации аппаратных средств и программного обеспечения бортовой системы сбора и обработки данных АСУ ЖД ПС для согласованного решения задач сегментации и локализации объектов с использованием стереоскопического зрения, обеспечивающий обнаружение малогабаритных объектов железнодорожной инфраструктуры и высокую скорость обработки данных видеопотока на графическом ускорителе видеокарты NVIDIA RTX A5000.

Соответствие паспорту научной специальности

Диссертация соответствует научной специальности 2.3.3. Автоматизация и управление технологическими процессами и производствами, пунктам 6 «Научные основы и методы построения интеллектуальных систем управления технологическими процессами и производствами»; 10 «Формализованные методы анализа, синтеза, исследования и оптимизация модульных структур

систем сбора, хранения, обработки и передачи данных в АСУТП, АСУП, АСТПП и др.»; 11 «Методы создания, эффективной организации и ведения специализированного информационного и программного обеспечения АСУТП, АСУП, АСТПП и др., включая базы данных и методы их оптимизации, промышленный интернет вещей, облачные сервисы, удаленную диагностику и мониторинг технологического оборудования, информационное сопровождение жизненного цикла изделия».

Достоверность результатов

Достоверность и обоснованность полученных в работе результатов подтверждается корректным применением математических, алгоритмических и инженерных методов сбора и обработки данных, обширной эмпирической базой входных данных, успешной производственной апробацией разработанного аппаратно-программного и алгоритмического обеспечения системы технического зрения, а также согласованностью с результатами, полученными другими исследователями.

Внедрение результатов диссертационного исследования

Результаты диссертационного исследования применены в научно-исследовательской и опытно-конструкторской работе «Система машинного зрения» (шифр СГМА.667527.001), выполняемого предприятием ООО «НПО САУТ», г. Екатеринбург; научно-производственное объединение САУТ образовано в 1994 г. на платформе отдела систем автоматического управления торможением поездов Уральского отделения Всесоюзного научно-исследовательского института железнодорожного транспорта; НПО САУТ занимается системами управления и обеспечения безопасности движения поездов.

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы и алгоритмы интеллектуализации решения задач технического зрения в автоматизированных системах управления железнодорожным подвижным составом»

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на всероссийских и международных конференциях:

- X Всероссийская молодежная научно-техническая конференция «Информационные технологии в науке и производстве», г. Омск, 18 апреля 2023 г.;

- X Международная молодежная научная конференция «Физика. Технологии. Инновации», г. Екатеринбург, 15-19 мая 2023 г.;

- Международная научно-техническая конференция «Автоматизация» (RusAutoCon-2023), г. Сочи, 10-16 сентября 2023 г.;

- Международная научно-техническая конференция «Индустрия 4.0» (SmartIndustryCon-2024), г. Сочи, 26-30 марта 2024 г.;

- Международная конференция «Путешествие в мир искусственного интеллекта» (AI Journey 2024), г. Москва, 11-13 декабря 2024 г.;

- Международная научно-практическая конференция «Исследование и развитие рельсового и автомобильного транспорта» (RnD RnAT 2025), г. Екатеринбург, 22-23 мая 2025 г.

Личный вклад автора

Автором самостоятельно проведен анализ литературных источников, выполнены исследовательские и опытно-конструкторские работы по теме диссертации, получены и апробированы основные результаты.

Публикации

По теме диссертации опубликовано 11 печатных работ, в том числе 6 статей в рецензируемых научных журналах, определенных ВАК РФ и Аттестационным советом УрФУ, из них 3 статьи - в изданиях, индексируемых в международных цитатно-аналитических базах Scopus и Web of Science. Получено свидетельство о регистрации программы для ЭВМ.

Объем и структура работы

Диссертация состоит из введения, четырех глав, заключения и пяти приложений. Полный объём диссертации составляет 167 страниц, включая 72 рисунка и 13 таблиц. Список литературы содержит 104 наименования.

Глава 1. ПРОБЛЕМАТИКА ТЕХНИЧЕСКОГО ЗРЕНИЯ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ЖЕЛЕЗНОДОРОЖНОГО

ТРАНСПОРТА

В первой главе представлен комплексный анализ современного состояния предметной области и существующих методов обнаружения объектов железнодорожной инфраструктуры. Исследованы различные подходы к обработке визуальной информации, включая традиционные методы компьютерного зрения и современные интеллектуальные методы, основанные на глубоком обучении. Особое внимание уделено анализу их преимуществ и недостатков, а также оценке применимости в автоматизированных системах управления железнодорожным подвижным составом (АСУ ЖД ПС) с учетом специфики и проблематики грузовых перевозок.

1.1 Проблема повышения уровня автоматизации АСУ ЖД ПС

К технологическим процессам железнодорожного транспорта [1] относятся все действия по обеспечению безопасного движения поездов на различных структурных участках: перегоны железнодорожных линий, железнодорожные станции, железнодорожные переезды и сортировочные горки. Автоматизированные системы управления технологическими процессами охватывают оперативное управление, диспетчерский контроль движения, диспетчерскую централизацию. При этом важную роль играют АСУ ЖД ПС, функционирование которых реализуется с помощью аппаратно-программных технических средств [2], контролирующих параметры движения и обеспечивающих информационный обмен. В частности, программное обеспечение системы управления единицей тягового подвижного состава [3] должно обеспечивать выполнение ряда функций в режиме реального времени.

Современное развитие железнодорожного транспорта неразрывно связано с повышением уровня автоматизации систем управления подвижным составом, которое позволяет не только увеличить пропускную способность железнодорожных линий и объемов перевозок, но и повысить безопасность движения, снизив влияние человеческого фактора [4].

Увеличение пропускной способности железнодорожных линий и объемов перевозок при повышении уровня автоматизации достигается путем сокращения интервалов между поездами благодаря возможности реализации технологии интервального регулирования движения поездов [5].

Снижение человеческого фактора при повышении уровня автоматизации достигается за счет снятия части функций контроля и управления с машиниста, что способствует безопасному движению. Так, по данным за 2023 год, около 10,3 % всех происшествий на железнодорожном транспорте были связаны с человеческим фактором, из них 2,4 % произошли из-за действий машиниста [6].

Согласно классификации, приведенной в ГОСТ Р 72010-2025 [7], системы управления железнодорожным подвижным составом по уровню участия персонала подразделяются на четыре уровня автоматизации (УА ЖД ПС): УА1 - первый уровень (частичная автоматизация), УА2 - второй уровень (условная автоматизация), УАЗ - третий уровень (высокая автоматизация) и УА4 -четвертый уровень (полная автоматизация).

Аналогичная классификация уровней автоматизации принята и в международном стандарте IEC 62290 [8], в котором перечисленные уровни обозначаются как Grade of Automation (GoA): GoA1, GoA2, GoA3 и GoA4.

Описание уровней автоматизации и их соответствие режимам управления ЖД ПС представлены в таблице 1.1.

Таблица 1.1 - Уровни автоматизации ЖД ПС

Уровень Режим управления Описание

УА1 / ОоЛ1 Автоматизированный АСУ осуществляет контроль превышения допустимой скорости движения и проезд запрещающего показания светофора. Управление скоростью ЖД ПС осуществляется вручную машинистом.

УА2 / ОоЛ2 АСУ автоматически контролирует скорость движения, управляет тягой и торможением. ЖД ПС может управляться автоматически, но машинист остается в кабине и может вмешиваться в работу системы.

УАЗ / ОоЛ3 Автоматический АСУ обеспечивает остановку ЖД ПС при возникновении препятствия. ЖД ПС движется в автоматическом режиме, но машинист находится в кабине и контролирует процесс.

УА4 / ОоЛ4 Автоматический, дистанционный АСУ осуществляет полный цикл управления подвижным составом без участия локомотивной бригады.

Реализация высоких уровней автоматизации управления (УАЗ и УА4) требует комплексной интеграции АСУ с системами технического зрения (СТЗ), на которые возлагается выполнение критически важных сенсорных функций [9], включая обнаружение объектов железнодорожной инфраструктуры и препятствий на пути следования ЖД ПС [10].

Можно выделить несколько типов задач автоматического управления, решение которых требует анализа визуальных данных с применением СТЗ и не поддерживается в настоящее время готовыми прикладными системами в составе АСУ ЖД ПС:

1) определение местоположения ЖД ПС в условиях отсутствия достоверных данных от спутниковых навигационных систем [11], в частности,

при движении в тоннелях, при возникновении помех спутниковому сигналу или при подмене спутникового сигнала;

2) точное позиционирование ЖД ПС при остановке в заданных точках маршрута, например, у предельных столбиков или пассажирских платформ [12];

3) обеспечение безопасности движения, в частности, инициирование многоуровневой системы торможения в случае обнаружения статических или динамических препятствий на пути следования ЖД ПС [13].

1.2 Анализ существующих методов обнаружения объектов техническим зрением

Обнаружение объектов представляет собой процесс поиска, распознавания, классификации и идентификации объектов, а также определения их местоположения в окружающей среде по результатам цифровой обработки данных от различных сенсорных устройств, таких как видеокамеры, радары, лидары [14]. В традиционных системах технического зрения в качестве источника данных обычно выступают видеокамеры видимого диапазона. Методы обнаружения объектов условно делятся на две основные группы по способу подготовки системы технического зрения к выполнению служебных функций: традиционные методы и интеллектуальные методы, основанные на глубоком обучении [15]. Каждая группа обладает уникальными инструментами и подходами к решению задач обнаружения объектов с учетом их характеристик.

1.2.1 Классические методы обнаружения объектов на основе цифровой обработки изображений

В машинном обучении до появления и широкого распространения методов глубокого обучения проектирование признаков объектов выполнялось вручную с последующей классификацией. Классические методы обнаружения объектов в техническом зрении предполагают извлечение признаков,

фильтрацию, статистический анализ для детектирования объектов на цифровом изображении. Они обычно менее сложные с точки зрения архитектуры и требований к данным по сравнению с методами глубокого обучения [16], но могут оставаться полезными в ряде приложений, особенно при ограничении вычислительной мощности [17].

Классические методы можно разделить на группы по типу решаемых задач: 1) сегментация изображения (детекторы границ Кэнни, детектор углов Харриса, алгоритм К-теаш и другие); 2) извлечение признаков [18] (гистограмма направленных градиентов, масштабно-инвариантная трансформация признаков, ускоренные надежные функции и другие); 3) классификация (метод опорных векторов, метод случайных лесов, метод к-ближайших соседей и другие) [19].

Сегментация заключается в выделении на изображении границ объектов. Для сегментации эффективно используют метод детекции границ Кэнни [20]. Применение этого классического метода включает операции цифровой обработки изображения: 1) сглаживание, 2) вычисление градиента, 3) подавление немаксимумов и 4) двойная пороговая фильтрация.

1) Сглаживание изображения выполняется с целью уменьшения шумов, как правило, посредством двухмерного фильтра Гаусса [21] по параметру яркости:

1 _ х2+у2

°{Х'У) = 2 ^ ' (11)

где 0(х, у) - значение яркости пикселей после фильтрации; х, у - координаты пикселей в прямоугольной области; а - среднеквадратическое отклонение нормального распределения.

2) После сглаживания вычисляется горизонтальный Ох и вертикальный Оу градиент интенсивности по разности параметра яркости соседних пикселей. Вычисление производится с использованием оператора Собеля [22].

-1 0 +1 Сх = -2 0 +2 * А, -1 0 +1

-1 -2 -1 £у = О О 0 * А, +1 +2 +1

(1.2)

где А - исходное сглаженное изображение, знак * обозначает операцию свертки.

Далее для каждого пикселя изображения вычисляется модуль градиента, который характеризует величину изменения яркости в точке:

3) Поскольку граница ассоциируется с максимальными значениями градиента, выполняется подавление немаксимальных точек путем установки нулевого значения, если значение градиента в текущем пикселе меньше, чем в соседних пикселях в направлении градиента.

4) На выходе детектор границ Кэнни выполняет пороговую фильтрацию, используя два порога (верхний и нижний) для выявления пикселей, образующих границы объектов. Если градиент пикселя превышает верхний порог, то пиксель считается образующим границу. Если градиент пикселя не превышает нижнего порога, то пиксель не считается образующим границу. Если значение градиента пикселя находится между значениями верхнего и нижнего порога, то пиксель будет считаться образующим границу только в том случае, если он связан с пикселем, который границу образует.

Детектор границ Кэнни работает некорректно при изменении освещения и при выделении границ нелинейных объектов [23], что затрудняет его применение в системах, эксплуатируемых непосредственно на ЖД ПС.

(1.3)

а также определяется направление градиента по углу:

в = агсЬд

который округляется до ближайшего значения из ряда:

00, 450, 900, 1350.

(1.4)

Детектор углов Харриса [24] реализует метод обнаружения угловых точек на изображении, которые часто служат важными характеристиками для описания объектов и структур. Основные этапы обнаружения углов включают вычисление градиентов, вычисление структурных тензоров, вычисление угловых откликов, пороговую фильтрацию, локализацию углов и подавление немаксимумов.

На предварительном этапе изображение преобразуется в формат оттенков серого цвета. Далее вычисляются градиенты интенсивности аналогично детектору границ Кэнни. Затем для каждого пикселя вычисляются структурные тензоры [25], которые представляют матрицей М вторых моментов:

где х и у - координаты пикселей участка изображения Ж; Ох и Оу горизонтальные и вертикальные градиенты интенсивности соответственно.

Структурные тензоры содержат информацию о локальной структуре вокруг пикселя и используются при вычислении угловых откликов Я угла Харриса для каждого пикселя [26]:

где к - константа, определяемая эмпирически, к е [0.04, 0.06].

Угловые отклики являются мерой того, насколько близка точка к угловой структуре. Если угловые отклики большие, это указывает на наличие угловой точки. На следующем этапе производится пороговая фильтрация угловых откликов для отбора наиболее ярко выраженных угловых точек. С помощью угловых откликов угловые точки локализуются на изображении. В случае наличия нескольких близких угловых точек в одной области, выполняется подавление немаксимумов, чтобы выбрать наиболее четкие угловые точки.

(1.5)

Я = с!е1:(М) - к 1гасе(М)2,

(1.6)

Детектор Харриса обычно используется как этап предобработки в задачах компьютерного зрения [27], таких как трекинг объектов, в стереозрении, реконструкция ЭЭ-сцен, а также для создания ключевых точек, которые могут быть использованы в дальнейшей обработке изображений.

Метод построения гистограмм направленных градиентов (Histogram of Oriented Gradients, HOG) [28] основан на извлечении признаков, используется для описания текстурных и структурных характеристик объектов на изображении. Основные этапы работы гистограммы направленных градиентов включают сглаживание изображения, вычисление градиентов интенсивности, разделение изображения на ячейки, сборку гистограмм в блоки, нормализацию блоков и создание векторов признаков [29]. По аналогии с детектором границ Кэнни на предварительном этапе выполняется сглаживание изображения с последующим вычислением градиентов.

Далее производится разделение изображения на небольшие ячейки (например, 8 x 8 пикселей) и вычисление гистограммы направлений градиентов для каждой ячейки. Гистограмма состоит из n бинов (обычно n = 9), каждый из которых соответствует определенному диапазону углов на горизонтальной оси диаграммы (например, 0 - 20°, 20 - 40°, и т.д.). Для каждого пикселя в ячейке добавляется малый по величине коэффициент вклада в соответствующий бин гистограммы для предотвращения деления на ноль. На следующем этапе производится объединение нескольких ячеек в блоки (например, 2 x 2 ячейки) и нормализация гистограмм в пределах каждого блока. Нормализация блока может производиться способом Ь2-нормализации [30]:

v

f=1W+& (L7)

где - вектор гистограммы блока, - евклидова норма вектора, - малая константа для предотвращения деления на ноль.

На заключительном этапе создаются вектора признаков. Итоговый вектор признаков формируется путем объединения всех гистограмм направленных градиентов из всех блоков. Такой вектор признаков может быть использован для обучения классификатора или для сравнения с другими векторами признаков в задачах обнаружения объектов. Метод построения гистограмм направленных градиентов в целом хорошо работает при обнаружении объектов на изображениях, особенно в случаях, когда объекты имеют характерные текстурные или структурные особенности. Недостаток метода HOG заключается в слабой аналитике поворотов [31]. Если объект повернут или наклонен, вычисленные градиенты изменяются, что может привести к ошибкам в его обнаружении.

Метод масштабно-инвариантной трансформации признаков (Scale-Invariant Feature Transform, SIFT) [32] представляет собой метод извлечения и описания ключевых точек на изображении с учетом их инвариантности к изменениям масштаба [33], ориентации и освещения. Метод предполагает выполнение следующих этапов: построение пирамиды гауссианов, построение пирамиды разностей гауссианов, обнаружение ключевых точек, локализацию ключевых точке, определение ориентации ключевых точек и описание ключевых точек.

Для создания нескольких уровней пирамиды масштабов пространства к исходному изображению применяется фильтр Гаусса с разными значениями стандартного отклонения [34]:

1 х2+у2

G(х,у,о) = , (1.8)

где о - стандартное отклонение, определяющее степень сглаживания.

Далее производится вычисление разности между соседними уровнями гауссианов в пирамиде масштабов:

D(x,y,o) = G(x,y,ka) - G(x,y,a),

(1.9)

где к - коэффициент масштабирования.

На следующем этапе используется аппроксимация функции разности гауссианов О с помощью квадратичного разложения Тейлора для уточнения положения ключевых точек и удаления слабых точек по параметрам кривизны и контраста:

где Дх - смещение точки.

Далее осуществляется определение ориентации ключевых точек. Модуль градиента т(х,у) и направление градиента в (х,у) [35] рассчитываются по формулам:

т(х,у) = V (L(х + 1 ,у) - L(х - 1 ,у))2 + (L(х,у + 1 ) - L(х,у- 1 )2, (1.11)

где L - сглаженное изображение.

На заключительном этапе происходит разделение окрестности ключевой точки на малые области (например, размером 4 x 4 пикселя) и вычисление гистограмм направлений градиентов для каждой области. Полученные гистограммы объединяются в итоговый вектор признаков.

Метод масштабно-инвариантной трансформации признаков позволяет уверенно обнаруживать объекты на изображениях, даже если объекты изображены с различными масштабами и поворотами. Недостаток метода SIFT заключается в слабой аналитике шумов и однородных текстур [36].

Метод ускоренных устойчивых функций (Speeded Up Robust Features, SURF) является ускоренной версией метода SIFT [37]. Метод SURF

dDT

D(pc,y, а) = D + ——

Дх + - Дх Дх,

(1.10)

в(х,у) = arctg

L(x,y + 1) — L(x,y — 1) L(x + l,y)-L(x-l,y)'

обеспечивает ускоренное вычисление ключевых точек и дескрипторов, сохраняя при этом инвариантность к изменению параметров масштаба и поворота. Метод также слабо реагирует на изменение освещенности и точки обзора объектов.

В методе SURF при построении пирамиды разностей гауссианов используются матрицы Хаара для вычисления производных по горизонтали Dx и вертикали Dy, что ускоряет процесс обработки по сравнению с методом SIFT.

Dx = Y w( i J) ■ ( / ( i + 1 J) - / ( i - 1 ,j) ) , (1.12)

¿—4,jew

¿—4,jew

Dy

' ' 'Jew

где Ж - окно (небольшая область) вокруг пикселя, и ( ¿,у) - весовая функция (обычно функция Гаусса), / ( ¿,у ) - значение интенсивности пикселя.

Далее производится обнаружение ключевых точек. Для этого выполняется сравнение каждого пикселя с его соседями в текущем и соседних уровнях пирамиды. Если пиксель является локальным максимумом или минимумом, он считается потенциальной ключевой точкой. Затем выполняется локализация ключевых точек с использованием аппроксимации Тейлора для уточнения положения ключевых точек с последующим удалением слабых точек на основе параметров кривизны и контраста.

На последнем шаге определяется ориентация ключевых точек. Для этого вычисляется модуль градиента т (х, у) и направление градиента в ( х, у) :

т(х,у) = I (Dx (х,у)) 2 + (Dy (х,у)) 2, (1.13)

6(х,у) = arctg

Dy(x,y)

Dx(x> У)'

где Dx и Dy - производные по горизонтали и вертикали.

Метод ускоренных устойчивых функций работает быстрее, чем метод SIFT, но неуверенно анализирует случаи значительного изменения масштаба объектов и освещенности [38].

Метод опорных векторов (Support Vector Machine, SVM) [39] опирается на алгоритм машинного обучения, используемый для решения задач классификации и регрессии. Основная идея метода SVM заключается в нахождении оптимальной гиперплоскости, которая максимизирует зазор между классами в многомерном пространстве признаков. Под гиперплоскостью поднимается подпространство, которое разделяет данные на классы. Соответственно, в двумерном пространстве гиперплоскость выражается прямой линией, в трехмерном - плоскостью, в пространстве с большим количеством измерений - гиперплоскостью.

Опорные векторы представляют точки, которые находятся ближе всего к гиперплоскости и определяют её положение и ориентацию. Опорные векторы играют ключевую роль в нахождении оптимальной гиперплоскости. Под зазором понимается расстояние между гиперплоскостью и ближайшими точками данных (опорными векторами) с каждой стороны.

Метод опорных векторов эффективен в задачах с малым объемом данных, но требует тщательной настройки гиперпараметров и работает с замедлением на больших наборах данных [40].

Метод случайных лесов [41] относится к машинному обучению, применяется в задачах классификации и регрессии, базируется на создании ансамбля деревьев решений с последующим объединением результатов. Основные этапы в применении метода случайного леса включают создание ансамбля деревьев, генерацию бутстрепа, случайный выбор признаков, построение дерева и голосование для классификации или усреднение для регрессии. На этапе создания ансамбля деревьев создается множество деревьев решений (лес). Каждое дерево строится независимо друг от друга на основе

подмножества обучающих данных и подмножества признаков. Такой подход делает деревья разнообразными и уменьшает вероятность переобучения.

На этапе генерации бутстрепа создаются образцы данных, где для построения каждого дерева случайным образом выбираются обучающие данные. Каждый образец данных представляет из себя случайную выборку с возвращением, то есть некоторые данные могут входить в выборку несколько раз, а некоторые данные могут быть проигнорированы. Такой подход способствует разнообразию деревьев. На следующем этапе для каждого узла дерева случайно выбирается подмножество признаков, из которых далее будет выбран лучший признак для разделения узла. Такой подход помогает предотвратить доминирование какого-либо одного признака. На этапе построения дерева происходит рекурсивное построение дерева, когда на каждом уровне выбирается лучший признак и пороговое значение для разделения данных. Процесс продолжается, пока не будет достигнуто предельное значение параметра в условии остановки, например, максимальная глубина дерева или минимальное количество объектов в листьях. На последнем этапе, когда все деревья построены, происходит голосование в задаче классификации или усреднение предсказаний в задаче регрессии. В итоге формируется итоговое предсказание случайного леса.

Основное преимущество метода случайного леса заключается в использовании ансамбля деревьев решений, что позволяет значительно повысить точность предсказаний и снизить риск переобучения. Разнообразие деревьев, достигаемое за счет бутстрепа и случайного выбора признаков, делает метод устойчивым к шуму и выбросам в данных [42]. Однако метод случайных лесов требует значительных вычислительных ресурсов, особенно при построении большого количества деревьев или обработке больших объемов данных.

Метод k-ближайших соседей (K-Nearest Neighbors, k-NN) [43] относится к машинному обучению, также используется в задачах классификации и регрессии. Основная идея метода k-NN заключается в том, что объект классифицируется или предсказывается на основе большинства голосов его k ближайших соседей в пространстве признаков. Метод k-NN является простым и эффективно работает, когда данные имеют низкую размерность и небольшой объем. Однако его применение ограничено в задачах с большими наборами данных или с высокой размерностью признаков, а также в условиях, когда важна скорость работы и устойчивость к шуму [44]. Для улучшения производительности метода k-NN часто используются дополнительные методы снижения размерности, оптимизации расстояний и ускорения поиска ближайших соседей.

1.2.2 Интеллектуальные методы обнаружения объектов на основе глубокого обучения

Методы обнаружения объектов на основе глубокого обучения относятся к интеллектуальной области машинного обучения и используют искусственные нейронные сети [45] с большим количеством слоев (глубокие нейронные сети) для анализа и автоматического извлечения признаков из обрабатываемых данных.

Для обработки изображений применяются сверточные нейронные сети, основными компонентами которых являются слои свертки, слои субдискретизации и полносвязные слои [46].

Сверточные слои отвечают за извлечение признаков из входных данных с помощью наборов фильтров (ядер свертки), которые перемещаются по входному изображению и выполняют операцию свертки.

Входными данными сверточного слоя является изображение, которое представляется в виде тензора X:

XER H x c, (1.14)

где H - высота изображения, W - ширина изображения, C - количество цветовых каналов (C = 3 для цветного изображения формата RGB).

Если в сверточном слое используется K фильтров, то весовые параметры всех фильтров можно представить в виде четырехмерного тензора W:

W E RFhxF™xсxK , (1.15)

где Fh - высота фильтра, Fw - ширина фильтра.

Операцию свертки С о nv 2 d для каждого фильтра к и каждого положения (i, j) в выходном тензоре, который является картой признаков [47], можно представить в виде:

С Fh Fw

Conv2d(X) iijik = ^ ^ ^ WminiCik ■ Xt+m_w+n_c + bk> (1.16)

C=l m=1 7i— 1

где Wmriic k - элемент фильтра к на позиции (m, n) для канала c, Wmnkc -элемент фильтра к в позиции (m,n,c), Xi+m_ltj+n_lc - элемент входного изображения в позиции ( i + т — 1 ,j + n — 1, с), bk - смещение для фильтра к.

В операции глубинной свертки D W С о n v 2 d каждому входному каналу соответствует свой отдельный фильтр, и операция выполняется по каналам независимо:

Fh Fw

DWConv2d(X)ij с = Y,Y*Wm

+ bk, (1.17)

m=1n=l

D W С о nv 2 d (X) i j, c - значение выходного тензора на позиции (i, j ) в канале c.

Слои субдискретизации используются для снижения размерности карт признаков, они позволяют уменьшить количество параметров и предотвратить переобучение нейронной сети.

В качестве основных слоев субдискредитации выступают подвыборки -максимальная и средняя. В случае максимальной подвыборки в слое

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Федоров Владимир Анатольевич, 2026 год

СПИСОК ЛИТЕРАТУРЫ

1. ГОСТ Р 70732-2023. Автоматизированные системы управления технологическими процессами и техническими средствами железнодорожного транспорта. Требования к функциональной и информационной безопасности программного обеспечения и методы контроля. Национальный стандарт Российской Федерации / Москва: Российский институт стандартизации, 2023. - 18 с.

2. ГОСТ 33435-2023. Устройства управления, контроля и безопасности железнодорожного подвижного состава. Требования безопасности и методы контроля. Межгосударственный стандарт / Москва: Российский институт стандартизации, 2023. - 52 с.

3. ГОСТ 34009-2016. Средства и системы управления железнодорожным тяговым подвижным составом. Требования к программному обеспечению / Москва: Стандартинформ, 2016. - 15 с.

4. Popov P. A. Prospects of autonomous railway transport development / P. A. Popov, A. V. Ozerov, A. S. Marshova // BRICS Transport. - 2024. - Vol. 3, No. 3. - P. 1-14.

5. Розенберг Е. Н. Комплексные решения по повышению пропускной способности железных дорог / Е. Н. Розенберг, И. Н. Розенберг, А. В. Озеров // Труды АО "НИИАС": сб. ст. - Москва: Т8 Издательские Технологии, 2021. - Т. 1, № 11. - С. 32-47.

6. Казанская Л. Ф. Беспилотные поезда при грузовых и пассажирских железнодорожных перевозках / Л. Ф. Казанская, П. В. Алпаева, А. А. Щипицына // Транспортное дело России. - 2023. - № 6. - С. 128-131.

7. ГОСТ Р 72010-2025. Системы управления железнодорожным подвижным составом в автоматическом и дистанционном режимах. Термины и определения / Москва: Российский институт стандартизации, 2025. - 17 с.

8. Bahcivan E. Investigation of railway system automation levels of istanbul metropolitan areas / E. Bahcivan, O. T. Kaymakci // SETSCI-Conference Proceedings. - 2018. - Vol. 2. - P. 124-125.

9. ГОСТ Р 72179- 025. Системы управления железнодорожным подвижным составом в автоматическом и дистанционном режимах. Требования к подсистеме распознавания объектов. - Москва: Российский институт стандартизации, 2025. - 16 с.

10. Etxeberria-Garcia M. Application of computer vision and deep learning in the railway domain for autonomous train stop operation / M. Etxeberria-Garcia, M. Labayen, M. Zamalloa, et al. // 2020 IEEE/SICE International Symposium on System Integration (SII). - 2020. - P. 943-948.

11. Steuer M. Implementation of global navigation satellite systems in railway traffic control systems: Overview of navigation systems, application areas, and implementation plans / M. Steuer, R. Burdzik, F. Piednoir // Applied Sciences. -2025. - Vol. 15. - AN 356.

12. Olaby O. Development of a novel railway positioning system using RFID technology / O. Olaby, M. Hamadache, D. Soper, P. Winship, R. Dixon // Sensors. - 2022. - Vol. 22. - AN 2401.

13. Rosic S. Analysis of the safety level of obstacle detection in autonomous railway vehicles / S. Rosic, D. Stamenkovic, M. S. Banic // Acta Polytechnica Hungarica. - 2022. - Vol. 19 (3). - P. 187-205.

14. Pagire V. A comprehensive review of object detection with traditional and deep learning methods / V. Pagire, M. Chavali, A. Kale // Signal Processing. - 2025. - Vol. 237. - AN 110075.

15. Zhong G. An overview on data representation learning: From traditional feature learning to recent deep learning / G. Zhong, L. N. Wang, J. Dong // The Journal of Finance and Data Science. - 2016. - Vol. 2. - №. 4. - P. 265-278.

16. O'Mahony N. Deep learning vs. traditional computer vision / N. O'Mahony, S. Campbell, A. Carvalho, et al. // Advances in Intelligent Systems and Computing.

- 2020. - Vol. 943. - P. 128-144.

17. Erabati G. K. Object detection in traffic scenarios - A comparison of traditional and deep learning approaches / G. K. Erabati, N. Gonfalves, H. Araujo // Computer Science & Information Technology Conference. - 2020. - Vol. 10. -№. 9. - P. 225-237.

18. Vishnoi V. K. A comprehensive study of feature extraction techniques for plant leaf disease detection / V. K. Vishnoi, K. Kumar, B. Kumar // Multimedia Tools and Applications. - 2022. - Vol. 81. - №. 1. - P. 367-419.

19. Gangadharan K. Classification and functional analysis of major plant disease using various classifiers in leaf images / K. Gangadharan, G. R. N. Kumari, D. Dhanasekaran // International Journal of Innovative Technology and Exploring Engineering. - 2019. - Vol. 9. - №. 2. - P. 4241-4248.

20. Canny J. A computational approach to edge detection / J. Canny // IEEE Transactions on pattern analysis and machine intelligence. - 1986. - №. 6. -P. 679-698.

21. Sun T. An improved Canny edge detection algorithm / T. Sun, C. Z. Gao // Applied Mechanics and Materials. - 2013. - Vol. 291. - P. 2869-2873.

22. Sobel I. A 3x3 isotropic gradient operator for image processing / I. Sobel, G. Feldman // In: Pattern Classification and Scene Analysis. - Hoboken: Wiley, 1973. - P. 271-272.

23. Nadernejad E. Edge detection techniques: evaluations and comparisons / E. Nadernejad, S. Sharifzadeh, H. Hassanpour // Applied Mathematical Sciences.

- 2008. - Vol. 2. - №. 31. - P. 1507-1520.

24. Harris C. A combined corner and edge detector / C. Harris, M. Stephens // Alvey vision conference. - 1988. - Vol. 15. - №. 50. - P. 147-151.

25. Jasani B. A. Threshold-guided design and optimization for Harris corner detector architecture / B. A. Jasani, S. K. Lam, P. K. Meher. et al. // IEEE Transactions on Circuits and Systems for Video Technology. - 2017. - Vol. 28. - №. 12. - P. 3516-3526.

26. Sanchez J. An analysis and implementation of the Harris corner detector / J. Sanchez, N. Monzon, A. Salgado // Image Processing On Line. - 2018. - Vol. 8. -P. 305-328.

27. Bhatia N. Accurate corner detection methods using two step approach / N. Bhatia, M. Chhabra // Global Journal of Computer Science and Technology. -2011. - Vol. 11. - P. 24-30.

28. Dalal N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // 2005 IEEE computer society conference on computer vision and pattern recognition. - IEEE, 2005. - Vol. 1. - P. 886-893.

29. Rahman M. Railway track detection: A HOG-based approach / M. Rahman, N. M. Yadav, P. V. Prakash. et al. // Journal of Emerging Trends and Novel Research. - 2024. - Vol. 2. - № 12 - P. 278-281.

30. Ghaffari S. Analysis and comparison of FPGA-based histogram of oriented gradients implementations / S. Ghaffari, P. Soleimani, K. F. Li. et al. // IEEE Access. - 2020. - Vol. 8. - P. 79920-79934.

31. Skrabanek P. Robust grape detector based on SVMs and HOG features / P. Skrabanek, P. Dolezel // Computational Intelligence and Neuroscience. - 2017. -Vol. 2017. - №. 1. - AN 3478602.

32. Lowe D. G. Object recognition from local scale-invariant features / D. G. Lowe // Proceedings of the seventh IEEE international conference on computer vision. -1999. - Vol. 2. - P. 1150-1157.

33. Lowe D. G. Distinctive image features from scale-invariant keypoints / D. G. Lowe // International journal of computer vision. - 2004. - Vol. 60. - P. 91-110.

34. Wu J. A Comparative Study of SIFT and its Variants / J. Wu, Z. Cui, V. S. Sheng, et al. // Measurement Science Review. - 2013. - Vol. 13. - №. 3. - P. 122-131.

35. Mistry D. Comparison of feature detection and matching approaches: SIFT and SURF / D. Mistry, A. Banerjee // Global Research and Development Journal for Engineering. - 2017. - Vol. 2. - №. 4. - P. 7-13.

36. Moreno P. Improving the SIFT descriptor with smooth derivative filters / P. Moreno, A. Bernardino, J. Santos-Victor // Pattern Recognition Letters. - 2009. - Vol. 30. - №. 1. - P. 18-26.

37. Bay H. SURF: Speeded up robust features / H. Bay, T. Tuytelaars, L. Van Gool // Lecture Notes in Computer Science. - 2006. - Vol. 3951. - P. 404-417.

38. Qu X. Evaluation of SIFT and SURF for vision-based localization / X. Qu, B. Soheilian, E. Habets, et al. // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. - 2016. - Vol. 41. - P. 685692.

39. Hearst M. A. Support vector machines / M. A. Hearst, S. T. Dumais, E. Osuna, et al. // IEEE Intelligent Systems and Their Applications. - 1998. - Vol. 13. - №. 4. - P. 18-28.

40. Czarnecki W. M. Robust optimization of SVM hyperparameters in the classification of bioactive compounds / W. M. Czarnecki, S. Podlewska, A. J. Bojarski // Journal of Cheminformatics. - 2015. - Vol. 7. - P. 1-15.

41. Wang H. Comparison of SVM and LS-SVM for regression / H. Wang, D. Hu // International Conference on Neural Networks and Brain. - 2005. - Vol. 1. - P. 279-283.

42. Zhou X. Improving robustness of random forest under label noise / X. Zhou, P. L. K. Ding, B. Li // IEEE Winter Conference on Applications of Computer Vision. - 2019. - P. 950-958.

43. Mezquita Y. A review of K-NN algorithm based on classical and quantum machine learning / Y. Mezquita, R. S. Alonso, R. Casado-Vara, et al. // Distributed Computing and Artificial Intelligence. - 2021. - Vol. 1242. - P. 189198.

44. Tomasev N. Hubness-aware kNN classification of high-dimensional data in presence of label noise / N. Tomasev, K. Buza // Neurocomputing. - 2015.

- Vol. 160. - P. 157-172.

45. Tsirtsakis P. Deep learning for object recognition: A comprehensive review of models and algorithms / P. Tsirtsakis, G. Zacharis, G. S. Maraslidis, et al. // International Journal of Cognitive Computing in Engineering. - 2025. - Vol. 6. -P. 298-312

46. Aloysius N. A review on deep convolutional neural networks / N. Aloysius, M. Geetha // IEEE International Conference on Communication and Signal Processing. - 2017. - P. 0588-0592.

47. Krichen M. Convolutional neural networks: A survey / M. Krichen // Computers.

- 2023. - Vol. 12. - № 8. - P. 151.

48. Sharma S. Activation functions in neural networks / S. Sharma, S. Sharma, A. Athaiya // International Journal of Engineering Applied Sciences and Technologiy. - 2020. - Vol. 4. - № 12. - P. 310-316.

49. Zhao X. A review of convolutional neural networks in computer vision / X. Zhao, L. Wang, Y. Zhang, et al. // Artificial Intelligence Review. - 2024. - Vol. 57. - № 4. - P. 57-99.

50. Gibert X. Robust fastener detection for autonomous visual railway track inspection / X. Gibert, V. M. Patel, R. Chellappa // IEEE Winter Conference on Applications of Computer Vision. - 2015. - P. 694-701.

51. Karakose M. A new computer vision based method for rail track detection and fault diagnosis in railways / M. Karakose, O. Yaman, M. Baygin, et al. //

International Journal of Mechanical Engineering and Robotics Research. - 2017.

- Vol. 6. - №. 1. - P. 22-27.

52. Karakose M. A new approach for condition monitoring and detection of rail components and rail track in railway / M. Karakose, O. Yaman, K. Murat, et al. // International Journal of Computational Intelligence Systems. - 2018. - Vol. 11. - №. 1. - P. 830-845.

53. Zhang H. Automatic visual detection system of railway surface defects with curvature filter and improved Gaussian mixture model / H. Zhang, X. Jin, Q. M. J. Wu, et al. // IEEE Transactions on Instrumentation and Measurement. - 2018.

- Vol. 67. - №. 7. - P. 1593-1608.

54. Wei X. Railway track fastener defect detection based on image processing and deep learning techniques: A comparative study / X. Wei, Z. Yang, Y. Liu, et al. // Engineering Applications of Artificial Intelligence. - 2019. - Vol. 80. - P. 6681.

55. Ren S. Faster R-CNN: Towards real-time object detection with region proposal networks / S. Ren, K. He, R. Girshick, et al. // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2016. - Vol. 39. - №. 6. - P. 1137-1149.

56. Wang T. Real-time detection of railway track component via one-stage deep learning networks / T. Wang, F. Yang, K. L. Tsui // Sensors. - 2020. - Vol. 20. -№. 15. - P. 4325.

57. Jing G. Developments, challenges, and perspectives of railway inspection robots / G. Jing, X. Qin, H. Wang // Automation in Construction. - 2022. - Vol. 138. -P. 104242.

58. Redmon J. YOLOv3: An incremental improvement / J. Redmon // arXiv preprint. - 2018. - arXiv:1804.02767.

59. Faghih-Roohi S. Deep convolutional neural networks for detection of rail surface defects / S. Faghih-Roohi, S. Hajizadeh, A. Nunez, et al. // IEEE International Joint Conference on Neural Networks. - 2016. - P. 2584-2589.

60. Zhao Y. A review on rail defect detection systems based on wireless sensors / Y. Zhao, Z. Liu, D. Yi, et al. // Sensors. - 2022. - Vol. 22. - №. 17. - P. 6409.

61. Wu Y. Automatic detection of arbitrarily oriented fastener defect in high-speed railway / Y. Wu, Y. Qin, Y. Qian // Automation in Construction. - 2021. - Vol. 131. - P. 103913.

62. Gavrilova N. M. Application of computer vision algorithms in the problem of coupling of the locomotive with railcars / N. M. Gavrilova, I. A. Dailid, S. A. Molodyakov, et al. // International Symposium on Consumer Technologies. -2018. - P. 1-4.

63. Гаврилова Н. М. Применение алгоритмов машинного обучения для поиска рельсовой колеи / Н. М. Гаврилова, И. А. Дейлид, С. А. Молодяков и др. // Международная конференция по мягким вычислениям и измерениям. -2018. - Т. 2. - С. 139-142.

64. Javed A. Efficient algorithm for railway tracks detection using satellite imagery / A. Javed, K. A. Qazi, M. Maqsood, et al.]// International Journal of Image, Graphics and Signal Processing. - 2012. - Vol. 4. - №. 11. - P. 34.

65. Berg A. Detecting rails and obstacles using a train-mounted thermal camera / A. Berg, K. Ofjall, J. Ahlberg, et al. // Scandinavian Conference on Image Analysis - 2015. - P. 492-503.

66. Belyaev S. Railroad semantic segmentation on high-resolution images / S. Belyaev, V. Shubnikov, D. Savchuk, et al. // IEEE International Conference on Intelligent Transportation Systems. - 2020. - P. 9294722.

67. Романчиков А. М. Определение траектории движения локомотива для систем машинного зрения / А. М. Романчиков, В. А. Гросс, П. Е. Мащенко, К. С. Болдырев // Железнодорожный транспорт. - 2020. - № 11. - С. 61-63.

68. Мащенко, П. Е. Оптимизация модели нейронной сети U-HarDNet-70 для сегментации железнодорожного пути / П. Е. Мащенко, П. П. Ширяев // Транспорт Российской Федерации. - 2020. - № 6 (91). - С. 35-38.

69. Yu M. Railway obstacle detection algorithm using neural network / M. Yu, P. Yang, S. Wei // AIP Conference Proceedings. - 2018. - Vol. 1967. - №. 1. - AN 040017.

70. Мащенко П. Е. Метод визуального распознавания местности NetVLAD для локализации локомотива / П. Е. Мащенко, П. П. Ширяев // Автоматика, связь, информатика. - 2020. - № 10. - С. 14-17.

71. Мащенко П. Е. «Глаза» машиниста при движении вагонами вперед / П. Е. Мащенко, Е. А. Александров // Автоматика, связь, информатика. - 2021.

- № 9. - С. 42-43.

72. Романчиков А. М. Машинное зрение: взгляд 4.0 / А. М. Романчиков, П. Е. Мащенко, Е. А. Александров // Автоматика, связь, информатика. - 2020.

- № 12. - С. 16-17.

73. Озеров А. В. Техническое зрение в современной системе управления движением поездов / А. В. Озеров, А. Л. Охотников // Интеллектуальные транспортные системы: Материалы II Международной научно-практической конференции (Москва, 25 мая 2023 г.). - М.: Российский университет транспорта, 2023. - С. 620-625.

74. Охотников А. Л. Беспилотное управление локомотивом: вчера, сегодня и завтра / А. Л. Охотников, П. А. Попов // Автоматика, связь, информатика. -2019. - № 8. - С. 12-17.

75. Долгий А. И. Автономное движение - отечественный и зарубежный опыт / А. И. Долгий, Е. Н. Розенберг, А. В. Озеров и др. // Автоматика, связь, информатика. - 2022. - № 12. - С. 14-16.

76. Мащенко П. Е. Анализ сенсоров систем технического зрения для нужд промышленного железнодорожного транспорта / П. Е. Мащенко, К. В. Шутилов // Вестник Института проблем естественных монополий: Техника железных дорог. - 2021. - № 1(53). - С. 40-45.

77. Дустмуродов А. Х. Применение беспилотных технических средств на инфраструктурных объектах железных дорог / А. Х. Дустмуродов // Наука и образование: прошлое, настоящее и будущее. - 2021. - С. 162-175.

78. Ворона А. А. Тенденции и перспективы грузооборота железнодорожного транспорта в России / А. А. Ворона // Таможенная политика России на дальнем Востоке. - 2020. - №. 3 (92). - С. 93-99.

79. Попов П. А. Сценарии работы системы автоматического управления на МЦК / П. А. Попов, А. А. Цветков, С. В. Кудряшов // Железнодорожный транспорт. - 2023. - № 9. - С. 41-43.

80. Попов П. А. Требования к системе технического зрения / П. А. Попов, С. В. Кудряшов // Железнодорожный транспорт. - 2024. - № 7. - С. 33-35.

81. Попов П. А. Применение технологий искусственного интеллекта для железнодорожного транспорта / П. А. Попов // Вестник Института проблем естественных монополий: Техника железных дорог. - 2024. - № 1(65).

- С. 38-41.

82. Охотников А. Л. Технические решения для перспективной железнодорожной магистрали «ТрансЕвразия» / А. Л. Охотников, В. Я. Цветков // Наука и технологии железных дорог. - 2019. - Т. 3. - №. 4.

- С. 50-56.

83. Охотников А. Л. Влияние системы управления поездом в автоматическом режиме на сетевое развитие железных дорог / А. Л. Охотников, В. Я. Цветков // Наука и технологии железных дорог. - 2020. - Т. 4. - №. 2.

- С. 76-83.

84. Охотников А. Л. Мировые тенденции развития систем автоматического управления движением поездов / А. Л. Охотников, И. А. Волкова // Наука и технологии железных дорог. - 2023. - Т. 7, № 2(26). - С. 23-29.

85. Попов П. А. Разработка системы управления электровозами в автоматическом режиме / П. А. Попов // Труды АО" НИИАС". - 2021. - С. 86-89.

86. Охотников А. Л. Проекты развития систем автоматического управления движением поездов / А. Л. Охотников, И. А. Волкова // Наука и технологии железных дорог. - 2023. - Т. 7, № 1(25). - С. 25-31.

87. Розенберг Е. Н. Европейская практика инновационного развития в области автоматизации управления движением поездов / Е. Н. Розенберг, А. В. Озеров // Интеллектуальные транспортные системы: материалы Международной научно-практической конференции (Москва, 26 мая 2022 г.). - Москва: Российский университет транспорта, 2022. - С. 278-284.

88. Fedorov V. A. Railway infrastructure instance segmentation based on convolutional neural networks / V. A. Fedorov // IEEE International Russian Automation Conference (Сочи, 10-16 сентября 2023 г.). - IEEE, 2023. -P. 443-447.

89. Safronov O. Calculated studies for the braking efficiency of freight trains under the rules of GOST 34434-2018 with the application of universal formulas (four-axle gondola cars, covered railraod cars, platforms, dump cars) / O. Safronov // Transport systems and technologies. - 2020. - №. 35. - P. 121-134.

90. Гаджиметов Г. И. К вопросу совершенствования методики подтверждения максимальной безопасной (конструкционной) скорости движения для грузовых вагонов / Г. И. Гаджиметов, А. А. Лунин, Г. И. Петров // Вестник Научно-исследовательского института железнодорожного транспорта. -2021. - Т. 80. - №. 3. - С. 141-151.

91. Правила технической эксплуатации железных дорог Российской Федерации с приложениями: утв. приказом Министерства транспорта Российской Федерации от 23 июня 2022 г. № 250. - Ростов-на-Дону: Мини-Тайп, 2024. - 662 с.

92. ГОСТ Р 72179-2025. Системы управления железнодорожным подвижным составом в автоматическом и дистанционном режимах. Требования к подсистеме распознавания объектов. Национальный стандарт Российской Федерации / Москва: Российский институт стандартизации, 2025. - 16 с.

93. ГОСТ 9238-2022. Габариты железнодорожного подвижного состава и приближения строений. Межгосударственный стандарт / Москва: Российский институт стандартизации, 2023. - 213 с.

94. Федоров В. А. Сегментация объектов техническим зрением в автоматизированных системах управления железнодорожным подвижным составом / В. А. Федоров, О. М. Огородникова // Автоматика на транспорте. - 2025. - Т. 11, № 3. - С. 239-249.

95. ГОСТ 8442-65. Знаки путевые и сигнальные железных дорог / Москва: Издательство стандартов, 1983. - 43 с.

96. Fedorov V. A. AI-based train localization using railway infrastructure object detection / V. A. Fedorov // Transportation Development Research. - 2024. -Vol.2. - No. 2. - P. 1-11.

97. Fedorov V. A. Recognizing Railway Infrastructure Using CNN and Stereoscopic Vision / V. A. Fedorov // IEEE International Russian Smart Industry Conference (Сочи, 25-29 марта 2024 г.). - IEEE, 2024. - P. 13-18.

98. Федоров В. А. Повышение качества обучения сверточных нейронных сетей в задачах технического зрения беспилотных поездов / В. А. Федоров, О. М. Огородникова // Моделирование, оптимизация и информационные технологии. - 2025. - Т. 13, № 4 (51) - С. 1-11.

99. Федоров В. А. Свидетельство о государственной регистрации программы для ЭВМ № 2024687024. Программа генерации и улучшения обучающего набора данных для сверточных нейронных сетей / Автор Федоров В.А. -заявка № 2024686564; дата государственной регистрации в Реестре программ для ЭВМ 13.10.2024.

100. Федоров В. А. Обнаружение пути следования локомотива на основе сверточных нейронных сетей / В. А. Федоров, О. М. Огородникова // Физика. Технологии. Инновации: Тезисы докладов X Международной молодежной научной конференции, 15-19 мая 2023 г. - Екатеринбург: Издательство АМБ, 2023. - С. 762-763.

101. Федоров В. А. Обнаружение железнодорожной инфраструктуры на основе YOLOv8 с использованием нейронного процессора / В. А. Федоров // Доклады Российской Академии наук. Математика, информатика, процессы управления. - 2024. - Т. 520. - № S2. - С. 49-56.

Fedorov V. A. Railway infrastructure detection based on YOLOv8 with NPU acceleration / V. A. Fedorov // Doklady Mathematics. - 2024. - Vol. 110. - No. S1. - P. 42-48.

102. Федоров В. А. Определение местоположения железнодорожного подвижного состава в условиях недоступности спутниковой навигации / В. А. Федоров // Исследование и развитие рельсового и автомобильного транспорта: Сборник трудов Международной научно-практической конференции, 22-23 мая 2025 г. - Екатеринбург: УрГУПС, 2025. - С. 259262.

103. Федоров В. А. Обнаружение объектов железнодорожной инфраструктуры методами компьютерного зрения / В. А. Федоров, О. М. Огородникова // Информационные технологии в науке и производстве: Материалы X Всероссийской научно-практической конференции, 18 апреля 2023 г. -Омск: Омский государственный технический университет, 2023. - С. 72-76.

104. Федоров В. А. Сверточные нейронные сети как инструмент обнаружения объектов железнодорожной инфраструктуры / В. А. Федоров, О. М. Огородникова // Автоматизация в промышленности. - 2024. - № 12. - С. 20-23.

Приложение А

Классификация объектов в банке данных для обнаружения и сегментации

Таблица А.1 - Классификация объектов обнаружения

№ Класс Подкласс Описание

1 Человек Человек в произвольной одежде Человек в произвольной одежде в положении «стоя», рост человека превышает 1 м.

Человек в сигнальном жилете Человек в сигнальном светоотражающем жилете желтого или оранжевого цвета в положении «стоя», рост человека превышает 1 м.

2 Животное Крупное животное Крупное животное (корова, лошадь, лось)

3 Ж/д подвижной состав Ж/д подвижной состав Локомотивы, пассажирские и грузовые вагоны

4 Автомобильное транспортное средство Легковой автомобиль -

Грузовой автомобиль

Автобус

5 Знак путевой Знак километровый Внешний вид и установка в соответствии с ГОСТ 8442-65

Знак пикетный Внешний вид и установка в соответствии с ГОСТ 8442-65

6 Путевое заграждение Тупиковая призма Внешний вид и места установки в соответствии с ПТЭ РЖД

7 Светофоры Мачтовый светофор -

Карликовый светофор -

Консольный светофор -

8 Прочая ж/д инфраструктура Ж/д переезд -

Ж/д платформа В соответствии с нормативным документом «Требования к пассажирским платформам по обеспечению безопасности граждан»

Ж/д мост -

9 Знак сигнальный Знак «Начало опасного места» Внешний вид и установка в соответствии с ГОСТ 8442-65

№ Класс Подкласс Описание

Знак «Конец опасного

места»

Знак «Предельный столбик»

Знак «С» - подача

свистка

Знак «Начало

торможения»

Знак «Конец

торможения»

Начало пролета

контактной сети

Конец пролета

контактной сети

Знак «Подготовиться к

опусканию

токоприемника»

Знак «Опустить токоприемник» Внешний вид и места установки в

Знак «Поднять соответствии с ПТЭ РЖД

токоприемник»

Знак «Отключить ток»

Знак «Включить ток на

электровозе»

Знак «Включить ток на

электропоезде»

Диск желтый

Диск зеленый

Щит желтый

Щит зеленый

Щит красный

Рельсовая колея Рельсовая колея шириной 1520 мм

Остряк прижат в «пошерстном» направлении движения Остряк прижат к рамной рельсе при

10 Ж/д пути проезде стрелочного перевода в направлении от крестовины к его острякам.

Остряк не прижат в Остряк не прижат к рамной рельсе

№ Класс Подкласс Описание

«пошерстном» направлении движения при проезде стрелочного перевода в направлении от крестовины к его острякам.

Остряк прижат в «протившерстном» направлении движения Остряк прижат к рамной рельсе при проезде стрелочного перевода в направлении от его остряков к крестовине.

Остряк не прижат в «протившерстном» направлении движения Остряк не прижат к рамной рельсе при проезде стрелочного перевода в направлении от его остряков к крестовине.

На рисунках А.1 - А.10 представлен внешний вид и размеры сигнальных и путевых знаков.

Рисунок А.1 - «Знак километровый» (слева) и «Знак пикетный» (справа)

Рисунок А.2 - Предельный столбик: у главных и приемоотправочных путей (слева), у съездов и отдельных стрелочных переводов (справа)

Рисунок А.3 - Сигнальный знак «С»

Рисунок А.4 - Знак «Начало торможения» (слева) и знак «Конец

торможения (справа)

Рисунок А.5 - Знаки «Начало воздушного промежутка» (слева) и «Конец

воздушного промежутка» (справа)

Рисунок А.6 - Сигнальные знаки «Начало опасного места» (слева) и «Конец

опасного места» (справа)

Рисунок А.7 - Знаки «Щит желтый» (слева), «Щит зеленый» (по центру) и

«Щит красный» (справа)

Рисунок А.8 - Знаки «Диск желтый» (слева) и «Диск зеленый» (справа)

Рисунок А.9 - Знаки «Подготовиться к опусканию токоприемника» (слева), «Опустить токоприемник» (по центру) и «Поднять токоприемник» (справа)

Рисунок А.10 - Знаки «Отключить ток» (слева), «Включить ток на электровозе» (по центру) и «Включить ток на электропоезде» (справа)

Приложение Б Свидетельство о регистрации программы для ЭВМ

Приложение В Акт о внедрении результатов диссертационной работы

УТВЕРЖДАЮ

Заместитель директора по научной работе ООО «НПО САУТ», действительный член Российской Инженерной Академии

В.И. Головин 2025 г.

О/)

АКТ

о внедрении резулыагов диссертационной работы Федорова Владимира Анатольевича

Настоящий акт удостоверяет, что результаты диссертационной работы Федорова Владимира Анатольевича на тему: «Методы и алгоритмы интеллектуализации решения задач технического зрения в автоматизированных системах управления железнодорожным подвижным составом» были использованы при выполнении научно-исследовательской и опытно-конструкторской работы (НИОКР) «Система машинного зрения» (шифр СГМА.667527.001).

В рамках указанной НИОКР были реализованы разработанные в диссертационном исследовании методы и алгоритмы, а также программные решения, направленные на повышение эффективности систем технического зрения. В частности, результаты исследования были использованы при решении задач автоматизированного обнаружения и сегментации объектов железнодорожной инфраструктуры с применением сверточных нейронных сетей, адаптированных для работы в реальном времени на борту подвижного состава.

Применение результатов диссертационной работы способствовало повышению технологического уровня и функциональных характеристик разработанной «Системы машинного зрения».

/

Начальник отдела

В. Н. Масл овс ки й

НИР-КСБ ООО «НПО САУТ»

Приложение Г

Результаты обучения разработанной модификации сверточной нейронной

сети У0Ь011з1ш

Эпохи

Рисунок Г.1 - График изменения ошибки классификации во время обучения

Эпохи

Рисунок Г.2 - График изменения ошибки локализации во время обучения

1,6

О 50 100 150 200 250 300 350

Эпохи

Рисунок Г.3 - График изменения ошибки сегментации во время обучения

1,4

0,8-----

О 50 100 150 200 250 300 350

Эпохи

Рисунок Г.4 - График изменения ошибки DFL во время обучения

Рисунок Г.5 - График изменения метрики Precision при локализации объектов

во время обучения

Рисунок Г.6 - График изменения метрики Recall при локализации объектов во

Рисунок Г.7 - График изменения метрики тАР50 при локализации объектов во

время обучения

Рисунок Г.8 - График изменения метрики тАР50-95 при локализации объектов

Рисунок Г.9 - График изменения метрики Precision при сегментации объектов

во время обучения

Рисунок Г.10 - График изменения метрики Recall при сегментации объектов во

Рисунок Г.11 - График изменения метрики тАР50 при сегментации объектов во

время обучения

Рисунок Г.12 - График изменения метрики тАР50-95 при сегментации

объектов во время обучения

Приложение Д

Примеры обнаружения и сегментации объектов моделью УОЬОуИ^ш

Рисунок Д.2 - Сегментация и обнаружение ж/д пути, пикетного столбика, мачтового светофора и людей в сигнальных жилетах

Рисунок Д.3 - Сегментация и обнаружение ж/д пути и километрового столба

Рисунок Д.4 - Сегментация и обнаружение ж/д пути, тупиковых призм, карликового светофора и пикетного столбика

Рисунок Д.5 - Сегментация и обнаружение ж/д путей, людей в сигнальных жилетах, мачтового светофора, легкового и грузового автомобилей

Рисунок Д.6 - Сегментация и обнаружение ж/д путей, ж/д платформ, легкового автомобиля, пикетного столбика и человека в произвольной одежде

Рисунок Д.8 - Сегментация и обнаружение ж/д путей и локомотива

Рисунок Д.9 - Сегментация и обнаружение ж/д путей, мачтовых светофоров,

желтого щита и километрового столба

Рисунок Д.10 - Сегментация и обнаружение ж/д путей, пикетного столбика, знаков «Начало пролета контактной сети» и знака «Опустить токоприемник»

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.