Анализ транспортных данных - новые модель и программная платформа тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Булыгин Марк Валерьевич
- Специальность ВАК РФ00.00.00
- Количество страниц 128
Оглавление диссертации кандидат наук Булыгин Марк Валерьевич
Введение
Глава 1. Обзор существующих методов анализа транспортных
данных
1.1 История развития методов анализа транспортных данных
1.2 Современные методы анализа транспортных данных
1.3 О Методике решения задач цифровой урбанистики
1.4 Краткие итоги главы
Глава 2. Мета-модель транспортных данных
2.1 Описание мета-модели
2.2 Модели данных основных типов
2.2.1 Модель данных вил идиторов
2.2.2 Модель данных матриц корреспонденции
2.2.3 Модель данных логистических центров
2.3 Сравнение с другими моделями
2.4 Краткие итоги главы
Глава 3. Об архитектуре открытой платформы анализа
транспортных данных
3.1 Архитектура платформы
3.2 Модуль хранения и загрузки данных
3.2.1 Особенности реализации на языке Python
3.3 Модуль проверки семантической корректности данных
3.3.1 Особенности реализации на языке Python
3.4 Модуль анализа данных
3.4.1 Особенности реализации на языке Python
3.5 Модуль визуализации результатов
3.5.1 Основные методы визуализации и особенности их
реализации на языке Python
3.6 Модуль API
3.6.1 Особенности реализации на языке Python
3.7 Практические аспекты использования открытой платформы анализа транспортных данных
3.8 Краткие итоги главы
Глава 4. Решение прикладных задач в открытой платформе
анализа транспортных данных
4.1 Детекция аномалий в транспортных потоках
4.1.1 Описание решения в платформе
4.2 Кластеризация районов города по паттернам пользования
транспортом
4.2.1 Описание решения в платформе
4.3 Выявление подозрительных валидаций льготных проездных
документов
4.3.1 Описание решения в платформе
4.4 Краткие итоги главы
Глава 5. Приложение логистический калькулятор
5.1 Логистический калькулятор
5.2 Математическая модель транспортного хаба
5.3 Задача поиска оптимального местоположения транспортного хаба
5.4 Расчет транспортных затрат в открытой платформе анализа
транспортных данных
5.4.1 Особенности реализации на языке Python
5.5 Клиентская часть логистического калькулятора
5.6 Использование логистического калькулятора для решения практических и исследовательских задач
5.7 Краткие итоги главы
Заключение
Список литературы
Приложение А. Диаграмма классов открытой платформы
анализа транспортных данных
Приложение Б. Акт внедрения в деятельность Академии В СМ . 126 Приложение В. Акт внедрения в деятельность ВИШ РУТ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Разработка и исследование интеллектуальной системы управления комбинированным траловым механизмом для перемещения высокотоннажных крупногабаритных грузов2025 год, кандидат наук Хрульков Владимир Николаевич
Методика и модели формирования сети синхронизации в оптических транспортных сетях со спектральным разделением каналов2025 год, кандидат наук Прошин Федор Алексеевич
Механизм формирования гармоничной транспортно-логистической системы общественного транспорта городской агломерации2025 год, кандидат наук Акимов Андрей Валерьевич
Методы и алгоритмы обработки гетерогенной информации и адаптивного управления в интеллектуальной транспортной системе2023 год, доктор наук Агафонов Антон Александрович
Методы и алгоритмы формирования психологического портрета пользователя социальной сети для эффективного подбора кадров2024 год, кандидат наук Зоткина Алена Александровна
Введение диссертации (часть автореферата) на тему «Анализ транспортных данных - новые модель и программная платформа»
Введение
Согласно отчетам ООН, к 2050 году более половины населения планеты будет проживать в городах. В этих условиях сохранение высокого уровня жизни требует значительного развития транспортной инфраструктуры. В настоящее время особую актуальность приобрели подходы, основанные на анализе данных. Ранее основными источниками информации служили переписи и опросы, однако их проведение было сопряжено с высокими затратами времени, ресурсов и финансов. Кроме того, такие данные часто отличались низкой точностью и оперативностью, что снижало их практическую ценность.
С появлением современных источников, таких как данные сотовых операторов и GPS, исследователи получили возможность извлекать информацию о перемещении людей и грузов с минимальными временными задержками. Это открывает перспективы для разработки систем, способных в режиме реального времени реагировать на изменения в транспортной системе города.
В настоящее время существующие инструменты и методы анализа транспортных данных, как правило, ориентированы на решение узкоспециализированных задач с использованием конкретных наборов данных. Это усложняет создание комплексных и многофункциональных инструментов, замедляет процессы разработки и затрудняет сравнение различных подходов к решению аналогичных задач. В данной ситуации перспективным направлением является разработка открытой платформы для анализа транспортных данных, которая позволит сосредоточить усилия на создании и совершенствовании аналитических решений, минимизировав затраты на процессы загрузки, проверки корректности и визуализации данных.
Одним из примеров успешного применения платформенного подхода является платформа HuggingFace и библиотека transformers, которые произвели значительные изменения в области обработки естественного языка. Данная платформа стала ключевым инструментом для исследователей и разработчиков благодаря своей открытости, удобству использования и возможности быстрого развертывания решений на основе предварительно обученных моделей и данных. В сфере транспортных данных аналогичных решений пока не существует.
В рамках данной диссертационной работы описана разработка открытой программной платформы, ориентированной на анализ транспортных данных. Актуальность данной темы обусловлена возрастающей необходимостью использования таких решений в условиях модернизации городской транспортной инфраструктуры.
Целью исследования является создание открытой и универсальной программной платформы, которая позволит значительно сократить время и ресурсы, необходимые для разработки решений в области транспортного анализа.
Для достижения поставленной цели необходимо было решить следующие задачи:
1. Выявить основные типы транспортных данных
2. Предложить метамодель, объединяющую модели транспортных данных различных типов
3. Предложить архитектуру открытой платформы анализа транспортных данных на основе полученной мети модели
4. Осуществить реализацию предложенной архитектуры
5. В рамках предложенной архитектуры предложить методы загрузки, проверки корректности данных и визуализации результатов
6. Осуществить реализацию данных методов
7. В рамках предложенной платформы разработать аналитические методы решения прикладных задач анализа транспортных данных
Научная новизна:
1. Впервые предложена модель транспортных данных, обеспечивающая масштабируемость аналитических модулей в цифровых платформах
2. Впервые предложена архитектура открытой платформы анализа транспортных данных, позволяющая расширять её функциональность путем добавления новых реализаций её модулей
3. Впервые разработан методологический подход к созданию решений для анализа транспортных данных, основанный на унифицированной платформе.
4. Впервые предложен подход к определению трендов и отклонений от них в метриках транспортной системы, которые выступают как цифровые индикаторы развития и использования городской среды
5. Впервые предложен алгоритм для определения местоположения транспортного хаба, минимизирующего суммарную стоимость аренды и затрат на транспортировку, с учетом пространственных ограничений и ограничений городской транспортной сети.
Практическая значимость
1. Реализация платформы и разработанные алгоритмы используются в Передовой инженерной школы «Академия ВСМ» для решения прикладных и исследовательских задач.
2. Разработанная модель данных была использована в рамках проектов Высшей Инженерной Школы Российского Университета Транспорта (ВИШ РУТ) для решения задач от различных заказчиков.
Методология и методы исследования. При получении основных результатов работы использовались теория графов, методы кластеризации данных и поиска аномалий в них. Для построения маршрутов между транспортными узлами с учетом дорожной сети были использованы карты OpenStreetMap и OpenStreet Routing Machine. Предложенная архитектура платформы была реализована с использованием языка Python. Для хранения конфигурационных файлов платформы для различных решений использован формат JSON. Вывод результатов работы алгоритмов на интерактивные карты реализован с помощью Follium.
Основные положения, выносимые на защиту:
1. Разработана метам од ель транспортных данных.
2. На основе предложенной мети модели разработана архитектура открытой платформы для анализа транспортных данных, которая обеспечивает возможность реализации новых алгоритмов анализа без необходимости повторного определения методов хранения, проверки корректности, выборки данных и способов визуализации результатов. Архитектура платформы реализована с использованием языка программирования Python.
3. На разработанной платформе реализованы новые алгоритмы анализа транспортных данных. Получено свидетельство о регистрации программного обеспечения.
4. Разработана математическая модель функционирования транспортного хаба. На основе данной модели с использованием открытой платформы
анализа транспортных данных создано приложение "Логистический калькулятор".
Достоверность полученных результатов обеспечивается как проведенными вычислительными экспериментами, так и доказательством теорем и утверждений. Результаты проведенного исследования находятся в соответствии с результатами других исследователей в области анализа данных.
Апробация работы. Основные результаты работы докладывались на следующих конференциях:
1. The 28th Conference of the Open Innovations Association FRUCT, Москва, Россия, 25-29 января 2021
2. Ломоносовские чтения 2021. Секция вычислительная математика и кибернетика, 20-29 апреля 2021, Москва, Россия, 20-29 апреля 2021
3. The 29th Conference of Open Innovations Association FRUCT, Тампере, Финляндия, 12-14 мая 2021
4. XXIX Международная научная конференция студентов, аспирантов и молодых ученых "Ломоносов 2022 МГУ имени М.В. Ломоносова, Россия, 11-22 апреля 2022
5. Ломоносовские чтения - 2022, Секция вычислительная математика и кибернетика, 14-22 апреля 2022, Москва, МГУ имени М.В.Ломоносова, факультет ВМК, Россия, 14-22 апреля 2022
6. Экономика цифровой трансформации и устойчивое развитие транспорта, Москва, Россия, 1-2 июня 2022
7. Ломоносовские чтения - 2023, Секция вычислительная математика и кибернетика, 4-14 апреля 2023, Москва, МГУ, факультет ВМК, Россия, 4-14 апреля 2023
8. XXX Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2023», г. Москва, МГУ имени М.В. Ломоносова, Россия, 10-21 апреля 2023
9. DCCN 2023, Москва, Россия, 25-29 сентября 2023
10. МЕЖДУНАРОДНАЯ НАУЧНО-ПРАКТИЧЕСКАЯ КОНФЕРЕНЦИЯ «ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ» (ITIDMS2023), Российский новый университет, г. Москва, Россия., Россия, 4-6 марта 2024
11. International Russian Smart Industry Conference, г. Сочи, Адлерский район, Бульвар Надежд, д. 42, корпус 6., Россия, 25-29 марта 2024
Личный вклад. Все результаты, представленные в работе, получены лично автором. Подготовка материала к публикациям проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Во всех опубликованных работах консультирование, корректировка и дополнение текста осуществлялись Д.Е. Намиотом.
Публикации.
Основные результаты по теме диссертации изложены в 11 печатных изданиях, 5 из которых изданы в периодических научных журналах, индексируемых Web of Science и Scopus, 1 —в журналах, рекомендованных ВАК (квартиль К1), 2 — в журналах, рекомендованных ВАК (квартиль К2), 3 и тезисах докладов. Получено 1 свидетельство о регистрации программы для ЭВМ.
— Bulygin М., Namiot D. On the automated text report generation in open transport data analysis platform // Lecture Notes in Computer Science. — 2024. - Vol. 14123. - P. 435-447.
— Bulygin M., Namiot D. On the open transport data analysis platform // Communications in Computer and Information Science. — 2024. — Vol. 2112. - P. 40-52.
— Bulygin M., Namiot D. On the smart card data privacy in public transport // 2024 International Russian Smart Industry Conference (SmartlndustryCon). — United States: IEEE Communications Society, 2024. - P. 155-160.
— Bulygin M. V., Namiot D. E., Pokusaev O. N. On the analysis of individual data on transport usage // Труды Института системного анализа Российской академии наук. — 2023. — Vol. 73, no. 1. Р. 24-33.
— Bulygin М., Namiot D. A new approach to clustering districts and connections between them based on cellular operator data // 2021 29th Conference of Open Innovations Association (FRUCT). — United States: IEEE Computer Society, 2021. - P. 71-80.
— Bulygin M., Namiot D. Anomaly detection method for aggregated cellular operator data // 2021 28th Conference of Open Innovations Association (FRUCT). - United States: IEEE Computer Society, 2021. - P. 42-48.
— Булыгин M. В., Ним нот Д. E. О возможностях применения данных сотовых операторов для решения задач цифровой урбанистики //
International Journal of Open Information Technologies. — 2021. — T. 9, Л'° 1. - C. 48-57.
— Булыгин M. В., Ним нот Д. Е. Об использовании данных мобильных абонентов в цифровой урбанистике // Современные информационные технологии и ИТ-образование. — 2019. — Т. 15, № 3. — С. 736-744.
Тезисы докладов:
— Булыгин М. В., Намиот Д. Е. Об автоматизированной генерации отчетов в открытой платформе анализа транспортных данных // Ломоносовские чтения-2023: научная конференция, факультет ВМК МГУ имени М.В.Ломоносова. Тезисы докладов. — Вычислительная математика и кибернетика. — Москва: ООО МАКС Пресс, 2023. — С. 177-178.
— Булыгин М. В., Намиот Д. Е. Об архитектуре программного решения для работы с транспортными данными // Ломоносовские чтения-2022: научная конференция, факультет ВМК МГУ имени М.В.Ломоносова. Тезисы докладов. - Т. 2022 из СЕКЦИЯ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ. - Москва: ООО МАКС Пресс, 2022. - С. 193-194.
— Булыгин М. В., Намиот Д. Е. О НЕКОТОРЫХ МЕТОДАХ АНАЛИЗА АГРЕГИРОВАННЫХ ДАННЫХ СОТОВЫХ ОПЕРАТОРОВ // Ломоносовские чтения-2021: научная конференция, факультет ВМК МГУ имени М.В.Ломоносова. Тезисы докладов. — Т. 2021 из Секция Вычислительной математики и кибернетики. — М.: Изд-во Моск. ун-та, 2021. - С. 112-113.
Свидетельство о регистрации программы для ЭВМ:
— Программа для обнаружения нетипичных значений в данных о транспортных потоках "А-детект"
Соответствие паспорту специальности Тема и содержание диссертационный работы соответствуют паспорту научной специальности 2.3.5. Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей, в частности в работе представлены мета-модель транспортных данных, новая архитектура открытой платформы анализа транспортных данных, новый методологический подход к созданию программ в области анализа транспортных данных, новый подход к анализу транспортных данных как цифровых метрик в городе, новые
и
алгоритмы для решения задач выявления аномалий в данных о транспортных потоках, а также кластеризации районов города по паттернам транспортного использования, математическая модель функционирования транспортного хаба.
Тема и содержание диссертационный работы соответствуют паспорту научной специальности 2.3.5. Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей, в частности в работе представлены:
— Мета-модель транспортных данных
— Модульная архитектура открытой платформы анализа транспортных данных
— Новый методологический подход к созданию программ в области анализа транспортных данных
— Новый подход к анализу транспортных данных как цифровых метрик в городе
— Новые алгоритмы для решения задач выявления аномалий в данных о транспортных потоках, а также кластеризации районов города по паттернам транспортного использования
— Математическая модель функционирования транспортного хаба
Это соответствует следующим пунктам паспорта направления исследования специальности: 1, 3, 4, 7
— 1. Модели, методы и алгоритмы проектирования, анализа, трансформации, верификации и тестирования программ и программных систем.
— 3. Модели, методы, архитектуры, алгоритмы, языки и программные инструменты организации взаимодействия программ и программных систем.
— 4. Интеллектуальные системы машинного обучения, управления базами данных и знаний, инструментальные средства разработки цифровых продуктов.
— 7. Модели, методы, архитектуры, алгоритмы, форматы, протоколы и программные средства человеко-машинных интерфейсов, компьютерной графики, визуализации, обработки изображений и видеоданных, систем виртуальной реальности, многомодального взаимодействия в социокиберфизических системах.
Объем и структура работы. Диссертация состоит из введения, 5 глав, заключения и 3 приложений.
Полный объём диссертации составляет 128 страниц, включая 36 рисунков и 5 таблиц. Список литературы содержит 56 наименований.
Глава 1. Обзор существующих методов анализа транспортных
данных
Транспортные системы представляют собой совокупность некоторых транспортных узлов, представляющих собой различные объекты транспортной инфраструктуры. Определение
Транспорт, ные данные - это данные, описывающие функционирование транспортных и логистических систем.
Транспортные данные отображают информацию о транспортных потоках в городе. Любое событие, происходящее в городе, оказывает влияние на транспортные потоки внутри него, а, значит, находит отображение в транспортных данных. В то же время верно и обратное: любое изменение в данных о транспортных потоках говорит об изменениях, происходящих в городе. Транспортные данные из различных источников являются своего рода измеряемыми величинами, описывающими город.
Транспортные данные, собираемые на уровне индивидуальных пользователей транспортной сети, могут рассматриваться в качестве информации о его жителях, по которой можно делать выводы об их социально-экономическом статусе и его изменениях.
Эти измеряемые величины позволяют строить решения на основе анализа данных не только для задач управления транспортом в городе, но и для управления городской инфраструктурой в целом.
1.1 История развития методов анализа транспортных данных
Проблема развития городской инфраструктуры появилась вместе с возникновением первых городов. Жителям приходилось принимать решения о распределении общих богатств города. Изначально пути и направления развития инфраструктуры городов устанавливались при помощи голосований, либо на основе мнения экспертов. В новое время с развитием науки и техники и ростом числа городов-миллиоников начали появляться методы анализа
транспортных данных, которые помогали городским властям в управлении городом. История развития методов анализа транспортных данных от 1960-ых годов до наших дней показана на рисунке 1.1. Решения в области анализа
Рисунок 1.1 История развития методов анализа транспортных данных
транспортных данных существовали в 60-ые годы XX века. Эти решения были построены на анализе данных опросов, переписей и анкетирований жителей городов.
В статье [1] авторами рассматриваются методы оценки количества поездок на автомобиле и общественном транспорте в зависимости от размера, состава и дохода домохозяйств. Этой же проблеме посвящена глава 6 книги [2]. Также в этой книге рассмотрены тенденции экономического развития городов в середине 60-ых годов XX века, особенности расположения городов и объектов в них, финансирование городского транспорта, а также анализируются схемы поездок и транспортный спрос.
Выявлению характеристик идеальной транспортной системы по мнению пользователей посвящена статья [3]. Исследование построено на базе 550 индивидуальных интервью и раскрывает индивидуальные потребительские предпочтения и мотивацию.
Данные переписей и опросов являются сложными и дорогими в получении. Они быстро устаревают, как и результаты полученные на их основе.
Уже в 60-ые годы XX века для исследований стали применяться компьютеры. Сокращению простоев водителей фургонов посвящена статья [4]. Авторы использовали вычислительную машину Mark II для применения разработанного эвристического метода составления расписания водителей.
В 90-ые годы XX века компьютеры становятся более доступными. Они получают более широкое применение в области анализа транспортных данных. В работе [5] отмечается нехватка цифровых источников данных, которые в отличие от данных переписей, являются богатыми с точки зрения охвата
факторов, релевантными и массовыми. Авторы предлагали возможные способы для создания более масштабных, актуальных в то время цифровых моделей моделей человеческой активности в городах.
В то же время начинают активное развитие геоинформационные системы. В статье [6] описывается использование геоинформационных систем для моделирования плотности населения в рамках различных территориальных единиц. В работе [7] сочетаются результаты компьютерного анализа данных переписей населения и анализа спутниковых снимков при помощи геоинформационных систем для оценки качества жизни населения в городах.
В начале XXI века увеличивается популярность мобильной связи. В настоящее время степень проникновения сотовой связи составляет свыше 98% в крупных городах. К 2008 году были получены методики вычисления местоположения пользователей мобильной сети по уровню сигнала и задержке его прохождения. Обзор методов, технологий и стандартов, необходимых для создания геолокационных сервисов и приложений на основе данных базовых станций сотовых операторов приведен в работе [8]. В 2010 году телекоммуникационным оператором Telecom Italia была разработана платформа LocHNESs, предназначенная для мониторинга изменений в городе на основе анонимизированных данных базовых станций. На основе этой платформы с добавлением данных о местоположении такси и автобусов была создана система мониторинга города в реальном времени. [9]. Позднее этими же авторами был предложен метод для получения матриц корреспонденций на основе данных сотовых операторов [10].
1.2 Современные методы анализа транспортных данных
Современным исследователям доступны транспортные данные, собираемые при помощи множества различных средств. Какие-то из этих средств непосредственно связаны с транспортными компаниями, например, валидаторы в системах общественного транспорта, трекеры грузовых автомобилей в компаниях, осуществляющих перевозку грузов. Другие же средства собирают данные в процессе выполнения других функций. Примером такого средства является смартфон. Он оставляет цифровой след в виде
данных на базовых станциях сотовых операторов, а также данных GPS и акселерометров, которые собираются приложениями. Данные, с которыми работают соврменные методы, получаются из различных источников и имеют различную структуру, но в то же время могут быть представлены в рамках одного из трёх основных типов данных. Основные типы данных с примерами представлены на рисунке 1.2. Данные первого типа это данные
Рисунок 1.2 Основные типы данных в современных методах анализа
отображающие для каждой пары узлов объем транспортного потока между ними. Эти данные могут быть представлены в виде матриц корреспонденции. К таким данным относятся данные сотовых операторов о транспортных потоках между районами города или станциями метро, а также агрегированные по времени и местоположению данные различных транспортных служб, в которых известно место окончания поездок, например, данные систем общественного транспорта, где валидация транспортных карт происходит на входе и на выходе. Такие данные не содержат информации об индивидуальных пользователях транспортной сети, но позволяют оценивать транспортное поведение в рамках больших социальных групп и территориальных единиц.
Также существует множество других способов получения матриц корреспонденции. Им посвящены статьи [11], [12], [13] и [14].
Также существуют методы предсказания матриц корреспонденции для следующих моментов времени на основе исторических данных. Одними из наиболее новых таких методов являются [15] и [16].
Рассуждению о способах использования агрегированных данных сотовых абонентов посвящена работа [17]. В исследовании обращается особое внимание на факт присутствия базовых станций сотовых операторов в метро, что
позволяет им собирать данные о входящих и выходящих пассажиров. На основе этих данных предлагается строить модели распределений по входу и выходу для станций метро, что может быть необходимо для оценки достаточности пропускной способности станций. Также авторы указывают на возможность измерения социальных событий по таким данным путем поиска аномалий и на возможность выявления моделей использования станций метро путём кластеризации временных рядов, полученных из данных сотовых операторов.
Метод использования данных для анализа воздействия пандемии СОУГО-19 на транспортное поведение был представлен в исследовании [18]. В рамках работы были проанализированы анонимизированные данные о местоположении пользователей одного из крупнейших австрийских операторов мобильной связи, включающие сведения о более чем 1 млрд событий от 4,5 млн пользователей. На первом этапе исследования на основе этих данных были построены матрицы корреспонденций для различных территориальных единиц. Эти матрицы были преобразованы в взвешенные графы, для которых вычислялись локальные и глобальные коэффициенты кластеризации каждой вершины. Также для каждого района была определена область активности, представляющая собой зоны, куда перемещаются жители данного района.
На завершающем этапе рассчитанные коэффициенты и области активности были визуализированы в виде графиков и карт, что позволило сделать выводы об изменениях в транспортном поведении населения в период пандемии, выделив четыре временных этапа: до введения карантинных мер (до 11 марта 2020 года), переходный этап (12-14 марта), период карантина (15 марта - 1 мая) и посткарантинный этап (с 2 мая). Исследование выявило значительное снижение всех показателей мобильности населения в период карантина, а также фрагментацию социальных связей на отдельные кластеры. После отмены ограничений наблюдалось восстановление большинства показателей мобильности, за исключением ряда точек интереса в городской среде.
Аналогичное исследование было проведено в Португалии в работе [19], где данные операторов мобильной связи также подтвердили значительные изменения в перемещениях пользователей в условиях пандемии.
Другим важным направлением исследования данных, представимых в форме матриц корреспонденций, является установление взаимосвязи между паттернами землепользования и транспортным поведением жителей
различных территориальных единиц. В работе [20] на основе агрегированных транспортных данных были выделены четыре основные категории железнодорожных станций в городе Нанкин. На первом этапе данные были разделены на четыре категории: "Входы в будние дни "Выходы в будние дни "Входы в выходные дни "Выходы в выходные дни и агрегированы по часам. Для устранения влияния размеров районов в рамках каждого дня была проведена процентная нормализация данных. Дополнительно были собраны данные о точках интереса (Р01) в каждом районе, разделённые на категории: коммерческие услуги, общественные услуги, туристические достопримечательности, жилые районы, офисные помещения и транспортные объекты.
Кластеризация временных рядов, описывающих входы и выходы на станциях, была выполнена с использованием метода КМеаш. В качестве метрик расстояния применялись К1). 1)Т\У и 8В1). Оптимальный метод кластеризации определялся с помощью индексов Кил и иски Хирибиши (СН) и Дэвиси Воуллини (1)В). Лучший результат кластеризации использовался для классификации типов станций.
Полученные кластеры вместе с набором признаков, включающим шесть признаков на основе данных Р01 и три сетевых признака, рассчитанных по железнодорожной сети, сформировали входные данные для модели ХОБоой^ Важность признаков, оцененная моделью, была использована для анализа влияния каждого из них на категоризацию станций.
Результаты кластеризации были представлены в виде карт с точечными пометками станций, на которых цветом был обозначен кластер, и графиков, характеризующих паттерны изменения пассажиропотоков в течение дня. Их анализ позволил выделить четыре основных типа железнодорожных узлов: «станции с высокой транспортной привлекательностью», характеризующиеся значительным объемом пассажиропотока и расположенные в центральной части города; «сбалансированные станции», где входящие и исходящие потоки пассажиров были приблизительно равны; «пригородные станции с высокой интенсивностью движения», которые располагались в пригородных районах с высоким притоком пассажиров и были окружены жилыми и коммерческими объектами; и «отдалённые пригородные станции с высокой интенсивностью движения», которые находились на большем удалении от центра и обслуживали жилые районы.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Информационно-измерительная и управляющая система территориально распределенных взаимосвязанных объектов газораспределения2024 год, кандидат наук Алексеева Полина Геннадьевна
Математическое и программное обеспечение сетецентрической системы управления доступом мобильных абонентов к информационным сервисам2018 год, кандидат наук Глазунов Вадим Валерьевич
Методы поддержки принятия решений на основе данных в задачах управления развитием урбанизированных территорий2023 год, доктор наук Парыгин Данила Сергеевич
Модели и алгоритмы анализа и исследования программно-конфигурируемых оптических сетей2022 год, кандидат наук Фатхулин Тимур Джалилевич
Формирование механизма управления транспортным поведением жителей мегаполиса2022 год, кандидат наук Пищикова Ольга Викторовна
Список литературы диссертационного исследования кандидат наук Булыгин Марк Валерьевич, 2025 год
Список литературы
1. Wootton HJ, Pick GW. A model for trips generated by households // Journal of Transport Economics and Policy. — 1967. — Pp. 137-153.
2. Meyer John Robert, Kain John F, Wohl Martin, The urban transportation problem. — Harvard University Press, 1965.
3. Hille Stanley J, Martin Theodore K. Consumer preference in transportation // Highway Research Record. — 1967. — Vol. 197. — Pp. 36-43.
4. Pullen HGM, Webb MHJ. A computer application to a transport scheduling problem // The computer journal. — 1967. — Vol. 10, no. 1. — Pp. 10-13.
5. Longley PA, Harris Richard J. Towards a new digital data infrastructure for urban analysis and modelling // Environment and Planning B: Planning and Design. - 1999. - Vol. 26, no. 6. - Pp. 855-878.
6. Batty Michael, Xie Yichun. Urban analysis in a GIS environment: population density modelling using ARC/INFO // Spatial analysis and GIS. — 1994. — Pp. 189-220.
7. Lo Chor Pang, Faber Benjamin J. Integration of Landsat Thematic Mapper and census data for quality of life assessment // Remote sensing of environment. — 1997. - Vol. 62, no. 2. - Pp. 143-157.
8. Wang Shu, Min Jungwon, Yi Byung. Location Based Services for Mobiles :Technologies and Standards // Proceedings of IEEE ICC 2008, (Beijing, China). - 2008. - 04.
9. Real-Time Urban Monitoring Using Cell Phones: A Case Study in Rome / Francesco Calabrese, Massimo Colonna, Piero Lovisolo et al. // IEEE Transactions on Intelligent Transportation Systems. — 2011. — Vol. 12, no. 1. - Pp. 141-151.
10. Estimating Origin-Destination Flows Using Mobile Phone Location Data / Francesco Calabrese, Giusy Di Lorenzo, Liang Liu, Carlo Ratti // IEEE Pervasive Computing. — 2011. — Vol. 10, no. 4. — Pp. 36-44.
11. Hussain Etikaf, Bhaskar Ashish, Chung Edward. Transit OD matrix estimation using smartcard data: Recent developments and future research challenges // Transportation Research Part C: Emerging Technologies. — 2021. — Vol. 125.
- P. 103044.
12. A method for bus OD matrix estimation using multisource data / Di Huang, Jun Yu, Shiyu Shen et al. // Journal of Advanced Transportation. — 2020. — Vol. 2020, no. 1. - P. 5740521.
13. Lu Qing-Long, Qurashi Moeid, Antoniou Constantinos. A two-stage stochastic programming approach for dynamic OD estimation using LBSN data // Transportation Research Part C: Emerging Technologies. — 2024. — Vol. 158.
- P. 104460.
14. National-Level Multimodal Origin-Destination Estimation Based on Passively Collected Location Data and Machine Learning Methods / Yixuan Pan, Aref Darzi, Mofeng Yang et al. // Transportation Research Record. — 2024.
- Vol. 2678, no. 5. - Pp. 525-541.
15. Li Changlin, Zheng Liang, Jia Ning. Network-wide ride-sourcing passenger demand origin-destination matrix prediction with a generative adversarial network // Transportmetrica A: Transport Science. — 2024. — Vol. 20, no. 1.
- P. 2109774.
16. Zhou Wenzhong, Tang Tao, Gao Chunhai. Spatio-Temporal Self-Attention Network for Origin-Destination Matrix Prediction in Urban Rail Transit // Sustainahility. - 2024. - Vol. 16, no. 6. - P. 2555.
17. OD-matrix and passenger flow analysis / Dmitry Namiot, Mariia Nekraplonna, Oleg Pokusaev, Alexander Chekmarev // International Journal of Open Information Technologies. — 2020. — Vol. 8, no. 4. — Pp. 25-30.
18. Country-wide mobility changes observed using mobile phone data during COVID-19 pandemic / Georg Heiler, Tobias Reisch, Jan Hurt et al. // 2020 IEEE international conference on big data (big data) / IEEE. — 2020. — Pp. 3123-3132.
19. Using CDR Data to Understand Post-pandemic Mobility Patterns / Cláudia Rodrigues, Marco Veloso, Ana Alves, Carlos Bento // EPIA Conference on Artificial Intelligence / Springer. — 2023. — Pp. 438-449.
20. Tian Li, Liang Yinlong, Zhang Bo. Measuring residential and industrial land use mix in the peri-urban areas of China // Land Use Policy. — 2017. — Vol. 69. — Pp. 427-438. — URL: https://www.sciencedirect.com/science/article/pii/ S0264837717306579.
21. Liu Yaolin, Fang Feiguo, Jing Ying. How urban land use influences commuting flows in Wuhan, Central China: A mobile phone signaling data perspective // Sustainable Cities and Society. — 2020. — Vol. 53. — P. 101914.
22. Simulating multiple urban land use changes by integrating transportation accessibility and a vector-based cellular automata: a case study on city of Toronto / Xiaocong Xu, Dachuan Zhang, Xiaoping Liu et al. // Geo-Spatial Information Science. — 2022. — Vol. 25, no. 3. — Pp. 439-456.
23. A decomposition-based forecasting method with transfer learning for railway short-term passenger flow in holidays / Keyu Wen, Guotang Zhao, Bisheng He et al. // Expert Systems with Applications. — 2022. — Vol. 189. — P. 116102.
24. Булыгии Марк Валерьевич, Намиот Дмитрий Евгеньевич Об использовании данных мобильных абонентов в цифровой урбанистике // Современные информационные технологии и ИТ-образование — 2019. — Vol. 15, по. 3. - Pp. 755-766.
25. Вулыгин MB, Намиот ДЕ. О возможностях применения данных сотовых операторов для решения задач цифровой урбанистики // International Journal of Open Information Technologies. — 2021. — Vol. 9, no. 1. — Pp. 48-57.
26. Profiling tourists' use of public transport through smart travel card data / Aaron Gutiérrez, Antoni Domenech, Benito Zaragozi, Daniel Miravet // Journal of Transport Geography. - 2020. - Vol. 88. - P. 102820.
27. Big data for big issues: Revealing travel patterns of low-income population based on smart card data mining in a global south unequal city / Caio Pieroni, Mariana Giannotti, Bianca В Alves, Renato Arbex // Journal of Transport Geography. - 2021. - Vol. 96. - P. 103203.
28. Examining public transport usage by older adults with smart card data: A longitudinal study in Japan / Shasha Liu, Toshiyuki Yamamoto, Enjian Yao, Toshiyuki Nakamura // Journal of transport geography. — 2021. — Vol. 93. — P. 103046.
29. The impact of rainfall on the temporal and spatial distribution of taxi passengers / Dandan Chen, Yong Zhang, Liangpeng Gao et al. // PloS one. _ 2017. - Vol. 12, no. 9. - P. eO 183574.
30. A multi-period analysis of taxi drivers' behaviors based on GPS trajectories / Weiwei Jiang, Jing Lian, Max Shen, Lin Zhang // 2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC). — 2017. — Pp. 1-6.
31. Wang Shuangquan, Chen Canfeng, Ma Jian. Accelerometer based transportation mode recognition on mobile phones // 2010 Asia-Pacific Conference on Wearable Computing Systems / IEEE. — 2010. — Pp. 44-46.
32. Tang Qinrui, Cheng Hao. Feature pyramid biLSTM: Using smartphone sensors for transportation mode detection // Transportation Research Interdisciplinary Perspectives. - 2024. - Vol. 26. - P. 101181.
33. Bulygin M. V., Namiot D. E., Pokusaev O. N. On the analysis of individual data on transport usage // Труды Института системного анализа Российской академии наук. — 2023. — Vol. 73, no. 1. — Pp. 24-33.
34. Unique in the crowd: The privacy bounds of human mobility / Yves-Alexandre De Montjoye, César A Hidalgo, Michel Verleysen, Vincent D Blondel // Scientific reports. — 2013. — Vol. 3, no. 1. — Pp. 1-5.
35. Bulygin Mark, Namiot Dmitry. On the Smart Card Data Privacy in Public Transport // 2024 International Russian Smart Industry Conference (SmartlndustryCon). — United States: IEEE Communications Society, 2024.
- Pp. 155-160.
36. Erlikh Anton, Erlikh Natalia. Determining the optimal location of an urban transport interchange hub // Revista Ingeniería UC. — 2021. — Vol. 28, no. 3.
- Pp. 412-417.
37. Green logistics location-routing problem with eco-packages / Yong Wang, Shouguo Peng, Xuesong Zhou et al. // Transportation Research Part E: Logistics and Transportation Review. - 2020. - Vol. 143. - P. 102118. - URL: https://www.sciencedirect.com/science/article/pii/S1366554520307663.
38. Strategway: web solutions for building public transportation routes using big geodata analysis / Alexey Golubev, Ilya Chechetkin, Konstantin S Solnushkin et al. // Proceedings of the 17th international conference on information integration and web-based applications & services. — 2015. — Pp. 1-4.
39. Development of a common framework for analysing public transport smart card data / Benito Zaragoz, Sergio Trilles, Aaron Gutiérrez, Daniel Miravet // Energies. - 2021. - Vol. 14, no. 19. - P. 6083.
40. Codd Edgar F. Data models in database management // Proceedings of the 1980 workshop on Data abstraction, databases and conceptual modeling. — 1980. — Pp. 112-114.
41. Bogomolov Yuri, Sobolevsky Stanislav. A Scalable Spatio-Temporal Analytics Framework for Urban Networks // Fifth Networks in the Global World Conference / Springer. — 2022. — Pp. 68-78.
42. Bulygin Mark, Namiot Dmitry. On the Open Transport Data Analysis Platform // International Scientific and Practical Conference on Information Technologies and Intelligent Decision Making Systems / Springer. — 2023. — Pp. 40-52.
43. Bulygin Mark, Namiot Dmitry. Anomaly detection method for aggregated cellular operator data // 2021 28th Conference of Open Innovations Association (FRUCT) / IEEE. - 2021. - Pp. 42-48.
44. Bulygin Mark, Namiot Dmitry. On the Automated Text Report Generation in Open Transport Data Analysis Platform // Lecture Notes in Computer Science. _ 2024. - Vol. 14123. - Pp. 435-447.
45. AER: Auto-encoder with regression for time series anomaly detection / Lawrence Wong, Dongyu Liu, Laure Berti-Equille et al. // 2022 IEEE International Conference on Big Data (Big Data) / IEEE. — 2022. — Pp. 1152-1161.
46. GitHub - sintel-dev/Orion: Library for detecting anomalies in signals — github.com. — https://github.com/sintel-dev/Orion/. — 2024. — [Accessed 10-01-2025].
47. Real-time passenger flow anomaly detection considering typical time series clustered characteristics at metro stations / Jinjing Gu, Zhibin Jiang, Wei "David" Fan et al. // Journal of Transportation Engineering, Part A: Systems. - 2020. - Vol. 146, no. 4. - P. 04020015.
48. Traffic anomaly detection in intelligent transport applications with time series data using informer / Xinggan Peng, Yuxuan Lin, Qi Cao et al. // 2022 IEEE 25th International Conference on Intelligent Transportation Systems (ITSC) / IEEE. - 2022. - Pp. 3309-3314.
49. Real-time passenger flow anomaly detection in metro system / Xiulan Wei, Yong Zhang, Xinyu Zhang et al. // IET Intelligent Transport Systems. — 2023.
- Vol. 17, no. 10. - Pp. 2020-2033.
50. Lloyd Stuart. Least squares quantization in PCM // IEEE transactions on information theory. — 1982. — Vol. 28, no. 2. — Pp. 129-137.
51. Tian Li, Liang Yinlong, Zhang Bo. Measuring residential and industrial land use mix in the peri-urban areas of China // Land Use Policy. — 2017. — Vol. 69.
— Pp. 427-438. — URL: https://www.sciencedirect.com/science/article/pii/ S0264837717306579.
52. Bulygin Mark, Namiot Dmitry. A New Approach to Clustering Districts and Connections Between Them Based on Cellular Operator Data // 2021 29th Conference of Open Innovations Association (FRUCT). — United States: IEEE Computer Society, 2021. - Pp. 71-80.
53. Guven Ozlem, Aras Serkan. Fraud Detection by Machine Learning Algorithms: A Case from a Mobile Payment System // Uluslararas Yonetim Iktisat ve Isletme Dergisi. - 2022. - Vol. 18, no. 3. - Pp. 895-911.
54. Herrera Juan Luis Lopez, Figueroa Homero Vladimir Rios, Ramirez Ericka Janet Rechy. Deep fraud. A fraud intention recognition framework in public transport context using a deep-learning approach // 2018 international
conference on electronics, communications and computers (CONIELECOMP) / IEEE. - 2018. - Pp. 118-125.
55. Chopde Nitin R, Nichai Mangesh. Landmark based shortest path detection by using A* and Haversine formula // International Journal of Innovative Research in Computer and Communication Engineering. — 2013. — Vol. 1, no. 2. — Pp. 298-302.
56. Gao Fuchang, Han Lixing. Implementing the Nelder-Mead simplex algorithm with adaptive parameters // Computational Optimization and Applications. — 2012. - Vol. 51, no. 1. - Pp. 259-277.
Приложение А
Диаграмма классов открытой платформы анализа транспортных
данных
Рисунок А.1
Диаграмма классов открытой платформы анализа транспортных данных
Приложение Б Акт внедрения в деятельность Академии В СМ
МИНИСТЕРСТВО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ
федрдльное госаддрствшное Автономное
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЬЮЩГО ОБРАЗОВАНИЯ
РОССИЙСКИЙ УНИВЕРСИТЕТ ТРАНСПОРТА РУТ (МИИТ)
ул. Образцова, д. 9. стр. 9, Москва, ГСПЧ 127994 Тел./факс: (495) 681-13-40, e-mail: info@rut-miit.ru ИНН/КПП 7715027733/771501001 ОГРН 1027739733922
15. 0J Ж» 043¡¿050
На Nfi_от_
АКТ
о внедрении результатов диссертационной ркГмнм Г>ульм ина М.В. «Авали I транспортных данных - новые модель и ирш раммиаи
илаIформа», представленной нн соискание ученой степени кандидата технических наук по специальности 2.3.5 «Математическое и про! раммное обеспечение вычислительных систем, комплексов и компьютерных сетей»
Теоретические и практические результаты диссертационной работы Булыгина Марка Валерьевича были использованы в исследованиях в рамках Гранта Правительства Москвы, направленных на оптимизацию размещения транспортных узлов с целью повышения эффективности лог истики поставок грузов в крупные городские агломерации (на примере доставки рыбы и морепродуктов в Московский регион). В ходе исследований были применены следующие теоретические разработки:
- модель транспортных данных,
- архитектура программной платформы, позволяющая конфигурировать решения из готовых блоков и адаптировать их под различные задачи,
- математическая модель транспортного хаба, формализующая процесс выбора оптимального расположения транспортных узлов с учетом логистических затрат и инфраструктурных ограничений;
В научных исследованиях, проводимых на базе Передовой инженерной школы «Академия ВСМ», используются следующие практические результаты:
Рисунок Б.1 — Акт внедрения в деятельность Передовой инженерной школы
«Академия ВСМ». Страница 1.
- приложение «Логистический калькулятор»,
- открытая платформа анализа транспортных данных на языке Python.
В отличие от аналогов, «Логистический калькулятор» при оптимизации учитывает фактические дорожные расстояния, что позволяет точнее определять оптимальное расположение транспортного хаба. Дальнейшее использование платформы как программной основы при решении подобных задач даёт возможность анализа факторов, влияющих на стоимость размещения объектов, с учётом территориальных и градостроительных ограничений различных типов, а также особенностей существующей транспортной сети.
Кроме того, в ходе внедрения разработанных решений была подтверждена гипотеза о снижении требований к навыкам персонала в области программирования. Часть исследований с использованием предложенной платформы была успешно проведена студентами первого курса направления подготовки 09.03.01 Информатика и вычислительная техника (программа «IT-сервисы и технологии обработки данных на транспорте») в рамках дисциплины «Проектная деятельность», что свидетельствует о доступности и удобстве применения платформы для широкого круга пользователей.
Руководитель Департаме
передовых инженерных i
О.Н. Покусаев
Начальник Информационно-аналитического отдела Центра компетенций ВСМ Передовой инженерной школы «Академия ВСМ»
А.Г". Шаклеин
Рисунок Б.2 Акт внедрения в деятельность Передовой инженерной школы
«Академия ВСМ». Страница 2.
Приложение В Акт внедрения в деятельность ВИШ РУТ
АКТ
о внедрении результатов диссертационного исследования Булыгина Марка Валерьевича в учебный процесс Высшей инженерной школы Российского университета транспорта
Основные научные положения, выводы и рекомендации, представленные в кандидатской диссертации Булыгина М. В. «Анализ транспортных данных новые модель и программная платформа», внедрены в учебный процесс Высшей инженерной школы Российского университета транспорта в рамках дисциплины «I [росктная дея тельность».
Разработанная платформа апробирована как в инициативных студенческих проектах, так и в рамках прикладных исследований, предложенных организациями. В частности, па основе предложенной платформы реализованы проекты, направленные на анализ пассажиропо тока трамвайных маршрутов, выявление случаев мошенничес тва с проездными документами, а также определение оптимального расположения объектов транспортной инфраструктуры.
Использование платформы способствовало повышению качества разработанных студентами решений, сокращению сроков их реализации и улучшению адаптации алгоритмов к данным из различных источников и регионов. Кроме того, модульная архитектура платформы позволила эффективно распределять обязанности между студентами в группах, что способствовало повышению эффективности командной работы и углубленному освоению методов анализа транспортных данных.
Директор Высшей инжен
РУТ (МИИТ)
Рисунок В.1 Акт внедрения в деятельность Высшей инженерной школы
Российского университета транспорта
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.