Исследование алгоритмов обработки и статистического анализа данных и разработка механизма повышения точности прогнозирования продаж в корпоративных информационных системах тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Брыкин Дмитрий Олегович
- Специальность ВАК РФ00.00.00
- Количество страниц 145
Оглавление диссертации кандидат наук Брыкин Дмитрий Олегович
Введение
Глава 1. Обзор методов прогнозирования продаж и анализа данных
1.1 Актуальность прогнозирования и развитие моделей
1.2 Основные понятия и характеристики данных
1.2.1 Временные ряды: классификация, сезонность и тренды
1.2.2 Статистические метрики качества прогноза
1.3 Методы очистки временных рядов, выбросы
1.4 Обзор методов прогнозирования
1.4.1 Экстраполяционные методы
1.4.2 Обзор модели ARIMA
1.4.3 Методы для разреженных данных
1.4.4 Предложенная модификация TSB
1.4.5 Обзор рассмотренных моделей
1.5 Методика экспериментальной проверки
1.5.1 Тестирование моделей для регулярных продаж
1.5.2 Тестирование моделей для редких продаж
1.6 Результаты тестирования и обоснование выбора модели
1.6.1 Результаты моделей прогнозирования регулярных продаж
1.6.2 Результаты моделей прогнозирования редких продаж
1.7 Сравнительный анализ методов расчета коэффициентов (S)ARIMA
1.8 Выводы по главе
Глава 2. Архитектура целевой платформы и формализация механизма
прогнозирования
2.1 Архитектура, функциональные возможности и ограничения платформы 1С
2.1.1 Структурно-компонентное описание архитектуры платформы
2.1.2 Функциональные возможности и ограничения платформы
2.1.3 Производительность и ограничения платформы
2.2 Технический обзор ERP-систем рынка РФ: ограничения для внедрения прогнозных решений
2.3 Формальная постановка задачи прогнозирования
2.3.1 Математическая формулировка задачи прогнозирования временных рядов
2.3.2 Формализация задачи прогнозирования для моделей ARIMA и TSB
2.3.3 Выводы по формальной постановке
2.4 Архитектура предлагаемого механизма (пайплайна) прогнозирования
2.4.1 Этапы пайплайна и взаимодействие между ними
2.4.2 Обоснование выбора архитектуры и компонентов пайплайна
2.5 Выводы по главе
Глава 3. Проектирование и реализация механизма прогнозирования продаж
3.1 Анализ требований и постановка задач
3.1.1 Определение функциональных и нефункциональных требований к системе
3.1.2 Описание бизнес-процессов в системе 1С:УНФ и их влияние на прогнозирование
3.2 Разработка архитектуры системы. Выделение основных модулей
3.3 Алгоритмы предварительной обработки данных
3.4 Автоматизированный выбор модели и оптимизация параметров
3.5 Реализация алгоритмов прогнозирования
3.5.1 Реализации алгоритма ARIMA
3.5.2 Реализации алгоритма TSB для разреженных данных
3.6 Оценка производительности, масштабируемости
3.7 Выводы по главе
Глава 4. Экспериментальное исследование и апробация разработанного
механизма прогнозирования продаж
4.1. Методика проведения экспериментального исследования
4.2 Результаты оценки точности прогнозирования
4.3 Обсуждение результатов и практические рекомендации
4.4 Выводы по главе
Заключение
Список сокращений и условных обозначений
Список литературы
Список рисунков
Список таблиц
Приложение А. Код генератора рядов регулярных продаж
Приложение Б. Код генератора рядов редких продаж
Приложение В. Регистрация программы для ЭВМ
Приложение Г. Акты о внедрении
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Модели и алгоритмы краткосрочного прогнозирования электропотребления на основе деревьев решений и искусственных нейронных сетей2025 год, кандидат наук Горшенин Алексей Юрьевич
Модели и методы прогнозирования сетевого трафика в гетерогенных сетях связи с учётом его статистических характеристик2024 год, кандидат наук Гребенщикова Александра Андреевна
Математическое моделирование и комплекс программ анализа временных рядов на основе нечеткой модели2013 год, кандидат наук Романов, Антон Алексеевич
Использование методов теории информации и искусственного интеллекта для разработки и исследования высокоточных методов прогнозирования временных рядов2022 год, кандидат наук Чирихин Константин Сергеевич
Риск-нейтральная динамика ARIMA-GARCH моделей с ошибками, распределенными по закону Su Джонсона2021 год, кандидат наук Данилишин Артём Ростиславович
Введение диссертации (часть автореферата) на тему «Исследование алгоритмов обработки и статистического анализа данных и разработка механизма повышения точности прогнозирования продаж в корпоративных информационных системах»
Введение
Актуальность темы. Прогнозирование продаж является одной из ключевых задач современной экономики и управления бизнес-процессами. Для предприятий малого и среднего бизнеса точное прогнозирование позволяет не только оптимизировать запасы, планировать закупки и формировать заказы поставщикам, но и существенно повышать качество управленческих решений, оперативно реагируя на изменения рыночной конъюнктуры [1, 2].
Современные корпоративные информационные системы становятся важнейшим источником данных для анализа и прогнозирования. Благодаря развитию технологий хранения и обработки больших массивов информации, а также внедрению методов интеллектуального анализа данных (data mining), такие системы уже не ограничиваются лишь автоматизацией учёта - они превращаются в мощные инструменты поддержки принятия решений [3, 4]. Среди множества подобных систем, используемых в бизнесе по всему миру, особое место занимают решения на платформе SAP и Microsoft Dynamics [5]. В России и странах СНГ наибольшую популярность приобрела система 1С:Предприятие (далее -платформа 1С), которая занимает лидирующие позиции в отечественном программном обеспечении для автоматизации управленческого учета и бизнес-процессов [6, 7]. Однако, реализация алгоритмов прогнозирования в среде 1С ставит ряд неочевидных вызовов, связанных с рядом технических особенностей платформы: отсутствие нативной поддержки сложных матричных операций, ограниченные вычислительные возможности, в том числе в облачных решениях и специфика интерпретируемого языка 1С [8]. Эти особенности создают существенные препятствия для внедрения современных, вычислительно затратных алгоритмов прогнозирования. В этих условиях возникает необходимость разработки и адаптации моделей и реализации алгоритмов, способных обеспечить высокую точность прогноза при ограниченных вычислительных ресурсах и специфических возможностях платформы.
Работа опирается на признанные подходы анализа временных рядов и при этом развивает их, предлагая алгоритмические и программные решения для задач прогнозирования продаж на платформе 1С. В качестве методологической базы использованы: подход Box-Jenkins к ARIMA-моделированию (де-факто стандарт дисциплины); методы экспоненциального сглаживания Holt-Winters для тренда и сезонности; подход Croston и его развитие в работах Teunter-Syntetos-Babai для прерывистого спроса; Theta модель Assimakopoulos & Nikolopoulos; а также результаты и данные M-соревнований (в т.ч. M3, M4).
Работа направлена не только на расширение теоретических основ прогнозирования в специфической среде 1С, но и на создание практического инструмента, способного существенно повысить эффективность управленческих решений на предприятиях малого и среднего бизнеса путем встраивания продвинутых методов прогнозирования непосредственно в учетную систему.
Степень разработанности темы. Проблематика прогнозирования продаж активно развивается и широко представлена в научной и прикладной литературе. Сформирован базовый набор методов (ARIMA/Box-Jenkins, ETS/Holt-Winters, Theta, подходы Croston/TSB) и процедур авто-настройки (AIC/BIC, кросс-валидация, ансамбли), подтверждённый результатами M-соревнований [9]. Однако назвать область «закрытой» нельзя: преимущества конкретных моделей существенно зависят от свойств данных, постановки задачи и ресурсных ограничений. Остаются нерешёнными вопросы устойчивого автоматического выбора и комбинирования моделей, а также переносимости результатов бенчмарков в реальные корпоративные контуры.
В экосистеме 1С накоплен практический опыт применения простых моделей сглаживания и регрессионных подходов, имеются частные интеграции с внешними сервисами, однако единых, воспроизводимых и производительных решений для встроенного прогнозирования, особенно для прерывистого спроса и сценариев массовой многономенклатурной обработки, пока недостаточно. Ограниченная нативная поддержка матричных операций и специфика интерпретируемого языка 1С осложняют перенос известных алгоритмов. Вопросы автоматизированного
подбора моделей с учётом характеристик данных (сезонность, интервальность спроса, длина историй), требований к ресурсоёмкости и ограничений развёртывания в типовой инфраструктуре 1С остаются разработанными фрагментарно. Настоящая работа восполняет указанный разрыв, предлагая адаптированные алгоритмы и программную реализацию полного пайплайна прогноза, пригодную для встроенного использования в 1С без критической зависимости от внешних вычислительных контуров.
Объект и предмет исследования. Объектом исследования является процесс автоматизированного прогнозирования продаж в корпоративных информационных системах на примере платформы 1С:Предприятие. Предмет исследования -математические модели, численные методы и алгоритмы построения прогнозов временных рядов, а также принципы их адаптации и системной интеграции для создания вычислительно-эффективных решений в условиях архитектурных ограничений платформы 1С.
Цель и задачи исследования. Целью исследования является разработка комплекса математических моделей и численных методов для прогнозирования временных рядов продаж с регулярным и прерывистым спросом, а также создание на их основе проблемно-ориентированного программного комплекса с функцией автоматического выбора модели для интеграции в информационные системы на платформе 1С.
Для достижения поставленной цели были сформулированы следующие задачи:
1. Провести сравнительный анализ существующих методов прогнозирования продаж, включая модели для регулярных (ARIMA/SARIMA, Holt-Winters, Theta) и разреженных (Croston, SBA, TSB) данных, с учётом их применимости в условиях технических ограничений платформы 1С.
2. Отобрать и экспериментально сравнить перспективные модели, определить их точность и потенциал для реализации на платформе 1С, включая анализ методов расчета коэффициентов ARIMA.
3. Проанализировать архитектуру платформы 1С, выявить ее ключевые ограничения (интерпретируемый язык, отсутствие матричных операций, ограничения облачных сервисов) и формализовать задачу прогнозирования с учетом этих особенностей.
4. Разработать и реализовать на встроенном языке 1С комплекс адаптированных прогностических моделей, включая авторскую модификацию модели прерывистого спроса (Mod_TSB) и вычислительно-эффективный метод оценки параметров ARIMA-моделей (YW2).
5. Спроектировать и реализовать архитектуру программного комплекса, реализующего автоматизированный процесс прогнозирования, включая модуль классификации рядов и интеграцию с бизнес-логикой.
6. Провести сравнительный анализ эффективности разработанного механизма прогнозирования продаж на реальных данных предприятий МСБ (3024 временных ряда), оценить точность прогнозирования различных моделей и режимов, а также сформулировать практические рекомендации по их применению.
Научная новизна.
1. Впервые предложен двухэтапный метод оценки параметров ARMA(p, q) («метод двойного Юла-Уокера», YW2), сводящий нелинейную задачу максимизации правдоподобия к последовательному решению двух согласованных систем линейных уравнений: для длинной AR(m)-аппроксимации исходного ряда и для регрессии по остаткам. Обоснована численная устойчивость и предсказуемая вычислительная сложность метода. На данных розничных продаж показана сопоставимая с MLE точность оценок (разница менее 1% по MAPE) при существенно меньших временных затратах.
2. Разработан вариант модели TSB, в котором рекуррентные процедуры экспоненциального сглаживания заменены на нерекурсивные оценки на основе скользящих и кумулятивных средних для вероятности ненулевого спроса и средней величины заказа. Такая линейная фильтрация снижает дисперсию оценок и упрощает вычислительную схему (делая возможной SQL реализацию) без существенной потери прогностической точности относительно канонической TSB.
3. Научно обоснован и формализован метод автоматической классификации временных рядов продаж, основанный на количественном анализе статистик А01 и СУ2. Новизна заключается в определении и экспериментальном подтверждении пороговых значений этих статистик для предметной области розничной торговли, что позволяет создать детерминированный алгоритм для объективного выбора между моделями регулярного и прерывистого спроса в рамках единого программного комплекса.
4. Разработана и реализована архитектура проблемно-ориентированного программного комплекса, предназначенного для автоматизации прогнозирования продаж в информационных системах на платформе 1С. Научная новизна заключается в реализованной модульной структуре, которая обеспечивает системную интеграцию и совместное функционирование разработанных в диссертации разнородных научных методов (YW2, Mod_TSB) и алгоритма их автоматического выбора, формируя тем самым единый, полностью автоматизированный конвейер построения прогноза продаж.
Практическая значимость работы обусловлена возможностью непосредственного внедрения разработанного программного механизма в прикладные решения на платформе 1С, которые используют компании для автоматизации своих бизнес-процессов. Это позволит оптимизировать процесс формирования заказов поставщикам за счет повышения точности прогноза, улучшить управление запасами и повысить оперативность принятия управленческих решений.
Методология и методы исследования. Результаты, полученные в диссертационной работе, относятся к области математического моделирования и прогнозирования данных. В работе используются методы теории вероятностей, математической статистики, анализа временных рядов, численные методы. Ключевые алгоритмы (ARIMA/SARIMA, Mod_TSB) были реализованы на встроенном языке 1С. Все теоретические положения и предложенные алгоритмы обосновываются результатами вычислительных экспериментов на реальных наборах данных о продажах. Работа подготовлена в соответствии с паспортом
специальности 1.2.2. Математическое моделирование, численные методы и комплексы программ. Исследование и результаты диссертации соответствуют следующим направлениям паспорта: (2) разработка, обоснование и тестирование эффективных вычислительных методов - адаптация и сравнение способов оценки коэффициентов (S)ARIMA, в т.ч. предложенный «двойной Yule-Walker (YW2)»; (3) реализация численных методов и алгоритмов в виде проблемно-ориентированного программного комплекса - создан модуль и полный программный пайплайн в среде 1С; (8) комплексные исследования с применением технологии математического моделирования и вычислительного эксперимента -многоэтапные эксперименты на реальных и синтетических данных; (9) постановка и проведение численных экспериментов, статистический анализ их результатов -корпус из 3024 рядов, протокол тестирования, сравнение метрик. Тем самым работа включает все три составляющих специальности: математическое моделирование, численные методы и комплексы программ.
Основные положения, выносимые на защиту:
- Двухэтапный метод оценки параметров ARMA-моделей (YW2), основанный на последовательном решении двух систем линейных уравнений, позволяет достигать сопоставимой с методом максимального правдоподобия (MLE) точности прогноза при значительном сокращении вычислительных затрат, что делает его эффективным для реализации в средах с ограничениями, подобных платформе 1С.
- Модифицированная модель прерывистого спроса (Mod_TSB), в которой экспоненциальное сглаживание заменено нерекурсивными оценками на основе скользящих и кумулятивных средних, обеспечивает снижение дисперсии прогноза и возможность эффективной реализации средствами SQL, превосходя по точности базовые методы для разреженных временных рядов.
- Метод автоматической классификации временных рядов, основанный на экспериментально подтвержденных пороговых значениях статистик ADI и CV2, позволяет объективно и детерминированно выбирать наиболее адекватную модель прогнозирования (для регулярного или прерывистого спроса).
- Программный комплекс, отличительной особенностью которой является модульная структура, системно интегрирующая разнородные научные методы (YW2, Mod_TSB) и алгоритм их автоматического выбора, обеспечивает создание единого автоматизированного процесса прогнозирования продаж на платформе 1С.
Достоверность научных положений и результатов работы подтверждена серией вычислительных экспериментов на реальных данных, обеспечивающих репрезентативность полученных выводов. Все основные результаты диссертационного исследования получены лично соискателем. Постановка задач и обсуждения полученных результатов осуществлялись совместно с научным руководителем.
Публикации и апробация работы. Основные научные результаты были опубликованы в восьми рецензируемых изданиях, два из которых включены в перечень научных журналов, рекомендованных Московским физико-техническим институтом (МФТИ, Физтех). Так же, получено 1 свидетельстве о государственной регистрации программы для ЭВМ. Кроме того, результаты исследований были представлены на международных конференциях:
1. Новые информационные технологии в образовании (2024, Москва, Россия),
2. 66-ая научная конференция МФТИ (2024, Долгопрудный, Россия),
3. Новые информационные технологии в образовании (2025, Москва, Россия),
4. 67-ая научная конференция МФТИ (2025, Долгопрудный, Россия),
5. Математическое и информационное моделирование-2025 (2025, Тюмень, Россия).
6. 22-ая всероссийская конференция «Математические методы распознавания образов» (2025, Муром, Россия).
Объем и структура диссертации. Диссертация состоит из введения, 4 глав и заключения. Полный объём диссертации составляет 145 страниц, включая 9 рисунков и 20 таблиц. Список литературы содержит 102 наименования.
Глава 1. Обзор методов прогнозирования продаж и анализа данных
Целью настоящей главы является комплексный обзор современных подходов к прогнозированию продаж на основе анализа временных рядов и других видов данных. В рамках главы рассматриваются классические статистические методы, которые можно было бы реализовать в условиях исходных технических ограничений. Описаны преимущества, ограничения и сферы применения методов. Особое внимание уделяется вопросам качества прогноза, особенностям работы с разреженными данными, а также процессу очистки исходной информации от выбросов и шумов. Для лучшего понимания сущности задачи прогнозирования в начале главы подробно рассматриваются основные понятия: структура временных рядов, виды сезонности и трендов, используемые метрики оценки точности предсказаний.
Обзор представленных в главе подходов позволит выделить наиболее эффективные методы прогнозирования для дальнейшего использования в корпоративных информационных системах.
1.1 Актуальность прогнозирования и развитие моделей
В современных условиях информационной эпохи, характеризующейся глобальной доступностью данных и развитием вычислительных технологий, задача прогнозирования временных рядов приобретает особую актуальность. Прогнозирование позволяет экспертам из различных областей - экономики, социальной сферы, экологии и др. - получать оценку будущих состояний сложных систем, используя как классические статистические модели, так и современные алгоритмы машинного обучения [9, 10].
В области экономических процессов, являющихся одними из наиболее изучаемых при анализе временных рядов, выбор оптимальной модели зачастую осложняется необходимостью интеграции множества бизнес-процессов и разнообразием источников информации. Таким образом, для построения корректных прогнозных моделей, автоматизированных систем и отчетов критически важно понимать не только методологические основы прогнозирования, но и внедрять такие системы непосредственно в программные продукты, используемые в деятельности компаний [11].
Ключевым понятием при рассмотрении задачи прогнозирования является спрос. Согласно общепринятому определению, спрос представляет собой соотношение между ценой и количеством товара, которое потребители способны и намерены приобрести за определённую стоимость в заданный период времени. При этом при анализе спроса необходимо учитывать целый комплекс факторов, среди которых можно выделить:
- Изменение потребительских предпочтений и вкусов;
- Количественные изменения числа покупателей;
- Изменения доходов населения;
- Взаимозаменяемость и взаимодополняемость товаров [12].
Помимо вышеуказанных факторов, прогнозные показатели продаж существенно зависят от маркетинговых программ, акций [13] и форс-мажорных обстоятельств (например, глобальных кризисов). Таким образом, применение прогнозных моделей в краткосрочном и долгосрочном планировании является неотъемлемой составляющей современной управленческой практики.
1.2 Основные понятия и характеристики данных
Для полноценного понимания последующих разделов работы необходимо рассмотреть основные понятия, связанные с прогнозированием продаж и анализом
данных. В первую очередь, это понятие временного ряда, как фундаментальной сущности при работе с историческими данными продаж. Временной ряд (time series) представляет собой последовательность значений определённого показателя, упорядоченных по времени с равными интервалами измерений. Ключевыми характеристиками временного ряда являются тренд, сезонность и цикличность [14].
1.2.1 Временные ряды: классификация, сезонность и тренды
Временные ряды продаж могут быть классифицированы по нескольким ключевым признакам. По типу данных выделяют непрерывные и дискретные временные ряды. Непрерывные временные ряды характеризуются постоянным измерением величины в любой момент времени (например, объемы производства), тогда как дискретные отражают измерения, выполненные через определенные временные интервалы (например, ежедневные продажи) [15].
Важной характеристикой временных рядов является сезонность, представляющая собой регулярные и предсказуемые колебания, повторяющиеся через одинаковые промежутки времени (например, увеличение спроса на новогодние товары). Идентификация и учет сезонных колебаний позволяет существенно повысить точность прогнозирования [16].
Тренд представляет собой долгосрочную тенденцию изменения показателя во времени. Он может быть восходящим, нисходящим или стационарным (отсутствие явной тенденции к изменению). Анализ трендов помогает выявить долгосрочные изменения рынка и корректировать стратегию компании в соответствии с полученными выводами [17].
Кроме того, временные ряды могут содержать циклические компоненты, которые отражают периодические колебания, не связанные напрямую с сезонными изменениями, например экономические циклы [18]. Важной задачей анализа
временных рядов является также выявление и коррекция выбросов (аномальных значений), которые могут существенно повлиять на результаты прогнозирования.
Еще одной важной характеристикой временных рядов является стационарность. Временной ряд называется стационарным, если его основные статистические свойства (среднее значение, дисперсия и автокорреляция) остаются неизменными во времени. Проверка стационарности осуществляется с помощью статистических тестов, например, расширенного теста Дики-Фуллера (Augmented Dickey-Fuller test, ADF) [19]. Для достижения стационарности используют методы трансформации данных, такие как дифференцирование, логарифмирование или вычитание скользящего среднего. Стационарность ряда является предпосылкой для использования многих моделей прогнозирования, включая широко распространённую модель ARIMA.
Изменения уровня продаж, как правило, описываются с использованием нестационарных временных рядов [20], что налагает определённые ограничения на их анализ и прогнозирование. В случае стационарных процессов увеличение числа наблюдений напрямую повышает точность оценки характеристик распределения случайной величины. Однако для нестационарных процессов, где статистические свойства меняются со временем, получение достаточного объёма данных для построения надёжной модели зачастую затруднено.
Для более глубокого понимания структуры временного ряда, особенно зависимостей между наблюдениями в разные моменты времени, используются коррелограммы - графики автокорреляционной функции и частичной автокорреляционной функции. Автокорреляционная функция (ACF) показывает, насколько сильно значение временного ряда в данный момент времени коррелирует со своими значениями в предыдущие моменты времени (лагами) [21]. Она измеряет общую корреляцию, включая как прямые, так и косвенные зависимости через промежуточные лаги. Например, ACF для лага 3 показывает корреляцию между yt и yt-з, которая может включать в себя влияние yt-i и yt-2. Визуально ACF помогает определить наличие тренда, сезонности и общую "память" процесса [22].
Частичная автокорреляционная функция (PACF) измеряет прямую корреляцию между значением временного ряда yt и его значением в предыдущий момент времени yt-k, устраняя при этом влияние всех промежуточных наблюдений. Смысл PACF заключается в том, чтобы выявить чистую, непосредственную связь между наблюдениями на определенном расстоянии (лаге), исключив опосредованные эффекты. Анализ графиков ACF и PACF является ключевым этапом при идентификации порядка моделей [23].
1.2.2 Статистические метрики качества прогноза
Для объективной оценки качества регрессионных моделей используются такие показатели, как корень из среднеквадратичной ошибки (RMSE), средняя абсолютная ошибка (MAE), средняя абсолютная процентная ошибка (MAPE) [24, 25]. Каждая из этих метрик характеризует модель с точки зрения разных аспектов:
- RMSE определяется как квадратный корень из среднего значения квадрата ошибок и возвращает величину ошибки в тех же единицах, что и прогнозируемая переменная. При этом RMSE чувствителен к масштабу данных, что может создавать трудности при сравнении моделей на различных наборах данных [26].
RSME = Х"=1(7# - +)% (1.1)
- MAE характеризует среднюю абсолютную разницу между прогнозируемыми и фактическими значениями, не усиливая влияние выбросов за счёт возведения ошибок в квадрат. Это позволяет получить более устойчивую оценку модели при наличии аномальных значений [27].
МАЕ = !X"=i|F# -+| (1.2)
- MAPE выражает ошибку в процентах от фактических значений, что обеспечивает интуитивно понятную интерпретацию результатов и позволяет оценить относительный масштаб погрешности [28].
Выбор подходящей метрики зависит от целей анализа и специфики данных. Так, при необходимости строгого контроля крупных ошибок лучше использовать RMSE, для оценки средней ошибки удобна MAE, а для сравнения качества прогнозов разных моделей или разных временных рядов чаще всего применяется MAPE. При наличии значительного числа выбросов MAE может оказаться предпочтительнее RMSE, тогда как MAPE полезен для понимания относительных отклонений [29].
1.3 Методы очистки временных рядов, выбросы
Выбросы - это точки данных, которые значительно отклоняются от нормального или ожидаемого диапазона значений в данных. Эти выбросы могут быть вызваны ошибками измерения, ошибками ввода данных или редкими событиями и могут искажать статистические свойства и закономерности данных, а также влиять на производительность и обобщение моделей [30]. Выбросы в временных рядах могут возникать по множеству причин, таких как ошибки измерения или регистрации данных, внезапные внешние воздействия, либо же очень редкие события.
Несмотря на то, что в некоторых случаях аномалии могут нести ценную информацию о редких событиях, зачастую их присутствие нарушает статистическую однородность данных, приводит к смещению параметров модели и снижает точность прогнозов [31]. Поэтому корректная идентификация и обработка выбросов является необходимым условием для обеспечения надежности дальнейших аналитических выводов [32].
Для разрабатываемого решения, ориентированного на широкую аудиторию и различные индустрии, важно обеспечить надежную и адаптивную обработку данных. В условиях, когда поступающие временные ряды могут существенно различаться по структуре, объему и характеру аномальных событий, выбор методов для определения выбросов должен удовлетворять нескольким критериям: простоте реализации, интерпретируемости результатов и универсальности применения.
Именно поэтому для дальнейшего тестирования и внедрения в аналитическую часть приложения были выбраны следующие три метода:
- Метод межквартильного размаха (IQR). Благодаря своей робастности и простоте интерпретации, этот метод эффективно работает на выборках с различными распределениями [33], позволяя без значительных вычислительных затрат определить крайние значения. Метод IQR основывается на расчёте межквартильного размаха, который определяется как разница между третьим ^3) и первым ^1) квартилем распределения данных.
Для определения границ, за пределами которых значения считаются выбросами, используется коэффициент, например 1.5 [34]. Любые наблюдения, попадающие за пределы этих границ, классифицируются как выбросы.
- Определение выбросов по процентилям. Метод позволяет гибко адаптироваться к специфике данных, устанавливая пороги в зависимости от границ процентиля (например, все, что выше 99% считать выбросами).
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Разработка средств визуального программирования для моделей машинного обучения на основе двудольного представления графа потоков данных2022 год, кандидат наук Ходненко Иван Владимирович
Комплексное исследование интервального прогнозирования нестационарных показателей с применением кластерных и нейронных моделей2015 год, кандидат наук Лузгин Александр Николаевич
Разработка и исследование алгоритмов анализа сетевой инфраструктуры и интернет-трафика в условиях ограниченных вычислительных мощностей2025 год, кандидат наук Изюмов Павел Сергеевич
Алгоритмы прогнозирования временных рядов на основе взвешенного метода наименьших модулей2025 год, кандидат наук Аботалеб Мостафа Салахелдин Абделсалам
Разработка и применение дискретных моделей на основе событийного подхода2025 год, кандидат наук Гаджимирзаев Шамиль Мусиевич
Список литературы диссертационного исследования кандидат наук Брыкин Дмитрий Олегович, 2025 год
Список литературы
1. Miller, S. Sales forecasting: The complete guide to predicting future sales. - URL: https://www.outreach.io/resources/blog/what-is-a-sales-forecast (visited on: 10.01.2025). - Text : electronic.
2. What is Sales Forecasting? - URL: https://o9solutions.com/articles/what-is-sales-forecasting (visited on: 10.01.2025). - Text : electronic.
3. Bertoni, A., T. Larsson. Data Mining in Product Service Systems Design: Literature Review and Research Questions / A. Bertoni, T. Larsson // Procedia CIRP. - 2017. -Vol. 64. - Data Mining in Product Service Systems Design. - P. 306-311. - DOI: 10.1016/j.procir.2017.03.131.
4. Hou, R. Marketing Decision Support System Based on Data Mining Technology / R. Hou, X. Ye, H. B. O. Zaki [et al.] // Applied Sciences. - 2023. - Vol. 13. - № 7. -P. 4315. - DOI: 10.3390/app13074315.
5. SAP Industry Overview and Insights. - URL: https://cdn.hl.com/pdf/2024/hl-sap-industry-overview-october-2024.pdf (visited on: 10.01.2025). - Text : electronic.
6. Обзор рынка. Данные TAdviser. - URL: https://www.tadviser.ru/index.php/Статья:СистемьI_управления_предприятием_0/o28 ERP-
pbiHOK_Poc™%29#.D0.9E.D0.B1.D0.B7.D0.BE.D1.80_.D1.80.D1.8B.D0.BD.D0.BA .D0.B0._.D0.94.D0.B0.D0.BD.D0.BD.D1.8B.D0.B5_TAdviser (дата обращения: 20.03.2025). - Текст : электронный.
7. АНО «НЦК ИСУ»: российский рынок ERP в 2025 г. стабилизируется. - URL: https://www.cnews.ru/news/line/2025-03-05_ano_ntsk_isu_rossijskij (дата обращения: 10.03.2025). - Текст : электронный.
8. Обзор архитектуры платформы. - URL: https://v8.1c.ru/platforma/obzor-arkhitektury-platformy (дата обращения: 10.09.2024). - Текст : электронный.
9. Petropoulos, F. Forecasting: theory and practice / F. Petropoulos, D. Apiletti, V. Assimakopoulos [et al.] // International Journal of Forecasting. - 2022. - Vol. 38. -Forecasting. - № 3. - P. 705-871. - DOI: 10.1016/j.ijforecast.2021.11.001.
10. Benidis, K. Deep Learning for Time Series Forecasting: Tutorial and Literature Survey / K. Benidis, S. S. Rangapuram, V. Flunkert [et al.] // ACM Computing Surveys. - 2023. - Vol. 55. - Deep Learning for Time Series Forecasting. - №2 6. - P. 1-36. - DOI: 10.1145/3533382.
11. Anwar, U. A. A. Supply chain integration as the implementation of strategic management in improving business performance / U. A. A. Anwar, A. Rahayu, L. A. Wibowo [et al.] // Discover Sustainability. - 2025. - Vol. 6. - № 1. - P. 101. - DOI: 10.1007/s43621-025-00867-w.
12. Langevin, J. Customer enrollment and participation in building demand management programs: A review of key factors / J. Langevin, K. Cetin, S. Willems [et al.] // Energy and Buildings. - 2024. - Vol. 320. - Customer enrollment and participation in building demand management programs. - P. 114618. - DOI: 10.1016/j.enbuild.2024.114618.
13. Fahimnia, B., T. Tan, N. Tahirov. Service-level anchoring in demand forecasting: The moderating impact of retail promotions and product perishability / B. Fahimnia, T. Tan, N. Tahirov // International Journal of Forecasting. - 2025. - Vol. 41. - Service-level anchoring in demand forecasting. - № 2. - P. 554-570. - DOI: 10.1016/j .ijforecast.2024.07.007.
14. Das, P., S. Barman. Perspective Chapter: An Overview of Time Series Decomposition and Its Applications / P. Das, S. Barman. - Text: electronic // Applied and Theoretical Econometrics and Financial Crises [Working Title]. - IntechOpen, 2025. - Perspective Chapter. - URL: https://www.intechopen.com/online-first/1205228 (visited on: 03.05.2025).
15. Tong, Y. Technology investigation on time series classification and prediction / Y. Tong, J. Liu, L. Yu [et al.] // PeerJ Computer Science. - 2022. - Vol. 8. - P. e982. -DOI: 10.7717/peerj-cs.982.
16. Park, M.-J., H.-S. Yang. Comparative Study of Time Series Analysis Algorithms Suitable for Short-Term Forecasting in Implementing Demand Response Based on AMI
/ M.-J. Park, H.-S. Yang // Sensors. - 2024. - Vol. 24. - № 22. - P. 7205. - DOI: 10.3390/s24227205.
17. Granger, C. W. J., P. Newbold. Forecasting Economic Time Series /
C. W. J. Granger, P. Newbold Google-Books-ID: oDWjBQAAQBAJ. - Academic Press, 2014. - 353 p.
18. Hall, V., P. Thomson. A Boosted Hp Filter for Business Cycle Analysis: Evidence from New Zealand's Small Open Economy. / V. Hall, P. Thomson. - Text: electronic // SSRN Electronic Journal. - 2023. - A Boosted Hp Filter for Business Cycle Analysis. -URL: https://www.ssrn.com/abstract=4188218 (visited on: 03.05.2025). DOI: 10.2139/ssrn.4188218.
19. Taylan, A., Sabri, G. Yapar, H. Selamlar Taylan. Automatic Time Series Forecasting with Ata Method in R: ATAforecasting Package / A. Taylan Sabri, G. Yapar, H. Selamlar Taylan // The R Journal. - 2021. - Vol. 13. - Automatic Time Series Forecasting with Ata Method in R. - № 2. - P. 441. - DOI: 10.32614/RJ-2021-101.
20. Liu, Y. Non-stationary Transformers: Exploring the Stationarity in Time Series Forecasting. Non-stationary Transformers / Y. Liu, H. Wu, J. Wang, M. Long. - arXiv, 2022. - URL: https://arxiv.org/abs/2205.14415 (visited on: 20.05.2025). - Text: electronic.
21. Reimers, S., N. Harvey. Sensitivity to autocorrelation in judgmental time series forecasting / S. Reimers, N. Harvey // International Journal of Forecasting. - 2011. -Vol. 27. - № 4. - P. 1196-1214. - DOI: 10.1016/j.ijforecast.2010.08.004.
22. Zhou, Y., H. Kantz. Effect of the uncertainty of autocorrelation estimation on trend analysis / Y. Zhou, H. Kantz // Physical Review Research. - 2024. - Vol. 6. - № 4. -P. 043160. - DOI: 10.1103/PhysRevResearch.6.043160.
23. Hyndman, R. J., G. Athanasopoulos. Autororrelation // Forecasting: principles and practice. - Melbourne, Australia : Otexts, Online Open-Access Textbooks, 2021. - 440 c.
24. Koutsandreas, D. On the selection of forecasting accuracy measures /
D. Koutsandreas, E. Spiliotis, F. Petropoulos [et al.] // Journal of the Operational Research Society. - 2022. - Vol. 73. - № 5. - P. 937-954. - DOI: 10.1080/01605682.2021.1892464.
25. Hyndman, R. J., A. B. Koehler. Another look at measures of forecast accuracy / R. J. Hyndman, A. B. Koehler // International Journal of Forecasting. - 2006. - T. 22. -№ 4. - C. 679-688. - DOI: 10.1016/j.ijforecast.2006.03.001.
26. Hodson, T. O. Root-mean-square error (RMSE) or mean absolute error (MAE): when to use them or not / T. O. Hodson // Geoscientific Model Development. - 2022. - Vol. 15.
- Root-mean-square error (RMSE) or mean absolute error (MAE). - № 14. - P. 54815487. - DOI: 10.5194/gmd-15-5481-2022.
27. Qi, J. On Mean Absolute Error for Deep Neural Network Based Vector-to-Vector Regression / J. Qi, J. Du, S. M. Siniscalchi [et al.] // IEEE Signal Processing Letters. -2020. - Vol. 27. - P. 1485-1489. - DOI: 10.1109/LSP.2020.3016837.
28. De Myttenaere, A. Mean Absolute Percentage Error for regression models / A. De Myttenaere, B. Golden, B. Le Grand [et al.] // Neurocomputing. - 2016. - Vol. 192. -P. 38-48. - DOI: 10.1016/j.neucom.2015.12.114.
29. Botchkarev, A. A New Typology Design of Performance Metrics to Measure Errors in Machine Learning Regression Algorithms / A. Botchkarev // Interdisciplinary Journal of Information, Knowledge, and Management. - 2019. - Vol. 14. - P. 045-076. - DOI: 10.28945/4184.
30. Correia, L. Online model-based anomaly detection in multivariate time series: Taxonomy, survey, research challenges and future directions / L. Correia, J.-C. Goos, P. Klein [et al.] // Engineering Applications of Artificial Intelligence. - 2024. - Vol. 138.
- Online model-based anomaly detection in multivariate time series. - P. 109323. - DOI: 10.1016/j.engappai.2024.109323.
31. Chen, C., L.-M. Liu. Joint Estimation of Model Parameters and Outlier Effects in Time Series / C. Chen, L.-M. Liu // Journal of the American Statistical Association. -1993. - Vol. 88. - № 421. - P. 284-297. - DOI: 10.1080/01621459.1993.10594321.
32. Blazquez-Garcia, A. A Review on Outlier/Anomaly Detection in Time Series Data / A. Blazquez-Garcia, A. Conde, U. Mori [et al.] // ACM Computing Surveys. - 2022. -Vol. 54. - № 3. - P. 1-33. - DOI: 10.1145/3444690.
33. Mramba, L. K. Detecting potential outliers in longitudinal data with time-dependent covariates / L. K. Mramba, X. Liu, K. F. Lynch [et al.] // European Journal of Clinical Nutrition. - 2024. - Vol. 78. - № 4. - P. 344-350. - DOI: 10.1038/s41430-023-01393-6.
34. Дорофеев, В. С., Т. М. Волосатова. Ensemble methods for detecting outliers in the preparation of a training data set / В. С. Дорофеев, Т. М. Волосатова // МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ. - 2022. - Т. 10. - № 3(38). - С. 13-14. - DOI: 10.26102/23106018/2022.38.3.013.
35. Paparrizos, J., F. Yang, H. Li. Bridging the Gap: A Decade Review of Time-Series Clustering Methods. Bridging the Gap / J. Paparrizos, F. Yang, H. Li arXiv:2412.20582 [cs]. - arXiv, 2024. - URL: http://arxiv.org/abs/2412.20582 (visited on: 03.05.2025). -Text: electronic.
36. Dash, Ch. S. K. An outliers detection and elimination framework in classification task of data mining / Ch. S. K. Dash, A. K. Behera, S. Dehuri [et al.] // Decision Analytics Journal. - 2023. - Vol. 6. - P. 100164. - DOI: 10.1016/j.dajour.2023.100164.
37. Язык запросов 1С. - URL: https://v8.1c.ru/platforma/mehanizm-zaprosov/ (дата обращения: 05.09.2022). - Текст : электронный.
38. Syntetos, A. A. Periodic control of intermittent demand items: theory and empirical analysis / A. A. Syntetos, M. Z. Babai, Y. Dallery [et al.] // Journal of the Operational Research Society. - 2009. - Vol. 60. - № 5. - P. 611-618. - DOI: 10.1057/palgrave.jors.2602593.
39. Syntetos, A. A., J. E. Boylan, J. D. Croston. On the categorization of demand patterns / A. A. Syntetos, J. E. Boylan, J. D. Croston // Journal of the Operational Research Society. - 2005. - Vol. 56. - № 5. - P. 495-503. - DOI: 10.1057/palgrave.jors.2601841.
40. Ma, S., R. Fildes. Retail sales forecasting with meta-learning / S. Ma, R. Fildes // European Journal of Operational Research. - 2021. - Vol. 288. - № 1. - P. 111-128. -DOI: 10.1016/j.ejor.2020.05.038.
41. Bohanec, M., M. Kljajic Borstnar, M. Robnik-Sikonja. Explaining machine learning models in sales predictions / M. Bohanec, M. Kljajic Borstnar, M. Robnik-Sikonja //
Expert Systems with Applications. - 2017. - Vol. 71. - P. 416-428. - DOI: 10.1016/j.eswa.2016.11.010.
42. Pavlyshenko, B. Machine-Learning Models for Sales Time Series Forecasting / B. Pavlyshenko // Data. - 2019. - Vol. 4. - № 1. - P. 15. - DOI: 10.3390/data4010015.
43. Martins, E., N. V. Galegale. Sales forecasting using machine learning algorithms / E. Martins, N. V. Galegale // Revista de Gestao e Secretariado (Management and Administrative Professional Review). - 2023. - Vol. 14. - № 7. - P. 11294-11308. -DOI: 10.7769/gesec.v14i7.1670.
44. Brezinski, C. A general extrapolation algorithm / C. Brezinski // Numerische Mathematik. - 1980. - Vol. 35. - № 2. - P. 175-187. - DOI: 10.1007/BF01396314.
45. Ordinary Least Squares / Text: electronic // A-Z of Error-Free Research. - Chapman and Hall/CRC, 2012. - P. 141-162. - URL: http://www.crcnetbase.com/doi/abs/10.1201/b12362-17 (visited on: 09.03.2025).
46. Gardner, E. S. Exponential smoothing: The state of the art / E. S. Gardner // Journal of Forecasting. - 1985. - Vol. 4. - Exponential smoothing. - № 1. - P. 1-28. - DOI: 10.1002/for.3980040103.
47. Chatfield, C., M. Yar. Holt-Winters forecasting: some practical issues / C. Chatfield, M. Yar // Journal of the Royal Statistical Society Series D: The Statistician. - 1988. -Vol. 37. - № 2. - P. 129-140.
48. Goodwin, P. The Holt-Winters Approach to Exponential Smoothing: 50 Years Old and Going Strong / P. Goodwin // Foresight: The International Journal of Applied Forecasting. - 2010. - № 19. - P. 30-33.
49. Hyndman, R. J. A state space framework for automatic forecasting using exponential smoothing methods / R. J. Hyndman, A. B. Koehler, R. D. Snyder [et al.] // International Journal of Forecasting. - 2002. - Vol. 18. - № 3. - P. 439-454. - DOI: 10.1016/S0169-2070(01)00110-8.
50. Assimakopoulos, V., K. Nikolopoulos. The theta model: a decomposition approach to forecasting / V. Assimakopoulos, K. Nikolopoulos // International Journal of Forecasting. - 2000. - Vol. 16. - The theta model. - № 4. - P. 521-530. - DOI: 10.1016/S0169-2070(00)00066-2.
51. Makridakis, S., M. Hibon. The M3-Competition: results, conclusions and implications / S. Makridakis, M. Hibon // International Journal of Forecasting. - 2000. -Vol. 16. - The M3-Competition. - № 4. - P. 451-476. - DOI: 10.1016/S0169-2070(00)00057-1.
52. Fiorucci, J. A. Models for optimising the theta method and their relationship to state space models / J. A. Fiorucci, T. R. Pellegrini, F. Louzada [et al.] // International Journal of Forecasting. - 2016. - Vol. 32. - № 4. - P. 1151-1161. - DOI: 10.1016/j .ijforecast.2016.02.005.
53. Nikolopoulos, K. The Theta Model: An Essential Forecasting Tool for Supply Chain Planning / K. Nikolopoulos, V. Assimakopoulos, N. Bougioukos [et al.]. - Text: electronic // Advances in Automation and Robotics, Vol. 2 : Lecture Notes in Electrical Engineering / ed. G. Lee. - Berlin, Heidelberg : Springer Berlin Heidelberg, 2011. -Vol. 123. - The Theta Model. - P. 431-437.
54. Gardner, E. S. Exponential smoothing: The state of the art—Part II / E. S. Gardner // International Journal of Forecasting. - 2006. - Vol. 22. - № 4. - P. 637-666. - DOI: 10.1016/j .ijforecast.2006.03.005.
55. Ramos, P., N. Santos, R. Rebelo. Performance of state space and ARIMA models for consumer retail sales forecasting / P. Ramos, N. Santos, R. Rebelo // Robotics and Computer-Integrated Manufacturing. - 2015. - Vol. 34. - P. 151-163. - DOI: 10.1016/j.rcim.2014.12.015.
56. Brykin, D. Sales Forecasting Models: Comparison between ARIMA, LSTM and Prophet / D. Brykin // Journal of Computer Science. - 2024. - Vol. 20. - Sales Forecasting Models. - № 10. - P. 1222-1230. - DOI: 10.3844/jcssp.2024.1222.1230.
57. Sampedro, G. A. Predicting Pre-Order Sales Using Time Series Algorithm, Forecasting, and ARIMA Model in Python for Small Businesses / G. A. Sampedro. -Text : electronic // 2024 International Conference on Electronics, Information, and Communication (ICEIC). - Taipei, Taiwan : IEEE, 2024. - P. 1-4.
58. Sirisha, U. M., M. C. Belavagi, G. Attigeri. Profit Prediction Using ARIMA, SARIMA and LSTM Models in Time Series Forecasting: A Comparison / U. M. Sirisha, M. C. Belavagi, G. Attigeri // IEEE Access. - 2022. - Vol. 10. - Profit Prediction Using
ARIMA, SARIMA and LSTM Models in Time Series Forecasting. - P. 124715-124727.
- DOI: 10.1109/ACCESS.2022.3224938.
59. Box, G. E. P. Time series analysis: forecasting and control : Wiley series in probability and statistics. Time series analysis / G. E. P. Box, G. M. Jenkins, G. C. Reinsel, G. M. Ljung. - Fifth edition. - Hoboken, New Jersey : John Wiley & Sons, Inc, 2016. - 669 p.
60. Brykin, D. O., E. A. Kaliberda, U. A. Bahmutsky. About Air Quality Assessment using Time Series Analysis Techniques on Air Particles Data / D. O. Brykin, E. A. Kaliberda, U. A. Bahmutsky // Programmnaya Ingeneria. - 2024. - Vol. 15. -№ 10. - P. 509-521. - DOI: 10.17587/prin.15.509-521.
61. Parmezan, A. R. S., V. M. A. Souza, G. E. A. P. A. Batista. Evaluation of statistical and machine learning models for time series prediction: Identifying the state-of-the-art and the best conditions for the use of each model / A. R. S. Parmezan, V. M. A. Souza, G. E. A. P. A. Batista // Information Sciences. - 2019. - Vol. 484. - P. 302-337. - DOI: 10.1016/j.ins.2019.01.076.
62. Neusser, K. Modeling Stationary ARMA Processes / K. Neusser. - Text: electronic // Time Series Econometrics / ed. K. Neusser. - Cham : Springer Nature Switzerland, 2025.
- P. 87-106. - DOI: 10.1007/978-3-031-88838-0_5.
63. Hyndman, R. J., Y. Khandakar. Automatic Time Series Forecasting: The forecast Package for R / R. J. Hyndman, Y. Khandakar. - Text: electronic // Journal of Statistical Software. - 2008. - Vol. 27. - Automatic Time Series Forecasting. - № 3. - URL: http://www.jstatsoft.org/v27/i03/ (visited on: 11.10.2025). DOI: 10.18637/jss.v027.i03.
64. Brockwell, P. J., R. A. Davis. Introduction to Time Series and Forecasting : Springer Texts in Statistics / P. J. Brockwell, R. A. Davis. - Cham : Springer International Publishing, 2016. - DOI: 10.1007/978-3-319-29854-2. - Text: electronic.
65. Deistler, M., W. Scherrer. ARMA Systems and ARMA Processes / M. Deistler, W. Scherrer. - Text: electronic // Time Series Models / eds. M. Deistler, W. Scherrer. -Cham : Springer International Publishing, 2022. - P. 111-128. - URL: https://doi.org/10.1007/978-3-031-13213-1_6 (visited on: 03.07.2025).
66. Croston, J. D. Forecasting and Stock Control for Intermittent Demands / J. D. Croston // Operational Research Quarterly (1970-1977). - 1972. - Vol. 23. - № 3. - P. 289. -DOI: 10.2307/3007885.
67. Kourentzes, N. On intermittent demand model optimisation and selection / N. Kourentzes // International Journal of Production Economics. - 2014. - Vol. 156. -P. 180-190. - DOI: 10.1016/j.ijpe.2014.06.007.
68. Syntetos, A. A., J. E. Boylan. On the bias of intermittent demand estimates / A. A. Syntetos, J. E. Boylan // International Journal of Production Economics. - 2001. -Vol. 71. - № 1-3. - P. 457-466. - DOI: 10.1016/S0925-5273(00)00143-2.
69. Teunter, R. H., A. A. Syntetos, M. Zied Babai. Intermittent demand: Linking forecasting to inventory obsolescence / R. H. Teunter, A. A. Syntetos, M. Zied Babai // European Journal of Operational Research. - 2011. - Vol. 214. - № 3. - P. 606-615. -DOI: 10.1016/j.ejor.2011.05.018.
70. Friedman, M. A Comparison of Alternative Tests of Significance for the Problem of $m$ Rankings / M. Friedman // The Annals of Mathematical Statistics. - 1940. - Vol. 11. - № 1. - P. 86-92. - DOI: 10.1214/aoms/1177731944.
71. Demsar, J. Statistical Comparisons of Classifiers over Multiple Data Sets / J. Demsar // J. Mach. Learn. Res. - 2006. - Vol. 7. - P. 1-30.
72. M4 Dataset. - https://github.com/Mcompetitions/M4-methods/tree/master/Dataset : Github, 2018 (visited on: 03.07.2025).
73. Ibe, O. C. Special Random Processes / O. C. Ibe. - Text : electronic // Fundamentals of Applied Probability and Random Processes. - Elsevier, 2014. - P. 369-425. - URL: https://linkinghub.elsevier.com/retrieve/pii/B9780128008522000122 (visited on: 04.06.2025).
74. Makridakis, S., E. Spiliotis, V. Assimakopoulos. The M4 Competition: 100,000 time series and 61 forecasting methods / S. Makridakis, E. Spiliotis, V. Assimakopoulos // International Journal of Forecasting. - 2020. - Vol. 36. - The M4 Competition. - № 1. -P. 54-74. - DOI: 10.1016/j.ijforecast.2019.04.014.
75. Hendry, D. F. Econometric Modeling: A Likelihood Approach. Econometric Modeling / D. F. Hendry. - Princeton : Princeton University Press, 2007. - 384 p.
76. Rossi, R. J. Mathematical statistics: an introduction to likelihood based inference. Mathematical statistics / R. J. Rossi. - 1st edition. - Hoboken, NJ : John Wiley & Sons, 2018. - 448 p.
77. Hannan, E. J., J. Rissanen. Recursive estimation of mixed autoregressive-moving average order / E. J. Hannan, J. Rissanen // Biometrika. - 1982. - Vol. 69. - №2 1. - P. 8194. - DOI: 10.1093/biomet/69.1.81.
78. Noble, J. Parameter Estimation for ARMA models / J. Noble // Time Series. - Warsaw University, 2025. - P. 65-75.
79. Dent, W. T., D. C. Cavander. More on Computational Accuracy in Regression / W. T. Dent, D. C. Cavander // Journal of the American Statistical Association. - 1977. -Vol. 72. - № 359. - P. 598-600. - DOI: 10.1080/01621459.1977.10480619.
80. Broersen, P. M. T. Autoregressive model orders for Durbin's MA and ARMA estimators / P. M. T. Broersen // IEEE Transactions on Signal Processing. - 2000. -Vol. 48. - № 8. - P. 2454-2457. - DOI: 10.1109/78.852025.
81. Обзор архитектуры платформы | Базовые механизмы - платформа 1С:Предприятие. - URL: https://v8.1c.ru/platforma/obzor-arkhitektury-platformy/ (дата обращения: 07.01.2025). - Текст : электронный.
82. Bass, L., P. Clements, R. Kazman. Software Architecture in Practice, 4th Edition / L. Bass, P. Clements, R. Kazman. - 1st edition. - Erscheinungsort nicht ermittelbar : Addison-Wesley Professional, 2021. - 1 p.
83. Клиент-серверный вариант работы | Варианты работы системы - платформа 1С:Предприятие. - URL: https://v8.1c.ru/platforma/klient-servernyy-variant-raboty/ (дата обращения: 07.12.2024). - Текст : электронный.
84. Peter G. Про кластер серверов 1С / Peter G. - 2020. - URL: https://habr.com/ru/companies/1c/articles/493008/ (дата обращения: 07.01.2025). -Текст: электронный.
85. СУБД | Системные требования «1С:Предприятия 8». - URL: https://v8.1c.ru/tekhnologii/systemnye-trebovaniya- 1s-predpriyatiya-8/subd/ (дата обращения: 08.01.2025). - Текст : электронный.
86. Варианты работы системы | Базовые механизмы - платформа 1С:Предприятие. - URL: https://v8.1c.ru/platforma/varianty-raboty-sistemy/ (дата обращения: 07.02.2025). - Текст : электронный.
87. Глава 19. Механизм заданий:: Руководство разработчика:: 1С:Предприятие 8.3.25. Документация. - URL: https://its.1c.rU/db/v8325doc#bookmark:dev:TI000000792 (дата обращения: 08.06.2025). - Текст : электронный.
88. Peter G. Как мы в «1С: Предприятии» решаем системы алгебраических уравнений. Как мы в «1С / Peter G. - 2018. - URL: https://habr.com/ru/companies/1c/articles/420029/ (дата обращения: 08.06.2024). -Текст: электронный.
89. Требования к дополнительным отчетам и обработкам. - URL: https://1cfresh.com/articles/so_addprocess_req (дата обращения: 08.03.2025). - Текст : электронный.
90. Overview of SAP NetWeaver AS ABAP. - URL: https://help. sap.com/doc/saphelp_nw73ehp1/7.31.19/en-
us/fc/eb2e97358411d1829f0000e829fbfe/frameset.htm (visited on: 08.04.2025). - Text: electronic.
91. Система «Галактика ERP» Описание функциональности системы. - Галактика Софт, 2017. - 214 с.
92. pvillads. X++ language reference - Finance & Operations | Dynamics 365. - URL: https://learn.microsoft.com/en-us/dynamics365/fin-ops-core/dev-itpro/dev-ref/xpp-language-reference (visited on: 08.04.2025). - Text: electronic.
93. Nah, F. F.-H., K. M. Zuckweiler, J. Lee-Shang Lau. ERP Implementation: Chief Information Officers' Perceptions of Critical Success Factors / F. F.-H. Nah, K. M. Zuckweiler, J. Lee-Shang Lau // International Journal of Human-Computer Interaction. - 2003. - Vol. 16. - ERP Implementation. - № 1. - P. 5-22. - DOI: 10.1207/S15327590IJHC1601 2.
94. Breck, E. Data Validation for Machine Learning / E. Breck, N. Polyzotis, S. Roy [et al.]. - Text: electronic // Proceedings of SysML. - 2019. - URL: https://mlsys.org/Conferences/2019/doc/2019/167.pdf (visited on: 10.09.2025).
95. Ur Rehman, A., S. B. Belhaouari. Unsupervised outlier detection in multidimensional data / A. Ur Rehman, S. B. Belhaouari // Journal of Big Data. - 2021. - Vol. 8. - № 1. -P. 80. - DOI: 10.1186/s40537-021-00469-z.
96. Брыкин, Д. О. Исследование и реализация алгоритма прогнозирования ARIMA для повышения эффективности прогнозирования данных в среде «1С» / Д. О. Брыкин. - Текст : электронный. - ООО «1С-Паблишинг», 2024. - С. 179-180.
97. Брыкин, Д. О. Расширение функционала прогнозирования продаж для 1С:УНФ с использованием дополнительных статистических моделей / Д. О. Брыкин. -Текст : электронный. - ООО «1С-Паблишинг», 2025. - С. 199-201.
98. Kong, J., R. Lund. Seasonal count time series / J. Kong, R. Lund // Journal of Time Series Analysis. - 2023. - Vol. 44. - № 1. - P. 93-124. - DOI: 10.1111/jtsa.12651.
99. Nopiah, Z. M. The Use of Autocorrelation Function in the Seasonality Analysis for Fatigue Strain Data / Z. M. Nopiah, A. Lennie, S. Abdullah [et al.] // Journal of Asian Scientific Research. - 2012. - Vol. 2. - № 11. - P. 782-788.
100. Donaldson, B. Sales Forecasting and Budgeting / B. Donaldson. - Text: electronic // Sales Management. - London : Macmillan Education UK, 1998. - P. 128-146. - URL: http://link.springer.com/10.1007/978-1-349-26354-7_7 (visited on: 07.10.2025).
101. Sonbol, R., G. Rebdawi, N. Ghneim. Towards a Semantic Representation for Functional Software Requirements / R. Sonbol, G. Rebdawi, N. Ghneim. - Text: electronic // 2020 IEEE Seventh International Workshop on Artificial Intelligence for Requirements Engineering (AIRE). - Zurich, Switzerland : IEEE, 2020. - P. 1-8.
102. Chung, L., J. C. S. Do Prado Leite. On Non-Functional Requirements in Software Engineering / L. Chung, J. C. S. Do Prado Leite. - Text: electronic // Conceptual Modeling: Foundations and Applications : Lecture Notes in Computer Science / eds. A. T. Borgida [et al.]. - Berlin, Heidelberg : Springer Berlin Heidelberg, 2009. -Vol. 5600. - P. 363-379.
139
Список рисунков
1. Рисунок 1.1 Классификация рассматриваемых моделей......................................21
2. Рисунок 2.1 Интерфейс пользователя.....................................................................76
3. Рисунок 2.2 Блок-схема пайплайна.........................................................................77
4. Рисунок 3.1 Поток данных в механизм прогноза..................................................91
5. Рисунок 3.2 Поток данных из механизма прогноза...............................................92
6. Рисунок 3.3 Визуализация слоев архитектуры......................................................93
7. Рисунок 3.4 Алгоритм построения прогноза.......................................................102
8. Рисунок 4.1 Итоговый ТМАРЕ для регулярных продаж....................................115
9. Рисунок 4.2 Итоговый ТМАРЕ для редких продаж............................................116
140
Список таблиц
1. Таблица 1. 1 Сравнение методов............................................................................35
2. Таблица 1.2 Структура эксперимента для регулярных продаж.........................36
3. Таблица 1.3 Структура эксперимента для редких продаж.................................37
4. Таблица 1.4 Параметры настройки моделей........................................................38
5. Таблица 1.5 Результаты расчета сценариев.........................................................41
6. Таблица 1.6 Интерпретация результатов..............................................................44
7. Таблица 1.7 Описание методов расчета коэффициентов (S)ARIMA................46
8. Таблица 1.8 Результаты сравнений методов........................................................50
9. Таблица 2.1 Сравнительные особенности ЕЯР-систем в контексте внедрения МЬ............................................................................................................................65
10. Таблица 3.1 Основные движения в базе...............................................................90
11. Таблица 3.2 Принципы выбора модели................................................................99
12. Таблица 3.3 Оценка скорости расчетов коэффициентов ARIMA....................106
13. Таблица 3.4 Сценарии тестирования..................................................................106
14. Таблица 3.5 Результаты выполненных оптимизаций на массиве 3000 SKU .. 107
15. Таблица 4.1 Основные категории товаров.........................................................112
16. Таблица 4.2 Схема эксперимента........................................................................114
17. Таблица 4.3 ТМДРЕ по категориям для регулярных продаж..........................115
18. Таблица 4.4 ТМЛРЕ по категориям для редких продаж..................................115
19. Таблица 4.5 Распределение групп товаров........................................................116
20. Таблица 4.6 Выбор режима ARIMA...................................................................120
141
Приложение А. Код генератора рядов регулярных продаж
def simulate_series( n: int,
L0: float = 100.0, b0: float = 0.5, sigma_u: float = 1.0, sigma_v: float = 0.05, period: int = 12, harmonics: int = 1, seas_amp: float = 10.0, phi: float = 0.4, sigma_eps: float = 5.0, p_out: float = 0.05, out_scale: float = 0.3, multiplicative: bool = False, stochastic_trend: bool = False, trend_type: str = "additive", precision: int = 0, zero_p: float = 0.1, seed: int | None = None, ) -> np.ndarray:
rng = np.random.default_rng(seed)
# --- 1) Trend-----------------------------
if stochastic_trend: L = np.empty(n) b = np.empty(n) L_prev, b_prev = L0, b0 for t in range(n):
L_t = L_prev + b_prev + rng.normal(scale=sigma_u)
b_t = b_prev + rng.normal(scale=sigma_v) L[t], b[t] = L_t, b_t L_prev, b_prev = L_t, b_t
else:
t = np.arange(n) if trend_type == "additive":
L = L0 + b0 * t elif trend_type == "multiplicative":
L = L0 * (1.0 + b0) ** t else: # "none" L = np.full(n, L0)
# — 2) Seasonality (Fourier)--------------------
t = np.arange(1, n + 1)
S = sum( seas_amp * (
np.sin(2 * np.pi * j * t / period) + np.cos(2 * np.pi * j * t / period)
)
for j in range(1, harmonics + 1)
)
# --- 3) AR(1) noise-------------------------------
eps = rng.normal(scale=sigma_eps, size=n) for i in range(1, n):
eps[i] += phi * eps[i - 1]
base = L + S
y = base + eps if not multiplicative else base * (1 + eps / base.mean())
# — 4) Occasional spikes------------------------
spikes = rng.random(n) < p_out
y[spikes] += rng.uniform(0, out_scale * np.median(y), spikes.sum())
if zero_p > 0:
zeros_mask = rng.random(n) < zero_p y[zeros_mask] = 0
if precision is not None: if precision == 0:
y = np.rint(y).astype(int) else:
y = np.round(y, precision) return y
142
Приложение Б. Код генератора рядов редких продаж
def simulate_sparse(n, adi=4,
rho_occ=0.4,
sigma_occ=0.8,
season_occ_amp=0.0,
period=7,
shape_Q=2.0,
mean_Q=5.0,
cv_Q=0.5,
season_Q_amp=0.0,
trend_size=0.0,
precision=0,
seed=None):
......Intermittent-sales (Bernoulli_Gamma)
generator.
Parameters adi : float
Target Average Demand Interval (mean
spacing between non-zero points).
rho_occ : float
AR(1) coefficient for logit-probability to
create clustering (0 = iid).
trend_size : float
Relative linear growth of mean_Q over full
horizon (e.g. 0.2 ^ +20%).
season_Q_amp : float
Amplitude of sinusoid added to mean_Q. ii ii ii
rng = np.random.default_rng(seed)
# 1) Occurrence probabilities p_t mu = scipy.special.logit(1.0 / adi) logit_p = np.empty(n) logit_p[0] = mu for t in range(1, n):
logit_p[t] = (mu + rho_occ * (logit_p[t-1] -mu) +
rng.normal(scale=sigma_occ)) if season_occ_amp: t_idx = np.arange(n) logit_p += season_occ_amp * np.sin(2*np.pi*t_idx / period)
p_t = scipy.special.expit(logit_p) I_t = rng.random(n) < p_t
# 2) Size process Q_t (only where I_t==1) base_size = mean_Q * (1 + trend_size * np.arange(n)/n) if season_Q_amp:
base_size *= 1 + season_Q_amp * np.cos(2*np.pi*np.arange(n)/peri od) scale = base_size * cv_Q**2 / shape_Q Q_t = rng.gamma(shape=shape_Q, scale=scale) y = np.where(I_t, Q_t, 0)
# 3) Rounding if precision == 0:
#if y is lower than 1, round to 0 or 1 y = np.where(((y < 1) & (y > 0)), 1, y) y = np.rint(y).astype(int) elif precision is not None:
y = np.round(y, precision) return y
143
Приложение В. Регистрация программы для ЭВМ
Приложение Г. Акты о внедрении
т
ит-кластер
СИБИРИ
Ассоциация по развитию Информационно-телекоммуникационных технологий «Информационно-телекоммуникационный Кластер Сибири» 644074, РФ, Омская обл., г. Омск, пр. Комарова, 21/1, офис 101
Сатори Консалтинг
1С: Франчайзи 1С: Дистрибьюция
1С: Центр сертифицированного обучения 1С: Центр компетенции по производству 1С: Центр компетенции по строительству Microsoft: Small Business Specialist Business Studio: дилер, учебный центр
644070 г, Омск. ул. Лермонтова, 63, тел/факс:.(3812) 906-911, e-mail; satorv@satorvornsk.ru. http://www.satoryomsk.rij
По месту требования
05.06.2025г. На_
Акт о внедрении
Акт о внедрении
Настоящим актом подтверждаем, что программный модуль, разработанный Брыкиным Дмитрием Олеговичем, успешно прошел испытания на ряде предприятий, входящих в Ассоциацию «ИТ-Кластер Сибири», связанных с торгово-закупочной деятельностью и автоматизированных на решениях фирмы «1С» с которыми произведена интеграция модуля прогнозирования.
По результатам практического применения модуля Брыкина Д.О. эксперты ассоциации положительно оценили возможность учета аналогов для построения алгоритмов прогнозирования, что дает положительный эффект, как минимум, в компаниях ИТ-интеграторах, работающих с большими базами данных комплектующих компьютерного оборудования.
Применение одновременно двух алгоритмов прогнозирования с выбором наиболее оптимального варианта также является интересным техническим решением, хотя и менее заметным для рядового пользователя системы.
В целом, результаты применения программного модуля прогнозирования Брыкина Д.О. признаются ассоциацией «ИТ-Кластер Сибири» положительными и планируются к дальнейшему тиражированию на предприятиях, входящих в ассоциацию.
Президент Ассоциации «ИТ-Кластер Сибири»
Тел. 8 929 367 0003
Эл. почта: info@itclastersib.ru
А.М. Тимофеечев
о внедрении результатов работы, выполненной Брыкиным Дмитрием Олеговичем
В период с «05» сентября 2023 г. и текущий момент Брыкин Дмитрий Олегович является членом команды реализующий проект цифровой трансформации группы компаний «Сатори Консалтинг» (ООО «Сатори Партнер»),
В рамках проекта осуществляется внедрение единой информационной системы, состоящей из ряда интегрированных между собой программных решений «1С: ЕР1Р Управление предприятием», «Битрикс 24», «1С: Документооборот КОРП», «1С: Зарплата и управление персоналом» и др. с их доработкой для отражения измененных бизнес-процессов и функций Заказчика. Информационная система предприятия содержит в себе большой массив данных, накопленных с января 2001 года.
Программный модуль прогнозирования спроса, разработанный Дмитрием Олеговичем в рамках его диссертационного исследования на платформе «1С: Предприятие 8», и включающий в себя:
- возможность применения двух независимых алгоритмов прогнозирования спроса, предназначенных для анализа данных о регулярных и редких продажах товаров и услуг клиентам компании, с автоматическим выбором наиболее подходящего метода;
- систему учета аналогов товаров и услуг, которая повышает точность прогнозирования спроса,
успешно интегрирован в единую информационную систему предприятия, прошел опытную
эксплуатацию на выборках данных за 2020-2024г.г. Его применение за данный период позволило выявить ряд упущений в ассортименте и технологии продаж услуг компании и оптимизировать его.
Настоящим актом подтверждаем, что выполненная Брыкиным Д.О. разработка, успешно прошла опытно-промышленную эксплуатацию и с 01.03.2025г. используется для ежемесячного планирования продаж компании.
В дальнейшем наша компания видит перспективу развития и применения созданного решения и для других видов деятельности, не связанных непосредственно с продажами, но требующих прогнозирования.
Директор
ООО «Сатори Партнер»
«Ой» 1л-*УИЯ_20
|альцев /
Магазин АисНоп^ег (ИП Хуснутдинов Азат Наилевич)
г. Казань, ул. Ямашева д.ЗЗБ
Акт внедрения
Настоящий документ подтверждает, что программный модуль, разработанный в рамках диссертационного исследования Брыкина Дмитрия Олеговича, успешно интегрирован в платформу 1С и используется в магазине аудиооборудовання «АисИогс^ег» (ИП Хуснутдинов Азат Наилевич).
Данный модуль включает:
• систему учета аналогов, которая повышает точность прогнозирования
спроса;
• два алгоритма прогнозирования, предназначенные для анализа данных о
регулярных и редких продажах, с автоматическим выбором наиболее подходящего метода.
Благодаря внедрению данного решения удалось значительно улучшить точность прогнозирования спроса, что позволило оптимизировать процесс формирования заказов поставшикам и повысить эффективность управления
товарными запасами
Хуснутдинов А.Н.
Магазин Грузовике (ИП Гилев Евгений Михайлович) г. Новосибирск, ул. Станционная, дом № 21
Акт внедрения
Настоящим актом удостоверяется, что программный модуль, разработанный в рамках диссертационного исследования Брыкина Дмитрия Олеговича, успешно внедрен и эксплуатируется на платформе 1С:УНФ в магазине по продаже автозапчастей «Грузовике» (ИП Гилев Евгений Михайлович).
Внедренный модуль включает в себя:
• систему учета аналогов для повышения качества прогнозирования;
• два алгоритма прогнозирования, предназначенных для обработки данных о регулярных и редких продажах, с автоматизированным выбором оптимального алгоритма.
Внедрение указанного модуля способствовало повышению точности прогнозирования спроса и оптимизировало процесс формирования заказов поставщикам.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.