Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Маневич Вячеслав Андреевич

  • Маневич Вячеслав Андреевич
  • кандидат науккандидат наук
  • 2025, «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 119
Маневич Вячеслав Андреевич. Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют: дис. кандидат наук: 00.00.00 - Другие cпециальности. «Национальный исследовательский университет «Высшая школа экономики». 2025. 119 с.

Оглавление диссертации кандидат наук Маневич Вячеслав Андреевич

1.3.7 Нейросети

1.3.8 Transfer Learning

1.3.9 Прочие методы

1.3.10 Методология прогнозирования

2 Метод тройной поправки

2.1 Для одного актива (ТСМ)

2.1.1 Исследование устойчивости метода

2.1.2 Исследование применимости регуляризации

2.2 Для нескольких активов (УТСМ)

2.2.1 Выбор активов для векторного метода

3 Результаты машинных экспериментов

3.1 Результаты методов одного актива

3.1.1 Средние дневные цены закрытия

3.1.2 Реализованные Волатильности

3.1.3 Заключение

3.2 Результаты векторных методов

3.2.1 Средние дневные цены закрытия

3.2.2 Реализованные Волатильности

Заключение и выводы

Список литературы 99 Приложение

Введение

Прогнозирование временных рядов - сложная задача. Временные ряды могут быть использованы для представления таких процессов, как движение на дорогах, работа лифтов, вулканическая активность, потребление электроэнергии, поведение различных уровней турбин и многих других. В данной работе исследуются временные ряды стоимости активов фондового рынка, а также реализованные волатильности этих активов. Прогнозирование стоимости активов важно для торговли и инвестирования в ценные бумаги. Прогнозирование волатильности важно как для торговой стратегии, так и для принятия решений организациями и учреждениями, такими как Центральный Банк.

Актуальность диссертации заключается в том, что предсказание курсов и волатильностей финансовых временных рядов является одной из главных задач современной прикладной экономики, эконометрики и компьютерных наук, решение которой ищется уже долгие годы (о чем свидетельствует многочисленная литература и соревнования на Kaggle). Исследование проводится на основных представителях индекса Б&Р500 и крупнейших криптовалютах, что делает его результаты актуальными и интерпретируемыми на прочие активы. Предлагаемый в работе метод ТСМ расширяет область знаний прогнозирования временных рядов, опираясь на большое количество биржевых активов до середины 2023 года.

Набор скользящих окон позволяет говорить о том, что изучается всё или практически всё возможное поведение рядов.

Целью работы является изучение возможностей и эффективности применения предложенного автором метода - Метода Тройной Поправки (TCM) в задаче прогнозирования финансовых временных рядов с точки зрения погрешности прогноза. А также исследование влияния дискретных вейвлет-преобразований на работу этого метода.

Новизна диссертации заключается в том, что предлагается новый метод прогнозирования временных рядов (TCM) и подтверждается его эффективность, а также эффективность его векторной формы. Вводится новый критерий практической применимости моделей 1.3.3. Также проводится исчерпывающий анализ применимости вейвлет-преобразований в задаче прогнозирования временных рядов, чего ранее не делалось на таких объемах исследуемых активов и моделей.

Теоретическая и практическая значимость работы заключается в том, что предлагаемый метод в совокупности с большим массивом собранных данных можно считать новым бенчмарком в области. Приводится новый критерий оценки практической применимости моделей 1.3.3. Проведено исчерпывающее исследование применимости дискретных вейвлет-преобразований в задаче прогнозирования финансовых временных рядов и демонстрируется их эффективность в этом вопросе.

В работе приводятся результаты работы следующих методов (как с вейвлет преобразованиями, так и без них): TCM, CTCM, VTCM, XGBoost, CNN, ARMA, VAR, Наивный прогноз, переносы обучения на моделях XGBoost, а также множество подходов, которые не показали эффективность с точки зрения точности прогноза, но также были рассмотрены

Все представленные методы и модели выбраны для рассмотрения потому, что они являются классическими моделями, бейзлайнами или бенчмарками в области прогнозирования временных рядов.

Работа построена следующим образом:

• В Главе "Введение" описывается мотивация работы, цель, актуальность, значимость, положения, выносимые на защиту, прошлые работы автора, а также приведены конференции, в которых принималось участие.

• В Главе 1 представлены релевантные работы в исследуемой области, подробный обзор используемых данных, их преобразований, описание кластеризации активов, методология и теория моделей и методов их сравнения. Здесь же приводится описание всех типов рассматриваемых вейвлет преобразований. Также описывается новый критерий практической применимости моделей.

• Глава 2 описывает предлагаемые автором методы, как векторный вариант, так и вариант одного актива. Также приводятся исследования устойчивости метода к длине обучающей выборки и регуляризации.

• Глава 3.1 обсуждаются полученные результаты методов одного актива и Метода Тройной Поправки для обоих типов исследуемых временных рядов.

• Глава 3.2 обсуждаются полученные результаты методов многих активов и Векторного Метода Тройной Поправки для обоих типов исследуемых временных рядов.

• В Главе 3.2.2 приводятся выводы о практической применимости моделей для каждого метода, общие результаты работы, а также план дальнейших исследований.

• Раздел "Приложение" содержит подробные таблицы с активами и графиками для лучших моделей.

Положения, выносимые на защиту

В рамках диссертации получены следующие результаты, которые выносятся на защиту:

1. Предложен новый метод - Метод Тройной Поправки (ТСМ). Метод показывает отличные результаты, сопоставимые или опережающие прочие модели и бейзлайны.

2. Предложена векторная модификация Метода Тройной Поправки (УТСМ). Данный метод позволяет улучшить точность прогнозов ТСМ, однако требует подбора дополнительных активов.

3. Предложен способ подбора активов для УТСМ и продемонстрирована его эффективность.

4. Предложен новый критерий определения практической применимости моделей.

5. Проведено исчерпывающее исследование вейвлет преобразований в задачах прогнозирования финансовых временных рядов. Показана применимость и эффективность этих преобразований и повышение точности прогноза.

Все положения, выносимые на защиту, проверяются в итоге на 46 временных рядах, которые отражают поведение определенных кластеров биржевых активов и их преобразований. Это позволяет говорить о репрезентативности полученных результатов.

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Метод тройной поправки и вейвлет-анализ в задачах прогнозирования фондового рынка и криптовалют»

Апробация работы

В рамках подготовки диссертации автором были написаны и опубликованы статьи, приведенные ниже:

1. Manevich V. A., Peresetsky A. A. & Pogorelova P. V. (2022). "Stock market and cryptocurrency market volatility", Applied Econometrics 65, 65-76 (In Russian).

https://doi.org/10.22394/1993-7601-2022-65-65-76 - Q3

В данной работе делаются первые шаги в изучении временных рядов классического фондового рынка и рынка криптовалют на примере реализованных волатильностей фьючерса на крупнейший индекс S&P500 и Bitcoin. Показаны перетоки волатильности из индекса в Bitcoin и обратно. Данная работа является первым кирпичиком исследования. Диссертация раскрывает индекс и исследует прогнозирование основных активов, составляющих его.

2. Aganin A. D., Manevich V. A., Peresetsky A. A. & Pogorelova P. V. (2023). "Comparison of Cryptocurrency and Stock Market Volatility Forecast Models", HSE Economic J. 27 (1), 49-77 (In Russian). https://doi.org/10.17323/1813-8691-2023-27-1-49-77 - Q3

Данная статья сравнивает классические модели прогнозирования реализованных волатильностей. Подтверждается логнормальная при-

рода волатильностей e-mini S&P 500 и Bitcoin. Также получено, что GARCH модели слабо пригодны для прогнозирования волатильностей указанных активов.

3. Manevich V. A. (2024). "Corrected Triple Correction Method, CNN and Transfer Learning for Prediction the Realized Volatility of Bitcoin and E-Mini S&P500". Lobachevskii J Math 45, 1194-1206. https://doi.org/10.1134/S1995080224600705 - Q2

В данной статье впервые предлагается Метод Тройной Поправки (TCM) и исследуется его эффективность на E-mini S&P500 и Bitcoin вместе с нейросетевыми моделями и методами машинного обучения. Также демонстрируется эффективность применения Transfer Learning для нейросетевых моделей и бустингов. Закладывается фундамент для изучения прогнозирования при обучении на различных активах.

4. Minxing Wang, Braslavski P., Manevich V., Ignatov D. (2025). "Bitcoin Ordinals: Bitcoin Price and Transaction Fee Rate Predictions ", IEEE Access PP(99):1-1. https://doi .org/10.1109/ACCESS.2025.3541302 - Q1

Данная работа позволяет лучше понимать поведение Bitcoin. Используя три метрики (MAE, RMSE и MAPE) и модель Temporal Fusion Transformer в качестве базовой, наши сравнительные эксперименты показали, что данные, связанные с ординалами Bitcoin, необходимы для прогнозирования ставок и цен на транзакции Bitcoin Этот вывод помогает инвесторам и участникам рынка ординалов Bitcoin избегать потерь и использовать арбитражные возможности, связанные с перегрузками, тем самым обеспечивая более точное

принятие решений на криптовалютном рынке

5. Manevich V. A., Ignatov D. (2025). "Benchmarking of Triple Correction method and wavelet transforms in time series forecasting: panacea or standard? ", Applied Soft Computing Journal - in submition. - Q1

В данной статье представлен Tripple Correction method, а также исследуется влияние вейвлет-преобразований на прогнозные способности этого и прочих методов, являющихся бейзлайнами в области прогнозирования.

Диссертация продолжает эти статьи и раскрывает индекс, рассматривая набор активов, которые его составляют. Также на большом количестве активов исследуется применимость TCM, VTCM и демонстрируется их эффективность и применимость с практической точки зрения.

Также при подготовке работы автор принимал участие в качестве докладчика на следующих конференциях:

1. "Cryptocurrency Market Volatility" - 9th International Conference on Applied Research in Economics and Finance (2021)

2. "Cryptocurrency Market Volatility" - Modern Econometric Tools and Applications - META2021 (2021)

3. "Comparison of GARCH and HAR models for realized volatility of Bitcoin and E-mini S&P 500" - 2nd International Conference on Econometrics and Business Analytics (iCEBA): Time series methods (2022)

4. "Comparison of GARCH and HAR models for realized volatility of Bitcoin and E-mini S&P500" - Modern Econometric Tools and Applications - META2022 (2022)

5. "Corrected Triple Correction Method, CNN and transfer learning for prediction the realized volatility of Bitcoin and E-mini S&P500" - Российский Экономический Конгресс 2023 (РЭК-2023)

6. "Corrected Triple Correction Method, CNN and transfer learning for prediction the realized volatility of Bitcoin and E-mini S&P500" - Modern Econometric Tools and Applications - META2023 (2023)

7. "Corrected Triple Correction Method, CNN and transfer learning for prediction the realized volatility of Bitcoin and E-mini S&P500" - 3rd International Conference on Econometrics and Business Analytics (iCEBA) (2023)

8. "Corrected Triple Correction Method, CNN and transfer learning for prediction the realized volatility of Bitcoin and E-mini S&P500" - Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2023) (2023)

Глава 1

Теория и методология

В данной главе приводится обзор литературы и теоретическая база. Описываются данные, методы и подходы, применяемые в диссертации.

1.1 Релевантные работы

Фондовый рынок - сложная и динамичная система, на которую влияет множество факторов, что делает точное прогнозирование крайне сложной задачей [24]. Традиционные методы прогнозирования не всегда оказываются эффективны из-за непредсказуемости и волатильности, присущих финансовым рынкам [25]. Как итог, растет интерес к использованию методов машинного обучения [21].

Рост популярности машинного обучения (МЬ) в задачах, связанных с финансовыми рынками, обусловлен его способностью обрабатывать огромные объемы данных и выявлять сложные закономерности, которые не могут уловить традиционные модели [21]. Алгоритмы МЬ показали хорошие способности к прогнозированию, превзойдя традиционные методы по точности и надежности [22]. Более того, использование та-

ких методов ML, как глубокое обучение, рекуррентные нейронные сети и ансамблевое обучение, показало многообещающие результаты в улавливании сложной динамики данных фондового рынка [23].

Однако прогнозирование фондового рынка с помощью ML сталкивается с рядом проблем. Одной из важнейших задач является определение критических характеристик, которые влияют на эффективность ML-моделей в достижении точных прогнозов цен на акции [17]. Кроме того, сложность и неопределенность фондовых рынков, которые по своей сути являются динамичными и нелинейными, создает значительные проблемы для процесса прогнозирования [19].

В [2] используется промышленный индекс Доу-Джонса (DJIA) и Nasdaq Composite (IXIC) для исследования большого количества гибридных моделей, основанных на ARMAX, GARCH, LSTM-моделях и вейвлет преобразованиях. Результаты показывают общее улучшение прогнозирования фондовых индексов с помощью модели AWT-LSTM-ARMAX-FIEGARCH с t-распределением Стьюдента. Робастный тест доказывает, что данная модель имеет лучшую точность прогнозирования на различных временных горизонтах (1-, 10-, 15-, 20-, 30- и 60-дневном) для обоих фондовых индексов. Кроме того, AWT-LSTM улучшает способность модели HAR_RV (3) X-RV предсказывать реализованную волатильность акций для указанных временных горизонтов.

В работе [3] авторы объединили различные методы и предложили гибридную DWT-ARIMA-GSXGB модель для достижения улучшенной точности прогнозирования, аппроксимации и способности к обобщению. Во-первых, дискретное вейвлет-преобразование применяется для разделения набора данных на аппроксимирующую и ошибочную части. Затем модели ARIMA(0, 1, 1), ARIMA(1, 1, 0), ARIMA(2, 1, 1) и ARIMA(3,

1, 0) обрабатывают приближенные частичные данные. Модель advanced xgboost (GSXGB) обрабатывает ошибочные частичные данные. Наконец, результаты прогнозирования объединяются с помощью вейвлет - реконструкции.

В работе [6] показано, что в практических приложениях, где требуется точное прогнозирование временных рядов, ARIMA с вейвлетами может быть хорошим выбором. Сочетание возможностей моделирования ARIMA и вейвлет - препроцессинга позволяет ей давать более точные и надежные прогнозы по сравнению с экспоненциальным сглаживанием в аналогичных условиях. Для сложных и зашумленных данных ARIMA с вейвлетами оказывается надежным и эффективным методом прогнозирования.

В [7] исследуется влияние вейвлет преобразований на классические модели прогнозирования временных рядов. Авторы рассматривают применение вейвлет - преобразования к наименьшей квадратичной машине опорных векторов (LSSVM), ANN и многомерным адаптивным регрессионным сплайнам (MARS). Для проверки моделей используются данные наблюдений за уровнем воды в двух реках Пакистана - Инде и Чена-бе. В результате было получено, что комбинированные вейвлет-модели по эффективности превосходят различные модели временных рядов. Таким образом, объединение вейвлетных моделей прогнозирования дает гораздо лучшие результаты.

В [14] исследуется применимость вейвлетов для предварительной обработки данных перед подачей на вход нейронных сетей. В статье использовались временные ряды добычи сырой нефти на азиатском континенте за период 1980-2012 гг. Авторы показали, что предложенный метод эффективен и подходит для обработки данных при прогнозировании вре-

менных рядов с целью выбора входных данных для ANN.

В [33] сравнивается вейвлет подход с другими подходами. Исследование основывается на ежедневных обменных курсах корейской воны к доллару США. Авторы показали, что вейвлет-подход является привлекательной альтернативой. Он предлагает очень быстрый алгоритм с хорошими теоретическими свойствами и предсказуемостью при построении модели финансового прогнозирования. Отмечается, что применимость может зависеть от области применения.

В [15] исследуется применение фильтрации шума с помощью вейвлет преобразований для прогнозирования LSTM моделями. В качестве объекта исследования используется промышленный индекс Доу-Джонса (DJIA). Цена закрытия DJIA каждые пять минут делится на краткосрочную (1 час), среднесрочную (3 часа) и долгосрочную (6 часов) соответственно. Результаты показывают, что в краткосрочном, среднесрочном и долгосрочном периодах фильтрация шума может значительно улучшить стабильность и точность прогноза LSTM-модели. Кроме того, гибридная модель может лучше отражать картину изменения цены закрытия DJIA.

[16] использовал модель конволюционной нейронной сети (CNN) для прогнозирования фондового индекса и в итоге создал модель прогнозирования фондового индекса с помощью CNN и машины опорных векторов (SVM). Эмпирические результаты показывают, что эффект от использования нейронной сети для прогнозирования финансовых временных рядов лучше, чем от традиционного метода измерения.

В [18] предлагается итерационный алгоритм, принимающий на вход прогнозы, сделанные базовым алгоритмом прогнозирования. В исследовании предложено несколько новых алгоритмов вычисления единого предсказательного значения и алгоритмов определения непредсказуемых

точек. В результате работы RMSE снизился с 0,11 до 0,06, а MAPE уменьшился с 0,38 до 0,04.

В статье [26] проводится анализ использования вейвлет преобразования для удаления шума из временного ряда цен на акции с целью дальнейшей оптимизации портфеля. Входные данные сначала декомпозируются с помощью вейвлет-преобразования. Затем в качестве входных данных используются только родительские вейвлеты (высокочастотные вей-влеты). После этого на высокочастотных данных выполняется обучение с подкреплением (модель LSTM). В качестве данных используются индексы S&P500, DJI и K0SPI200. Используя разложенные высокочастотные данные в качестве входных, был улучшен портфель инвестиционных сделок для высоковолатильных рынков.

Применение моделей LSTM и GRU также показало свою перспективность в стратегиях инвестирования и прогнозировании цен биржевых активов, как было показано в [5].

В современном машинном обучении помимо методов глубокого обучения (Deep Learning) существуют так же подходы из интерпретируемого машинного обучения на основе узорных структур (pattern structures), например, интервальных, и парадигмы ленивого обучения (Lazy Learning), которые так же заслуживают отдельного развития в рамках задач регрессионного анализа данных [20].

1.2 Данные

Изначально интерес для данного исследования представляло сравнение рынка криптовалют и классического фондового рынка. Это привело к написанию трех статей [1, 35, 36], указанных во введении. В них рас-

сматривается прогнозирование реализованных волатильностей В^сот и Е-тш Б&Р500, как основных представителей указанных рынков, перетоки волатильности и переносы обучения, а также представляется новый метод - Метод Тройной Поправки, более детально исследуемый в данной диссертации.

Однако прогнозирование всего двух временных рядов не позволяет получить репрезентативные в полной мере выводы об эффективности или не эффективности исследуемых методов. Поэтому в диссертации рассматривается более детальное раскрытие рынка криптовалют и классического фондового рынка, что позволило подтвердить эффективность предложенного метода.

Исследуемые величины - это логарифмы реализованных волатильностей, рассчитанные за пятиминутные интервалы, и среднедневные значения закрытия пятиминутных интервалов. Подробное описание расчетов приведено в подразделе 1.2.1.

1.2.1 Активы

В работе рассматривается временной промежуток 01.01.2018-01.06.2023. Все данные взяты с сайта finam.ru1. Берутся высокочастотные данные с частотой в 5 минут. Рассматриваются 13 категорий активов, содержащих в общей сложности 89 акций, более подробную информацию о которых можно найти в Табл.А1 Приложения. Сводная информация о категориях активов представлена ниже в Табл.1.1. Изучение такого большого количества субъектов рынка позволяет получить репрезентативную картину касательно эффективности тех или иных методов и подходов к прогнозированию.

1https://www.finam.ru/profile/cryptocurrencies/btc-usd/export

№ Категория Кол-во активов

1 Криптовалюты 3

2 Информационные технологии 8

3 Здравоохранение 8

4 Потреб. товары второй необходимости 6

5 Коммунальные услуги 8

6 Финансы 8

7 Производство 8

8 Потреб. товары первой необходимости 8

9 Энергетика 8

10 Материалы 8

11 Недвижимость 8

12 Нефть и газ 8

13 Сырье 8

Таблица 1.1. Категории активов

Реализованные волатильности (КУ)

В качестве меры волатильности (изменчивости) финансовых активов обычно используется ее непараметрическая оценка - реализованная во-латильность. Эта оценка сходится к ненаблюдаемой волатильности, т.е. является состоятельной оценкой ненаблюдаемой (интегральной) волатильности [34]. Важным условием получения этой оценки является наличие высокочастотных наблюдений, т.к. они необходимы для ее расчета.

В качестве реализованной волатильности используется пятиминутная реализованная волатильность. Выбор таких временных интервалов обусловлен исследованием [34]. Автор показал, что значения реализованной

волатильности, рассчитанные по пятиминутным интервалам, являются наиболее оптимальными с точки зрения точности и микроструктуры ошибок. Ранее такая же форма расчета волатильности использовалась в статьях [1, 35, 36].

Реализованная волатильность в день £ представляется как

где г^- = log(pt,j) — log(pt,j-l) - доходность, р^ - цена актива в день £ в конце внутридневного интервала ] длиной Т (секунд), ] = 1... N с общим количеством интервалов для одного дня равным N. Первые пять минут - это 00:00-00:05. Последние пять минут - это 23:55-00:00. Расчет ведется по ценам закрытия пятиминутных периодов.

Чтобы получить сопоставимые результаты при наличии пробелов в данных, применяется следующий алгоритм масштабирования данных, предложенный в первой опубликованной статье [1]:

• Если в течение дня имеется менее 5 часов данных, день удаляется;

• Если наблюдения в начале и/или конце дня недоступны, реализованная волатильность рассчитывается с использованием доступных пятиминутных интервалов К. Затем она масштабируется на дневные данные. Поскольку день содержит 288 пятиминутных ин-

• В случае отсутствия данных в течение суток, например, между моментами ]1 и соответствующая сумма заменяется квадратом доходности за пропущенный период.

(1.1)

тервалов, числитель равен 288: =

Таким образом, мы получаем сопоставимость ежедневных значений реализованной волатильности классических биржевых активов в разные дни с ежедневной реализованной волатильностью криптовалют, которые, как правило, торгуются 24/7.

В [1] было получено, что реализованные волатильности имеют логнор-мальный характер. В работе на вход моделей подаются логарифмы реализованных волатильностей. Затем берутся экспоненты из прогнозов. Таким образом, мы можем учесть логнормальный характер реализованных волатильностей и получить наиболее качественные прогнозы исследуемых величин.

Средние дневные цены закрытия (СДЦЗ)

Второй исследуемый тип финансовых временных рядов - это средняя дневная цена закрытия (СДЦЗ) актива. Как и реализованная волатиль-ность, это значение рассчитывается за пятиминутные интервалы. Важно отметить, что это не просто среднее значение цены закрытия за день.

Средняя дневная цена закрытия (СДЦЗ) - это среднее значение цены закрытия торгового интервала, рассчитанное по пятиминутным интервалам. СДЦЗ в день £ рассчитывается по следующей формуле:

где ри - цена актива в день £ в конце внутридневного интервала ] длиной Т (секунд), ] = 1... N, при этом общее количество таких интервалов в один день равно N. Для криптовалют, как правило, N = 288, то есть полный день. Для других активов это значение может меняться изо дня в день в зависимости от времени торгов.

(1.2)

з=1

Отличия КУ и СДЦЗ

По своей природе и поведению исследуемые типы данных очень сильно отличаются, что хорошо видно на Рис.1.1. Для наглядности на каждом графике из шести в разных осях, соответствующих масштабу данных, представлены СДЦЗ (синяя линия) и ИУ (красная линия). Берутся срезы по 30-50 единиц данных из конца исследуемых интервалов.

- СДЦЗ - ГО/

Рис. 1.1. ИУ и СДЦЗ

Как можно видеть, данные очень разнородны для одних и тех же активов. По своей сути это два совершенно разных экономических процесса, имеющих разные паттерны поведения, масштабы величин и прочие характеристики. Поэтому некорректно сравнивать погрешности СДЦЗ и ИУ.

1.2.2 Кластеризация данных

Поскольку рассматривается большое количество активов, их прогнозирование может занять длительное время. Поэтому применяется кластеризация активов и выделение "ведущих" активов внутри кластеров. Прогнозы делаются для специально отобранных активов из всего множества, чтобы сократить время выполнения кода и при этом сохранить репрезентативность результатов. Активы (для обоих типов временных рядов) отбираются по следующему алгоритму:

1. Все активы (отдельно среднедневные цены закрытий и реализованная волатильность) кластеризуются методом k_means, при этом k (количество кластеров, на которые производится разбиение) варьируется от 2 до 89.

2. При каждом разбиении рассчитывается инерция разбиения (сумма квадратов ошибок (или SSE)). Это сумма расстояний всех точек в кластере до центроида кластера.

3. Для определения оптимального числа k используется "метод локтя", реализованный в пакете [Kneed] методом KneeLocator. В некоторый момент значения инерции выходят на плато и значение k перед выходом на плато является оптимальным количеством кластеров. То есть, когда увеличение k перестает существенно уменьшать инерцию, считается, что оптимальное значение k найдено. В случае логарифмов реализованных волатильностей все не так однозначно (Таб.??), но разбиение все равно производится на основе результатов метода.

4. После получения оптимального значения k^t временные ряды раз-

биваются на кластеры.

5. В каждом кластере рассчитываются корреляции между элементами кластера, а затем выбираются два элемента с наибольшей суммарной корреляцией (в абсолютном выражении) с другими активами в кластере. Если в кластере имеется только один элемент, то берется только он. Выбранные активы далее называются "ведущими" или "основными" элементами кластера.

В следующих разделах приведены подробные разбиения кластеров, а также графики убывания инерции и отсечки к^.

Кластерные разбиения для двух типов исследуемых данных (средние дневные цены закрытия и реализованные волатильности) существенно отличаются друг от друга в силу значительных различий в природе самих процессов.

Кластеризация данных. Средние дневные цены закрытия

Для средних дневных значений закрытия к^ = 5, т.е. оптимальное количество кластеров для разбиения этих активов равно 5. Таким образом, разбиение на 5 кластеров дает следующие группы активов (Таб.1.2) (первые 1-2 в каждом наборе являются "основными"):

Кластер № Основные элементы Все элементы кластера

1 DHR, LIN AAPL, ABBV, ABT, ADBE,

AEP, AMT, APD, BA

BAC, BLK, BRK+B, BZ,

CAT, CCI, CL, CMCSA,

COP, COST, CRM, CSCO,

СУХ, Б, БИЯ, Б1Б,

БЬИ, БИЕ, ЕСЬ, ЕЬ,

ЕОО, Ед1Х, ЕТИИББ, ЕХС,

ЕСХ, ИБ, ИО^ INTC,

JNJ, ЛРМ, КМ1, КО,

ЬШ, ЬМТ, ЬОШ, ЬУБ,

МА, MБЬZ, МЕТА, МММ,

МИК, МБ, МБЕТ, NEE,

NEM, NFЬX, NVБA, РЕР,

РО, РЬБ, РМ, РРО,

РБА, РБХ, РУРЬ, дИАЬ,

ББИХ, БИШ, БО, БИЕ,

Т, TJX, ТМО, ТМиБ,

иРБ, У, VZ, ШЕЬЬ,

ШМБ, ШМТ, ХЕЬ, ХОМ,

МРС, PFE, ИNP, ХИРИББ,

ББАС, ИТХ, ИNИ

2 РЬ, ОООО АИ, AMZN, Б^О,

ОС, ОООО, РА, РЬ

3 БТСИББ БТСИББ

4 СА СА

5 N1 N1

Таблица 1.2. Кластерное разбиение для средних дневных цен закрытия

Большинство из них объединены в один большой кластер, включающий все категории активов, от криптовалют до сырьевых товаров. Остальные кластеры включают в себя гораздо меньшее количество ак-

тивов, например, БТСИБВ, СА и N1 являются единственными представителями своих кластеров.

Кластеризация данных. Реализованные волатильности

Для логарифмов дневных реализованных волатильностей к0р^ — 12, т.е. оптимальное количество кластеров для разбиения этих активов равно 12. Таким образом, при разбиении на 12 кластеров получаются следующие группы активов (Таб.1.3) (первые 1-2 в каждом наборе являются "основными"):

Кластер № Основные элементы Все элементы кластера

1 V, MSFT AAPL, ABT, COST, CSCO, DHR, ECL, GOOG, HD, JPM, LMT, MA, MMM, MSFT, PFE, PPG, RTX, SBUX, SHW, TMO, UNH, UNP, UPS, V

2 CVX, KMI ABBV, BAC, BLK, CAT, CMCSA, CVX, DLR, EL, EQIX, INTC, KMI, LOW, MS, NEM, SBAC, TJX, TMUS, WELL, WMB, XOM

3 CRM ADBE, AMZN, BKNG, CRM, META, PYPL

4 DRE, XEL AEP, AMT, APD, CC D, DIS, DRE, EXC, HON, LIN, MRK, NEE, PLD, PM,

PSA, SO, SRE, XEL

5 AH, CA AH, CA, PL

6 COP, PSX BA, COP, EOG, LYB, MPC, PSX

7 KO, PEP BRK+B, JNJ, KO, MDLZ, PEP, PG, T, VZ, WMT

8 BTCUSD, ETHUSD BTCUSD, ETHUSD, XRPUSD

9 PA, CL BZ, CL, NI, PA

10 NFLX, NVDA FCX, NFLX, NVDA

11 GC GC

12 QUAL QUAL

Таблица 1.3. Кластерное разбиение для логарифмов реализованных во-латильностей

В случае с логарифмами реализованных волатильностей разделение на кластеры гораздо четче, чем в случае со средними дневными значениями закрытия. Криптовалюты выделились в отдельный кластер. Материалы образовали два кластера. Активы, которые выделились в отдельные одиночные кластеры 11 и 12, четко определены.

1.3 Методология

Ранее, в работах [35] и [36] было показано, что модели GARCH и HAR уступают другим рассмотренным моделям (ARMA, TCM, XGBoost). Поэтому в данной работе эти модели не рассматриваются для прогнозирования. Кроме того, в работе [36] было проанализировано значительное количество методов и подходов, поэтому выборка методов, рассматрива-

емых здесь, была сужена.

Исследуется применимость различных типов вейвлет преобразований (подраздел 1.3.1) для улучшения предсказательной способности моделей:

1. ARMA (подраздел 1.3.4) - классическое семейство для прогнозирования временных рядов. Модели из этого семейства продолжают демонстрировать свою эффективность наряду с новыми методами;

2. Наивный прогноз (подраздел 1.3.5) - необходимый бейзлайн, поскольку если модели дают предсказание хуже наивного, они неработоспособны с практической точки зрения;

3. Boosting (подраздел 1.3.6) - методы из наук о данных, которые показали свою эффективность в различных конкурсах и работах, фактически он считается бенчмарком в области;

4. Нейронные сети (NN) (подраздел 1.3.7) - нейронные сети являются методом прогнозирования с большими возможностями развития и хорошей прецедентной базой, подтверждающей их эффективность.

1.3.1 Общая теория вейвлет преобразования

Вейвлеты используется как инструмент для преобразования временных рядов. Оно помогает разложить данные на различные компоненты и изучить их с разрешением, соответствующим масштабу [38]. Дискретное вейвлет-преобразование (DWT) - это метод преобразования данных, который представляет их во временной и частотной областях. Это преобразование наиболее подходит для применения в анализе временных рядов. Оно позволяет преодолеть недостаток преобразования Фурье, ко-

торое способно предоставить информацию только в одном домене и ограничено определенными окнами.

DWT обладает такими преимуществами, как простота реализации и эффективность с точки зрения времени вычислений [39], [40]. Вейвлет-преобразования имеют обширную теоретическую базу, которую можно найти в [38] и [45].

Фундаментальная и математическая литература по вейвлетам была опубликована [41], [42] и [43].

Идею объединения вейвлет-разложения и NN можно найти в следующих работах [27-32].

Одной из целей данной работы является изучение практической применимости вейвлет преобразований в задачах прогнозирования финансовых временных рядов. Также рассматриваются различные вариации вейвлет преобразований. Теоретические выкладки не приводятся - с ними можно ознакомиться в указанных выше источниках.

Для прямых вейвлет преобразований временных рядов используется метод wavedec из библиотеки pywt в Python [37], для обратных - waverec.

wavedec включает несколько параметров, которые существенно влияют на результаты прогнозирования:

• wavelet - тип используемого материнского вейвлета для преобразования;

• mode - метод экстраполяции сигнала;

• level - уровень декомпозиции (количество слоев декомпозиции) сигнала (временного ряда).

Ниже приведено описание каждого из параметров, а также значения, которые они могут принимать.

Параметр wavelet

В статье рассматриваются следующие типы DWT:

1. Haar (haar2)

Одним из видов вейвлетов является вейвлет Хаара, который проще использовать в расчетах, особенно при сглаживании.

Вейвлет Хаара был предложен в 1909 году [50]. Хаар использовал эти функции, чтобы дать пример ортонормированной системы для пространства квадратично-непрерывных функций на единичном интервале [0, 1].

2. Daubechies (db1-db38)

Вейвлеты Добеши, названные в честь бельгийского математика Ингрид Добеши в [38], широко используются в обработке сигналов и сжатии изображений. Они известны своим компактным носителем, ортогональностью и способностью идеально восстанавливать полиномы до определенной степени. Эти свойства делают их хорошо подходящими для приложений, требующих точной локализации как во временной, так и в частотной областях [46].

3. Symlets (sym2-sym20)

Вейвлеты Symlet являются модификацией вейвлетов Daubechies, обеспечивая улучшенную фазовую линейность и симметрию. Они обеспечивают баланс между компактным носителем и лучшей локализацией частоты, что делает их подходящими для приложений, связанных как с гладкими, так и с колебательными сигналами.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Маневич Вячеслав Андреевич, 2025 год

Список литературы

[1] Manevich V. A., Peresetsky A. A. & Pogorelova P. V. (2022). "Stock market and cryptocurrency market volatility", Applied Econometrics 65, 65-76 (In Russian).

https://doi.org/10.22394/1993-7601-2022-65-65-76

[2] Zolfaghari M. & Gholami S. (2021). "A hybrid approach of adaptive wavelet transform, long short-term memory and ARIMA-GARCH family models for the stock index prediction", Expert Systems with Applications 182, 115149.

https://doi.org/10.1016/j.eswa.2021.115149

[3] Wang Y. & Guo Y. (2020). "Forecasting method of stock market volatility in time seriesdata based on mixed model of arima and xgboost", China Communications 17 (3), 205-221.

https://doi.org/10.23919/JCC.2020.03.017

[TabNet] Sercan O. Arik and Tomas Pfister (2020). "TabNet: Attentive Interpretable Tabular Learning", AAAI Conference on Artificial Intelligence.

https://doi.org/10.1609/aaai.v35i8.16826

[5] Lin, Z., Tian, F., Zhang, W. (2022). Evaluation and analysis of an LSTM

and GRU basedstock investment strategy. 1615-1626. https://doi.org/10.2991/978-94-6463-052-7_179

[6] Kumar M. & Kumar J. (2023). "Reverse effect of Wavelets on ES and ARIMA Models using electricity demand time series data", Preprint. https://doi.org/10.21203/rs.3.rs-3469115/v1

[7] Shaikh W. A., Shah S. F., Pandhiani S. M. & Solangi M. A. (2022). "Wavelet Decomposition Impacts on Traditional Forecasting Time Series Models", Computer Modeling in Engineering & Sciences, 130(3), 15171532.

https://doi.org/10.32604/cmes.2022.017822

[8] Alshraideh, H., Runger, G. (2013). "Process monitoring using hidden markov models", Qualityand Reliability Engineering International, 30(8), 1379-1387.

https://doi.org/10.1002/qre.1560

[9] Awe, O., Dias, R. (2022). "Comparative analysis of Arima and artificial neural networktechniques for forecasting non-stationary agricultural output time series", Agris on-LinePapers in Economics and Informatics, 14(4), 3-9.

https://doi.org/10.7160/aol.2022.140401

[10] Yahaya, A., Etuk, E., Amos, E. (2021). "Comparative performance of arima and garch modelin forecasting crude oil price data", Asian Journal of Probability and Statistics, 251-275.

https://doi.org/10.9734/ajpas/2021/v15i430378

[11] Yu, Q., Jibin, L., Jiang, L. (2016). "An improved arima-based traffic anomaly detectionalgorithm for wireless sensor networks", International

Journal of Distributed SensorNetworks, 12(1), 9653230. https://doi.org/10.1155/2016/9653230

[12] Kandananond, K. (2011). "Forecasting electricity demand in Thailand with an artificial neuralnetwork approach", Energies, 4(8), 1246-1257. https://doi.org/10.3390/en4081246

[13] Bulut, C., Hudaverdi, B. (2022). "Hybrid approaches in financial time series forecasting: astock market application", Ekoist Journal of Econometrics and Statistics, 0(37), 53-68.

https://doi.org/10.26650/ekoist.2022.37.1108411

[14] Jamal A., Hameed Ashour M. A., Abbas Helmi R. A. & Liew Fong S. (2021). "A Wavelet-Neural Networks Model for Time Series", 2021 IEEE 11th IEEE Symposium on Computer Applications & Industrial Electronics (ISCAIE), Penang, Malaysia, Volume: 11. https://doi.org/10.1109/ISCAIE51753.2021.9431777

[15] Tang Q., Shi R., Fan T., Ma Y. & Huang J. (2021). "Prediction of Financial Time Series Based on LSTM Using Wavelet Transform and Singular Spectrum Analysis", Mathematical Problems in Engineering, vol. 2021, Article ID 9942410, 13 pages.

https://doi.org/10.1155/2021/9942410

[16] Cao J. & Wang J. (2019)."Stock price forecasting model based on modified convolution neural network and financial time series analysis", International Journal of Communication Systems, vol. 32. https://doi.org/10.1002/dac.3987

[17] Htun, H., Biehl, M., Petkov, N. (2023)."Survey of feature selection and extraction techniquesfor stock market prediction", Financial Innovation,

9(1).

https://doi.org/10.1186/s40854-022-00441-7

[18] Gromov V.A., Tomashchuk K.K. Rukavishnikov A.A. (2024). "Multi-Step-Ahead Prediction of Chaotic Time Series: Self-Healing Algorithm for Restoring Values at Non-Predictable Points ", Qubahan Academic Journal, 2024. Vol. 4. No. 3.

https://doi.org/10.48161/qaj.v4n3a912

[19] Mansor, R., Zaini, B., Yusof, N. (2019). "Prediction stock price movement using subsethoodand weighted subsethood fuzzy time series models".

https://doi.org/10.1063/1.5121123

[20] Masyutin A. and Kuznetsov S. (2016). "Continuous Target Variable Prediction with Augmented Interval Pattern Structures: Lazy Algorithm", International Conference on Concept Lattices and their Applications. https://api. semanticscholar.org/CorpusID:792872

[21] Zhang, J., Lei, Y. (2022). reinforcement learning for stock prediction", Scientific Programming, 2022, 1-9.

https://doi.org/10.1155/2022/5812546

[22] Soni, P., Tewari, Y., Krishnan, D. (2022). Machine learning approaches in stock priceprediction: a systematic review. Journal of Physics Conference Series, 2161(1),012065. https://doi.org/10.1088/ 1742-6596/2161/1/012065v

[23] Wang, Q., Kang, K., Zhihan, Z., Cao, D. (2021). Application of LSTM and conv1d networkin stock forecasting model. Artificial Intelligence

Advances, 3(1), 36-43.

https://doi.org/10.30564/aia.v3i1.2790

[24] Hu, Z., Liu, W., Bian, J., Liu, X., Liu, T. (2018). Listening to chaotic whispers.

https://doi.org/10.1145/3159652.3159690

[25] Fraz, T., Fatima, S., Uddin, M. (2022). "Modeling and forecasting stock market volatility ofCPEC founding countries: using nonlinear time series and machine learning models", Journal of Independent Studies and Research Management Social Science and Economics, 20(1), 1-20. https://doi.org/10.31384/jisrmsse/2022.20.1.1

[26] Lee J., Koh H. & Hi JUN Choe (2021). "Learning to trade in financial time series using high-frequency through wavelet transformation and deep reinforcement learning", Applied Intelligence, Volume 51, pages 6202-6223.

https://doi.org/10.1007/s10489-021-02218-4

[27] Bakshi B. R. & Stephanopoulos G. (1993). "Wave-net: a multiresolution, hierarchical neural network with localized learning", AIChE Journal, 39, 1, 57-81.

https://doi.org/10.1002/aic.690390108

[28] Bakshi B. R. & Stephanopoulos G. (1995). "Reasoning in Time: Modeling, Analysis, and Pattern Recognition of Temporal Process Trends", Advances in Chemical Engineering, Vol. 22, 485-547. https://doi.org/10.1016/S0065-2377(08)60265-3

[29] Delyon B., Juditsky A. & Benveniste A. (1995). "Reasoning in Time: Modeling, Analysis, and Pattern Recognition of Temporal Process

Trends", IEEE Transactions on Neural Networks, vol.6, 332-348. https://doi.org/10.1109/72.363469

[30] Geva A. B. (1998). "ScaleNet-multiscale neural-network architecture for time series prediction", IEEE Transactions on Neural Networks, Vol. 9, No.5.

https://doi.org/10.1109/72.728396

[31] Zhang Q. & Benveniste A. (1992). "Wavelet Networks", IEEE Transactions on Neural Networks, Vol. 3, No. 6, 889-898. https://doi.org/10.1109/72.165591

[32] Zhang Q. (1997). "Using Wavelet Networks in Nonparametric Estimation", IEEE Transactions on Neural Networks, vol.8, 227-236. https://doi.org/10.1109/72.557660

[33] Shin T. & Han I. (1999). "Optimal Multi-scale Time Series Decomposition for Financial Forecasting Using Wavelet Thresholding Techniques", New Directions in Rough Sets, Data Mining, and Granular-Soft Computing, 7th International Workshop, RSFDGrC '99, Yamaguchi, Japan, November 9-11, 1999, Proceedings.

https://doi.org/10.1007/978-3-540-48061-7_66

[34] Bollerslev T. (1986). "Generalized autoregressive conditional heteroskedasticity", J. of Econometrics 31, 307-327.

https://doi.org/10.1016/0304-4076(86)90063-1

[35] Aganin A. D., Manevich V. A., Peresetsky A. A. & Pogorelova P. V. (2023). "Comparison of Cryptocurrency and Stock Market Volatility Forecast Models", HSE Economic J. 27 (1), 49-77 (In Russian). https://doi.org/10.17323/1813-8691-2023-27-1-49-77

[36] Manevich V. A. (2024). "Corrected Triple Correction Method, CNN and Transfer Learning for Prediction the Realized Volatility of Bitcoin and E-Mini S&P500", Lobachevskii Journal of Mathematics, Vol. 45, No. 3, pp. 1138-1150.

https://doi.org/10.1134/S1995080224600705

[37] Lee G. R., Gommers R., Wasilewski F., Wohlfahrt K. & O'Leary A. (2019). "PyWavelets: A Python package for wavelet analysis", Journal of Open Source Software, 4(36), 1237.

https://doi.org/10.21105/joss.01237

[38] Daubechies I. (1992). "Ten Lectures on Wavelets", Society for Industrial and Applied Mathematics. SIAM.

[39] Guo T., Zhang T., Lim E., Lopez-Benitez M., Ma F. & Yu L. (2022). "A Review of Wavelet Analysis and Its Applications: Challenges and Opportunities", IEEE Access, vol. 10, pp. 58869-58903. https://doi.org/10.1109/ACCESS.2022.3179517

[40] Katsavrias C., Papadimitriou C., Hillaris A. & Balasis G. (2022). "Application of Wavelet Methods in the Investigation of Geospace Disturbances: A Review and an Evaluation of the Approach for Quantifying Wavelet Power", Atmosphere (Basel)., vol. 13, no. 3. https://doi.org/10.3390/atmos13030499

[41] Addison P. S. (2002). "The illustrated wavelet transform handbook: introductory theory and applications in science, engineering, medicine and finance", CRC Press.

https://doi.org/10.1201/9781420033397

[42] Lahmiri S. (2014). "Wavelet low-and high-frequency components as features for predicting stock prices with backpropagation neural networks", Journal of King Saud University - Computer and Information Sciences, Volume 26, Issue 2, Pages 218-227.

https://doi.org/10.1016/j.jksuci.2013.12.001

[43] Walnut D. F. (2004). "An introduction to wavelet analysis", Part of the book series: Applied and Numerical Harmonic Analysis (ANHA). https://doi.org/10.1007/978-1-4612-0001-7

[Kneed] kneed - https://pypi.org/project/kneed/

[45] Andreas de Vries (2006). "Wavelets", FH Sudwestfalen University of Applied Sciences, Haldener Straße 182, D-58095 Hagen, Germany.

[46] Chui C. K. (1992). "An Introduction to Wavelets: Wavelet Analysis and Its Applications", eBook ISBN: 9781483282862.

https://shop.elsevier.com/books/an-introduction-to-wavelets/ chui/978-0-12-174592-9

[47] Coifman R. R. & Meyer Y. (1992). "Remarques sur lanalyse de Fourier a fenetre", C.R. Acad. Sci. Paris 312, 259-261.

[48] Coifman R. R., Meyer Y. & Wickerhauser M. V. (1993). "Progress in Wavelet Analysis and Applications", in Y. Meyer and S. Roques (eds.), Editions Frontieres, France, 77-93.

[49] Coifman R. R. & Wickerhauser M. V. (1992). "Entropy Based Methods for Best Basis Selection", IEEE Transactions on Information Theory Vol.38, No.2, 719-746.

[50] Haar A. (1910). "Zur Theorie der orthogonalen Funktionensysteme", athematische Annalen, 69 (3): 331-371. https://doi.org/10.1007/BF01456326

[XGBoost] XGBoost - https://xgboost.readthedocs.io/en/stable/ python/python_intro.html#

[Tsfresh] Tsfresh - https://tsfresh.readthedocs.io/en/stable/text/ introduction.html

[Chronos] Abdul Fatir Ansari, Lorenzo Stella, Caner Turkmen, Xiyuan Zhang, Pedro Mercado, Huibin Shen, Oleksandr Shchur, Syama Sundar Rangapuram, Sebastian Pineda Arango, Shubham Kapoor, Jasper Zschiegner, Danielle C. Maddix, Hao Wang, Michael W. Mahoney, Kari Torkkola, Andrew Gordon Wilson, Michael Bohlke-Schneider, Yuyang Wang (2024). "Chronos: Learning the Language of Time Series", Transactions of Machine Learning Research. https://doi.org/10. 48550/arXiv.2403.07815

[darts] darts - https://unit8co.github.io/darts/generated_api/ darts.models.forecasting.nbeats.html

Приложение

№ Category Ticker Full Name

1 Cryptocurrencies BTCUSD Bitcoin

ETHUSD Ethereum

XRPUSD Ripple

2 Information AAPL Apple

technology MSFT Microsoft

NVDA Nvidia

CRM Salesforce

ADBE Adobe

INTC Intel

QUAL Qualcomm

CSCO Cisco Systems

3 Healthcare ABBV AbbVie

ABT Abbott Labs

DHR Danaher

JNJ Johnson & Johnson

PFE Pfizer

UNH UnitedHealth

MRK Merck & Co

TMO Termo Fisher Scientific Inc

4 Consumer AMZN Amazon

Discretionary HD Home Depot

LOW Lowes Companies

SBUX Starbucks Corporation

BKNG Booking Holdings Inc

TJX TJX Companies Inc. (The)

5 Utilities GOOG Google

META Facebook

VZ Verizon Communications

DIS Disney

CMCSA Comcast Corporation

NFLX Netflix

T AT&T

TMUS T-Mobile US Inc.

6 Financials BRK+B berkshire hathaway

V Viza

JPM JPMorgan Chase

MA Mastercard

BAC Bank of America

PYPL PayPal

BLK BlackRock

MS Morgan Stanley

7 Industrials HON Honeywell International

UNP Union Pacific Corp.

UPS United Parsel Service

LMT Lockheed Martin Corp

BA Boeing

RTX Raytheon Company

MMM 3M Company

CAT Caterpillar Inc

8 Consumer WMT Walmart inc.

Defensive PG Procter & Gamble

KO Coca Cola

PEP PepsiCo

COST Costco Wholesale Corporation

PM Philip Morris International Inc

EL Estee Lauder Companies Inc.

MDLZ Mondelez International Inc.

9 Energy NEE NextEra Energy

D Dominion Energy

DRE Duke Realty Corporation

SO Southern Company (The)

AEP American Electric Power Company Inc.

EXC Exelon Corp.

SRE Sempra Energy

XEL Xsel Energy

10 Materials LIN Linde plc

SHW Sherwin-Williams Company (The)

APD Air Products and Chemicals Inc.

ECL Ecolab Inc.

NEM Newmont Mining Corporation

FCX Freeport-McMoRan Inc.

LYB LyondellBasell Industries NV

PPG PPG Industries

11 Real AMT American Tower Corp. Cl A

Estate PLD Prologis inc.

CCI Crown Castle International Corp. (REIT)

EQIX Equinix inc.

PSA Public Storage

DLR Digital Realty Trust Inc.

SBAC SBA Communications Corporation

WELL Welltower Inc.

12 Oil CVX Chevron

and XOM Exxon Mobile Corp.

gas COP ConocoPhillips

KMI Kinder Morgan Inc.

PSX Philips 66

EOG EOG Resources

WMB Williams Companies Inc. (The)

MPC Marathon Petroleum Corporation

13 Raw BZ Brent

material CL Light

AH Aluminum

GC Gold

CA Copper

NI Nickel

PA Palladium

PL Platinum

Таблица A1. Все активы

Parameter Assets RV

Types Count % of total Types Count % of total

Model naive 4 57.1 CTCM 32 80.0

TCM 2 28.6 ARMA(1, 1) 4 10.0

nn 1 14.3 ARMA 2 5.0

naive 2 5.0

Wavelet bior5.5 2 28.6 rbio1.3 23 57.5

no _ wt 2 28.6 coifl 7 17.5

bior1.3 1 14.3 bior2.6 2 5.0

db18 1 14.3 haar 2 5.0

sym19 1 14.3 no_wt 2 5.0

Mode constant 5 71.4 symmetric 35 87.5

no_wt 2 28.6 no_wt 2 5.0

reflect 2 5.0

constant 1 2.5

Level 1 5 71.4 6 21 52.5

no_wt 2 28.6 5 8 20.0

1 3 7.5

3 3 7.5

4 2 5.0

Таблица A2. Наилучшие значения параметров для метрики MAPE.

Parameter Assets RV

Types Count % of total Types Count % of total

Model naive 3 42.9 ARMA(1, 1) 16 40.0

TCM 2 28.6 boost 7 17.5

TCM 2 28.6 TCM 7 17.5

ARMA 6 15.0

Wavelet no_wt 2 28.6 db3 9 22.5

db17 1 14.3 no_wt 8 20.0

db18 1 14.3 haar 7 17.5

db6 1 14.3 bior3.1 3 7.5

rbio1.5 1 14.3 rbio3.1 3 7.5

Mode constant 4 57.1 symmetric 22 55.0

no_wt 2 28.6 constant 9 22.5

symmetric 1 14.3 no_wt 8 20.0

Level 1 4 57.1 1 21 52.5

no_wt 2 28.6 no_wt 8 20.0

2 1 14.3 4 4 10.0

6 3 7.5

Таблица A3. Наилучшие значения параметров для метрики MAE.

Parameter Assets RV

Types Count % of total Types Count % of total

Model CTCM 3 42.9 nn 15 37.5

naive 3 42.9 nn 12 30.0

ARMA(1, 0) 1 14.3 ARMA(1, 1) 4 10.0

Wavelet bior1.1 1 14.3 no_wt 14 35.1

db30 1 14.3 db18 6 15.0

db6 1 14.3 sym3 4 10.0

rbio3.1 1 14.3 sym10 3 7.5

rbio3.3 1 14.3 db5 2 5.0

Mode constant 4 57.1 symmetric 19 47.5

smooth 2 28.6 no_wt 14 35.0

symmetric 1 14.3 constant 5 12.5

Level 2 3 42.9 no_wt 14 35.0

3 2 28.6 2 13 32.5

4 1 14.3 1 8 20.0

7 1 14.3 5 2 5.0

Таблица A4. Наилучшие значения параметров для метрики CCD.

Active The best model Metric value % diff best TCM % diff TCM

DHR naiv wt 1.11 -0.19 -0.41

LIN naiv wt 1.05 -0.16 -1.04

PL TCM 1.04 -1.88 0

GOOG tcm_wt 3.02 0 -3.16

BTCUSD naiv wt 2.01 -0.18 -1.53

CA TCM 0.82 -0.74 0

NI naiv wt 1.52 -0.36 -3.84

Таблица А5. Лучшие модели для каждого актива и значения МАРЕ этих моделей.

Active The best model Metric value % diff best TCM % diff TCM

DHR tcm_wt 0.56 0.00 5.20

LIN tcm_wt 0.54 0.00 6.72

PL naiv wt 0.61 0.52 1.04

GOOG tcm_wt 0.55 0.00 3.92

BTCUSD ARMA(1, 0)_wt 0.57 0.55 3.76

CA naiv wt 0.61 0.42 2.79

NI naiv wt 0.58 0.35 1.41

Таблица A6. Лучшие модели для каждого актива и значения CCD для этих моделей.

Active The best model Metric value % diff best TCM % diff TCM

MSFT tcm_wt 24.5 0 -6.25

V tcm_wt 24.17 0 -5.06

INTC tcm_wt 25.08 0 -7.18

CMCSA tcm_wt 23.89 0 -4.9

ADBE tcm_wt 23.27 0 -5.99

CRM tcm_wt 23.27 0 -5.99

XEL tcm_wt 21.29 0 -2.63

AEP tcm_wt 21.65 0 -4.67

AH arma (1,1) 15.58 -3.95 -4.45

PLD tcm_wt 22.87 0 -2.71

AMT tcm_wt 22.53 0 -4.47

AMZN tcm_wt 25.93 0 -6.86

GOOG tcm_wt 24.56 0 -6.73

BAC tcm_wt 25.12 0 -4.5

JPM tcm_wt 23.76 0 -3.35

BRK+B tcm_wt 48.72 0 -3.86

BTCUSD tcm_wt 25.73 0 -4.96

ETHUSD tcm_wt 23.46 0 -5.82

BZ naiv wt 36,47 -1.34 -6.47

CL ARMA(1, 1)_wt 31.88 -0.72 -3.14

CA ARMA(1, 1)_wt 24.9 -1.77 -5.44

PSX tcm_wt 22.15 0 -4.73

COP tcm_wt 21.89 0 -3.21

MMM tcm_wt 24.3 0 -5.05

UNP tcm_wt 23.1 0 -4.96

XOM tcm_wt 23.36 0 -5.21

CVX tcm_wt 24.06 0 -5.37

NFLX tcm_wt 22.91 0 -6.41

NVDA tcm_wt 25.48 0 -8.93

GC ARMA(1, 1)_wt 24.06 -0.02 -2.5

LOW tcm_wt 23.28 0 -7.24

HD tcm_wt 23.23 0 -5.24

HON tcm_wt 61.48 0 -11.15

KO tcm_wt 22.85 0 -4.6

PEP tcm_wt 21.77 0 -5.56

NI ARMA(1, 1)_wt 18.67 -1.51 -9.27

PA tcm_wt 20.55 0 -4.87

PL arma_(1, 1)_wt 18.94 -1.49 -4.45

QUAL naiv wt 58.64 -2.4 -16.55

XRPUSD tcm_wt 26.67 0 -4.46

Таблица А7. Лучшие модели для КУ и значения МАРЕ этих моделей.

Active The best model Metric value % diff best TCM % diff TCM

MSFT nn wt 0.37 3.36 6.72

V nn_wt 0.44 25.53 25.30

INTC nn 0.38 2.45 6.54

CMCSA nn 0.37 5.90 2.53

ADBE ARMA(1, 1)_wt 0.35 2.35 14.12

CRM ARMA(1, 1)_wt 0.35 2.35 14.12

XEL nn wt 0.45 19.45 24.94

AEP nn wt 0.48 26.09 27.45

AH tcm_wt 0.42 0.00 5.90

PLD nn_wt 0.57 33.09 39.67

AMT nn 0.39 6.18 7.53

AMZN nn_wt 0.35 4.42 8.55

GOOG nn 0.34 4.53 14.20

BAC nn_wt 0.37 0.56 5.90

JPM nn 0.39 5.08 7.49

BRK+B tcm_wt 0.55 0 23.08

BTCUSD nn 0.42 2.41 3.01

ETHUSD nn wt 0.43 3.12 5.50

BZ tcm_wt 0.55 0 37.75

CL CTCM 0.38 6.70 8.42

CA tcm_wt 0.37 0 3.80

PSX nn wt 0.45 15.05 24.54

COP nn 0.39 5.88 4.01

MMM nn 0.38 6.61 13.77

UNP nn wt 0.46 28.76 31.69

XOM nn_wt 0.46 22.50 22.05

CVX nn_wt 0.38 6.79 10.87

NFLX tcm_wt 0.36 0 6.36

NVDA tcm_wt 0.37 0 8.36

GC nn 0.35 8.67 11.81

LOW ARMA(1, 1)_wt 0.36 3.45 4.89

HD nn wt 0.54 32.69 34.62

HON nn wt 0.38 4.17 16.93

KO nn_wt 0.57 38.57 44.06

PEP CTCM 0.38 2.75 7.99

NI nn 0.36 9.22 9.22

PA nn 0.37 1.24 4.73

PL ARMA(1, 1)_wt 0.39 0.71 9.22

QUAL tcm_wt 0.51 0 35.39

XRPUSD tcm_wt 0.41 0 5.93

Таблица A8. Лучшие модели для RV и значения CCD для этих моделей.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.