Моделирование и прогнозирование миграции населения с использованием данных Google Trends тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Броницкий Георгий Тимурович

  • Броницкий Георгий Тимурович
  • кандидат науккандидат наук
  • 2024, ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 123
Броницкий Георгий Тимурович. Моделирование и прогнозирование миграции населения с использованием данных Google Trends: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики». 2024. 123 с.

Оглавление диссертации кандидат наук Броницкий Георгий Тимурович

1.1 Теория миграции населения

1.2 Особенности учета миграций в национальной и международной статистиках

1.2.1 Методология учета мигрантов в России

1.2.2 Данные о внешней миграции, публикуемые национальной статистической службой (Росстат)

1.2.3 Данные о миграции, публикуемые принимаемой стороной

1.2.4 Модель увеличения частотности данных о внешней миграции

1.2.5 Данные статистического офиса Германии в помесячной частотности

1.3 Использование альтернативных источников данных для прогноза миграции

1.3.1. GPS - координаты мобильных устройств

1.3.2. Данные социальных сетей

1.3.3. IP-адреса устройств

1.4 Данные Google Trends Index

1.4.1 Использование Google Trends Index для оценки миграции в литературе

1.4.2. Подготовка данных о поисковых запросах GTI

1.4.3 Алгоритмы выбора множества поисковых запросов

1.4.4 Ограничения применения GTI

Глава 2. Моделирование миграции из России в Германию с использованием GTI

2.1 Подготовка данных для оценки миграции

2.2 Модели распределенных лагов

2.2.1. PCA - векторы по тематикам

2.2.2 Тестирование асимметрии реакции на внешние шоки

2.2.3 Сравнение предсказательной силы моделей

2.3 Средний лаг для моделей с распределенными лагами

Глава 3. Применение Google Trends для прогнозирования миграции в Германию из различных стран

3.1 Данные о миграции из различных стран в Германию

3.2 Алгоритм сбора поисковых запросов на различных языках

3.3 Моделирование миграции из различных стран в Германию

3.4 Результаты оценки миграции для различных стран в Германию

Заключение

Список литературы

Приложения

Введение

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Моделирование и прогнозирование миграции населения с использованием данных Google Trends»

Актуальность исследования

Миграция населения существенным образом влияет на демографические, экономические, социальные и иные показатели страны выбытия и прибытия мигрантов. Показатели миграции подвержены внешним шокам, таким как эпидемии, военные действия, природные катаклизмы и пр. При наступлении таких событий особенно важно иметь оценку миграций без задержки во времени. Своевременный анализ миграционных потоков, а также намерений о миграции может помочь актуализировать меры демографической политики государства. Кроме этого, данные о количестве мигрантов также необходимы для оценки и других экономических показателей, таких как численность постоянного населения, безработица, ВВП на душу населения и др. Таким образом, минимальная задержка в данных о миграции может помочь своевременно реагировать на внешние шоки, минимизируя экономические риски страны. Однако сложность сбора такой статистики (не все перемещения фиксируются в статистике), изменение в методологии сбора (Чудиновских, Степанова, 2020), отсутствие достоверных данных, а также предоставление данных о миграции с временной задержкой (в некоторых случаях задержка составляет более года) затрудняют такие оценки.

При анализе внешней миграции из России исследователи сталкиваются с двумя основными проблемами: во-первых, такие данные публикуются с задержкой, так на момент написания работы (Броницкий, Вакуленко, 2022) такая задержка достигала 5 лет, а на момент написания диссертационного исследования - более 9 месяцев; во-вторых, из-за особенностей подсчета мигрантов по данным страны убытия (Денисенко, 2012), а также изменения методологии в 2011 г. одной из целей которого был учет мигрантов, зарегистрированных по месту пребывания на 9 месяцев и более (Чудиновских, Степанова, 2020), увеличился разрыв между официальной статистикой Росстата, сравнительно с данными принимающих стран. Так, за период с 2011 по 2014 г. для эмиграции в Германию, США, Израиль из России необходимо скорректировать данные российской статистики в 3-5 раз в сторону увеличения за рассматриваемый период (Воробьева, Гребенюк, 2017).

Такие расхождения затрудняют использование данных национальной статистики о количестве выбывающих мигрантов, из-за чего авторам все чаще приходится обращаться к альтернативным источникам данных.

По мере развития информационных технологий, в литературе появилось новое направление, связанное с анализом миграционных потоков различных стран на основе цифрового следа мигрантов в сети Интернет. Такие данные открывают новые возможности для исследователей, позволяя получать оценки различных экономических показателей с меньшей задержкой во времени, а иногда и в режиме реального времени (наукастинг). В 2006 году появился сервис, предоставляющий данные о поисковых запросах в сети Интернет - Google Trends Index (GTI), позволяющий получать статистику об интересах пользователей в различных областях (медицина, связь, бизнес и экономика и многих других). Одной из первых работ в этой области является (Choi, Varian, 20121), в которой авторы отмечают большой потенциал использования данных о поисковых запросах Google Trends Index для измерения интересов экономических агентов в режиме реального времени (спроса на жилье, автомобили и т. д.). В (Jun et al., 2018) отмечается прогрессивный рост использования Google Trends за 10 лет их существования на основе метаанализа 657 статей.

Несмотря на множество работ, связанных с получением оценок экономических показателей с использованием GTI, их применение для оценки миграционных потоков только начинает развиваться: всего было найдено 10 работ по использованию GTI для оценки миграции, за исключением одной работы (Wladyk, 2017), все остальные были написаны за последние 4 года (т. е. с 2020 года), авторы которых исследовали миграцию при помощи Google Trends Index. Две из них посвящены анализу миграционных потоки России: внутренних — из Москвы в Санкт-Петербург (Fantazzini et al., 2021), а также внешних — из Таджикистана в Россию (Цапенко, Юревич, 2022). В приведенных выше исследованиях авторы обозначают ряд сложностей, возникающих при оценке миграции с использованием

1 Первая версия этой работы в виде препринта появилась 2009 году (Choi, Varían, 2009).

GTI: проблемы, как правило, связаны с доступностью данных в помесячной частотности, а также с ограничениями получаемых моделей. Так, в работе (Wladyka, 2017) автор использует альтернативные источники данных из-за невозможности исследования лаговой структуры запросов (исследование задержки во времени, проходящей между ростом поисковой активности и ростом миграции) на годовых данных, представляемых официальными статистическими службами. В работе (Böhme, 2020) исследуются исключительно годовые лаги, а в работе (Wanner, 2021) оцениваются модели с использованием только одного лага. Кроме этого, в большинстве рассматриваемых работ отбор поисковых запросов происходит экспертно, что также может влиять на качество получаемых оценок (Ormerod et al., 2014).

В рамках данного диссертационного исследования делается вклад в области исследования миграции с использованием данных Google Trends. Совершенствуется существующая методология оценки миграции, предлагается алгоритм оценки количества мигрантов из различных стран в Германию. Делаются выводы о целесообразности использования предложенных алгоритмов для оценки миграции при влиянии различных внешних факторов.

Объект, предмет исследования

Объектом исследования является международная миграция. Предметом исследования является прогнозирование миграции из различных стран в Германию с использованием данных Google Trends.

Цель и задачи исследования

Основная цель работы - создание алгоритма оценки объемов миграции населения без задержки во времени (наукастинг). В качестве источника таких данных возможно использовать данные о поисковых запросах Google Trends Index2 (GTI), опережающих данные, публикуемые официальными статистическими службами. Такой подход уже ранее применялся для прогнозирования миграции как

https://trends.google.m/trends/?geo=RU

внутренней, так и внешней (Böhme et al., 2020), в том числе и в России (Fantazzini et al., 2021; Цапенко, Юревич, 2022). В этих работах рассматриваются модели временных рядов (типа SARIMAX) с зависимой переменной — миграционный поток, а в числе объясняющих рассматриваются GTI для определенных поисковых запросов, которые, как правило, определяются экспертно. В работе предложено усовершенствование описанных ранее моделей и методов определения множества поисковых слов. На примере оценки миграции из России, Польши, Италии, Румынии, Испании, Болгарии в Германию исследуются модели наукастинга: SARIMAX, модель множественной регрессии, а также модели распределенных лагов, для которых используются поисковые индексы GTI в качестве экзогенных данных. Такие модели сравниваются с «базовыми» моделями прогноза, такими как SARIMA, ETS, модель среднего. При использовании моделей распределенных лагов проверяется гипотеза о том, что включение в модель сразу нескольких поисковых лагов увеличивает точность предсказания на вневыборочных данных. Исследование лаговой структуры обусловлено тем, что миграция происходит не в момент поискового запроса, а с некоторым лагом, необходимым на подготовку документов и принятие решения о переезде.

Можно выделить основные задачи в исследовании:

1. Разработка способа отбора ключевых слов и словосочетаний, наилучшим образом предсказывающих факт миграции. Создание метода, позволяющего отойти от экспертной оценки поисковых запросов в пользу автоматического определения множества поисковых слов;

2. Разработка и тестирование метода повышения частотности исходных данных, позволяющего получить оценку миграции в помесячной частотности, а также использовать пропущенные значения в моделях;

3. Исследование различных способов снижения размерности множества поисковых запросов с целью снизить количество объясняющих переменных и их лагов;

4. Оценка моделей миграции с включенными лагами GTI от 1 до 12 месяцев. Исследование качества прогнозов на случай миграции из России в Германию,

оценка величины среднего лага в тематиках «посольство», «учеба» и «работа», сравнение полученных значений с результатами других исследований в предметной области.

5. Тестирование асимметрии реакции миграционных потоков на рост и падение динамики поисковых запросов, а также исследование глубины лагов в периоды шоков.

6. Проверка устойчивости полученных выводов для оценки миграции на случай других стран (для оценки миграции из России, Польши, Италии, Румынии, Испании, Болгарии в Германию), разработка алгоритмов сбора поисковых запросов для мигрантов, использующих отличные от русского языки для поиска информации в сети Интернет.

Теоретическая и методологическая основа исследования

Анализ миграционных потоков из России в различные страны представлен в работах (Чудиновских, Степанова, 2020; Денисенко, 2012), в которых авторы описывают историю изменений миграционных потоков, а также преимущества и недостатки официальных данных о миграции в России. В работе (Tjaden, 2021) описываются основные способы оценки миграции с использованием данных цифрового следа в сети Интернет, некоторые из которых критикуются в работе (Чудиновских, 2018). Тем не менее растет популярность использования Google Trends Index для оценки как внешней (Wladyka, 2017; Böhme et al., 2020; Wanner, 2021; Juric, 2022; Цапенко, Юревич, 2022; Golenvaux et al., 2020), так и внутренней миграции (Fantazzini et al., 2021).

Информационная база исследования

Основой для исследования послужили данные о поисковых запросах, представляемые базой данных Google Trends Index. Для формирования множества поисковых запросов была взята база готовых эмбеддингов (предобученных моделей машинного обучения), использующие в качестве изначальной словарной базы «Национальный словарь», а также базу текстовых файлов «Википедии».

В работе также использовались данные миграционной статистики: при анализе миграции из России в Германию исследовались данные официальных статистических служб как страны выбытия (Росстат), так и страны прибытия (статистический офис Германии). Кроме этого, использовались данные организации экономического сотрудничества и развития (ОЭСР), которая публикует ежегодные данные о числе мигрантов из стран Евросоюза, а также данные службы Eurostat. Кроме официальных статистических источников, для работы также использовались помесячные данные, полученные по запросу у статистического офиса Германии. При агрегации до годовых значений такие показатели совпадают с открытыми данными.

Научная новизна исследования

На данный момент в литературе по прогнозированию миграции с помощью Google Trends не удалось найти работ, где бы предлагалось решение по автоматизированному методу сбора множества поисковых запросов, а также по агрегированию поисковых запросов и изучению их лаговой структуры:

1. В диссертационной работе предлагаются усовершенствование сбора множества поисковых запросов, которое в большинстве исследуемых работ производится экспертно (Wanner, 2021; Juric, 2022). В работе предлагается использовать методы машинного обучения (NLP), позволяющие отойти от экспертной оценки к автоматическому сбору множества запросов, характеризующих намерение мигрировать;

2. Разработан алгоритм, позволяющий увеличить частотность исходных данных о миграции от годовых до помесячных значений. В отличие от MIDAS (Mixed Data Sampling) моделей, применяемых для работы с данными смешанной частотности, такой подход позволяет исследовать лаговую структуру поисковых запросов.

3. Предложена методика агрегации ключевых поисковых запросов в индексы по тематикам запросов, которые наилучшим образом будут описывать миграцию. Тем самым рассматривается сразу группа поисковых запросов, которая характеризует различные цели миграции (трудовая, учебная и т. д.),

что позволяет уменьшить размерность при одновременном включении разных типов запросов;

4. В диссертационном исследовании производится усовершенствование существующих методов работы с лагами поисковых запросов, в том числе описанных в работе (Wanner, 2021) за счет добавления в модель сразу нескольких временных лагов GTI (модели распределенных лагов). Полученные при сравнении различных стран выводы говорят о преимуществе моделей сразу с несколькими лагами относительно моделей с только одним лагом.

5. Произведена оценка величины среднего лага по тематикам запросов, которая характеризует количество времени, проходящее с момента поиска информации в сети Интернет до момента миграции. Также был разработан алгоритм вычисления доверительного интервала для получаемых оценок среднего лага при помощи метода Монте-Карло;

6. Разработан алгоритм сбора поисковых запросов на случай анализа миграции из различных стран (исследуется миграция из шести различных стран в Германию), произведенный анализ указывает на улучшение предсказательной силы в моделях с использованием GTI. Кроме этого, показано, что модели распределенных лагов имеют лучшую предсказательную силу сравнительно с моделями, где использовались лаги по отдельности (Wanner, 2021).

Положения, выносимые автором на защиту

В работе предлагается методика оценки миграционной статистики с минимальной задержкой во времени, так называемый наукастинг статистики миграции. Хотя подобная идея и описывалась в более ранних работах, она неприменима в явном виде к показателям Росстата и статистических служб широкого круга стран.

1. Предложен алгоритм сбора множества поисковых запросов, позволяющий автоматически определять необходимые для дальнейшего прогноза поисковые слова;

2. Разработан метод повышения частотности данных за счет выделения сезонной компоненты в данных о миграции, позволяющий получить оценку помесячных показателей из годовых значений;

3. Исследованы различные эконометрические модели прогноза миграции ^АЫМА, SARIMAX, модели распределенных лагов), показано, что использование экзогенных переменных, таких как GTI по различным тематикам, улучшает предсказательную силу моделей;

4. Показано, что использование сразу нескольких лагов GTI уменьшает ошибки предсказания моделей сравнительно с моделями, в которых каждый лаг взят по отдельности;

5. Предложена методология оценки времени, проходящего от момента изменения динамики поисковых запросов до изменения миграции при помощи величины среднего лага;

6. В результате сравнения прогнозных качеств моделей на примере нескольких стран делается вывод, что в случае прогноза для периодов с внешними воздействиями (такими как эпидемия Covid-19, начало СВО в России) модель распределенных лагов показывает лучшую предсказательную силу по сравнению с SARIMAX и ETS моделями.

Теоретическая и практическая значимость исследования

Теоретические результаты диссертационного исследования заключаются в развитии научных подходов по оценке миграции с минимальной задержкой во времени (наукастинг) с использованием данных цифрового следа мигрантов в сети Интернет. Такие подходы могут быть использованы для оценки как миграционных потоков, так и других экономических показателей, в которых необходима минимальная задержка во времени. Они также могут быть использованы при подготовке изменений в методологии оценки миграции, например, при помощи

предложенных методов возможно оценить расхождения в данных о миграции за счет нелегальных мигрантов.

Также описываемые в работе подходы могут быть использованы в качестве материалов лекций для студентов, занимающихся наукастингом экономических показателей. Данные лекции помогут студентам получить знания об основных способах сбора и обработки данных, позволяющих проводить дальнейшее моделирование экономических процессов. Среди различных источников, в которых возможно получать данные о цифровом следе в сети Интернет, основной фокус производится на работе с Google Trends Index.

Практическая значимость исследования заключается в следующем: в ходе исследования была выявлена проблема недоучета данных о мигрантах в официальной статистике России, подтверждена необходимость использования «зеркального метода» оценки миграции на основе регистрируемых в странах въезда данных. При оценке количества мигрантов с использованием данных GTI необходимо использовать не только текущие данные о запросах, но одновременно и их лаги. В моделях оценки внешней миграции в различные страны возможно использовать тематики «посольство», «работа» и «учеба».

Результаты исследования могут быть приняты во внимание Главным управлением по вопросам миграции МВД России при разработке новой методологии учета мигрантов, методов сбора такой статистики, а также правительством России и профильными министерствами при разработке мер демографической политики в области миграции.

Ограничения исследования

Стоит отметить некоторые ограничения предложенных подходов, связанные с данными о миграции, а также с данными о поисковых запросах Google Trends Index и используемых моделей. Во-первых, в исследовании используются данные о совокупных потоках миграции в различные страны без выделения целей миграции (трудовая, учебная, воссоединение семей и пр.); во-вторых, возможен недоучет мигрантов в официальных статистиках, используемых для построения моделей, так

как в данных могут не учитываться мигранты с двойным гражданством, а также нелегальные мигранты; в-третьих, при использовании данных Google Trends Index для оценки миграции появляется смещение в сторону мигрантов, использующих сеть Интернет для поиска информации, кроме этого, есть ряд стран, где рассматриваемая поисковая система не используется; в-четвертых, в работе исследуется асимметрия реакций на внешние шоки (такие как пандемии и прочие кризисы), однако для большинства моделей не учитывается возможность разной скорости реакции при внешних факторах, и, как следствие, возможное расхождение полученных данных с истинными объемами миграции. Кроме этого, асимметрия может быть также вызвана тем, что экономические агенты могут искать информацию в сети Интернет из-за их широкого обсуждения с СМИ или другого события, подверженного высокой огласке среди населения, а не из-за истинного желания мигрировать; в-пятых, при обобщении полученных алгоритмов на широкий список стран используется запрос «работа в Германии» ввиду отсутствия необходимости в получении визы, однако возможно также исследовать второй тип запросов «посольство Германии» для тех стран, в которых необходимо получения визы для миграции.

Структура диссертации

Диссертационное исследование общим объемом 120 страниц состоит из введения, 3 глав, заключения, списка использованной литературы, а также приложений. Основой для первой главы является работа (Броницкий, Вакуленко, 2022), в которой описываются теоретическая и методологические основы исследования, а также основные проблемы, возникающие при использовании данных из официальных источников о миграции из России. К основным из них можно отнести задержку в публикации данных, а также недоучет мигрантов из России в официальных статистических источниках. В главе описываются используемые в диссертации данные о миграции (публикуемые как принимаемой стороной, так и страной убытия мигрантов). Приводятся методы, позволяющие подготовить данные для дальнейшего моделирования, в том числе алгоритмы увеличения частотности исходных данных о миграции. Во второй части главы

приводится обзор различных источников данных цифрового следа в сети Интернет, которые возможно использовать при моделировании миграции. Приводится анализ работ, связанных с применением данных Google Trends Index при моделировании как внешней, так и внутренней миграции. Исследуются основные преимущества и недостатки моделей оценки миграции с использованием данных цифрового следа в сети Интернет.

В основе второй главы лежит исследование (Броницкий, Вакуленко, 2024). В главе на примере миграции из России в Германию исследуются различные способы моделирования миграции с использованием данных Google Trends Index. Описываются способы понижения размерности исходных данных, позволяющие учитывать не только текущие значения поисковых индексов, но и их лаги от 1 до 12 месяцев. Сравниваются следующие типы моделей: без лагов; с лагами; по различным тематикам (таким как «работа», «учеба», «посольство») по отдельности; по всем тематикам одновременно. Кроме этого, оценивается величина среднего лага, характеризующего время, проходящее от момента поиска информации в сети Интернет до фактической миграции. Делаются выводы относительно эффективности используемых моделей в сравнении с базовыми SARIMA моделями без учета внешних данных о миграции.

Третьей главой является работа (Броницкий, 2024), которая обобщает все предыдущие работы для анализа миграции из различных стран в Германию. В главе описываются методы сбора множества поисковых слов на случай работы с различными языками. Проверяется гипотеза относительно увеличения предсказательной силы моделей оценки миграции при добавлении данных GTI, особенно в периоды внешних шоков, в которые SARIMA модели без экзогенных переменных показывают худшее качество. Также сравнивается качество моделей, с использованием запросов в нескольких тематиках с моделями, построенными по одному поисковому запросу, и его лагах.

Степень достоверности и апробация результатов исследования

Результаты проведенных исследований в рамках работы над диссертацией

были представлены к обсуждению на следующих конференциях:

• XXIV Ясинская (Апрельская) международная научная конференция по проблемам развития экономики и общества (выступление 04.04.2023). Секция демография и рынки труда. Доклад: Прогнозирование международной миграции с использованием Google трендов.

• Пятый Российский экономический конгресс 2023 (выступление 11.09.2023). Секция прикладная эконометрика. Доклад: Исследование лаговой структуры индексов Google Trends в задаче прогнозирования миграции из России.

• Седьмая конференция консорциума журналов (выступление 25.10.2023). Сессия современные методы и данные в демографическом анализе. Доклад: Применение Google Trends для прогнозирования миграции из России.

• XI международная конференция «Многомерный статистический анализ, эконометрика и моделирование реальных процессов» имени С.А.Айвазяна (выступление 25.06.2024). Секция Многомерный статистический анализ и эконометрика. Доклад: Наукастинг миграции с помощью Google Trends Index.

Основные результаты диссертационного исследования опубликованы в 3

работах общим объемом 4 п.л.; личный вклад автора составляет 3 п.л.:

• Броницкий Г. Т.(2024). Наукастинг миграции с использованием Google Trends: применение для разных стран. Population and Economics. (в печати). НИУ ВШЭ список С. Scopus Q2.

• Броницкий Г. Т., Вакуленко Е. С. (2024). Применение Google Trends для прогнозирования миграции из России: агрегация поисковых запросов и учет лаговой структуры. Прикладная эконометрика, 73. 78-101. D0I:10.22394/1993-7601-2024-73-78-101. НИУ ВШЭ список B. Scopus Q3.

• Броницкий Г. Т., Вакуленко Е. С. (2022). Прогнозирование миграции из России в Германию с использованием Google-трендов. Демографическое обозрение, 9 (3), 75-92. DOI: 10.17323/demreview.v9i3.164. НИУ ВШЭ список D.

Глава 1. Теоретическая и методологическая основы исследования миграции

1.1 Теория миграции населения

Миграция играет важную роль в формировании населения и рынков труда, при этом на сегодняшний день не существует единой теории миграции, объясняющей причины и механизмы миграции населения. Существует сразу несколько различных теорий, которые описывают факторы, влияющие на миграционные процессы. Одной из классических является теория миграции Э.Г. Равенштейна (Ravenstein, 1885), которая была разработана в конце XIX века, однако многие из факторов до сих пор остаются актуальными (а также применимы как для внутренней, так и для внешней миграции). Теория основывается на анализе большого объема статистических данных и выделяет 11 правил, которые описывают закономерности миграционных процессов. Вот некоторые из них: города притягивают мигрантов больше, чем сельская местность; большинство мигрантов — взрослые люди, семьи редко мигрируют за пределы своей страны; масштабы миграции возрастают с развитием промышленности, торговли и транспорта; главные причины миграции — экономические. Эти правила помогают понять, как и почему люди мигрируют, и могут быть использованы для прогнозирования миграционных потоков.

Наряду с законами Э.Г. Равенштейна, к классическим миграционным теориям относится также эконометрическая модель Эверетта С. Ли (Lee, 1996), которая основывается на идее, что миграция является результатом соотношения притягивающих и выталкивающих факторов в разных местах. Притягивающие факторы (например, лучшие экономические возможности, лучшее качество жизни) привлекают людей в определённое место, а выталкивающие факторы (например, бедность, политическая нестабильность) заставляют людей покидать свои родные места. Эти факторы взаимодействуют друг с другом и влияют на решение человека мигрировать. Например, если притягивающие факторы в месте назначения сильны, а выталкивающие факторы в месте выбытия слабы, то вероятность миграции высока. Однако, важно отметить, что теории Э.Г. Равенштейна и Эверетта С. Ли не

являются универсальными и могут не полностью описывать все аспекты современных миграционных процессов, особенно в контексте глобализации и изменения социально-экономических условий (Цапенко, 2007).

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Броницкий Георгий Тимурович, 2024 год

Список литературы

Айвазян С.А. (2012). Анализ качества и образа жизни населения (эконометрический подход). М: Наука, 432 с..

Броницкий Г.Т. (2024). Наукастинг миграции с использованием Google Trends: применение для разных стран. Population and Economics. (в печати).

Броницкий Г.Т., Вакуленко Е.С. (2022). Прогнозирование миграции из России в Германию с использованием Google-трендов. Демографическое обозрение, 9 (3), 75-92. DOI: 10.17323/demreview.v9i3.16471.

Броницкий Г. Т., Вакуленко Е.С. (2024). Применение Google Trends для прогнозирования миграции из России: агрегация поисковых запросов и учет лаговой структуры. Прикладная эконометрика, 73. 78-101. D0I:10.22394/1993-7601-2024-73-78-101.

Вакуленко Е.С., Цимайло В.В. (2011). Учет нелегальной миграции населения: методы и оценки. Демоскоп Weekly, 479-480.

Воробьева О.Д., Гребенюк А.А. (2017). Сравнительный анализ отечественной и зарубежной статистической информации об эмиграции граждан России. Вопросы статистики, 1 (9), 64-73.

Денисенко М.Б. (2003). Эмиграция из России по данным зарубежной статистики. Мир России: Социология, этнология. 12 (3), 157-169.

Денисенко М.Б. (2012). Эмиграция из России в страны дальнего зарубежья. Демоскоп Weekly. No 513-514.

Козлова Н.В. (2013) Лингвистические корпусы: типология и определение основных понятий. Вестник НГУ, 11 (1), 79-88.

Станкевич И.П. (2020). Сравнение методов наукастинга макроэкономических индикаторов на примере российского ВВП. Прикладная эконометрика, 59, 113-127.

Цапенко И.П. (2007). Движущие силы международной миграции населения. Мировая экономика и международные отношения, 3, 3-14. DOI: https://doi.org/10.20542/0131-2227-2007-3-3-14

Цапенко И.П., Юревич М.А. (2022). Статистика онлайн-запросов в наукастинге миграции. Экономические и социальные перемены: факты, тенденции, прогноз, 15 (1), 74-89. DOI: 10.15838/esc.2022.1.79.4.

Чудиновских О.С. (2016). Административная статистика международной миграции: источники, проблемы и ситуация в России. Вопросы статистики, 2, 32-46. DOI: https://doi.org/10.34023/2313-6383-2016-0-2-32-46

Чудиновских О.С. (2018). Большие данные и статистика миграции. Вопросы статистики, 25 (2), 48-56.

Чудиновских О.С. (2019). О пересмотре рекомендаций ООН 1998 г. по статистике и в российском контексте. Вопросы статистики, 26(8), 61-76. DOI: https://doi.org/10.34023/2313-6383-2019-26-8-61-76

Чудиновских О.С., Степанова А.В. (2020). О качестве федерального статистического наблюдения за миграционными процессами. Демографическое обозрение, 7 (1), 54-82. DOI: 10.17323/demreview.v7i1.10820.

Чудиновских О.С. (2020). Оценки масштабов нелегальной миграции в России: возможные подходы и источники информации. Вопросы статистики, 27 (1), 8-28. DOI: 10.34023/2313-6383-2020-27-1-8-28.

Юмагузин В.В. (2020) Возможности и ограничения данных сотовых операторов в изучении миграции населения. II Всероссийский демографический форум с международным участием: материалы форума (Москва, 4-5 декабря 2020г.), 267-270.

https://publications.hse.ru/chapters/422722847?ysclid=lsdlqzdcbd653699661

Akaike H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19(6), 716-723. D0I:10.1109/TAC.1974.1100705

Avramescu A., Wisniowski A. (2021). Now-casting Romanian migration into the United Kingdom by using Google Search engine data. Demographic Research, 45, 1219-1254. DOI: 10.4054/DemRes.2021.45.40.

Bengtsson L., Lu X., Thorson A., Garfield R., von Schreeb J. (2011). Improved Response to Disasters and Outbreaks by Tracking Population Movements with Mobile Phone Network Data: A Post-Earthquake Geospatial Study in Haiti. PLoS Medicine, 8 (8). DOI: 10.1371/journal.pmed.1001083.

Benson-Rea M., Rawlinson S. (2003). Highly skilled and business migrants: Information processes and settlement outcomes. International Migration, 41 (2), 5979. DOI: 10.1111/1468-2435.00235.

Böhme M., Gröger, A., Stöhr T. (2020). Searching for a better life: Predicting international migration with online search keywords. Journal of Development Economics, 142, 102347. DOI:10.1016/j.jdeveco.2019.04.002.

Cesare N., Lee H., McCormick T., Spiro E., Zagheni E. (2018). Promises and Pitfalls of Using Digital Traces for Demographic Research. Demography. 55. DOI: 10.1007/s13524-018-0715-2.

Chi G., State B., Blumenstock J.E., Adamic L. (2020). Who Ties the World Together? Evidence from a Large Online Social Network. In: Cherifi, H., Gaito, S., Mendes, J., Moro, E., Rocha, L. (eds) Complex Networks and Their Applications VIII. COMPLEX NETWORKS 2019. Studies in Computational Intelligence, 882. DOI: 10.1007/978-3-030-36683-4_37.

Choi H., Varian H. (2009). Predicting the Present with Google Trends. Technical report, Google. [Cited 1 April 2012.] Available from: http://google.com/googleblogs/pdfs/google_predicting_the_present.pdf.

Choi H., Varian H. (2012). Predicting the present with Google Trends. Economic record, 88, 2-9. DOI: 10.5018/economics-ejournal.ja.2018-34.

Cooke T., Shuttleworth I. (2017). Migration and the Internet. Migration Letters. 14. 331-342. DOI: 10.33182/ml.v14i3.347.

Deaton A. (2008). Income, Health, and Well-Being around the World: Evidence from the Gallup World Poll. The journal of economic perspectives: a journal of the American Economic Association. 22. 53-72. DOI:10.1257/jep.22.2.53.

Desroches R., Comerio M., Eberhard M., Mooney W., Rix G. (2011). Overview of the 2010 Haiti Earthquake. Earthquake Spectra. 27. S1-S21. D0I:10.1193/1.3630129.

Docquier F., Peri G., Ruyssen I. (2014). The Cross-country Determinants of Potential and Actual Migration. International Migration Review 48, S37-S99. D0I:10.1111/imre.12137.

Lee E. (1966). A Theory of Migration. Demography, 3 (1) 47-57.

Fantazzini D., Pushchelenko J., Mironenkov A., Kurbatskii, A. (2021). Forecasting internal migration in Russia using Google Trends: evidence from Moscow and Saint Petersburg. Forecasting, 3 (4), 774-803. D0I:10.3390/forecast3040048.

Gabrielli L., Deutschmann E., Natale F., Recchi E., Vespe M. (2019). Dissecting global air traffic data to discern different types and trends of transnational human mobility. EPJ Data Science, 8(1), 26.

Ginsberg J., Mohebbi M., Patel R., Brammer L., Smolinski M., Brilliant L. (2009). Detecting Influenza Epidemics Using Search Engine Query Data. Nature, 457, 1012-1014. DOI: 10.1038/nature07634.

Golenvaux N., Alvarez P., Kiossou H., Schaus P. (2020). An LSTM approach to Forecast Migration using Google Trends. DOI: 10.1145/1122445.1122456.

Holt C. (1957). Forecasting seasonals and trends by exponentially weighted averages. ONR Memorandum №52. Reprinted in the International Journal of Forecasting, 2004. DOI: https://doi.org/10.1016/j.ijforecast.2003.09.015.

Israeli O. (2007). A Shapley-based decomposition of the R-square of a linear regression. Journal of Economic Inequality, 5, 199 -212. DOI: 10.1007/s10888-006-9036-6.

Jun S., Yoo H., Choi S. (2018). Ten years of research change using Google Trends: From the perspective of big data utilizations and applications. Technological forecasting and social change, 130, 69-87. DOI: 10.1016/j.techfore.2017.11.009.

Juric T. (2022). Facebook and Google as an Empirical Basis for the Development of a Method for Monitoring External Migration of Croatian Citizens. Ekonomskipregled, 73 (2), 186-214. DOI: 10.32910/ep.73.2.2.

Kotyrlo E. (2019). Impact of Modern Information and Communication Tools on International Migration. International Migration. 58. DOI: 10.1111/imig. 12677.

Kikas R., Dumas M., Saabas A. (2015). Explaining International Migration in the Skype Network. 17-22. DOI: 10.1145/2806655.2806658.

Kim J., Sîrbu A., Giannotti F., Gabrielli L. (2020). Digital Footprints of International Migration on Twitter (pp. 274-286). DOI: 10.1007/978-3-030-44584-3_22.

Klöble K. (2021). A Behavioural Perspective on the Drivers of Migration: Studying Economic and Social Preferences Using the Gallup World Poll. 10.23661/dp4.2021.

Leysen B., Verhaeghe P. (2023). Searching for migration: estimating Japanese migration to Europe with Google Trends data. Qual Quant 57, 4603-4631. DOI: https://doi.org/10.1007/s11135-022-01560-0.

Martin Y., Cutter S., Li Z., Emrich C., Mitchell J. (2020). Using geotagged tweets to track population movements to and from Puerto Rico after hurricane Maria. Population and Environment, 1(1), 1-24.

Moise I., Zurich E., Gaere E., Merz R., Pournaras E. (2016). Tracking language

mobility in the Twitter landscape. In Proceedings of the 2016 IEEE 16th International

108

Conference on Data Mining Workshops (pp. 663-670). DOI: 10.1109/ICDMW.2016.0099.

Ormerod P., Nyman R., Bentley A. (2014). Nowcasting economic and social data: when and why search engine data fails, an illustration using Google Flu Trends. DOI: 10.48550/arXiv. 1408.0699

Pesando L., Rotondi V., Stranges M., Kashyap R., Billari F. (2020). The Internetization of International Migration. Population and Development Review. 47. DOI: 10.1111/padr. 12371.

Piorc M. (1979). Migrant labour and industrial societies. New York: CambridgeUniversity Press.

Pisarevskaya A., Levy N., Scholten P., Jansen J. (2019). Mapping migration studies: An empirical analysis of the coming of age of a research field. Migration Studies, 8(3), 455-481.

Qi H., Bircan T. (2023). Can Google Trends predict asylum-seekers' destination choices? EPJ Data Science, 12, 41. DOI: https://doi.org/10.1140/epjds/s13688-023-00419-0.

Ravenstein E. (1885) The Laws of Migration. Journal of the Statistical Society of London, 48 (2), 167-235.

Spyratos S., Vespe M., Natale F., Weber I., Zagheni E., Rango, M. (2019). Quantifying International Human Mobility Pat- terns Using Facebook Network Data. PLoS ONE, 14(10), 1-22.

State B., Rodriguez M., Helbing D., Zagheni E. (2014). Migration of professionals to the U.S.: Evidence from linkedin data. In L. M. Aiello, D. McFarland (Eds.), 6th international conference on social informatics (pp. 531-543). DOI: 10.1007/978-3-319-13734-6 37.

Subbotin A., Aref S. (2021). Brain drain and brain gain in Russia: Analyzing international migration of researchers by discipline using Scopus bibliometric data 1996-2020. Scientometrics, 126 (9), 7875-7900. DOI: 10.1007/s11192-021-04091-x.

Tiru M., Oopkaup A., Bruun M., Ahas R., Krusell S., Ilves M., Esko S. (2014). Measuring cross border mobility and transnational lifestyle between Estonia and Finland with Mobile Positioning Datasets. Economic Commission for Europe Conference of European Statisticians Work Session on Migration Statistics Chisinau, Republic of Moldova 10- 12 September 2014.

Tjaden J., Auer D., Laczko F. (2019). Linking migration intentions with flows: Evidence and potential use. International Migration, 57, 36-57.

Tjaden J. (2021). Measuring migration 2.0: A review of digital data sources. Comparative Migration Studies, 9 (1), 59. DOI: 10.1186/s40878-021-00273-x.

Tjaden J., Arau A., Nuermaimaiti M., Cetin I., Acostamadiedo E., Rango M. (2021). Using "Big Data" to forecast migra- tion—A tale of high expectations, promising results and a long road ahead'. MEDIUM. Available at https://medium. com/@UNmigration/using-big-data-to-forecast-migration-8c8e64703559.

United Nations (1980). Recommendations on Statistics of International Migration.Statistitical Papers, No. 58.Sales No.E.79.XVII.18. New York.

Vakulenko E. (2016). Does migration lead to regional convergence in Russia? International Journal of Economic Policy in Emerging Economies. No. 9(1). P. 1-25

Vakulenko E., Leukhin R. (2016). Wage Dicrimination Against Foreign Workers in Russia. Economic Policy (in Russian). 11. 121-142. D0I:10.18288/1994-5124-2016-1-08.

Van Dalen H., Henkens K. (2013). Explaining emigration intentions and behavior in the Netherlands, 2005-2010. Population Studies, 67(2), 225-241.

Vilhelmson B., Thulin E. (2013). Does the Internet Encourage People to Move? An Exploratory Study of Swedish Young Adults' Migration Experiences and Plans. Geoforum. 47. 209-216. DOI: 10.1016/j.geoforum.2013.01.012.

Wallerstein I. (1989) The Modern World-System, vol. III: The Second Great Expansion of the Capitalist World- Economy, 1730-1840's. San Diego: Academic Press.

Wanner P. (2021). How well can we estimate immigration trends using Google data?. Quality & Quantity, 55 (4), 1181-1202. DOI: 10.1007/s11135-020-01047-w.

Williams N., Thomas A., Dunbar M., Eagle N., Dobra A. (2015). Measures of human mobility using mobile phone records enhanced with GIS Data. PLoS ONE, 10(7), 1-16.

Wladyka D. (2017). Queries to Google Search as predictors of migration flows from Latin America to Spain. Journal of Population and Social Studies [JPSS], 25 (4), 312-327.

World Bank. 2015. International Migrant Stock. Data available via the Data Bank of the World Bank at: https://data.worldbank.org/indicator/SM.POP.TOTL

Yang C., Yang J., Luo X., Gong P. (2009). Use of mobile phones in an emergency reporting system for infectious disease surveillance after the Sichuan earthquake in China. Bull World Health Organ 87: 619-623.

Zagheni E., Garimella V., Weber I., State B. (2014). Inferring international and internal migration patterns from Twitter data. 439-444. DOI: 10.1145/2567948.2576930.

Zagheni E., Weber I. (2012). You are where you E-mail: Using E-mail data to estimate international migration rates. Proceedings of the 3rd Annual ACM Web Science Conference, WebSci'12. DOI: 10.1145/2380718.2380764.

Zagheni E., Weber I., Gummadi K. (2017). Leveraging Facebook's Advertising Platform to Monitor Stocks of Migrants. Population and Development Review. 43. D01:10.nn/padr.12102.

Единая межведомственная информационно - статистическая система (ЕМИСС) (2024) [электронный ресурс]: https://rosstat.gov.ru/emiss

Database of the Federal Statistical Office of Germany (2024) [электронный ресурс]: https://www-genesis.destatis.de

Eurostat (2024) [электронный ресурс]: https://ec.europa.eu

Google Trends Index (2024) [электронный ресурс]: https://trends.google.ru/trends/

Organization for Economic Co-operation and Development (OECD) (2024) [электронный ресурс]: https://stats.oecd.org

Рисунок П1. Автокорреляционная функция (ACF) для данных о миграции из России в Германию за период 01.01.2011-01.06.2020.

Autocorrelation

III. ! 1 1 t

Рисунок П2. Остатки модели АММА(1ДД) для оценки миграции из России в Германию за период 01.01.2011-01.06.2020.

Рисунок П3. Частичная автокорреляционная функция (PACF) для остатков модели АММА(1ДД) за период 01.01.2011-01.06.2020.

Partial Autocorrelation

т 1

i 1 1 i I

Приложение 2

Таблица П4. Вклад поисковых запросов в объясненную долю дисперсии, оцененный по методу Шепли для модели множественной регрессии.

Переменная Процент от

_объясненного Я2

Работа в Германии для русских 21%

Учеба в Германии 20%

Работа в Германии 12%

Работа Германия 12%

Работа в Германии вакансии 11%

Посольство Германии 11%

Посольство Германии в Москве 5%

Шенгенская виза в Германию 2%

Работа в Германии для русских вакансии 1%

Пмж в Германии 1%

Жилье в Германии 1%

Работа в Германии без знания языка 0%

Вид на жительство в Германии_0%_

Таблица П5. Оценки моделей распределенных лагов (2) для различных поисковых

запросов.

Переменная Лаг, РСА по РСА с РСА- РСА- РСА- А1С-критерий

мес. тематикам фиктивной вектор вектор вектор «учеба»,

переменно «посольст «учеба» с «работа» с «работа»,

й во» с лагами лагами «посольство»

лагами

Константа 1.49 -9.42 -39.62 -40.18 -41.49 -63.43

(65.30) (66.05) (55.15) (76.67) (56.97) (60.68)

РСА-вектор 0 -174.33*** -161.21** -177 98*** -286.96***

«посольство» (56.48) (61.80) (56.57) (56.47)

1 -212.96*** -286.96***

(57.94) (56.47)

2 -223.17*** -138.62**

(58.19) (62.66)

3 -102.92* -144.19**

(54.00) (58.99)

9 104.09* 124.52**

(55.26) (56.17)

10 165.59***

(50.90)

11 108.38**

(49.03)

РСА-вектор 0 39.54 52.34

«учеба» (50.04) (53.57)

5 137.99**

(63.55)

11 -139.21*** -123.51***

(52.35) (42.51)

РСА-вектор 0 -88.95* -87.46* -113.81**

«работа» (48.49) (47.07) (46.84)

1 -128.53***

(45.71)

2 -120.33***

(43.49)

6 -101.93**

(48.22)

7 -133.07*** -85.27*

(46.66) (45.76)

9 93.54** 71.91

(44.08) (43.50)

10 129.58***

(40.13)

11 129.45***

(36.66)

Фиктивная

переменная:

GTI

«посольство» больше 95%-

2399.77* (1272.64)

го

перцентиля

(Фиктивная 778.50*

переменная)* (462.38)

(PCA-вектор «посольство»

)

Наблюдений 92 92 80 80 80 80

AIC 1449 1449 1226 1273 1231 1240

BIC 1459 1464 1245 1281 1253 1259

R2 0.19 0.22 0.58 0.14 0.56 0.50

F Statistic 6.82*** 4.91*** 14.15*** 6.34*** 11.52*** 10.43***

Средний лаг 5.6 8.0 6.5 Посольство -

[95%-ный [3.64;7.92] [5.36;10.8] [4.72;8.21] 4.3

доверительн [2.45;7.18].

ый интервал] Учеба - 11а). Работа - 7.9 [7.01;8.98]

Примечание. Значимость коэффициентов модели: *** — p <0.01, ** — p <0.05, * — p <0.1. В

круглых скобках представлены стандартные ошибки.

а) При включении в модель единственного лага, величина среднего лага (3) не является случайной величиной, поэтому доверительный интервал для нее оценить невозможно.

Приложение 4

Рисунок П6. Распределение величины среднего лага для тематики «работа» модели распределенных лагов, полученное в результате применения метода Монте-Карло.

Рисунок П7. Распределение среднего для величины среднего лага, оцененное методом бутстрэп.

Приложение 5

Таблица П8. Описательная статистика данных о миграции в Германию из других стран, показатель «прибытия иностранцев» за период 2006-2023 гг.49

Число наблю

Страна дений Min Max Std Mean

Бельгия 209 - 571 101 283

Болгария 209 380 9 153 2 213 4 854

Франция 209 522 2 840 524 1 267

Греция 209 - 3 959 888 1 872

Италия 209 904 8 124 1 764 3 680

Хорватия 209 381 6 911 1 627 2 304

Мальта 209 - 83 12 12

Нидерланды 209 562 1 362 149 880

Австрия 209 542 2 164 239 985

Польша 209 4 060 22 557 3 971 11 835

Португалия 209 221 1 410 240 679

49 Выбраны страны, для которых было зарегистрировано более 200 миграций в Германию за месяц в период с 01.01.2023 по 01.06.2023

Румыния 209 976 24 341 6 634 12 285

Швеция 209 - 688 97 254

Словакия 209 - 1 789 297 933

Испания 209 - 5 598 1 012 1 805

Чешская республика 209 236 1 588 253 786

Венгрия 209 957 6 349 1 268 3 128

Босния и Герцеговина 209 - 2 732 695 1 316

Северная Македония 18 - 2 628 472 119

Российская Федерация 209 305 3 692 574 1 461

Швейцария 209 190 945 149 468

Сербия 209 - 5 342 1 022 1 837

Турция 209 1 063 9 751 1 457 2 983

Великобритания 209 - 2 094 390 975

Ливан 209 - 2 087 246 340

СЕ Пакистан 209 97 4 400 552 531

X т <£ Филиппины 209 57 839 146 212

Сирия 74 - 9 960 1 879 838

Вьетнам 209 - 1 131 175 419

Египет 209 97 1 445 255 379

го Алжир 209 - 1 757 229 243

^ Марокко 209 161 2 182 258 463

^р < Нигерия 209 - 1 317 276 340

Сомали 209 - 1 178 254 207

Тунис 209 94 929 182 335

го ^ Бразилия 209 286 1 896 313 701

Колумбия 209 54 651 136 229

^р ш 2 Венесуэла 209 - 399 72 84

< США 209 - 3 808 778 1 583

Таблица П9. Таблица корреляций данных о миграции из различных стран в Германию с данными о поисковых запросах и их лагах от 1 до 12 месяцев (в скобках) за период с 01.01.2013 - 06.01.2023гг. Данные о миграции, а также

данные о поисковых запросах приведены в сезонных разностях с периодом в 12 месяцев.

Лаг, меся ц Польша (Niemcy praca) Италия (Lavoro in Germania) Румыния (Locuri munca Germania) Испания (Ofertas trabajo Alemania) Болгария (Работа в Германия) Россия (Работа в Германии)

0 0,47 0,39 0,21 0,01 0,34 -0,04

1 0,36 0,43 0,18 0,14 0,36 -0,07

2 0,39 0,47 0,12 0,14 0,38 -0,03

3 0,29 0,46 0,02 0,07 0,25 -0,05

4 0,32 0,48 -0,02 0,02 0,17 0,01

GTI «Работа в Германии» 5 0,31 0,51 -0,02 0,19 0,08 0,01

на языке 6 0,25 0,53 -0,01 0,27 0,10 -0,10

страны мигранты 7 0,16 0,54 0,01 0,17 0,13 -0,11

8 0,14 0,57 0,09 0,20 0,08 -0,09

9 0,12 0,55 0,16 0,26 0,07 -0,05

10 0,08 0,55 0,12 0,24 0,08 -0,07

11 0,02 0,54 0,07 0,01 0,10 -0,17

12 -0,14 0,55 0,08 -0,05 -0,01 -0,19

Таблица П10. Оценки SARIMAX моделей для 2-х летнего контрольного периода.

Лаг,

меся ц

Польша Италия Румыния Испания Болгария Россия

Спецификация модели SARIMAX(p, 4 q)x(P, D, Q, S)

(1, 1, 1)х (0, 1, 0)х (1, 1, 1)х (0, 1, 1)х (0, 1, 1, 1 (0, 1, 1, 1 (0, 1, 1, 1 (0, 1, 1, 1

А

А

Ж

(1, 1, 1)х (0, 1, 0)х (0, 1, 1, (0, 1, 1, 1

_2)_

GTI «Работа в Германии»

0 1

2

3

4

5

6

7

8

9

10 11 12

1187.5*** (287.66)

555.29 (340.25)

1343.5*** (408.77)

414.50** (167.34)

265.34** (131.96)

618.99*** (236.81)

-187.42** (94.46)

274.13 (279.53)

306.58** (148.15)

94.14 (167.12)

-1.21 (147.45)

16.47 (106.12) -41.92 (100.58) 13.40 (79.98)

281.14

- 46.70 (35.11)

Число

наблюдений 114 114 114 114 114 114

А1С 1746 1579 1834 1451 1620 1438

В1С 1767 1572 1840 1469 1638 1446

Примечание: Значимость коэффициентов модели: *** p <0.01, ** p <0.05, *p <0.1. В скобках представлены стандартные ошибки.

Таблица П11. Оценки качества моделей распределенных лагов моделей для 2-х летних контрольных периодов (01.06.2021 - 01.06.2023, а также 01.06.2020 -01.06.2022).

Метрики качества моделей MAPE (MAE) на тестовой выборке Модель

распределенных SARIMAX SARIMA

лагов

2021 - 2020 - 2021 - 2020 - 2021 - 2020 -

2023 2022 2023 2022 2023 2022

Польша 0.18 0.28 0.08 0.59 0.29 0.34

(1466.5) (2178.5) (638.3) (4570.4) (2386.2) (2549.7)

Италия 0.13 0.30 0.14 0.37 0.20 0.49

(479.7) (904.9) (534.9) (1274.6) (688.3) (1666.4)

Румыния 0.11 0.16 0.11 0.41 0.14 0.36

(1782.6) (2534.7) (1844.9) (6492.3) (2320.7) (5667.9)

Испания 0.12 0.25 0.08 0.55 0.09 0.59

(304.8) (487.9) (178.3) (1083.4) (184.4) (1158.1)

Болгария 0.13 0.16 0.09 0.18 0.10 0.16

(723.5) (994.8) (518.1) (1134.7) (574.2) (1005.3)

Россия, однозапросная модель Россия, мультизапросна я модель 0.38 (826.5) 0.22 (436.9) 0.52 (555.4) 0.17 (184.1) 0.42 (897.1) 0.63 (748.5) 0.79 (1258.7) 0.66 (778.7)

Приложение 9

Таблица П12. Оценки моделей распределённых лагов (6) для 3-х летнего контрольного периода._

Лаг, месяц Польша Италия Румыния Испания Болгария Россия

Константа -533.9*** 88.8 1095.4** * -68.4 379.5*** -74.3

(154.5) (77.1) (298.4) (48.8) (99.6) (73.8)

0 1 2 3 4 896.7** 1416.8** * 446.7***

(323.7) (459.7) (144.1)

820.9** 509.9***

(337.7) (145.1)

268.4**

(116.1)

5 6 7 670.1*

GTI «Работа в (293.97)

Германии» 250.4*

(142.5)

8 488.2*** 167.8* -184.3**

(156.9) (106.4) (92.9)

9 153.9

(101.8)

10 587.1** 320.5** 176.5*

(243.2) (139.2) (97.5)

11

12 854.3**

(429.9)

Число

наблюдений 90 90 90 90 90 90

А1С 1567 1445 1685 1331 1476 1434

В1С 1579 1453 1693 1343 1486 1439

R2 0.39 0.47 0.11 0.15 0.26 0.04

F-статистика 14.11*** 38.2*** 5.28** 3.77*** 10.3*** 3.93**

Средний лаг, 5.2 [2.8;8.6] 8.7 [8.02;9.5] 6.9 [4.8;9.0] 3.2

95% дов.интервал 12.050 [2.01;5.47 ] 8.0

Примечание: Значимость коэффициентов модели: *** p <0.01, ** p <0.05, * p <0.1. В скобках представлены стандартные ошибки.

50 При включении в модель единственного лага, величина среднего лага (3) не является случайной величиной, поэтому доверительный интервал для нее оценить невозможно.

Таблица П13. Оценки SARIMAX моделей для 3-х летнего контрольного периода.

Лаг, меся

ц

Польша Италия Румыния Испания Болгария Россия

Спецификация модели SARIMAX(p, 4 q)x(P, D, Q, S)

(0, 1, 1)х (1, 1, 1)х (1, 1, 1)х (0, 1, 1)х (0, 1, 1, 1 (0, 1, 1, 1 (0, 1, 1, 1 (0, 1, 1, 1

2)

2)

2)

2)

(1, 1, (0, 1, 1, 12)

(1, 1, 1)х (0, 1, 1, 1 2)

GTI «Работа в

0 1 2

3

4

5

6

1221.0*** (283.3)

872.3* (377.2)

1252.1*** (481.1)

377.7** (169.3)

263.7** (137.3)

-182.4** (90.7)

664.6** (236.81)

Германии» 7 86.8

(145.8)

8 311.1* 18.5 -44.5

(138.0) (92.1) (38.1)

9 -60.8

(89.6)

10 -112.5 143.1 3.57

(273.8) (190.8) (69.6)

11

12 293.4

(550.5)

Число

наблюдений 102 102 102 102 102 102

AIC 1538 1366 1610 1281 1426 1290

BIC 1545 1381 1625 1270 1444 1283

Примечание: Значимость коэффициентов модели: *** p <0.01, ** p <0.05, * p <0.1. В скобках представлены стандартные ошибки.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.