Интеллектуальная система поддержки принятия решений на основе ансамблевых методов машинного обучения для прогнозирования проблемных состояний тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Фирюлина Мария Андреевна

  • Фирюлина Мария Андреевна
  • кандидат науккандидат наук
  • 2022, ФГБОУ ВО «Воронежский государственный технический университет»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 154
Фирюлина Мария Андреевна. Интеллектуальная система поддержки принятия решений на основе ансамблевых методов машинного обучения для прогнозирования проблемных состояний: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГБОУ ВО «Воронежский государственный технический университет». 2022. 154 с.

Оглавление диссертации кандидат наук Фирюлина Мария Андреевна

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИЗА СОВРЕМЕННЫХ ПОДХОДОВ К РАЗРАБОТКЕ МОДЕЛЕЙ И АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ ПРОБЛЕМНЫХ СОСТОЯНИЙ

1.1 Общая постановка задачи прогнозирования проблемных состояний

1.2 Анализ современный: подходов к решению задач прогнозирования проблемны1х состояний

1.3 Описание процесса построения систем поддержки принятия решений при

прогнозировании проблемны1х состояний

1.4 Цели и задачи исследования

1.5 Выводы по главе

ГЛАВА 2. РАЗРАБОТКА АЛГОРИТМИЧЕСКОЙ ОСНОВЫ СППР С ИСПОЛЬЗОВАНИЕМ АНСАМБЛЕВЫХ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ

2.1. Поиск внутренних и внешних прогностических факторов, влияющих на возникновение проблемной ситуации и первичным анализ их причинно-

следственны1х взаимосвязей

2. 2. Построение ансамблевых моделей машинного обучения

2.3 Разработка и применение методов балансировки данны1х

2.4 Вышор метрик для проведения выиислительного эксперимента

2.5 Выбор методов визуализации и интерпретации результатов

прогнозирования

2.6. Выводы по главе

ГЛАВА 3. РАЗРАБОТКА СППР ДЛЯ МИС «SMARTCARDЮ» НА ОСНОВЕ АНСАМБЛЕВЫХ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ПРОГНОЗИРОВАНИЯ ПРОБЛЕМНЫХ СОСТОЯНИЙ

3.1 Прогнозирование динамики ИМ в регионе

3.2 Прогнозирование стационарной летальности после ИМ

3.3 Прогнозирование годичной выживаемости после ИМ на основе модели временного квилтинга

3.4 Прогнозирование развития сердечной аритмии определенного вида

3.5 Прогнозирование эффективности терапии гипертонической болезни

3.6 Прогнозирование комплаентности пациентов с сердечно-сосудистыми заболеваниями

3.7 Программная реализация интеллектуальной СППР для информационной системы диагностики и лечения кардиологических заболеваний

3.8 Выводы по главе

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ВВЕДЕНИЕ

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Интеллектуальная система поддержки принятия решений на основе ансамблевых методов машинного обучения для прогнозирования проблемных состояний»

Актуальность темы исследования.

Зачастую в сложных системах критическому состоянию предшествует то или иное отклонение от нормы в течении даже короткого времени - такое состояние системы будем называть проблемным. Задача прогнозирования проблемных состояний (ЗППС) актуальна для самых разных областей (в системах экологического мониторинга необходимо прогнозировать неблагоприятное развитие экологической ситуации; в медицинских системах на основе прогнозирования развития заболевания можно предсказать его обострение или смертельный исход; в технических системах данная задача связана с прогнозированием отказов оборудования), а ее решение лежит в основе формирования управляющих воздействий, позволяющих вернуть систему в норму или, по крайней мере, минимизировать возникшие отклонения. В общем случае, задача прогнозирования проблемных состояний используется для распознавания критических ситуаций, связанных с угрозой дестабилизации нормального состояния объектов.

ЗППС составляют особый класс, отличающийся от других классов задач прогнозирования тем, что при формировании прогнозов учитывается не только предшествующая динамика временного ряда, но существенная роль отводится выявлению и системному анализу факторов, которые привели к развитию проблемного состояния, а также поиску значимых паттернов признаков, которые способствуют построению точных прогнозов. Поскольку точность прогнозирования является важным фактором при разработке алгоритмов решения ЗППС, базовым аппаратом для этого могут быть выбраны ансамблевые методы машинного обучения, которые на сегодняшний день обладают самой высокой прогностической производительностью.

Начатая в последние годы лет цифровизация различных сфер деятельности

привела к тому, что на текущий момент в них накопились достаточно большие массивы данных, доступные для точного и полного анализа, позволяющие использовать современные алгоритмы машинного обучения для разработки интеллектуальных систем поддержки принятия решений (СППР). Применение таких методов закладывает основу для развития высокопроизводительных технологий управления, которые будут основаны на данных и уменьшат зависимость от человеческого фактора.

Таким образом, актуальность данного исследования определяется необходимостью концептуализации и усовершенствования ансамблевых методов машинного обучения в составе СППР для прогнозирования проблемных состояний в сложных системах.

Степень разработанности темы исследования.

В области построения интеллектуальных СППР принято использовать концепции построения автоматизированных информационных систем, представленные в работах А.О. Недосекина, В.Н. Буркова, Г.С. Поспелова, А.А. Дородницына, Д.А. Новикова, А.В. Щепкина, С.Л. Подвального, В.Д. Кондратьева М.А. Айзермана, Н. Нильсона, Т.М. Леденевой, С. А. Юдицкого и других.

Задача прогнозирования проблемных состояний рассматривалась в работах И. А. Биргера, В.И. Круглова, Л.Г. Евланова, Я.Е.Львовича, Л.С. Ломакиной и других. Однако в работах этих авторах она не выделялась в отдельный класс, предполагающий разработку специализированного инструментария на основе методов машинного обучения для ее решения. Информационная система, включающая комплекс таких алгоритмов, в постоянном режиме может осуществлять мониторинг прогностических факторов, обучаясь по мере поступления новых данных. Следствием работы такой системы с момента накопления большого массива данных будет получение новых знаний и закономерностей в отношении влияния различных

факторов на развитие проблемных ситуаций в конкретной предметной области.

Цель и задачи исследования. Целью диссертационной работы является разработка интеллектуальной системы поддержки принятия решений, включающей комплекс ансамблевых алгоритмов машинного обучения для повышения эффективности решения задач прогнозирования проблемных состояний.

Для достижения поставленной цели необходимо решить следующие задачи:

1. На основе системного анализа выделить основные этапы построения интеллектуальных СППР для прогнозирования проблемных состояний, общие для различных предметных областей, и определить пути повышения качества решения данной задачи.

2. На основе подходов машинного обучения сформировать алгоритмический аппарат для выявления закономерностей влияния различных факторов на возникновение проблемных состояний, улучшения качества обработки информации на основе повышения точности за счет применения стратегий балансировки данных, а также обеспечения объяснимости результатов за счет повышения уровня интерпретируемости.

3. На основе разработанной алгоритмической базы разработать структуру и программную реализацию подсистемы интеллектуальной поддержки принятия решений для прогнозирования проблемных ситуаций в составе медицинской информационной системы для наблюдения кардиологических пациентов на базе современных телемедицинских технологий.

Научная новизна. Получены следующие научные результаты, характеризующееся научной новизной:

— формализованная процедура разработки интеллектуальной системы поддержки принятия решений на основе ансамблевых методов машинного обучения, отличающаяся способом формирования основных этапов решения задачи

прогнозирования проблемных состояний и позволяющая повысить производительность прогнозных моделей;

— комплекс методов для выявления значимых признаков, влияющих на возникновение проблемных ситуаций и их причинно-следственных взаимосвязей, отличающийся совместным использованием специализированных методов машинного обучения, методов статистического анализа и метода нейросетевой кластеризации на основе карт Кохонена, позволяющий строить интерпретируемые визуализации результатов прогнозирования с использованием SHAP-анализа;

— ансамблевая модель прогнозирования зависящего от времени риска наступления проблемной ситуации на основе подхода временного квилтинга, объединяющая базовые модели для создания достоверной функции выживаемости, демонстрирующей высокую точность в различных временных горизонтах за счет откалиброванного переключения между базовыми моделями с использованием пользовательской функции оценки ошибки калибровки;

— комплекс интеллектуальных ансамблевых алгоритмов машинного обучения в составе медицинской информационной системы <^тайСаМю», охватывающих все основные этапы взаимодействия с кардиологическими пациентами и позволяющих на основе выявленных значимых признаков прогнозировать такие проблемные ситуации, как развитие инфаркта миокарда (ИМ), стационарную летальность после ИМ, риск смерти в течение года после ИМ, развитие аритмии, неэффективный результат назначенного лечения, несоблюдение пациентом предписаний врача, для планирования профилактических мероприятий.

Теоретическая и практическая значимость работы. Теоретическая значимость заключается в разработке новых ансамблевых моделей машинного обучения, учитывающих специфику ЗППС и позволяющих повысить точность базовых методов ее решения. Практическая значимость состоит в том, что

разработанные методы, модели, алгоритмы и соответствующее программное обеспечение составили основу построения системы интеллектуального анализа данных и поддержки принятия решений «SmartCardio». Использование элементов данной системы в медицинской практике позволяет значительно повысить эффективность диагностических, лечебных и профилактических мероприятий.

Реализация и внедрение результатов работы. Материалы диссертации в форме СППР в задачах диагностики, сопровождения и лечения сердечно-сосудстых заболеваний, используются в работе кардиологического отделения Воронежского областного клинического консультативно-диагностического центра. Теоретические результаты диссертационной работы внедрены в учебный процесс ФГБОУ ВО Воронежского государственного университета.

Методология и методы исследования. Для решения поставленных задач использовались методы системного анализа, принятия решений, теории вероятностей и математической статистики; принципы математического моделирования; технологии машинного обучения и искусственных нейронных сетей; методы обработки и хранения данных в СУБД. Построение моделей машинного обучения и графическое представление результатов производилось на высокоуровневом языке программирования Python версии 3.8. Для хранения и обработки медицинских данных была использована СУБД MS SQL Server 2016. Программный комплекс был разработан в среде Miсrоsоft Visual Studw C#. Веб-приложение было разработано с помощью платформы .NET Framework 4.6.1 и Angular 6.0.2.

Степень достоверности и апробация работы. Результаты исследования показали их воспроизводимость в различных условиях, непротиворечивость аналогичным результатам, полученным другими исследователями в области разработки интеллектуальных систем предсказательной аналитики. Основные положения и научные результаты диссертации докладывались и обсуждались на

следующих конференциях: Международная научно-техническая конференция: «Актуальные проблемы прикладной математики, информатики и механики» (2016, 2017, 2018 2019, 2020, 2021), Всероссийская научно-практическая конференция «Актуальные вопросы эксплуатации систем охраны и защищенных телекоммуникационных систем» (2018), V Всероссийской научно-практическая конференция c международным участием «Современные проблемы физико-математических наук» (2019), XIX международная научно-методическая конференция «Информатика: проблемы, методология, технологии» (2019), XX международная научно-методическая конференция «Информатика: проблемы, методология, технологии» (2020), Международная конференция «24th international conference on soft computing and measurements» (2021), Международная конференция «22nd International Conference on Data Analytics and Management in Data Intensive Domains, DAMDID/RCDL» (2020).

Публикации. Основные результаты диссертационной работы опубликованы в 22 научных статьях. Из них 12 статей входят в Перечень ведущих научных журналов, рекомендуемых ВАК для опубликования основных научных результатов диссертаций, в том числе 4 проиндексированы в SCOPUS. Имеется 3 свидетельства о государственной регистрации программ для ЭВМ. В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежат все результаты, представленные в списке основных результатов работы.

Гранты. Исследование поддержано грантом РФФИ № 20-37-90029 Аспиранты «Разработка и исследование методов машинного обучения в задачах диагностики и сопровождения пациентов с заболеваниями сердечно-сосудистой системы»

Структура и объем работы. Диссертация состоит из введения, 3 глав с выводами, заключения, приложения и списка литературы из 124 наименований. Основная часть работы изложена на 144 страницах, содержит 55 рисунков и 14 таблиц

ГЛАВА 1. АНАЛИЗА СОВРЕМЕННЫХ ПОДХОДОВ К РАЗРАБОТКЕ МОДЕЛЕЙ И АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ ПРОБЛЕМНЫХ СОСТОЯНИЙ

1.1 Общая постановка задачи прогнозирования проблемных состояний

Задача прогнозирования проблемных состояний возникает при разработке широкого класса информационных систем и используется для распознавания критических ситуаций, связанных с угрозой дестабилизации нормального состояния объектов.

Зачастую, отсутствие своевременных мер по устранению проблемы, может привести к критическому состоянию. Таким образом, отклонение от нормы даже за небольшой промежуток времени может способствовать аварийной ситуации. Прогнозирование проблемного состояния поможет избежать критической точки [1].

Задача прогнозирования проблемных состояний может применяться в различных сферах: по параметрам химических элементов спрогнозировать свойства получаемого соединения и оценку неблагоприятного воздействия на окружающую среду; в задачах медицинского характера на основе прогнозирования развития заболевания можно предсказать его обострение или смертельный исход; в системах управления производством данная задача связана с прогнозированием отказов оборудования; в физике применение возможно в прогнозировании показателей работы реактора по данным телеметрии и предотвращении его неисправности [2- 4]. Таким образом, решение задачи прогнозирования проблемной ситуации актуально во многих областях. Конечные пользователи систем хотят знать, что, скорее всего,

произойдет в будущем, и, что еще важнее, определить действия, которые они могут предпринять, чтобы предотвратить проблемные состояния.

Можно сформулировать общую постановку задачи прогнозирования проблемных состояний, которая заключается в способности к обобщению и выделению скрытых зависимостей между входными факторами и конечным состоянием системы, с целью распознавания критических ситуаций, связанных с угрозой дестабилизации нормального состояния объектов. Решение лежит в основе формирования управляющих воздействий, позволяющих вернуть систему в норму или, по крайней мере, минимизировать возникшие отклонения.

Задачи прогнозирования проблемных состояний составляют особый класс, выделяющийся из общего класса задач прогнозирования. В основе решения задачи лежит поиск и системный анализ признаков, которые способствуют развитию проблемного состояния и поиск значимых паттернов признаков, которые способствуют построению точных прогнозов. Таким образом, важен не только результат прогнозирования, а понимание того, какие показатели повлияли на прогноз.

Выделяют следующие подходы к постановке задачи прогнозирования проблемной ситуации: рассмотрение ее как классификации, или регрессии.

Под задачей классификации подразумевается построение правил, по которым можно отнести объект к определенному классу, причем множество классов заранее определено. Класс - это множество объектов, характеризующиеся одинаковыми или схожими свойствами. Обычно выделяют классы: 0 - прогнозируется стабильное состояние, 1 - прогнозируется проблемное состояния. Примером являются различные системы принятия постановки диагноза в рамках медицинских информационных систем [5].

В задаче регрессии по заданным значениям входных переменных необходимо получить значение выходного параметра. Результатом является значение

непрерывного вещественного показателя (или нескольких показателей). Требуется установить количественную взаимосвязь между показателем и факторами. Регрессия применяется в случаях, когда проблемное состояние характеризуется изменением значений непрерывного параметра. Примером является работа [6], в которой описывается система прогнозирования оттока кадров кадров с целью улучшения работы предприятия.

Также существует класс задач, в которых прогнозируется риск возникновения проблемной ситуации, то есть одновременно решается и задача регрессии (прогнозирования вещественной оценки риска) и задача классификации (на основе сравнения с пороговым значением риска) [7, 8].

1.2 Анализ современных подходов к решению задач прогнозирования проблемных состояний

Увеличение возможностей вычислительной техники и прогресс в области сбора, передачи и обработки разно форматных данных, способствовали накоплению большого массива данных, необходимых для анализа. В настоящий момент актуальны современные методы обработки данных. Интеллектуальные системы анализа данных позволяют минимизировать затраты в процессе принятия решений на этапе анализа данных и настройки алгоритмов. Преимущество таких систем в том, что они позволяют не только решать поставленные задачи, но и выявлять причинно-следственные связи и скрытые закономерности [9, 10].

Интеллектуальные системы поддержки принятия решений (СППР) в задачах прогнозирования проблемных состояний широко используются в различных приложениях для принятия решений. Для реализации этих СППР требуются алгоритмы машинного обучения, разнообразные парадигмы, и среды

программирования. Алгоритмы машинного обучения и прогнозирования широко распространены в природе и дают наиболее точные результаты. Таким образом, специалистам-практикам и лицам, принимающим решения, требуются интеллектуальные научные методологии, такие как подходы эмпирической оценки и машинного обучения с использованием многокомпонентного обучения, статистических и теоретико-информационных методов, ориентировочных методов и методов сложности, чтобы они могли выбрать наиболее подходящие алгоритмы обучения и прогнозирования проблемных ситуаций [11, 12].

В основе систем прогнозирования проблемных состояний используются математические алгоритмы и методы [13]. В течение последнего десятилетия увеличение вычислительной мощности и усовершенствованные алгоритмы привели к внедрению машинного обучения в качестве альтернативы традиционным регрессионным моделям для анализа больших массивов данных. Роль машинного обучения стремительно растет, и растущее количество данных указывает на то, что она станет движущей силой новых инструментов. Маловероятно, что модели машинного обучения полностью заменят специалистов конкретной области. Вместо этого СППР может стать инструментом, который квалифицированный персонал будет использовать для расширения своих возможностей, принятия более точных и быстрых решений, во избежания наступления проблемного состояния.

Системы интеллектуальной поддержки принятия решений в задачах прогнозирования проблемных состояний применяются в различных сферах человеческой деятельности. [14-16]. Ниже приведены краткие описания некоторых из них.

Возможность объединять информацию из различных источников и смешивать различные точки зрения для создания однозначных прогнозов проблемных ситуаций является ключевым первым шагом к стратегическому, оперативному и тактическому

планированию в масштабах предприятия [17]. В исследовании [18] описан инструмент поддержки принятия решений для установления ответственности за аварии двух транспортных средств на основе сгенерированных самоорганизующихся карт признаков и моделей интеллектуального анализа данных. Авторы методики [19] предлагают открытую и распределенную архитектуру системы поддержки принятия клинических решений. Эта техническая архитектура использует преимущества электронной медицинской карты (EHR), методы интеллектуального анализа данных, клинические базы данных, базы знаний экспертов в предметной области, доступные технологии и стандарты для поддержки принятия решений медицинскими работниками.

Реальные системы поддержки принятия решений при прогнозировании проблемного состояния требуют рассмотрения и анализа множества критериев, которые, в свою очередь, влияют на окончательные решения. Критерии часто носят противоречивый характер. Следовательно, лицам, принимающим решения, необходимы научные подходы для выполнения такой сложной оценки. Исследователи, занимающиеся проектированием и разработкой СППР, стремятся продемонстрировать инновационные научные методы, инструменты и модели, которые улучшают качество и точность предполагаемых решений. Несколько примеров таких методов и инструментов включают многоатрибутное принятие решений, многоатрибутную теорию полезности, опережение, анализ чувствительности, систему исследования приблизительных наборов, адаптивные методы рассуждений [20].

Так как исходные данные могут быть представлены в различном формате: записи на естественном языке, реестры баз данных, изображения или звуковые сигналы, это приводит к увеличению количества данных и времени на их обработку [21]. Как правило, существующие СППР делятся на две основные категории. Первая

категория включает методы, которые анализируют структурированные данные. Вторая категория включает методы обработки естественного языка (Natural Language Processing, NLP), которые извлекают информацию из неструктурированных данных. Процедуры NLP нацелены на превращение текстов в машиночитаемые структурированные данные, которые затем могут быть проанализированы с помощью методов машинного обучения.

Как уже было отмечено, машинное обучение (МО) является ключевой технологией для систем поддержки принятия решений и приобретает все большее значение в исследованиях и практике. Хотя большая часть исследований сейчас сосредоточена на технических реализациях и адаптации алгоритмов машинного обучения к предметным областям, факторы проектирования машинного обучения, влияющие на эффективность системы поддержки принятия решений, все еще недостаточно изучены. В статье [22] проведен обзор 52 исследований, чтобы лучше понять машинное обучение и его использование в СППР, в период с 1994 по 2013 год в основных изданиях по информационным системам. Полученные данные свидетельствуют о том, что эффективность выбранного метода машинного обучения для поддержки лиц, принимающих решения, зависит от задачи, этапа принятия решения и применяемых технологий. Наиболее часто применяемыми методами МО на сегодня являются искусственные нейронные сети, метод опорных векторов, деревья решений.

Как и любой статистический метод или инструмент, применяемый на практике, важно понимать сильные стороны, ограничения, возможности и риски. Основная массовая проблема внедрения машинного обучения - это то, что имеются риски, которые могут привести к потенциально неточным результатам. В последнее время методы интеллектуализации процессов принятия решений являются довольно часто обсуждаемой темой, разворачивается полемика о том, заменят ли СППР людей. В

целом системы подобного рода полностью не могут быть внедрены в тех сферах, где требуется экспертное мнение, но определенно могут помочь принимать более обоснованные решения или даже заменить человеческие суждения в определенных функциональных областях. Система прогнозирования проблемных состояний может помочь уменьшить ошибки, которые неизбежны в практике, а также предоставлять актуальную информацию из банка данных [17]. СППР обрабатывает необходимую информацию из большого числа архивных данных, чтобы помочь сделать выводы в реальном времени для предупреждения о риске и прогнозирования результатов.

Существует множество методов машинного обучения, используемых для разных целей и задач. Выделяют два типа методов: ориентированные на проверку (система проверяет гипотезу пользователя) и ориентированные на обнаружение (система находит новые правила и шаблоны автономно). Методы обнаружения — это те, которые автоматически определяют закономерности в данных, в том числе задача прогнозирования проблемных состояний [23]. Прогностическая информация, полученная в результате интеллектуального анализа данных, может быть дополнительно использована с помощью анализа в реальном времени и принятия решений, а также с помощью управляемого человеком анализа, основанного на управлении исключениями или целями, для получения практических знаний [17]. Некоторые исследования в области ИИ, направленные на то, чтобы дать системам возможность более гибко реагировать на новизну и неопределенность, были успешно использованы в СППР. Например, интеллектуальный анализ данных, который ищет скрытые шаблоны в базе данных, использовался в ряде приложений для поддержки принятия решений [24].

Основными преимуществами использования МО в СППР являются более быстрые результаты принятия решений. Но важно понимать, что МО также требует

огромного количества знаний в предметной области или достаточного объема обучающих наборов данных.

В последние годы стали активно развиваться модели машинного обучения, основанные на ансамблевых подходах. Важнейшее преимущество этих моделей заключается в том, что их можно применять к различным типам данных (структурированным и неструктурированным). Во-вторых, эти методы применимы к обработке больших данных, собираемых в сети интернет или представляющих собой потоковые изменения важных мониторинговых показателей. Аналитика больших данных может потенциально облегчить идентификацию значимых предикторов, а также помочь в принятии важных решений [25]. В-третьих, эти методы потенциально обладают более высокой точностью, по сравнению с отдельными моделями(при условии правильной организации процесса ансамблирования).

Несколько современных исследований доказывают предположение о том, что ансамблирование методов машинного обучения может привести к более высокой эффективности, в частности, оптимизация процесса поиска параметров обучения за счет дополнительного применения эволюционных алгоритмов кажется многообещающим подходом [26-28].

Хотя методы машинного обучения привлекают значительное внимание, их практическая реализация все еще сталкивается с препятствиями. Первое препятствие исходит из положения, что неверный прогноз может усугубить и без того критическую ситуацию. Поэтому использовать модель прогнозирования с невысокой точностью довольно опасно. В задачах прогнозирования проблемных состояний важна высокая точность, а существующие системы этим не отличаются. Разработка новых ансамблевых моделей машинного обучения, учитывающих специфику задачи прогнозирования проблемных состояний и позволяющих повысить точность базовых методов ее решения, частично способствуют решению данной проблемы.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Фирюлина Мария Андреевна, 2022 год

СПИСОК ЛИТЕРАТУРЫ

1. Бестужев-Лада, В. И. Поисковое социальное прогнозирование. / В. И. Бестужев-Лада - Москва: Наука, 1984. - 272 с.

2. Бледнов, Р. Г. Прогнозирование сбоев приложений по журналам состояния программных объектов / Р. Г. Бледнов // Современные информационные технологии и ИТ-образование. - 2019. - Т. 15, № 4. - С. 947-953.

3. Клячкин, В. Н. Прогнозирование состояния технического объекта с применением методов машинного обучения / В. Н. Клячкин, Д. А. Жуков // Программные продукты и системы. - 2019. - Т. 32, № 2. - С. 244-250.

4. Алешин, В. Ф. Проблемные вопросы прогнозирования и подтверждения надежности космических аппаратов длительного функционирования / В. Ф. Алешин, А. Ю. Колобов, Ю. А. Петров // Наука и образование: научное издание МГТУ им. Н.Э. Баумана. - 2015. - № 6. - С. 31-41.

5. Савенков, П. А. Использование методов и алгоритмов машинного обучения в системах поддержки принятия управленческих решений / П. А. Савенков // Вестник науки и образования. - 2019. - № 1(55). - С. 213-218.

6. Latif, S. Intelligent decision support system approach for predicting the performance of students based on three-level machine learning technique / S. Latif, F. Wen, L. Wang // Journal of Intelligent Systems. - 2021. - № 30. - С. 739-749.

7. Подвальный, С. Л. Многоальтернативное управление объектами с критическими режимами функционирования / С. Л. Подвальный, Е. М. Васильев // Современные сложные системы управления : материалы XII международной научно-практической конференции, Липецк, 25-27 октября 2017 года. - Липецк: Липецкий государственный технический университет, 2017. - С. 119-123.

8. Леденева, Т. М. Моделирование оценочных систем на основе принципа многоальтернативности / Т. М. Леденева, С. Л. Подвальный // Системы управления и информационные технологии. - 2014. - № 3-1(57). - С. 155-161.

9. Podvalny, S. L. Predicting Accident Modes in a Gas Pipeline with Incomplete Parameters / S. L. Podvalny, E. V. Kutsova, E. M. Vasiljev // IOP Conference Series: Earth and Environmental Science, Virtual, Online, 10-12 января 2022 года. - Virtual, Online, 2022. - P. 032064.

10. Подвальный, С. Л. Информационно-управляющие системы в управлении критическими режимами сложных объектов / Л. С. Подвальный, Е. М. Васильев // Актуальные проблемы прикладной математики, информатики и механики: сборник трудов Международной научно-технической конференции, Воронеж, 18-20 декабря 2017 года / Воронежский государственный университет. - Воронеж: Издательство "Научно-исследовательские публикации"; Общество с ограниченной ответственностью "Вэлборн", 2017. - С. 282-291.

11. Casari, A. Feature Engineering for Machine Learning / A. Casari, A. Zheng. - O'Reilly Media, Inc., 2018. - 218 p.

12. Ломакина, Л. С. Информационные технологии диагностирования многомерных объектов: Монография / Л. С. Ломакина, Д. В. Ломакин, С. А. Зеленцов. - Воронеж: ООО "Издательство "Научная книга", 2018. - 180 с.

13. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А. А. Барсегян [и др.]. - Санкт-Петербург: БХВ-Петербург, 2007. - 384 с.

14. Bellot, A. Boosted Trees for Risk Prognosis / A. Bellot, M. Schaar, A. Cloninger // Proceedings of Machine Learning Research. - 2018. - № 85. - С. 2-16.

15. Лойко, В. И. Семантические информационные модели управления агропромышленным комплексом / В. И. Лойко, Е. В. Луценко. - Краснодар : КубГАУ, 2005. - 480 с.

16. Симанков, В. С. Адаптивное управление сложными системами на основе теории распознавания образов / В. С. Симанков, Е. В. Луценко. - Краснодар : КубГАУ, 1999.

- 318 с.

17. Khan, S. Data mining and data fusion for enhanced decision support / S. Khan, A. R. Gangulu, R. Gupta. - Берлин: Springer, 2008. - 581-608 с.

18. Renu, R. S. Use of big data and knowledge discovery to create data backbones for decision support systems / R. S. Renu, G. Mosko, A. Koneru // Procedia Comput Sci. - 2013.

- № 20. - С. 446-453.

19. El-Sappagh, S. H. A distributed clinical decision support system architecture / S. H. El-Sappagh, S. El-Masri // J King Saud Univ Comput Inf Sci - 2014. - № 26(1). - С. 6978.

20. Podval'ny, S. L. Intelligent modeling systems: Design principles / S. L. Podval'ny, T. M. Ledeneva // Automation and Remote Control. - 2013. - Vol. 74. - No 7. - P. 1201-1210.

21. Разработка подсистемы поддержки принятия решений на основе результатов анализа множества изображений / И. Я. Львович [и др.] // Цифровая обработка сигналов и её применение (цос-2021). - 2015. -С. 111-115.

22. Merkert, J. A Survey of the Application of Machine Learning in Decision Support / J. Merkert, M. Mueller, M. Hubl // ECIS 2015 Completed Research Papers. - 2015. - С. 133.

23. Алгоритм поддержки принятия решений по выбору средств обработки больших массивов естественно-языковых данных / К. А. Польщиков, О. Н. Польщикова, Е. В. Игитян, М. С. Балакшин // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. - 2019. - Т. 46. - № 3. - С. 553-562.

24. Consensus clustering based on constrained self-organizing map and improved Cop-Kmeans ensemble in intelligent decision support systems / Y. Yang [и др.] // Knowl Based Syst. - 2012. - № 32. - С. 101-115.

25. Львович, Я. Е. Анализ задач, решаемых при внедрении автоматизированных систем в современных организациях / Я. Е. Львович // МОЛОДЕЖЬ И XXI ВЕК - 2020 материалы X Международной молодежной научной конференци. - 2020. - С. 111-114.

26. Rupnik, R. Decision Support System to support decision processes with Data Mining / R. Rupnik, K. Matjaz // Journal of information and organizational sciences. - 2007. - № 31(1). - С. 217-232.

27. Arnott, D. A Critical Analysis of Decision Support Systems Research / D. Arnott, G. Pervan // Journal of Information Technology. - 2005. - № 1. - С. 67-87.

28. Evolutionary Machine Learning: A Survey / A. Telikani [и др.] // ACM Comput. Surv. - 2012. - Т. 54, № 8. - С. 161.

29. Ломакина, Л. С. Нейросетевые технологии диагностирования состояний биоценоза на основе априорных статистических данных / Л. С. Ломакина, К. М. Носков // Информатика и управление в технических и социальных системах. - 2018. -№ 1(120). - С. 37-43.

30. MachineLearning. Машинное обучение (курс лекций, К.В.Воронцов) [Электронный ресурс]: профессионально-аналитический ресурс - / MachineLearning. - Электронные данные. Режим доступа: URL.: http://www.machinelearning.ru/wiki/, свободный - (дата обращения 02.03.2022)

31. Zheng, A. Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists / A. Zheng, A. Casari. - Себастопол: O'Reilly Media, 2018. - 245 с.

32. Лбов, Г. С. Выбор эффективной системы зависимых признаков / Г. С. Лбов // Вычислительные системы. — 1965. — Т. 19. — С. 21-34.

33. Ивахненко, A. Г. Моделирование сложных систем по экспериментальным данным / A. Г. Ивахненко, Ю. П. Юрачковский. - Москва: Радио и связь, 1987. - 120 с.

34. Халафян, А. А. Современные статистические модели медицинских исследований / А. А. Халафян. - Москва: URSS, 2014. - 320 с.

35. StudFile. Графическое изображение статистических данных [Электронный ресурс]: файловый архив студентов - / StudFile. - Электронные данные. Режим доступа: URL.: https://studopedia.org/1-60304.html, свободный - (дата обращения 11.02.2018)

36. Kruschke, J. K. Doing Bayesian Data Analysis / J. K. Kruschke. - Кембридж : Academic Press, 2015. - 776 с.

37. Evidence of Experimental Bias in the Life Sciences: Why We Need Blind Data Recording / L. Holman [и др.] // PLoS biology. - 2015. - № 13. - С. 1-12.

38. Pratiwi, D. The Use of Self Organizing Map Method and Feature Selection in Image Database Classification System / D. Pratiwi // International Journal of Computer Science Issues. - 2012. - № 9(3). - С. 377-381.

39. Хайлан, А. Обнаружение ресурсоемких запросов к базам данных на основе применения самоорганизующихся карт и нечеткого вывода / А. Хайлан, К. А. Польщиков, С. М. М. Алгазали // Экономика. Информатика. - 2021. - Т. 48. - № 3. -С. 578-593.

40. Iivarinen, J. Feature Selection with Self-Organizing Feature Map / J. Iivarinen, K. Valkealahti, A. Visa // ICANN '94. - 1994. - С. 334-337.

41. Rokach, L. Pattern Classification Using Ensemble Methods / L. Rokach - Израиль: Ben-Gurion University of the Negev, 2009. - 244 с.

42. Zhou, Z. Ensemble Methods: Foundations and Algorithms / Z. Zhou - Лондон : Chapman and Hall, 2012. - 236 с.

43. Халафян, А. А. Современные статистические модели медицинских исследований / А. А. Халафян. - Москва: URSS, 2014. - 320 с.

44. Loginom. Деревья решений: общие принципы [Электронный ресурс]: электронная энциклопедия для бизнес-анализа - / Loginom. - Электронные данные. Режим доступа: URL.: https://loginom.ru/blog/decision-tree-p1///, свободный - (дата обращения 22.09.2021)

45. Ломакина, Л. С. Идентификация состояний объектов сложной структуры на основе нейронечётких технологий / Л. С. Ломакина, С. А. Манцеров // Системы управления и информационные технологии. - 2022. - № 1(87). - С. 8-12.

46. Ломакина, Л. С. Нейро-нечеткие классификаторы. Теория и практика / Л. С. Ломакина, С. А. Манцеров, И. Д. Чернобаев. - Воронеж: ООО "Издательство "Научная книга", 2022. - 136 с.

47. Zhou, Z. On the doubt about margin explanation of boosting / Z. Zhou // Artificial Intelligence. - 2021. - № 203. - С. 1-18.

48. Казакова, А. О. Прогнозирование летальности после инфаркта миокарда с помощью модели кокса / А. О. Казакова // Вопросы науки. - 2016. - Т. 2. - С. 30-40.

49. Spooner, A. A comparison of machine learning methods for survival analysis of high-dimensional clinical data for dementia prediction / A. Spooner, E. Chen, A. Sowmya // Scientific Reports. - 2020. - . - № 10(1). - С. 20410.

50. Кашиницкий, Ю. С. Ансамблевый метод машинного обучения, основанный на рекомендации классификаторов / Ю. С. Кашиницкий // Интеллектуальные системы. Теория и приложения. - 2015. - Т. 19, № 4. - С. 37-55.

51. Freund, Y. A Short Introduction to Boosting / Y. Freund, R. E. Schapire // Journal of Japanese Society for Artificial Intelligence. - 1999. - № 14(5). - С. 771-780.

52. He, H. Imbalanced Learning: Foundations, Algorithms, and Applications / H. He, Y. Ma. - Wiley-IEEE Press, 2013. - 216 с.

53. Mullin, M. Complete cross-validation for nearest neighbor classifiers / M. Mullin, R. Sukthankar // Proceedings of International Conference on Machine Learning. - 2000. - С. 639-646.

54. Evaluating the Quality of Machine Learning Explanations: A Survey on Methods and Metrics / J. Zhou [и др.] // Electronics. - 2021. - № 10(5). - С. 593.

55. Jiang, F. Artificial intelligence in healthcare: past, present and future / F. Jiang, Y. Jiang, H. Zhi // Stroke Vasc. Neurol. - 2017. - Т. 2, № 4. - С. 230-243.

56. Lopez-Jimenez, F. Artificial Intelligence in Cardiology: Present and Future / F. Lopez-Jimenez, Z. Attia, A.M. Arruda-Olson // Mayo Clinic Proceedings. - 2020. - . - Т. 95, № 5. - С. 1015-1039.

57. Graham, J. Artificial Intelligence, Machine Learning, and the FDA [Электронный ресурс] / J. Graham. - Электрон. журн. - Forbes, 2016. - режим доступа к журн.: https://www.forbes.com/sites/theapothecary/2016/08/19/artificial-intelligence-machine-learning-and-the-fda/?sh=4742f7711aa1

58. Finale, D-V. Towards A Rigorous Science of Interpretable Machine Learnin / D-V. Finale, B. Kim // Machine Learning. - 2017.- С. 1-13.

59. Steiger, M. Enhancing User Understanding in a Decision Support System: A Theoretical Basis and Framework / M. Steiger // Journal of Management Information Systems. - 1998. - № 15(2). - С. 199-220.

60. Brennan, J. J. Understanding and validating results in model-based decision support systems / J. J. Brennan, J. J. Elam // Decision Support Systems. - 1986. - № 2. - С. 49-54.

61. Visualization of Different Types of Cochlear Implants in Postoperative Cone-Beam CT Imaging / I. Burck [и др.] // Academic Radiology. - 2021. - № 29(3). - С. 88-97.

62. Molnar, C. Interpretable Machine Learning: A Guide for Making Black Box Models Explainable [Электронный ресурс] / C. Molnar. - Электрон. текстовые дан., 2019. -Режим доступа: https://christophm.github.io/interpretable-ml-book, свободный.

63. Zachary, L. The Mythos of Model Interpretability / L. Zachary // Queue. - 2018. - Т. 16, № 3. - С. 31-57.

64. Hastie, T. The Elements of Statistical Learning / T. Hastie, R. Tibshirani, J. Friedman. - Берлин: Springer, 2009. - 7б4 с.

65. Гланц, С. Медико-биологическая статистика / С. Гланц. - Москва: Практика, 1999. - 460 с.

66. Гмурман, В. E. Теория вероятностей и математическая статистика: Учебное пособие для вузов / В. E. Гмурман. - Москва: Высшая школа, 2004. - 479 с.

67. Наркевич, А. Н. Выбор метода для статистического анализа медицинских данных и способа графического представления результатов [Электронный ресурс] / А. Н. Наркевич, К. А. Виноградов. - Электрон. журн. - Социальные аспекты здоровья населения, 2019. - № 65(4). - режим доступа к журн.: http : //vestnik.mednet.ru/content/view/1092/30/lang,ru/

68. Обзор методов статистического анализа данных [Электронный ресурс]: свободная энциклопедия - / StatLab. - Электронные данные. Режим доступа: URL.: http://www.statlab.kubsu.ru/node/4, свободный - (дата обращения 10.04.2020)

69. Халафян, А. А. Современные статистические модели медицинских исследований / А. А. Халафян. - Москва: URSS, 2014. - 320 с.

70. Нильсен, Э. Практический анализ временных рядов: прогнозирование со статистикой и машинное обучение / Э. Нильсен. - СПб.: ООО "Диалектика", 2021. -544 с.

71. Webiomed. Интерпретация результатов машинного обучения [Электронный ресурс]: Платформа прогнозной аналитики - / Webiomed. - Электронные данные. Режим доступа: URL.: https://webiomed.ai/blog/interpretatsiia-rezultatov-mashinnogo-obucheniia/, свободный - (дата обращения 05.02.2021)

72. Каширина, И.Л. Нейросетевые технологии. Учебно-методическое пособие для вузов / И.Л. Каширина. - Воронеж, 2008. - 72 с.

73. Кашницкий, Ю. С. Ансамблевый метод машинного обучения, основанный на рекомендации классификаторов / Ю. С. Кашницкий, Д. И. Игнатов // Интеллектуальные системы. Теория и приложения. - 2015. - Т. 19, № 4 - С. 1-32.

74. Клюева, И. А. Ансамблевые методы в задаче мнококлассовой SVM-классификации / Б. В. Костров, А. И. Баранчиков, И. А. Клюева // XXI век: итоги прошлого и проблемы настоящего плюс. - 2021. - Т. 10, № 2 (54). - С. 105- 108.

75. Breiman, L. Random Forests / L. Breiman // Machine Learning. - 2001.- № 1.- С. 532.

76. Шитиков, В. К. Классификация, регрессия, алгоритмы Data Mining с использованием R [Электронный ресурс]: электронная книга / В. К. Шитиков, С. Э. Мастицкий. - Тольятти: Лондон, 07.04.2017. - 351 с. - Режим доступа: https://github.com/ranalytics/data-mining, свободный.

77. Borra, S. Improving nonparametric regression methods by bagging and boosting / S. Borra, A. Ciaccio // Computational Statistics and Data Analysis. - 2002. - Т. 38, № 4. - С. 407-420.

78. Чистяков, C. П. Случайные леса: обзор / С. П. Чистяков // Математическое моделирование и информационные технологии. - 2013.- № 4.- С. 177-136.

79. Bylander, T. Estimating generalization error on twoclass datasets using outofbag estimates / T. Bylander // Machine Learning. - 2002.- № 48.- С. 287-297.

80. Natekin, A. Natekin A, Knoll A. Gradient boosting machines, a tutorial / A. Natekin, A. Knoll // Front Neurorobot. - 2013. - Т. 7, № 21. - С. 1-21.

81. Friedman, JH. Greedy function approximation: a gradient boosting machine / JH. Friedman // The Annals of statistics. - 2001. - Т. 29, № 5. - С. 1189-1232.

82. Firyulina, M. A. Classification of cardiac arrhythmia using machine learning techniques / M. A. Firyulina, I. L. Kashirina // J. Phys.: Conf. Ser. - 2020. - № 1614. - С. 1167-1175.

83. Фирюлина, М.А. Оценка комплаентности пациентов с сердечно-сосудистыми заболеваниями на основе методов интеллектуального анализа данных/ М.А. Фирюлина, И.Л. Каширина, Е.В. Конобеева // Системный анализ и управление в биомедицинских системах. - 2019.- Т. 18, № 3.- С. 177-183.

84. D'yakonov, A. A blending of simple algorithms for topical classification / А. D'yakonov // Rough Sets and Current Trends in Computing: 8th International 156 Conference, RSCTC 2012: Proceedings. Lecture Notes in Computer Science. - Chengdu (China), 2012. - Vol. 7413. - P. 432-438.

85. Towards Data Science. Deep Dive into Catboost Functionalities for Model Interpretation [Электронный ресурс]: Научный блог - / Towards Data Science. -Электронные данные. Режим доступа: URL.: https://towardsdatascience.com/deep-dive-into-catboost-functionalities-for-model-interpretation-7cdef669aeed, свободный - (дата обращения 06.02.2021)

86. Guo, C. On calibration of modern neural networks / C. Guo, G. Pleiss, Y. Sun // Proceedings of the 34th International Conference on Machine Learning. - 2017. - № 70. -С. 1321-1330.

87. Snoek, J. Practical Bayesian optimization of machine learning algorithms / J. Snoek, L. Larochelle, R. Adams // NIPS'12: Proceedings of the 25th International Conference on Neural Information Processing Systems. - 2012. - № 2. - С. 2951-2959.

88. Feurer, M. Hyperparameter Optimization / M. Feurer, F. Hutter // Automated Machine Learning. - 2019. - С. 3-33.

89. Hutter, F. Sequential Model-Based Optimization for General Algorithm Configuration / F. Hutter, H. Holger, K. Leyton-Brown // LION. - 2011. - № 5. - С. 507523.

90. Thornton, C. Auto-WEKA: Combined selection and hyperparameter optimization of classification algorithms / C. Thornton, F. Hutter, H. Hoos // Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. - 2013. - С. 1-9.

91. Glazkova, T. G. Assessment of the quality of diagnostic methods and prognosis in medicine / T.G. Glazkova // Bulletin of science center of medical Sciences of Russia. - 1994.

- №.2. - С. 3-11.

92. Elkan, C. The Foundations of Cost-Sensitive Learning / C. Elkan // Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence. - 2001. - № 1. - С. 17.

93. Base Group Labs. Различные стратегии сэмплинга в условиях несбалансированности классов [Электронный ресурс]: Base Group Labs технологии анализа данных. - Электронные данные. Режим доступа: URL.: https://basegroup.ru/community/articles/imbalance-datasets///, свободный - (дата обращения 05.10.2021)

94. Garcia, S. Evolutionary Undersampling for Classification with Imbalanced Datasets: Proposals and Taxonomy / S. Garcia, F. Herrera // Evolutionary Computation. - 2019. - № 17. - С. 275-306.

95. Chawla, N. SMOTE: Synthetic Minority Over-sampling Technique / N. Chawla, K. Bowyer, L. Hall // Journal of Artificial Intelligence Research. - 2002. - № 16. - С. 341-378.

96. Merkle, E. Weighted Brier score decompositions for topically heterogenous forecasting tournaments / E. Merkle, R. Hartman // Judgment and Decision Making. - 2018.

- № 13. - С. 185-201.

97. Суилин, А. Конверсия и data science III. Как отличить хорошее от плохого [Электронный ресурс]: научный блог - / Артур Суилин. - Электронные данные. Режим доступа: URL.: https://suilin.ru/post/conversion_factors/, свободный - (дата обращения 10.04.2021)

98. WOH. The top 10 causes of death [Электронный ресурс]: Всемирная организация здравоохранения - / WOH. - Электронные данные. Режим доступа: URL.: https://www.who.int/news-room/fact-sheets/detail/the-top- 10-causes-of-death, свободный - (дата обращения 10.05.2021)

99. Firyulina M.A. Using of machine learning methods in cardiology / M. A. Firyulina, I. L. Kashirina // Journal of physics: conference series. 2021. - .№1902. DOI: 10.1088/17426596/1902/1/012135

100. Фирюлина М. А. Использование методов машинного обучения в кардиологии/ М.А. Фирюлина, И.Л. Каширина // Актуальные проблемы прикладной математики, информатики и механики: Международная научно-технической конференция-Воронеж, 2021. - С. 1132-1141.

101. Фирюлина, М. А. Анализ показателей смертности Воронежской области в сравнении с развитыми странами / М.А. Фирюлина, И.Л. Каширина // ВЕСТНИК Воронежского института высоких технологий - 2018. - №2. - С. 150-154.

102. Фирюлина М.А. Прогнозирование влияния внешних факторов на показатели смертности по воронежской области // Информатика: проблемы, методология, технологии: материалы XVIII Международной научно-методической конференции. -Воронеж, 2018. С. 216-222.

103. Каширина, И. Л. Статистический анализ влияния метеорологических и сезонных факторов на развитие инфаркта миокарда и смертность от него по данным воронежского областного регистра / И. Л. Каширина, Р. А. Хохлов, А.О. Казакова // Врач-аспирант. - 2017. - № 85. - С. 142-150.

104. Data science blog. ANOVA using Python [Электронный ресурс]: Научный блог -/ Data science blog. - Электронные данные. Режим доступа: URL.: https://www.reneshbedre.com/blog/anova.html, свободный - (дата обращения 03.06.2021)

105. Bhatt, D. L. Comparative Determinants of 4-Year Cardiovascular Event Rates in Stable Outpatients at Risk of or With Atherothrombosis / D. L. Bhatt, K. A. Eagle, E. M. Ohman // Elsevier - Journal of Vascular Surgery. - 2011. - № 12. - С. 1350-1357.

106. Фирюлина М. А. Анализ значимости предикторов выживаемости после инфаркта миокарда с помощью метода Каплана-Мейера / М. А. Фирюлина, И. Л. Каширина, Е. Я. Гафанович // Моделирование, оптимизация и информационные технологии. - 2019. - № 7. - С. 7-20.

107. Shin, S. Machine learning vs. conventional statistical models for predicting heart failure readmission and mortality / S. Shin, P. Austin, H. Ross // ESC HEART FAILURE. -2021. - № 8. - С. 106-115.

108. Фирюлина М.А. Прогнозирование риска смертности после инфаркта миокарда с использованием методов машинного обучения/ М.А. Фирюлина, И.Л. Каширина // Информатика: проблемы, методы, технологии, материалы XX Международной научно-методической конференции- Воронеж, 2021. - С. 1535-1544.

109. Kashirina I.L. Identification of risk factors for mortality after myocardial infarction using machine learning methods / Kashirina I.L., Firyulina M.A., Bondarenko Y.V., Desyatirikova E.N., Efimova O.E., Chernenkaya L.V. // Proceedings of 2021 24th international conference on soft computing and measurements. - 2021. - Т.1. - P. 233-236.

110. Kashirina I. L. Building models for predicting mortality after myocardial infarction in conditions of unbalanced classes, including the influence of weather conditions / I.L. Kashirina, M.A. Firyulina // CEUR Workshop Proceedings. - 2020. - №2790. - P. 188-197.

111. Фирюлина М.А. Применение метода «временного квилтинга» для анализа

выживаемости после инфаркта миокарда // Моделирование, оптимизация и информационные технологии. - 2021. - №9(4). - С. 4-6.

112. Фирюлина М. А. Классификация сердечной аритмии с использованием методов машинного обучения/ М.А. Фирюлина, И.Л. Каширина // Актуальные проблемы прикладной математики, инф. и механики: Международная научно-техническая конференция. - Воронеж, 2020. - С. 1167-1175.

113. Фирюлина М.А. Применение методов машинного обучения при назначении терапии гипертонической болезни / М.А. Фирюлина, И.Л. Каширина, Е.Я. Гафанович // Моделирование, оптимизация и информационные технологии. - 2020. - №8(4). -С.4-5.

114. Фирюлина М.А. Оценка комплаентности пациентов с сердечно-сосудистыми заболеваниями на основе методов интеллектуального анализа данных / М.А. Фирюлина, И.Л. Каширина, Е.В. Конобеева // Системный анализ и управление в биомедицинских системах. - 2019. - Т. 18, № 3. - С. 177-183.

115. Гафанович Е.Я. Исследование основных факторов влияния приверженности к лечению статинами с использованием «деревьев решений» / Е.Я. Гафанович, И.М. Соколов, Е.В. Конобеева, И.Л. Каширина, М.А. Фирюлина // Моделирование, оптимизация и информационные технологии. - 2021. - №9(3). - С. 1-2.

116. Хохлов Р.А. Разработка автоматизированного рабочего места врача кардиолога / Р.А. Хохлов, М.А. Фирюлина, М.В. Демченко // Информатика: проблемы, методы, технологии, материалы XX Международной научно-методической конференции. Воронеж, 2020. С. 1311-1318.

117. Демченко М.В. Разработка медицинской информационной системы с элементами поддержки принятия решений в кардиологии / Демченко М.В., Фирюлина М.А., Каширина И.Л. //Международный Научно-Исследовательский Журнал. - 2021. - Т.8-1(110). - С. 69-76.

118. Microsoft. Руководство Microsoft для разработчиков [Электронный ресурс]: документация по разработке - / Microsoft. - Электронные данные. Режим доступа: URL.: https://msdn.microsoft.com, свободный - (дата обращения 20.02.2018)

119. Рихтер, Дж. CLR via C#. Программирование на платформе Microsoft .NET Framework 4.5 на языке C# / Дж. Рихтер. - 4-е изд. - СПб.: Питер, 2013. - 896 с.

120. Файн, Я. Angular и TypeScript. Сайтостроение для профессионалов / Я. Файн, А. Моисеев. - СПб.: Питер, 2018. - 464 с.

121. Бен-Ган, И. Microsoft SQL Server 2008. Основы T-SQL / И. Бен-Ган. - СПб.: БХВ-Петербург, 2009. - 432 с.

122. Документация Flask [Электронныйресурс] -https://flask.palletsprojects.com/en/2.0.x/ (дата обращения: 06.22.2021)

123. Документация Python [Электронный ресурс]: документация по разработке - / Python. - Электронные данные. Режим доступа: URL.: https://docs.python.org/3/, свободный - (дата обращения 06.22.2021)

124. Navathe, S. Fundamentals of Database Systems / S. Navathe, R. Elmasri. - Бостон: Pearson, 2018. - 1280 с.

Приложение

Табл. 1. Распределение категориальных переменных в региональном регистре инфарктом миокарда.

Признак Выжившие (%) Умершие (%) Признак Выжившие (%) Умершие (%)

Пол ИМ(повторный )

Мужской 5997(63.9 %) 1028 (52.8 %) Нет 8146(86.9 %) 1519(78 %)

Женский 3382(36.1 %) 919 (47.2 %) Да 1233(13.1 %) 428 (22 %)

ХСН ТЛТ

Нет 4064 (43.3 %) 789 (40.5 %) Не провод-сь 8131 (86.7 %) 1703(87.5 %)

Н I 1194 (12.7 %) 84 (4.3 %) Актилизе 437 (4.7 %) 81 (4.2 %)

Н ПА 4098 (43.7 %) 1053 (54.1 %) Пуролаза 527 (5.6 %) 57 (2.9 %)

Н III 23 (0.2 %) 21 (1.1 %) Метализе 284 (3.0 %) 106 (5.4 %)

Артериальная гипертензия Фибриляция предсердий

Нет 1815 (19.4 %) 316 (16.2 %) Нет 8568(91.4 %) 1597(82 %)

Да 7564 (80.6 %) 1631 (83.8 %) Да 811 (8.6 %) 350 (18 %)

ХОБЛ ОНМК

Нет 8744 (93.2 %) 1710 (87.8 %) Нет 8926(95.2 %) 1750(89.9 %)

Да 635 (6.8 %) 237 (12.2 %) Да 464 (4.8 %) 197 (10.1 %)

Сахарный диабет ЧКВ

Нет 8167 (87.1 %) 1579 (81.1 %) Нет 8586(91.5 %) 1899(97.5 %)

Ьтипа 21 (0.2 %) 6 (0.3 %) БАП 278 (3.0 %) 25 (1.2 %)

П-типа 1191 (12.7 %) 362 (18.6 %) ЧКВ гол. стент 157 (1.7 %) 3 (0.3 %)

Локализация ЧКВ ст. с покр 358 (3.8 %) 20 (1 %)

Не опред. 319 (3.4 %) 46 (2.4 %) Киллип

Перед. стенки 4350 (46.4 %) 940 (48.3 %) Нет 313 (3.3 %) 41 (2.1 %)

Заднебазал. 425 (4.5 %) 96 (4.9 %) I 5332(56.9 %) 461 (23.7 %)

Боковой ст. 414 (4.4 %) 71 (3.6 %) II 2714(28.9 %) 473 (24.3 %)

Нижней ст. 2828 (30.2 %) 556 (28.6 %) III 837 (8.9 %) 393 (20.2 %)

Переднебок. 1043 (11.1 %) 238 (12.2 %) VI 184 (2 %) 579 (29.7 %)

Время госпитализации после ИМ

Не опред. 7 (0.1%) 5 (0.3%) 24 часа 1470 (15.7%) 432 (22.2%)

2 часа 1062 (11.3%) 256 (13.1%) 1-2 суток 1088 (11.6%) 274 (14.1%)

6 часов 2382 (25.4%) 438 (22.5%) 2-5 суток 1137 (12.1%) 230 (11.8%)

12 часов 1122 (12%) 185 (9.5%) более 5 суток 1111 (11.8%) 127 (6.5%)

В таблице присутствуют признаки: пол, возраст, наличие артериальной гипертензии (АГ), является ли инфаркт миокарда повторным (ИМ), есть ли у пациента в анамнезе сахарный диабет (СД), фибрилляция предсердий (ФП), острое нарушение мозгового кровообращения (ОНМК), хроническая обструктивная болезнь легких (ХОБЛ), хроническая сердечно-сосудистая недостаточность (ХСН), локализация, тяжесть сердечной недостаточности по шкале KILLIP, проводилась ли пациенту тромболитическая терапия (ТЛТ) и чрескожные коронарные вмешательства (ЧКВ), время от ИМ до госпитализации.

Табл. 2. Результаты Т-теста влияния месяца на развитие ИМ.

Месяц Mean Std.Err. t-value p-value

Янв 10.311 0.3751 -0.083 0.9333

Фев 10.647 0.4373 0.694 0.4892

Март 11.526 0.3811 3.105 0.0025

Апр 12.444 0.4160 5.050 0.0000

Май 11.279 0.3654 2.561 0.0120

Июн 9.644 0.3743 -1.866 0.0652

Июл 9.268 0.3526 -3.046 0.0030

Авг 9.419 0.3308 -2.792 0.0063

Сен 9.966 0.3842 -0.980 0.3297

Окт 10.032 0.3884 -0.800 0.4253

Нояб 10.000 0.3755 -0.914 0.3631

Дек 9.619 0.5012 -1.443 0.1522

Табл. 3. Сравнение значимости признаков в модели «Прогнозирование стационарной летальности после ИМ», полученная различными методами.

Признак Метод Метод Кокса Лог. регрес. Градиентный бустинг

SHAP PredictionValues LossFunction

Возраст 0 0 0 0.089 24.75503 0.017342

Пол 0.0006 0.7 0.601 0.0001 0.279655 0.000096

АГ 0 0 0.002 0 0.219685 0.000094

ИМ 0.0007 0.5 0.001 0.02 0.524612 0.000447

СД 0.00005 0.03 0.001 0.018 1.678912 0.000923

ФП 0.0027 0.41 0.204 0.0005 0.440791 0.000204

ОНМК 0.0734 0.62 0.47 0.008 1.317384 0.00088

ХОБЛ 0.0471 0.64 0.015 0.016 0.654008 0.00055

ХСН 0 0.31 0 0.015 2.773895 0.000855

Локал-я 0 0 0 0.01 2.671677 0.000927

KILLIP 0 0 0 0.15 46.31707 0.076953

ТЛТ 0.0006 0.25 0.227 0.00015 0.276061 0.000068

ЧКВ 0 0 0 0.045 8.158427 0.003233

Время госпит. 0.00207 0 0.002 0.02 4.085619 0.001765

Макс. темпер. 0 0 0.702 0.004 1.20937 0.000499

Влажность 0 0.76 0.635 0.009 1.450809 0.000572

Облачн. 0 0.24 0.01 0.006 0.413224 0.000297

Атм.давл. 0 0.53 0.163 0.008 0.940747 0.000374

Разница темп. 0.0918 0.43 0.768 0.005 0.821746 0.000359

Ск-ть ветра 0 0.58 0.636 0.004 1.011273 0.000351

Табл. 4. Исходные показатели пациентов для построения модели «Прогнозирование эффективности терапии гипертонической болезни»

Категориальные признаки

Пол, ожирение, степень АГ (артериальной гипертензии), частота гипертонических кризов, наличие ИМ, стенокардия напряжения, кардиалгия на фоне гипертонии, наличие застойных явлений, ХСН (хроническая сердечная недостаточность), наличие и вид мерцательной аритмии, ОНМК (острые нарушения мозгового кровообращения) в анамнезе, наличие ЧМТ (черепно-мозговой травмы), наличие аллергических реакций, ХОБЛ (хроническая обструктивная болезнь легких), сахарный диабет, осложнения сахарного диабета, наличие операций, потребовавших общий наркоз, наследственная отягощенность по АГ, менопауза, тип телосложения, ЭОС (электрическая ось сердца), НЖЭС (наджелудочковая экстрасистолия) на ЭКГ, ЖЭС (желудочковая экстрасистолия) на ЭКГ, НЖТ

(наджелудочковая тахикардия), АВ-блокада, СА-блокада, ПБПНПГ, ПБЛН111, НБПНПГ, НБЛНП1 (показатели сердечного ритма), лечение до поступления И-АПФ\АРА, лечение до поступления БКК (блокаторами кальциевых каналов), лечение до поступления диуретиками, лечения до поступления препаратами центр. действия, лечение до поступления БАБ (бета-адреноблокаторами), непереносимость препарата, прием в стационаре И-АПФ\АРА (ингибиторов ангиотензинпревращающего фермента), прием в стационаре БАБ, прием в стационаре БКК гр. нифедипина, прием в стационаре БКК гр. верапамила, прием в стационаре диуретиков, прием в стационаре препаратов центрального действия,

Непрерывные признаки Возраст, ИМТ (индекс массы тела), длительность АГ (артериальной гипертензии), ЧСС (частота сердечных сокращений), PQ, QRS, QT (показатели электрокардиограммы), анемия, лейкоцитопения, тромбоцитопения, СОЭ (скорость оседания эритроцитов), удельный вес мочи, глюкоза, холестерин, креатинин, КДР (конечно-диастолический размер), ФВ (фракция выброса), ЛП (размер левого предсердия), 1111 (размер правого предсердия), ПЖ (размер правого желудочка), аорта, ДЛП (дислипидемия), ТМЖП (толщина межжелудочковой перегородки), ТЗСЛЖ (толщина задней стенки левого желудочка), САД при поступлении, ДАД при поступлении, САД при выписке, ДАД при выписке, САД на третий день, ДАД на третий день

Табл. 5. Исследуемые препараты в модели «Прогнозирование эффективности

терапии гипертонической болезни»

Название препарата Кол-во пациентов, которым назначен препарат Кол-во пациентов, которым не назначен препарат

БАБ 151 111

И-АПФ\АРА 178 84

БКК гр. нифедипина 60 202

БКК гр. верапамила 40 222

Диуретики 169 93

Препараты центр. действия 32 230

Табл. 6. Исходные показатели пациентов для построения модели

«Прогнозирование развития сердечной аритмии определенного вида»

Категориальные признаки Пол, ожирение, курит ли пациент, имеются ли другие нарушения сердечного ритма, степень АГ (артериальной гипертензии), имеются ли гипертонические кризисы, наличие ИМ, ХСН (хроническая сердечная недостаточность), имеется ли сахарный диабет, наличие варикозных заболеваний, индекс ВИ Кердо, наличия поражения щитовидной железы (щ.ж), наблюдались ли в анамнезе инсульты, электрическая кардиоверсия, хроническая ишемия, наличие узловых образований в щ.ж., диффузное увеличение щ.ж., кислотозависимые болезни пищевой системы, камненосительство, панические атаки

Непрерывные признаки Возраст, длительность мерцательной аритмии, ЧСС (частота сердечных сокращений), УТ1, ОИ1(показатель качества жизни), холестерин, глюкоза, креатинин, мочевина, QRS, QT, ФВ(фракция выброса), КДР ЛЖ(конечно-диастолический размер левого желудочка), КСР ЛЖ(конечно-систолический размер левого желудочка), ЗСЛЖ(толщина задней стенки левого желудочка), МЖП(межжелудочковая перегородка), КДР ПЖ(конечно-диастолический размер правого желудочка), ЛП(левое предсердие), ПП(правое предсердие)

Табл. 7. Исходные показатели пациентов для построения модели

«Прогнозирование комплаентности пациентов»

Категориальные признаки Пол, работает/пенсионер, поступил экстренно/планово, причина госпитализации, степень АГ (артериальной гипертензии), наличие ИБС (ишемическая болезнь сердца), ХСН (хроническая сердечная недостаточность), имеется ли сахарный диабет, наличие ИМ в анамнезе, наличие ИМ на момент поступления, ФП, имеются ли сопутствующие заболевания, выданы во время госпитализации наглядные рекомендации, выданы при выписке наглядные рекомендации, лечился ли амбулаторно, причины пропусков, самочувствие на фоне препаратов, использование наглядных рекомендаций, замена препарата, причина замены препарата, побочные действия от препарата

Непрерывные признаки Возраст

Классификация сердечной аритмии с использованием методов машинного обучения

Правообладатель: федеральное государственное бюджетное образовательное учреждение высшего образования «Воронежский государственный университет» (ФГБОУ ВО «ВГУ») (1(11)

Авторы: Фирюлина Мария Андреевна (Я11) Каширина Ирина Леонидовна (Я1/)

Дата поступления 22 Октября 2019 Г.

Дата государственной регистрации в Реестре программ для ЭВМ 05 ноября 2019 2.

Руководитель Федеральной слуэ/сбы

тш

ттш

СВИДЕТЕЛЬСТВО

о государственной регистрации программы для ЭВМ

№ 2019664324

Заявка № 2019663172

по интеллектуальной собственности

Г. П. Ивлиев

тттшшштш

ммжмшммжммм

УТВЕРЖАЮ

Проректор по науке, инновациям и цифровнзании ФГБОУ ВГЮ «Воронежский государственный университет», доктор

химических наук, донент —•—О.А. Козадеров ft /J» ig^feW 2022 г.

химическ

АКТ

о внедрении результатов диссертационного исследования Фнрюлиной Марии Андреевны

Комиссия в составе: председателя комиссии - декана факультета прикладной математики, информатики и механики, доктора физико-математических паук, профессора Шашкина А.И. и членов комиссии: преподавателя кафедры вычислительной математики н прикладных информационных технологий, кандидата физико-математических наук, доцеша Медведева С.П.: заведующего кафедрой математических методов исследования операций, доктора технических наук, профессора Азарновой Т.В. составила настоящий Акт о том. что результаты диссертационного исследования аспиранта Фнрюлиной М.А. по теме «Интеллектуальная система поддержки принятия решений на основе ансамблевых методов машинного обучения для прогнозирования проблемных состояний» внедрены в учебный процесс факультета прикладной математики, информатики и механики в программах следующих учебных дисциплин:

• Машинное обучение (направление бакалавриата 01.03.02 Прикладная математика и информатика):

• Прикладное машинное обучение па языке Python (направление магистрату ры 02.04.02 - Фундаментальная информатика и информационные технологии)

Члены комиссии:

П редседател ь ком нее и и:

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.