Метод построения модели анализа выживаемости и решения задачи отбора признаков тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Микулик Илья Игоревич
- Специальность ВАК РФ00.00.00
- Количество страниц 152
Оглавление диссертации кандидат наук Микулик Илья Игоревич
Введение
Глава 1. Постановка задачи и анализ современных подходов к ее решению
1.1. Основные понятия анализа выживаемости
1.1.1. Цензурированные данные
1.1.2. Функции оценки риска
1.2. Модели анализа выживаемости и их сравнение
1.2.1. Статистические модели
1.2.1.1. Кривые Каплана-Мейера
1.2.1.2. Модель Нельсона-Аалена
1.2.1.3. Экспоненциальная модель
1.2.1.4. Модель Вейбулла
1.2.1.5. Логлогистическая модель
1.2.1.6. Логнормальная модель
1.2.1.7. Модель Кокса
1.2.1.8. Другие статистические модели анализа выживаемости
1.2.2. Модели машинного обучения
1.2.2.1. Градиентный бустинг
1.2.2.2. Метод опорных векторов
1.2.2.3. Случайный лес выживаемости
1.2.2.4. Другие модели машинного обучения
1.2.3. Сравнительная характеристика моделей анализа выживаемости
1.3. Оценка моделей
1.4. Постановка задачи
Вывод по разделу
Глава 2. Расширение модели Кокса и определение целевой функции оптимизации
2.1. Модель Кокса с аддитивно-мультипликативной функцией риска
2.2. Построение целевой функции приспособленности
Выводы по разделу
Глава 3. Метод оптимизации для построения модели анализа выживаемости
3.1. Муравьиный алгоритм
3.2. Генетический алгоритм
3.3. Гибридный алгоритм
3.4. Алгоритм муравьев-опылителей
Выводы по разделу
Глава 4. Распараллеливание предложенного метода
4.1. Оценка распараллеливания программ
4.2. Параллельная реализация алгоритма муравьев-опылителей
Выводы по разделу
Глава 5. Комплекс программ, реализующий метод построения модели анализа выживаемости
5.1. Описание программного комплекса
5.2. Программная реализация алгоритма на наборе данных о рецидивах преступлений
5.3. Программная реализация алгоритма на наборе данных больных раком предстательной железы
5.4. Программная реализация алгоритма на наборе данных больных раком молочной железы
5.5. Программная реализация алгоритма на наборе данных о неисправностях автомобилей
5.6. Параллельная реализация и ускорение
Выводы по разделу
Заключение
Список литературы
Приложение А. Листинг программы
Приложение Б. Свидетельство о государственной регистрации программы
для ЭВМ
Приложение В. Акт внедрения результатов диссертационного исследования
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Методы объяснения результатов моделей машинного обучения в контексте анализа выживаемости2021 год, кандидат наук Ковалев Максим Сергеевич
Исследование и разработка методов машинного обучения анализа выживаемости2024 год, кандидат наук Васильев Юлий Алексеевич
Разработка алгоритмического обеспечения и исследование обобщенных моделей пропорциональных интенсивностей2015 год, кандидат наук Семёнова, Мария Александровна
Выбор параметра размытости в непараметрической оценке условной функции надёжности и её применение в критериях согласия2016 год, кандидат наук Демин, Виктор Андреевич
Статистические модели обработки результатов форсированных испытаний при сложной структуре данных2014 год, кандидат наук Ермолаева, Мария Андреевна
Введение диссертации (часть автореферата) на тему «Метод построения модели анализа выживаемости и решения задачи отбора признаков»
Введение
Актуальность исследования. В настоящее время прогностические модели занимают значимое место в принятии решений в различных областях науки и техники. Прогностические модели позволяют оценить вероятность исхода некоторого события по вводным характеристикам объекта. Особое место среди прогностических моделей занимают модели анализа выживаемости. Анализ выживаемости - это совокупность статистических методов, позволяющих оценить вероятность наступления некоторого терминального события. Терминальное событие — это необратимое и однократное событие, связанное с изучаемым процессом, после которого дальнейший учет времени для данного объекта прекращается. Для сложных технических систем таким событием является наступление критического состояния. Его возникновение интерпретируется как достижение исхода, в отличие от цензурированных наблюдений, при которых событие не наступает в течение периода наблюдения [1]. Анализ выживаемости находит применение в медицине - исследование динамики состояния пациента во время протекания болезни [2]; в инженерии - оценка надежности систем [3]; в биотехнологии - исследование динамики усвояемости лекарственных препаратов [4]; в прикладных задачах экономики и социологии [5].
В анализе выживаемости вероятность наступления события описывается функцией риска, зависящей от времени и характеристик объекта наблюдения, называемых признаками (или ковариатами). Наиболее широко используемой моделью анализа выживаемости является полупараметрическая регрессионная модель пропорциональных рисков Кокса [6]. В данной модели логарифм функции риска представляет собой линейную комбинацию признаков, что обеспечивает интерпретируемость результатов. Однако предположение о линейности между признаками и функцией риска является ограничивающим фактором и снижает адаптивность модели в задачах с высокой сложностью структуры данных. Эта особенность побуждает специалистов использовать интеллектуальные модели [7]. Однако несмотря на то, что интеллектуальные модели имеют более высокую прогностическую точность, результаты их работы сложно поддаются
интерпретации со стороны специалистов прикладных областей. В этой связи актуализируется задача построения объяснимых прогностических моделей, сочетающих высокую точность и возможность интерпретации.
Основу диссертационной работы составляют труды как зарубежных, так и отечественных ученых в следующих областях:
1. В области анализа выживаемости, статистических моделях и методах: Cox D. R., Fine J. P., Gray R. J., George B., Seals S., Aban I., K. Dietz, Gail M., Krickeberg K., Samet J., Tsiatis A., Luoma M., Laitinen E.K., Chambless L. E., Cummiskey, Ковалев М.С., Бондарева Н.А., Лётчиков А.В., Матвеев Р.Ю., Широбокова М.
2. В области методах оптимизации: Dorigo M., Скобцов Ю.А., Кажаров А.А., Курейчик В.М.
3. В области параллельных вычислений: Essaid M., Stützle T., Соснин В.В., Балакшин П.В., Шилко Д.С., Благовещенская Е.А., Пушкарев Д.А., Мишенёв А.В., Кустарев П.В., Тропченко А.А.
Разработка программного комплекса построения новых прогностических моделей, предназначенных для оценки вероятности наступления критических состояний технических систем и установления явной зависимости между функцией риска и признаками, представляет собой актуальную научно-техническую задачу.
Важность этой задачи обусловлена необходимостью создания адаптивных и высокоэффективных инструментов для прогнозирования вероятности наступления терминальных событий, что имеет большое значение в различных прикладных областях. Программное обеспечение, способное построить модель анализа выживаемости, автоматически адаптируясь к конкретному набору входных данных, позволяет проводить более точное и индивидуализированное прогнозирование, что значительно повышает эффективность оценки рисков и принятия решений.
Программный комплекс должен обеспечивать построение прогностических моделей, способных учитывать особенности входных данных, включая наличие цензурированных наблюдений и нелинейных взаимосвязей между признаками и функцией риска. Разработка программы позволяет автоматизировать процесс
анализа и формирования прогноза, а также обеспечивает возможность интерпретации результатов, что важно для принятия обоснованных решений на основе анализа факторов риска. Важно, что процедура построения таких моделей не только позволяет прогнозировать вероятность наступления критического состояния, но и выявляет наиболее значимые для этого состояния признаки [8], что способствует оптимизации процесса принятия решений и снижению трудоемкости работы экспертов. Программа также позволяет снижать размерность данных, что позволяет ускорять процесс прогнозирования, что делает её инструментом для оперативной оценки рисков в реальном времени.
Решение задачи позволяет спрогнозировать вероятность возникновения определенных состояний системы, которые могут повлечь за собой ее отказ или привести к серьезным нарушениям ее работы.
Степень разработанности темы исследования
Примерами известных моделей прогнозирования наступления терминальных событий являются модель пропорциональных рисков Кокса [6], кривые Каплана-Мейера [9], регрессионная модель конкурирующих рисков Файна и Грея [10], модель Вейбулула, экспоненциальная модель, и другие [11].
Рядом исследователей были рассмотрены нелинейные модификации модели Кокса, в которых вклад признаков в функцию риска определяется не линейной комбинацией, а более сложной функцией [12]. Для решения задач анализа выживаемости используются методы машинного обучения, такие как случайный лес выживаемости, метод опорных векторов или градиентный бустинг. Эти подходы способны демонстрировать высокую прогностическую точность, но слабо поддаются интерпретации экспертами предметных областей. В связи с этим набирает популярность область объяснительного интеллекта, раздела искусственного интеллекта, направленного на получение интерпретации результатов работы методов искусственного интеллекта [13]. Однако применяемые в этой области методы не всегда достаточно раскрывают логику принимаемых решений, что затрудняет их применение в практических задачах.
Рассматриваемые модели анализа выживаемости, в которых зависимость между признаками и функцией риска задана заранее и остается неизменной, не адаптируются к различным прикладным задачам. Это приводит к тому, что одна и та же модель может демонстрировать различную прогностическую точность на различных наборах данных, что ограничивает универсальность и снижает эффективность применения таких моделей [14]. Эта особенность побуждает разработку метода динамического построения моделей анализа выживаемости с различными функциями риска в зависимости от входных данных. В работе представлен метод построения моделей из класса расширенных моделей Кокса, в которых зависимость между признаками и функцией риска описывается полиномиальной функцией особого вида.
Объект, предмет, цель и задачи работы
Объект исследования: поведение сложной технической системы в условиях критической ситуации.
Предмет исследования: прогнозирование поведения технической системы в критической ситуации с использованием расширенной регрессионной модели Кокса.
Цель: увеличить точность прогнозов наступления критических ситуаций и уменьшить число ковариат, необходимых для построения прогноза.
Для достижения поставленной цели были сформулированы и решены следующие задачи:
1. Определен класс расширенных моделей Кокса с аддитивно -мультипликативной функцией риска.
2. Сформулирована задача построения функции риска и отбора признаков для расширенной модели Кокса. Построена функция приспособленности, оценивающая результаты прогнозов расширенной модели Кокса.
3. Разработан метод оптимизации, решающий поставленную задачу.
4. Разработано программное обеспечение, реализующее предложенный алгоритм построения прогностической модели.
5. Разработана параллельная версия алгоритма, обеспечивающая повышение вычислительной эффективности при обработке больших объемов данных.
6. Получен и проанализирован результат работы программы.
Научная новизна
Научная новизна диссертационной работы заключается в следующем:
1. Предложен новый класс расширенных моделей Кокса, устанавливающих нелинейные зависимости между признаками.
2. Впервые предложен метод построения расширенной модели Кокса, позволяющий находить зависимости между признаками и сокращать их количество, решая задачу отбора признаков.
3. Разработан программный комплекс, реализующий предложенный метод, позволяющий на основе входных данных построить функцию зависимостей между признаками, выбрать наиболее значимые для прогноза признаки и на основе построенной модели осуществлять прогноз наступления терминального события для конкретного экземпляра данных.
Теоретическая и практическая значимость работы
Теоретическая значимость исследования выражается в дальнейшем развитии методов построения моделей анализа выживаемости.
Практическая значимость исследования выражается в следующем:
1. Улучшение прогностических способностей построенных моделей в сравнении с регрессионной моделью Кокса.
2. Построение моделей совместно с отбором признаков, что является важной прикладной задачи.
3. Вариативность моделей, адаптация функции риска под конкретную практическую задачу в зависимости от рассматриваемого набора данных.
4. Конфигурируемость метода построения моделей, позволяющая исследователю прикладной области делать выбор в пользу повышения прогностической точности модели или сокращению числа признаков, входящих в ее функцию риска.
С практической точки зрения, предложенные модели, метод их построения и разработанный программный комплекс могут использоваться для прогнозирования отказов сложных технических систем, что способствует повышению их надежности, оптимизации технического обслуживания и снижению эксплуатационных рисков. Кроме того, разработанные инструменты применимы в медицине — для оценки прогноза течения заболеваний и поддержки клинических решений, а также в других прикладных областях, таких как биотехнологии, экономика и социология, где требуется прогноз наступления критических событий и анализ факторов риска.
Методы исследования
Работа выполнена на основе методов анализа выживаемости, методов оптимизации, теории параллельных вычислений. В качестве языка программирования использовался РуШопЗ, среда разработки РуОДагт.
Соответствие паспорту специальности.
Диссертационное исследование соответствует паспорту специальности «1.2.2 - Математическое моделирование, численные методы и комплексы программ», а именно:
1. П. 2 - «Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий».
2. П. 3 - «Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента».
3. П. 7 - «Качественные или аналитические методы исследования математических моделей (технические науки)».
4. П. 9 - «Постановка и проведение численных экспериментов, статистический анализ их результатов, в том числе с применением современных компьютерных технологий (технические науки)».
Положения, выносимые на защиту:
1. Класс расширенных моделей Кокса с аддитивно-мультипликативной функцией риска.
2. Метод построения расширенной модели Кокса.
3. Программный комплекс, реализующий метод построения расширенной модели Кокса и его распараллеливание.
Степень достоверности и апробация результатов
Приведенные в работе математические утверждения имеют строгое доказательство. Вычислительные эксперименты демонстрируют результаты, подтверждающие изложенные положения, что говорит в пользу достоверности работы предлагаемого метода.
Основные результаты работы докладывались и обсуждались на следующих конференциях:
1. Системный анализ в проектировании и управлении (Санкт-Петербург, 2020 г.).
2. Workshop «Models and methods for researching information systems in transport 2020» on the basis of the departments «information and computer systems» and «higher mathematics» (Санкт-Петербург, 2020 г.).
3. Математическое моделирование и суперкомпьютерные технологии (Нижний Новгород, 2022 г.).
4. 2023 Ural Environmental Science Forum on Sustainable Development of Industrial Region (Челябинск, 2023).
Публикации
Основные результаты диссертации изложены в 7 работах, 3 из которых опубликованы в изданиях, индексируемых Scopus, 3 - в журналах, рекомендованных ВАК РФ.
Список публикаций по теме диссертации
1. Blagoveshchenskaya E. A., Mikulik I. I., Strungmann L. H. Ant colony optimization with parameter update using a genetic algorithm for travelling salesman problem //Models and Methods for Researching Information Systems in Transport 2020 (MMRIST 2020). - 2020. - №. 1. - С. 20-25. [Scopus]
2. Kudarov R., Mikulik I., Blagoveshchenskaya E. Application of a method for student academic performance control //E3S Web of Conferences. - EDP Sciences, 2023. - Т. 389. - С. 08027. [Scopus]
3. Микулик И. И., Благовещенская Е. А. Распараллеливание гибридного алгоритма муравьиной колонии с изменяющимися с помощью генетического алгоритма параметрами //Проблемы информатики. - 2023. - №. 2 (59). - С. 86-97.
4. Blagoveshchenskaya E., Mikulik I. Butler Group Direct Decomposition Classification With Applications to Parallel Algorithms //Advances in Systems Science and Applications. - 2023. - Т. 23. - №. 3. - С. 153-163. [Scopus, Q2]
5. Микулик И.И. Методика для решения задачи выбора признаков в регрессионной модели Кокса // Вестник Астраханского Государственного Технического университета. Серия: управление, вычислительная техника и информатика. - 2024. - №. 3. - С. 85-94. [Перечень ВАК]
6. Микулик И. И., Жаринов Г. М., Кнеев А. Ю. Алгоритм построения функции риска расширенной модели Кокса и его применение на базе данных больных раком предстательной железы //Advanced Engineering Research (Rostov-on-Don). - 2024. - Т. 24. - №. 4. - С. 413-423. [Перечень ВАК]
7. Микулик И. И., Благовещенская Е. А., Ходаковский В. А. Распараллеливание метода муравьев-опылителей для задачи построения модели анализа выживаемости //Международный научно-исследовательский журнал. -2024. - №. 12 (150). - С. 34. [Перечень ВАК]
Структура и объем диссертации.
Диссертация состоит из введения, пяти глав, заключения, списка литературы, трех приложений; включает 21 таблицу, 36 рисунков. Объем работы состоит из 152 страниц машинописного текста. Список литературы содержит 1 39 наименований.
Глава 1. Постановка задачи и анализ современных подходов к ее
решению
Анализ выживаемости представляет собой совокупность статистических методов, позволяющих оценить вероятность наступления некоторого исследуемого терминального события, после которого объект выпадает из наблюдения. Методы оперируют с данными, имеющими временную характеристику. Временной характеристикой является время от начала наблюдения до наступления терминального события или выхода объекта из-под наблюдения. Анализ выживаемости позволяет оценивать вероятность наступления терминального события и выявить факторы, которые могут повлиять на него [15].
1.1. Основные понятия анализа выживаемости
Анализ выживаемости, как раздел статистики, имеет свой набор понятий и определений. Анализ выживаемости изучает время до наступления терминального события, поэтому важно дать его строгое определение. Терминальное событие — это необратимое и однократное событие, связанное с исследуемым процессом, после которого дальнейший учет времени для данного объекта прекращается. Его возникновение свидетельствует о достижении исследуемого исхода, в отличие от цензурированных наблюдений, при которых событие не наступает в течение периода наблюдения. Критериями терминального события являются релевантность, финальность и измеримость. Эквивалентными являются термины «отказ» или «критическое событие» [16].
Модели анализа выживаемости строят свои прогнозы для объектов по их признакам. Признаки (или ковариаты) в анализе выживаемости — это наблюдаемые переменные, характеризующие объекты исследования и потенциально влияющие на время наступления терминального события. Признаки могут быть численными или категориальными.
Наблюдением (или экземпляром, объектом) называется единица анализа, для которой определены: время наблюдения (до терминального события или цензурирования), статус события (наступило или цензурировано), значения признаков (ковариат).
1.1.1. Цензурированные данные
Важным преимуществом моделей анализа выживаемости перед классическими регрессионными методами является их способность учитывать цензурированные данные. Под цензурированными данными понимаются наблюдения, информация о которых становится недоступной до наступления терминального события. В таких случаях известно, что событие не произошло в течение периода наблюдения, но его статус после окончания этого периода остаётся неизвестным [17]. Таким образом, цензурирование отражает неполноту данных, вызванную ограниченным временем наблюдения или преждевременным выходом объекта из исследования. Явление возникает естественным образом при сборе и подготовке статистических данных: наблюдение за некоторыми объектами начинается позже, чем за другими, а в связи с практической сложностью непрерывного наблюдения за объектами, некоторые объекты выбывают до его завершения.
Говорят, что данные цензурированы справа, если данные выпали из-под наблюдения до его завершения. Наблюдаемое время данных У являются:
где С - время цензурирования, а Т - время наступления терминального события.
В противном случае, если нет информации о наблюдениях на начало периода, то говорят, что такие данные цензурированы слева:
Особенностью анализа выживаемости является возможность учета таких данных, следовательно, модели располагают большим количеством информации и, как следствие, более высокую точность построения прогнозов наступления терминального события. Данные для обучения моделей анализа выживаемости, помимо характеристик объектов наблюдения, должны содержать два обязательных
У = тт(Т, С),
У = та х(Т, С)
Для каждого объекта наблюдения определен индикатор наблюдения:
(1)
поля - время наблюдения и признак наступления терминального события. Временной характеристикой объекта является значение времени наблюдения за объектом, которое может являться как дискретной, так и непрерывной величиной [18]-[20]. Признаком наступления терминального события обычно является булево значение, определяющее, наступило ли терминальное событие за период, указанный во временной характеристике объекта. Если событие не наступило, а время наблюдения объекта меньше общего времени наблюдения, то имеет место цензурирование данных.
1.1.2. Функции оценки риска
В анализе выживаемости для оценки риска наступления рассматриваемого события используются несколько функций - функция выживаемости, функция риска, функция кумулятивной доли выживших и кумулятивная функция риска.
Функция выживаемости - вероятностная характеристика, функция, определяющая вероятность выживания (отсутствия терминального события) на протяжении заданного временного интервала. Другими словами, функция выживаемости 5(1) определяется как вероятность того, что терминальное событие не наступит до момента времени 1:
5(1) = Р(Т > О,
где Т - время наступления терминального события.
Функция выживаемости является базовым показателем в анализе выживаемости, на основе которой строятся другие оценочные функции, такие как функция риска или функция кумулятивной доли выживших. Функция выживаемости также используется для оценки влияния признаков на прогноз модели [21].
Также на практике используется кумулятивная функция распределения риска, определяющая вероятность того, что к моменту времени 1 терминальное событие наступило:
F(t) = Р(Т < 0 = 1-5(1)
Она отражает кумулятивную вероятность того, что объект выживет не менее, чем до указанного момента времени. С помощью кумулятивной функции распределения можно отслеживать динамику выживания объекта, проводить сравнительный анализ между различными группами и определять влияние различных факторов на выживаемость [22]. Кроме того, с помощью производной кумулятивной функции распределения по можно получить функцию плотности распределения, отражающая частоту наступления терминального события в момент времени t :
„ N dF(t) /(t) = F'(t) = _12
Функция плотности распределения f(t) является фундаментальной характеристикой временного распределения терминальных событий. Она показывает интенсивность терминальных событий в зависимости от времени и позволяет оценить скорость наступления таких событий в исследуемой группе объектов. Функция плотности распределения также может быть использована для оценки выживаемости и выявления факторов, влияющих на выживаемость [23].
Функция риска, также известная как интенсивность событий [24] - это функция, определяющая в каждый момент времени вероятность наступления терминального события при условии, что оно не наступило до этого момента. Формально она выражает условную вероятность того, что объект, для которого терминальное событие не наступило до момента t, испытает терминальное событие в бесконечно малом интервале ( t,t + At] . Оценка функции интенсивности вычисляется следующим образом:
f(t) P(t<T<t + At\T>t)
A(t) = lim ---
w S(t) At^0 At
Функция риска служит концептуальным и вычислительным ядром моделей анализа выживаемости, определяя их теоретические и прогностические свойства. В исследовательской практике именно спецификация функции риска становится ключевым этапом построения модели: через оценку ее параметров и анализ
функциональной зависимости от ковариат исследователь фактически задает структуру всей модели.
Принципиально, что выбор конкретной формы функции риска эквивалентен выбору модели - различные аналитические представления ЛЮ порождают различные классы моделей [25]. Она позволяет оценивать влияние различных факторов на выживаемость и устанавливать связь между ними [26].
Использование функции риска позволяет проводить более точные анализы выживаемости, прогнозировать вероятность событий и принимать обоснованные решения в инженерии, медицине, биологии, экономике и других областях, где изучается динамика выживаемости объектов [27] или прогнозирование событий, которые могут произойти в будущем [28].
Для некоторых моделей также используется кумулятивная функция риска
Н(€). В то время как функция риска Л(^) описывает вероятность наступления
события в конкретный момент времени 1, кумулятивная функция риска отражает
общий накопленный риск к моменту времени
с
н(г) = I л(т)йт 0
Кумулятивная функция риска также связана с функцией выживаемости. Заметим, что
= ЯО = dF(t) = а(1 - Б(г)) = <я(г) = а
А() Б(1) Б(1)(И Б(1)(И Б(1)(И (И ()
Проинтегрировав функцию риска, справедливо: с
(Л г
н(г) = I —г1пБ(т) дх = - 1пБ(т) „ = - 1п5(1) + 1п5(0) = - 1п5(1) ) ат 0
0
Функции, оценивающие риск наступления терминального события, являются важнейшими инструментами для построения различных моделей анализа выживаемости. Их использование позволяет не только оценить вероятность наступления события, но и выявить факторы, влияющие на риск, что особенно важно в прикладных областях науки.
1.2. Модели анализа выживаемости и их сравнение
Модели и методы анализа выживаемости традиционно разделяют на классические статистические модели и методы машинного обучения [29]. В рамках статистического подхода выделяют три основные группы моделей. Непараметрические модели, такие как метод Каплана-Мейера и модель Нельсона-Аалена, не требуют предположений о виде распределения. Параметрические модели, включая экспоненциальную модель, модель Вейбулла и другие [30], предполагают определенную форму распределения времени до наступления события. Особое место занимают полупараметрические модели, среди которых наиболее распространена модель пропорциональных рисков Кокса, сочетающая параметрическую и непараметрическую компоненты. В отличие от классических методов, модели машинного обучения делают акцент на автоматическом выявлении сложных зависимостей в данных, часто жертвуя интерпретируемостью результатов в пользу прогностической точности. Выбор между этими подходами определяется конкретными задачами исследования, требованиями к интерпретации и характером имеющихся данных. 1.2.1. Статистические модели
Статистические модели анализа выживаемости классифицируются на три основные группы в зависимости от типа их параметризации. Непараметрические модели не используют априорных предположений о виде распределения времени до наступления терминальных события. Они могут быть использованы при построении кривых выживаемости, их анализе и сравнении для различных групп объектов, разделенных по определенному признаку. Параметрические модели предполагают использование базового распределения времени выживания, зависящего от параметров, и позволяют оценивать как функцию выживаемости (или функцию риска), так и влияние признаков. Полупараметрические модели оценивают риск наступления терминального события как с помощью параметрической функции влияния признаков, так и с непараметрической базовой функции риска.
Параметрические модели разделяются на базовые и регрессионные модели. Базовые модели учитывают только время наступления события, регрессионные -учитывают также влияние ковариат. И те, и другие модели основываются на информации о характере распределения риска наступления события. Регрессионные модели позволяют определить, какие признаки уменьшают или увеличивают риск наступления терминального события, а также какая группа признаков имеет большую прогностическую значимость для конкретной модели.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Математическое и алгоритмическое обеспечение статистического анализа данных типа времени жизни2016 год, кандидат наук Чимитова, Екатерина Владимировна
Совершенствование моделей оценки банковских рисков кредитования с применением технологий искусственного интеллекта2022 год, кандидат наук Широбокова Маргарита Александровна
Факторы прогноза выживаемости больных локализованным, местно-распространненым и метастатическим раком предстательной железы при различных видах лечения2019 год, доктор наук Грицкевич Александр Анатольевич
Статистический анализ критериев для проверки гипотезы однородности распределений по случайно цензурированным наблюдениям2018 год, кандидат наук Филоненко Петр Александрович
Многопараметрический анализ лабораторных показателей крови для получения диагностической информации в экспериментальной и клинической онкологии2004 год, доктор медицинских наук Боженко, Владимир Константинович
Список литературы диссертационного исследования кандидат наук Микулик Илья Игоревич, 2025 год
Список литературы
1. George B., Seals S., Aban I. Survival analysis and regression models //Journal of nuclear cardiology. - 2014. - Т. 21. - №. 4. - С. 686-694. DOI: 10.1007/s12350-014-9908-2.
2. Purnami S. W., Putra R. S., Edina A. I., Pertiwi I. N., Sukur E., Soraya N. Cox Model Survival Analysis to Evaluate Treatment of Electro-Capacitive Cancer Therapy (ECCT) For Cancer Patients // Journal of Physics: Conference Series. 2021. Vol. 1863. No. 1. P. 012036. DOI 10.1088/1742-6596/1863/1/012036.
3. Проурзин В. А. Динамические модели риска в анализе выживаемости, теории надежности и ускоренных испытаниях //Моделирование и анализ безопасности и риска в сложных системах. - 2020. - С. 186-193.
4. Dokoumetzidis A., Valsami G., Macheras P. Modelling and simulation in drug absorption processes //Xenobiotica. - 2007. - Т. 37. - №. 10-11. - С. 1052-1065.
5. Зозуленко К. С. Математические модели определения цены опционов //современные проблемы и тенденции развития. - 2018. - С. 249.
6. Cox D. R. Regression models and life - tables //Journal of the Royal Statistical Society: Series B (Methodological). - 1972. - Т. 34. - №. 2. - С. 187-202.
7. Wiegrebe S., Kopper P., Sonabend R., Bischl B., Bender A. Deep learning for survival analysis: a review // Artificial Intelligence Review. 2024. Vol. 57. No. 3. P. 65.
8. Remeseiro B., Bolon-Canedo V. A review of feature selection methods in medical applications //Computers in biology and medicine. - 2019. - Т. 112. - С. 103375.
9. Kaplan E. L., Meier P. Nonparametric estimation from incomplete observations //Journal of the American statistical association. - 1958. - Т. 53. - №. 282. - c. 457-481.
10. Fine J. P., Gray R. J. A proportional hazards model for the subdistribution of a competing risk //Journal of the American statistical association. - 1999. - Т. 94. - №. 446. - С. 496-509.
11. Candes E., Lei L., Ren Z. Conformalized survival analysis //Journal of the Royal Statistical Society Series B: Statistical Methodology. - 2023. - Т. 85. - №. 1. - С. 24-45.
12. Roshani D., Ghaderi E. Comparing smoothing techniques for fitting the nonlinear effect of covariate in Cox models //Acta Informatica Medica. - 2016. - Т. 24.
- №. 1. - С. 38.
13. Meldo A. The natural language explanation algorithms for the lung cancer computer-aided diagnosis system / A. Meldo, L. Utkin, M. Kovalev, E. Kasimov // Artificial Intelligence in Medicine. - 2020. - Vol. 108.
14. Pawar A., Chowdhury O. R., Salvi O. A narrative review of survival analysis in oncology using R //Cancer Research, Statistics, and Treatment. - 2022. - Т. 5. - №. 3.
- С. 554-561.
15. Шредер О. В., Горячев Д. В., Меркулов В. А. Основные принципы расчета необходимой численности участников клинических исследований. Часть 2. Анализ выживаемости (обзор) //Ведомости Научного центра экспертизы средств медицинского применения. - 2025. - Т. 15. - №. 1. - С. 92-104.
16. Изергина А. Р. Обзор статистических методов оценки надежности // Математические модели современных экономических процессов, методы анализа и синтеза экономических механизмов. Актуальные проблемы и перспективы менеджмента организаций в России: сб. ст. XII Всерос. науч.-практ. конф. / под ред. Д. А. Новикова. - Самара: Изд-во СамНЦ РАН, 2018. - С. 45-50.
17. Herbst R. S., Tsuboi M., John T., Kato T., Majem M., Grohe C., Wang J., Goldman J. W., Lu S., Su W.-C., de Marinis F., Shepherd F. A., Lee K. H., Le N., Dechaphunkul A., Kowalski D. M., Poole L., Stachowiak M., Rukazenkov Y., Wu Y.-L. Overall survival analysis from the ADAURA trial of adjuvant osimertinib in patients with resected EGFR-mutated (EGFRm) stage IB-IIIA non-small cell lung cancer (NSCLC) // Journal of Clinical Oncology. 2023. Vol. 41, no. 17. P. LBA3. DOI: 10.1200/Jm.2023.41.17_suppl.LBA3.
18. Singer J. D., Willett J. B. It's about time: Using discrete-time survival analysis to study duration and the timing of events //Journal of educational statistics. -1993. - Т. 18. - №. 2. - С. 155-195.
19. Kvamme H., Borgan 0. Continuous and Discrete-Time Survival Prediction with Neural Networks // arXiv preprint arXiv:1910.06724. - 2019. - 35 p. - DOI: 10.48550/arXiv.1910.06724.
20. Васильев Ю. А. Критический обзор методов анализа выживаемости на основе бустинг ансамблей // Материалы форума «Ломоносов-2023». М.: МАКС Пресс, 2023.
21. Islam M. M., Fatema F. Do business strategies affect firms' survival during the COVID-19 pandemic? A global perspective //Management Decision. - 2023. - Т. 61. - №. 3. - С. 861-885.
22. Бондарева Н. А. Поиск предсказательных признаков при анализе выживаемости //76-я научная конференция студентов и аспирантов Белорусского государственного университета. - 2019. - С. 142-145
23. Лётчиков А. В., Матвеев Р. Ю., Широбокова М. А. Решение проблемы цензурированных данных при моделировании оценки индивидуального кредитного риска //Вестник Удмуртского университета. Серия «Экономика и право». - 2019. - Т. 29. - №. 1. - С. 34-41.
24. Калинин М.Н., Хасанова Д.Р. Церебролизин и оптимизация сроков возобновления антикоагулянтной терапии при ишемическом инсульте: комбинированный ретроспективный анализ выживаемости исследования CEREHETIS // Журнал неврологии и психиатрии им. С.С. Корсакова. 2023. Т. 123, № 5. С. 45-52.
25. Chambless L. E., Cummiskey C. P., Cui G. Several methods to assess improvement in risk prediction models: extension to survival analysis //Statistics in medicine. - 2011. - Т. 30. - №. 1. - С. 22-38.
26. Liu X. Survival Analysis: Models and Applications. - Chichester: John Wiley & Sons, 2012. - 464 p. - ISBN: 978-0-470-97715-6.
27. Bonofiglio F., Beyersmann J., Schumacher M., Koller M., Schwarzer G. Meta-analysis for aggregated survival data with competing risks: a parametric approach using cumulative incidence functions // Research Synthesis Methods. - 2016. - Vol. 7, no. 3. - P. 282-293. - DOI: 10.1002/jrsm.1165.
28. Kozlowski E., Kowalska B., Kowalski D., Mazurkiewicz D. Survival function in the analysis of the factors influencing the reliability of water wells operation // Water Resources Management. - 2019. - Vol. 33, no. 14. - P. 4909-4921. - DOI: 10.1007/s11269-019-02419-0
29. Emmert-Streib F., Dehmer M. Introduction to survival analysis in practice //Machine Learning and Knowledge Extraction. - 2019. - T. 1. - №. 3. - C. 1013-1038.
30. Caraviello D. Z., Weigel K. A., Gianola D. Analysis of the relationship between type traits and functional survival in US Holstein cattle using a Weibull proportional hazards model //Journal of Dairy Science. - 2004. - T. 87. - №2. 8. - C. 26772686.
31. Saikia R., Barman M. P. A review on accelerated failure time models //International Journal of Statistics and Systems. - 2017. - T. 12. - №. 2. - C. 311-322.
32. Patel K., Kay R., Rowell L. Comparing proportional hazards and accelerated failure time models: an application in influenza //Pharmaceutical Statistics: The Journal of Applied Statistics in the Pharmaceutical Industry. - 2006. - T. 5. - №2. 3. - C. 213-224.
33. Snapinn S. M., Jiang Q. I., Iglewicz B. Illustrating the impact of a time-varying covariate with an extended Kaplan-Meier estimator //The American Statistician.
- 2005. - T. 59. - №. 4. - C. 301-307.
34. Bladt M., Furrer C. Expert Kaplan-Meier estimation //Scandinavian Actuarial Journal. - 2024. - T. 2024. - №. 1. - C. 1-27.
35. Karim S., Iqbal M.S., Ahmad N., Ansari M.S., Mirza Z., Merdad A., Jastaniah S.D., Kumar S. Gene expression study of breast cancer using Welch Satterthwaite t-test, Kaplan-Meier estimator plot and Huber loss robust regression model // Journal of King Saud University - Science. - 2023. - Vol. 35, no. 1. - Article 102447.
- DOI: 10.1016/j.jksus.2022.102447.
36. Messori A., Fadda V., Romeo M.R., Trippoli S., Maratea D., Marinai C., Vaiani M., Bosi S., Gualtieri G., Bacci T., Gualtieri P. A comparison of statistical analysis between "real" patients reported in Kaplan-Meier curves and «reconstructed» patients estimated through the IPDfromKM method: analysis of eight trials evaluating catheter ablation of ventricular tachycardia // Cureus. - 2023. - Vol. 15, no. 10. - Article e47891.
- DOI: 10.7759/cureus.47891.
37. Colosimo E.A., Ferreira F.F., Oliveira M.D., Sousa C.B. Empirical comparisons between Kaplan-Meier and Nelson-Aalen survival function estimators // Journal of Statistical Computation and Simulation. - 2002. - Vol. 72, no. 4. - P. 299-308.
- DOI: 10.1080/00949650212847.
38. Jenkins S. P. Survival analysis //Unpublished manuscript, Institute for Social and Economic Research, University of Essex, Colchester, UK. - 2005. - T. 42. - C. 5456.
39. Borgan 0. Three contributions to the encyclopedia of biostatistics: the Nelson-Aalen, Kaplan-Meier, and Aalen-Johansen //Preprint series. Statistical Research Report http://urn. nb. no/URN: NBN: no-23420. - 1997.
40. Eswar Reddy R., Santhi K. The Survival Analysis of Mental Fatigue Utilizing the Estimator of Kaplan-Meier and Nelson-Aalen //International Conference on Cognitive Computing and Cyber Physical Systems. - Cham : Springer Nature Switzerland, 2023. - C. 218-241.
41. Widiharih T. Kaplan-Meier and Nelson-Aalen estimators for credit scoring //media statistika. - T. 16. - №. 1. - C. 37-46.
42. Chen T. Survival Analysis Revisited: Understanding and Unifying Poisson, Exponential, and Cox Models in Fall Risk Analysis //arXiv preprint arXiv:2501.03058. -2025.
43. Zhu S., Campanella O., Chen G. Estimation of parameters in the Weibull model from microbial survival data obtained under constant conditions with come-up times //Journal of Food Engineering. - 2021. - T. 292. - C. 110364.
44. Buzrul S. The Weibull model for microbial inactivation //Food Engineering Reviews. - 2022. - T. 14. - №. 1. - C. 45-61.
45. Sato H., Goto T., Hayashi A., Kawabata H., Okada T., Takauji S., Sasajima J., Enomoto K., Fujiya M., Oyama K., и др. Prognostic significance of skeletal muscle decrease in unresectable pancreatic cancer: Survival analysis using the Weibull exponential distribution model // Pancreatology. - 2021. - Т. 21. - № 5. - С. 892-902. -DOI: 10.1016/j.pan.2021.03.002.
46. Абдурахмонов П.К., Мансуров Ю.Н., Намозов С.Б., Рахматов Х.А., Йулдошов Р.М. Анализ надежности вагонов метрополитена по данным эксплуатационных отказов // Научно-технический журнал ФерПИ. Фергана, 2024. Т.28 № 1. С. - С. 88-96.
47. Vigas M. V. P., Fatoretto M. B., Slanzon G. S., Mion E. M. M., Bittar C. M. M. Red propolis effect analysis of dairy calves health based on Weibull regression model with long-term survivors // Research in Veterinary Science. - 2021. - Т. 136. - С. 464471. - DOI: 10.1016/j.rvsc.2021.03.019.
48. Zhu S., Li B., Chen G. A modified Weibull model for design of oscillated high hydrostatic pressure processes //LWT. - 2021. - Т. 143. - С. 111118.
49. Vigas M.V.P., Fatoretto M.B., Slanzon G.S., Bittar C.M.M. Red propolis effect analysis of dairy calves health based on Weibull regression model with long-term survivors // Research in Veterinary Science. - 2021. - Vol. 136. - P. 464-471. - DOI: 10.1016/j.rvsc.2021.03.011.
50. Usman A., Doguwa S.I., Sadiq I.A., Akor A. Exploring Accelerated Failure Time Models for Tuberculosis Survival: Loglogistic and Weibull Survival Regression Model // Journal of Science Research and Reviews. - 2025. - Vol. 2, no. 1. - P. 27-36. -DOI: 10.70882/josrar.2025.v2i1.27
51. Afin R., Tibor K., Ilona C. Firm performance and markets: survival analysis of medium and large manufacturing enterprises in Indonesia //Journal of Industrial and Business Economics. - 2024. - С. 1-45.
52. Gencer G. Lung Cancer Survival Analysis: A Comparative Evaluation of Cox Proportional Hazards and Accelerated Failure Time Models: An Analytical Study //Turkiye Klinikleri. Tip Bilimleri Dergisi. - 2025. - Т. 45. - №. 1. - С. 8-16.
53. Kalu U., Okafor N., Ezeh C., Nwankwo O. Systematic assessment of Cox proportional hazards, exponential, log-normal survival models in time to event using breast cancer data // World News of Natural Sciences. - 2025. - Vol. 58. - P. 163-182. -DOI: 10.1234/wnns.2025.58.163.
54. Hadou A., Belaadi A., Boumaaza M., Ghernaout D. The Impact of Test Number on the Mechanical Properties of Dracaena Draco Cellulose Fibers for Composite Structures: Weibull Statistic // Journal of Natural Fibers. - 2024. - Vol. 22, no. 1. - Article e2442681. - DOI: 10.1080/15440478.2024.2442681.
55. Prentice R. L. Introduction to Cox (1972) regression models and life-tables //Breakthroughs in Statistics: Methodology and Distribution. - New York, NY : Springer New York, 1992. - C. 519-526.
56. Powell J. L. Estimation of semiparametric models //Handbook of econometrics. - 1994. - T. 4. - C. 2443-2521.
57. McLernon D. J., Giardiello D., Van Calster B., Wynants L., van Geloven N., van Smeden M., Therneau T., Steyerberg E. W. Assessing performance and clinical usefulness in prediction models with survival outcomes: practical guidance for Cox proportional hazards models // Annals of Internal Medicine. - 2023. - T. 176. - № 1. -C. 105-114. - DOI: 10.7326/M22-0844.
58. Tao X., Wang M., Ji Y. The application of graph-structured cox model in financial risk early warning of companies //Sustainability. - 2023. - T. 15. - №. 14. - C. 10802.
59. Gomez-Gonzalez J. E., Uribe J. M., Valencia O. M. Does economic complexity reduce the probability of a fiscal crisis? //World Development. - 2023. - T. 168. - C. 106250.
60. Avelino-Silva V.I., Thomazella M.V., Marmorato M.P., Correia C.A., Dias J.Z.C., Maestri A., Cerqueira N.B., Moreira C.H.V., Buccheri R., Félix A.C., Zanella L.G.F.A.B.E., Costa P.R., Kallas E.G. Viral kinetics in sylvatic yellow fever cases // The Journal of Infectious Diseases. - 2023. - Vol. 227, no. 9. - P. 1097-1103. - DOI: 10.1093/infdis/jiac435.
61. Ziadi C., Sánchez J.P., Sánchez M., Morales R., Molina A. Survival analysis of productive life in Florida dairy goats using a Cox proportional hazards model // Journal of Animal Breeding and Genetics. - 2023. - Vol. 140, no. 4. - P. 431-439. - DOI: 10.1111/jbg.12769.
62. Del Brutto O.H., Mera R.M., Rumbea D.A., Recalde B.Y., Sedler M.J. High social risk and mortality. A prospective study in community-dwelling older adults living in a rural Ecuadorian village // Preventive Medicine Reports. - 2023. - Vol. 32. - Article 102146. - DOI: 10.1016/j.pmedr.2023.102146.
63. Papathanasiou D., Demertzis K., Tziritas N. Machine failure prediction using survival analysis //Future Internet. - 2023. - Т. 15. - №. 5. - С. 153.
64. Зулькарнаев А. Б. Особенности анализа выживаемости на примере пациентов в «листе ожидания» трансплантации почки //Бюллетень сибирской медицины. - 2019. - Т. 18. - №. 2. - С. 215-222.
65. Austin P. C., Lee D. S., Fine J. P. Introduction to the analysis of survival data in the presence of competing risks //Circulation. - 2016. - Т. 133. - №. 6. - С. 601-609.
66. Dianatkhah M., Rahgozar M., Talaei M., Karimlou M., Sadeghi M., Oveisgharan S., Sarrafzadegan N. Comparison of competing risks models based on cumulative incidence function in analyzing time to cardiovascular diseases // ARYA Atherosclerosis. - 2014. - Vol. 10, no. 1. - P. 6-12. - PMID: 24963307.
67. Andersen P.K., Geskus R.B., de Witte T., Putter H. Competing risks in epidemiology: possibilities and pitfalls // International Journal of Epidemiology. - 2012.
- Vol. 41, no. 3. - P. 861-870. - DOI: 10.1093/ije/dyr213.
68. Schreiner A.D., Mellinger J.L., Fontana R.J., Volk M.L., Waljee A.K., Lok A.S.F., Tapper E.B. FIB-4 and incident severe liver outcomes in patients with undiagnosed chronic liver disease: A Fine-Gray competing risk analysis // Liver International. - 2023. - Vol. 43, no. 1. - P. 170-179. - DOI: 10.1111/liv.15295.
69. Al-Essa L.A., Soliman A.A., Abd-Elmougod G.A., Alshanbari H.M. Comparative study with applications for Gompertz models under competing risks and generalized hybrid censoring schemes // Axioms. - 2023. - Vol. 12, no. 4. - Article 322.
- DOI: 10.3390/axioms12040322.
70. Abadi A., Amanpour F., Bajdik C., Yavari P. Breast cancer survival analysis: Applying the generalized gamma distribution under different conditions of the proportional hazards and accelerated failure time assumptions // International Journal of Preventive Medicine. - 2012. - Vol. 3, no. 9. - P. 644-651. - PMID: 23024854.
71. Ning Z., Lin Z., Xiao Q., Du D., Feng Q., Chen W., Zhang Y. Multi-constraint latent representation learning for prognosis analysis using multi-modal data // IEEE Transactions on Neural Networks and Learning Systems. - 2023. - Vol. 34, no. 7.
- P. 3737-3750. - DOI: 10.1109/TNNLS.2021.3112194.
72. Tarapituxwong S., Chimprang N., Yamaka W., Polard P. A Lasso and Ridge-Cox Proportional Hazard Model Analysis of Thai Tourism Businesses' Resilience and Survival in the COVID-19 Crisis // Sustainability. - 2023. - Vol. 15, no. 18. - Article 13582. - DOI: 10.3390/su151813582.
73. Wang Q., Li Y., Zhang H., Liu X., Chen Y., Zhao M. A light gradient boosting machine learning-based approach for predicting clinical data breast cancer // Multiscale and Multidisciplinary Modeling, Experiments and Design. - 2025. - Vol. 8, no. 1. - P. 75-85. - DOI: 10.1007/s41939-025-00075-0.
74. Ji L., Li S. A Dynamic Financial Risk Prediction System for Enterprises Based on Gradient Boosting Decision Tree Algorithm //Systems and Soft Computing. -2025. - C. 200189.
75. Van Belle V., Pelckmans K., Suykens J.A.K., Van Huffel S. Support vector machines for survival analysis // Proceedings of the Third International Conference on Computational Intelligence in Medicine and Healthcare (CIMED2007). - 2007. - P. 1-8
76. Shivaswamy P. K., Chu W., Jansche M. A support vector approach to censored targets //Seventh IEEE international conference on data mining (ICDM 2007).
- IEEE, 2007. - C. 655-660.
77. Ibrahim N.A., Kudus A., Daud I., Abu Bakar M.R. Decision Tree for Competing Risks Survival Probability in Breast Cancer Study // International Journal of Biological and Medical Sciences. - 2008. - Vol. 3, no. 1. - P. 25-29.
78. Oh E.J., Alfano C.M., Esteva F.J., Baron P.L., Xiong W., Tortorella B., Chen E.I., Chiuzan C. Risk stratification using tree-based models for recurrence-free survival
in breast cancer // JCO Oncology Advances. - 2025. - Vol. 2. - Article e2400011. - DOI: 10.1200/OA.24.00011
79. Jiang X., Xue D., Brufsky A., Khan S., Neapolitan R. A new method for predicting patient survivorship using efficient Bayesian network learning // Cancer Informatics. - 2014. - Vol. 13. - P. 47-57. - DOI: 10.4137/CIN.S13053.
80. Delgado R., Nunez-Gonzalez J.D., Yebenes J.C., Lavado A. Survival in the Intensive Care Unit: a prognosis model based on Bayesian classifiers // Artificial Intelligence in Medicine. - 2021. - Vol. 115. - Article 102054. - DOI: 10.1016/j.artmed.2021.102054.
81. Zhu X., Yao J., Huang J. Deep convolutional neural network for survival analysis with pathological images //2016 IEEE international conference on bioinformatics and biomedicine (BIBM). - IEEE, 2016. - C. 544-547.
82. Biganzoli E., Boracchi P., Mariani L., Marubini E. Feed forward neural networks for the analysis of censored survival data: a partial logistic regression approach // Statistics in Medicine. - 1998. - T. 17. - № 10. - C. 1169-1186. -DOI: 10.1002/(SICI)1097-0258(19980530)17:10<1169::AID-SIM796>3.0.CO;2-D.
83. Hao J., Kim Y., Mallavarapu T., Oh J.H., Kang M. Interpretable deep neural network for cancer survival analysis by integrating genomic and clinical data // BMC Medical Genomics. - 2019. - T. 12. - C. 189. - DOI: 10.1186/s12920-019-0624-2.
84. Kovalev M. S., Utkin L. V. A robust algorithm for explaining unreliable machine learning survival models using the Kolmogorov-Smirnov bounds //Neural Networks. - 2020. - T. 132. - C. 1-18.
85. Kovalev M., Utkin L., Coolen F., Konstantinov A. Counterfactual explanation of machine learning survival models // Informatica. - 2021. - T. 32. - № 4. - C. 817-847. - DOI: 10.15388/21-INFOR468.
86. Kovalev M. S., Utkin L. V., Kasimov E. M. SurvLIME: A method for explaining machine learning survival models //Knowledge-Based Systems. - 2020. - T. 203. - C. 106164.
87. Ewees A. A., Al-Qaness M. A. A., Abualigah L., Oliva D., Algamal Z. Y., Anter A. M., Ibrahim R. A., Ghoniem R. M., Abd Elaziz M. Boosting arithmetic
optimization algorithm with genetic algorithm operators for feature selection: Case study on Cox proportional hazards model // Mathematics. - 2021. - Т. 9. - № 18. - Статья 2321. - DOI: 10.3390/math9182321.
88. Rahat M., Kharazian Z. Survloss: A new survival loss function for neural networks to process censored data //PHM Society European Conference. - 2024. - Т. 8.
- №. 1. - С. 7-7.
89. Xiao Y., Abrahamowicz M., Moodie E. E. M. Accuracy of conventional and marginal structural Cox model estimators: a simulation study //The international journal of biostatistics. - 2010. - Т. 6. - №. 2.
90. Xiao Y., Moodie E. E. M., Abrahamowicz M. Comparison of approaches to weight truncation for marginal structural Cox models //Epidemiologic Methods. - 2013.
- Т. 2. - №. 1. - С. 1-20.
91. Qin J., Shen Y. Statistical methods for analyzing right-censored length-biased data under Cox model //Biometrics. - 2010. - Т. 66. - №. 2. - С. 382-392.
92. Lu Y., Aslani S., Zhao A., Shahin A., Barber D., Emberton M., Alexander D.C., Jacob J. A hybrid CNN-RNN approach for survival analysis in a Lung Cancer Screening study // Heliyon. - 2023. - Vol. 9, no. 8. - Article e18695. - DOI: 10.1016/j.heliyon.2023 .e18695.
93. Baek E.T., Kim S., Lee S., Lee K. Survival time prediction by integrating Cox proportional hazards network and distribution function network // BMC Bioinformatics. - 2021. - Vol. 22, no. 1. - Article 192. - DOI: 10.1186/s12859-021-04103-w.
94. Harrell F.E., Califf R.M., Pryor D.B., Lee K.L., Rosati R.A. Evaluating the yield of medical tests // JAMA. - 1982. - Vol. 247, no. 18. - P. 2543-2546. - DOI: 10.1001/jama.1982.03320430047030.
95. Alabdallah A., Ohlsson M., Pashami S., Rognvaldsson T. The Concordance Index decomposition: A measure for a deeper understanding of survival prediction models // Artificial Intelligence in Medicine. - 2024. - Vol. 148. - Article 102781. - DOI: 10.1016/j.artmed.2024.102781.
96. Hartman N., Kim S., He K., Kalbfleisch J. Pitfalls of the concordance index for survival outcomes // Statistics in Medicine. - 2023. - Vol. 42, no. 13. - P. 2179-2190. - DOI: 10.1002/sim.9717.
97. Румянцева Е. В., Фурманов К. К. Использование вневыборочных остатков Кокса-Снелл при прогнозировании наступления событий //Бизнес-информатика. - 2021. - Т. 15. - №. 1. - С. 7-18.
98. Longato E., Vettoretti M., Di Camillo B. A practical perspective on the concordance index for the evaluation and selection of prognostic time-to-event models // Journal of Biomedical Informatics 108, 2020.
99. Pencina M.J., D'Agostino R.B. OverallC as a measure of discrimination in survival analysis: model specific popula-tion value and confidence interval estimation // Statist. Med. 23. 2004 - С. 2109-2123.
100. Yin Q., Chen W., Zhang C., Wei Z. A convolutional neural network model for survival prediction based on prognosis-related cascaded Wx feature selection // Laboratory Investigation 102. 2022 - С. 1064-1074.
101. Newson R.B. Comparing the predictive powers of survival models using Harrell's C or Somers' D // The Stata Journal. 2010. Vol. 10. No 3. С. 339-358.
102. Rayan A., Soliman A. Applying a neoscore in locally advanced rectal cancer is beneficial in predicting local recurrences after surgery //Plos one. - 2023. - Т. 18. - №2. 5.
103. Bommert A., Rahnenfuhrer J. Adjusted Measures for Feature Selection Stability for Data Sets with Similar Features // В кн.: Nicosia G. и др. (ред.) Machine Learning, Optimization, and Data Science. LOD 2020. Lecture Notes in Computer Science, т. 12565. - Cham: Springer, 2020. - С. 203-214. - DOI: 10.1007/978-3-030-64583-0_19.
104. Bommert A, Welchowski T, Schmid M, Rahnenfuhrer J. Benchmark of filter methods for feature selection in high-dimensional gene expression survival data // Briefings in Bioinformatics, 2021.
105. Govindarajulu U.S., Malloy E.J., Ganguli B., Spiegelman D., Eisen E. A. The comparison of alternative smoothing methods for fitting non-linear exposure-
response relationships with Cox models in a simulation study. The international journal of biostatistics, 5; 2009.
106. Abdel-Basset M., Abdel-Fatah L., Sangaiah A. K. Metaheuristic algorithms: A comprehensive review //Computational intelligence for multimedia big data on the cloud with engineering applications. - 2018. - С. 185-231.
107. Скобцов Ю.А., Федоров Е.Е. Метаэвристики.-Донецк: изд-во «Ноулидж». -2013. - 427 с
108. Zhao F.T., Yao Z., Luan J., Song X. A novel fused optimization algorithm of genetic algorithm and ant colony optimization // Mathematical Problems in Engineering. - 2016. - Vol. 2016. - Article ID 2167413. - DOI: 10.1155/2016/2167413.
109. Afzal A., Buradi A., Jilte R., Shaik S., Kaladgi A.R., Arici M., Lee C.T., Nizetic S. Optimizing the thermal performance of solar energy devices using meta-heuristic algorithms: A critical review // Renewable and Sustainable Energy Reviews. -2023. - Vol. 173. - Article 112903. - DOI: 10.1016/j.rser.2022.112903.
110. Stutzle T., Dorigo M. A short convergence proof for a class of ant colony optimization algorithms // IEEE Transactions on Evolutionary Computation. - 2002. -Vol. 6, no. 4. - P. 358-365. - DOI: 10.1109/TEVC.2002.802444.
111. Кажаров А. А., Курейчик В. М. Муравьиные алгоритмы для решения транспортных задач //Известия Российской академии наук. Теория и системы управления. - 2010. - №. 1. - С. 32-45.
112. Chebouba A., Yalaoui F., Smati A., Amodeo L., Younsi K., Tairi A. Optimization of natural gas pipeline transportation using ant colony optimization // Computers & Operations Research. - 2009. - Vol. 36, no. 6. - P. 1916-1923. - DOI: 10.1016/j.cor.2008.06.005.
113. Kooshari A., Fartash M., Mihannezhad P., Chahardoli M., AkbariTorkestani J., Nazari S. An optimization method in wireless sensor network routing and IoT with water strider algorithm and ant colony optimization algorithm // Evolutionary Intelligence. - 2024. - Vol. 17, no. 3. - P. 1527-1545. - DOI: 10.1007/s12065-023-00835-6.
114. Zhou X. Dynamic route optimization for Chinese e-commerce logistics based on ant colony algorithm // Applied Mathematics and Nonlinear Sciences. - 2023. - Vol. 8, no. 2. - P. 325-336. - DOI: 10.2478/amns-2023-0032.
115. Yang X., Zhu D., Yang C., Zhou C. H-ACO with consecutive bases pairing constraint for designing DNA sequences // Interdisciplinary Sciences: Computational Life Sciences. - 2024. - Vol. 16, no. 3. - P. 593-607. - DOI: 10.1007/s12539-024-00614-1.
116. Wang Y., Han Z. Ant colony optimization for traveling salesman problem based on parameters optimization //Applied Soft Computing. - 2021. - Т. 107. - С. 107439.
117. Whitley D. Next generation genetic algorithms: a user's guide and tutorial //Handbook of metaheuristics. - 2019. - С. 245-274.
118. Katoch S., Chauhan S. S., Kumar V. A review on genetic algorithm: past, present, and future //Multimedia tools and applications. - 2021. - Т. 80. - С. 8091-8126.
119. Singh G., Gupta N. A study of crossover operators in genetic algorithms //Frontiers in nature-inspired industrial optimization. - 2022. - С. 17-32.
120. Lambora A., Gupta K., Chopra K. Genetic algorithm-A literature review //2019 international conference on machine learning, big data, cloud and parallel computing (COMITCon). - IEEE, 2019. - С. 380-384.
121. Скобцов Ю. А., Скобцов В. Ю. Современные модификации и обобщения генетических алгоритмов //Таврический вестник информатики и математики. - 2004. - №. 1. - С. 60-71.
122. Parouha R. P., Verma P. Design and applications of an advanced hybrid meta-heuristic algorithm for optimization problems //Artificial Intelligence Review. -2021. - Т. 54. - №. 8. - С. 5931-6010.
123. Deng W., Xu J., Zhao H. An improved ant colony optimization algorithm based on hybrid strategies for scheduling problem //IEEE access. - 2019. - Т. 7. - С. 20281-20292.
124. Blagoveshchenskaya E. A., Mikulik I. I., Strungmann L. H. Ant colony optimization with parameter update using a genetic algorithm for travelling salesman
problem //Models and Methods for Researching Information Systems in Transport 2020 (MMRIST 2020). - 2020. - №. 1. - С. 20-25.
125. Neumann F., Sudholt D., Witt C. Computational complexity of ant colony optimization and its hybridization with local search //Innovations in swarm intelligence. - Berlin, Heidelberg : Springer Berlin Heidelberg, 2009. - С. 91-120.
126. Микулик И. И., Благовещенская Е. А. Распараллеливание гибридного алгоритма муравьиной колонии с изменяющимися с помощью генетического алгоритма параметрами //Проблемы информатики. - 2023. - №. 2 (59). - С. 86-97.
127. Liu G., Bai Y., Zhu L., Wang Q., Zhang W. A sequential excitation and simplified ant colony optimization based global extreme seeking control method for performance improvement // Swarm and Evolutionary Computation. - 2024. - Vol. 86. -P. 101522. - DOI: 10.1016/j.swevo.2024.101522.
128. Essaid M., Idoumghar L., Lepagnot J., Brevilliers M. GPU parallelization strategies for metaheuristics: a survey // International Journal of Parallel, Emergent and Distributed Systems. - 2019. - Vol. 34, no. 5. - P. 497-522. - DOI: 10.1080/17445760.2018.1428969.
129. Zhang N. Moore's Law is dead, long live Moore's Law! //arXiv preprint arXiv:2205.15011. - 2022.
130. Соснин В.В., Балакшин П.В., Шилко Д.С., Пушкарев Д.А., Мишенёв А.В., Кустарев П.В., Тропченко А.А. Введение в параллельные вычисления — СПб.: Университет ИТМО, 2023. — 128 с.
131. Гаврилова Н. М., Плотоненко Ю. А., Ступников А. А. Разработка интеллектуального программного обеспечения для исследования распараллеливания вычислений //Вестник Тюменского государственного университета. Серия: Физико-математическое моделирование. Нефть, газ, энергетика.-2021.-Т. 7,№ 3 (27). - 2021.
132. Stutzle T. Parallelization strategies for ant colony optimization //International Conference on Parallel Problem Solving from Nature. - Berlin, Heidelberg : Springer Berlin Heidelberg, 1998. - С. 722-731.
133. Rossi P. H., Berk R. A., Lenihan K. J. Money, work and crime: some experimental results, 1980
134. Жаринов Г. М. База данных больных раком предстательной железы. -
2016.
135. Ghannad-Rezaie M., Soltanian-Zadeh H., Ying H., Dong M. Selection-fusion approach for classification of datasets with missing values // Pattern Recognition. - 2010. - Vol. 43, no. 6. - P. 2340-2350. - DOI: 10.1016/j.patcog.2009.12.003.
136. Troyanskaya O., Cantor M., Sherlock G., Brown P., Hastie T., Tibshirani R., Botstein D., Altman R.B. Missing value estimation methods for DNA microarrays // Bioinformatics. - 2001. - Vol. 17, no. 6. - P. 520-525. - DOI: 10.1093/bioinformatics/17.6.520.
137. Кошечкин А. А., Андрющенко В. С., Замятин А. В. Новый метод восстановления пропущенных значений в наборе данных на примере иммуносигнатур //Современные технологии в медицине. - 2019. - Т. 11. - №. 2. -С. 19-24.
138. Oh E., Lee H. Quantum mechanics-based missing value estimation framework for industrial data //Expert Systems with Applications. - 2024. - Т. 236. - С. 121385.
139. Teng J. SEER breast cancer data //IEEE Dataport. - 2019.
Приложение А. Листинг программы
В Приложении указан код программы, реализующей представленный в работе алгоритм муравьев-опылителей. Представлены модули, реализующие однопоточное и многопоточное выполнение.
entities/ACOProvider. py
class ACOProvider:
def __init__(self, fit_model, get_filter_nan, get_imputation, get_filter,
get_concordance):
self.fit_model = fit_model self.get_filter_nan = get_filter_nan self.get_imputation = get_imputation self.get_filter = get_filter self.get_concordance = get_concordance
entities/Ant.py
import numpy as np
from entities.Graph import Graph from entities.Metric import Metric
tau = 100
class Ant:
def _init_(self, graph: Graph, q, alpha, beta):
self.pheromone_bit = None self.graph = graph self.initialize()
self.sensitivity = Metric(0.5, 2.0, 0.1) self.sensitivity.set_value(alpha) self.intensity = Metric(5, 50, 1) self.intensity.set_value(q) self.heuristic = Metric(0.5, 3.0, 0.1) self.heuristic.set_value(beta)
def move_to_next(self):
stochastic = np.array([]) prev_cost = self.cost
for flower in self.available:
stochastic = np.append(stochastic, flower.pheromone ** self.sensitivity.value *
flower.heuristic ** self.heuristic.value)
if stochastic.sum():
stochastic = stochastic / stochastic.sum()
new_flower = np.random.choice(self.available, p=stochastic) try:
self.available.remove(new_flower) except ValueError:
print("available", self.available) print(stochastic)
new_path = self.path.union({new_flower.node})
new_cost =
self.graph.calculate_cost(self.graph.vertices_to_nodes(new_path)) if new_cost >= prev_cost: self.path = new_path self.cost = new_cost
return len(self.available) > 0 else:
return False
def change_pheromone_old(self, strategy):
self.pheromone_bit = {flower.node: 0 for flower in self.graph.flowers}
for flower_node in self.path:
if strategy == 0: # ant-quality system
self.pheromone_bit[flower_node] = self.intensity.value elif strategy == 1: # ant-density system
self.pheromone_bit[flower_node] = self.intensity.value * self.graph.calculate_cost(
self.graph.calculate_cost_by_node_idx(flower_node)
)
elif strategy == 2: # ant-cycle system
self.pheromone_bit[flower_node] = self.intensity.value *
self.cost
def initialize(self): self.path = set()
self.available = self.graph.flowers[:] self.cost = 0 self.calculations = 0 self.pheromone_bit = []
entities/Flower.py
class Flower:
def _init_(self, node, pheromone, heuristic, lifespan):
self.node = node self.pheromone = pheromone self.heuristic = heuristic self.lifespan = lifespan
def _str__(self):
return "flower: " + str(self.node) + " ph: " + str(self.pheromone) + " heu: " + str(
self.heuristic) + " ls: " + str(self.lifespan)
def __repr__(self):
return "(" + str(self.node) + ": " + str(self.lifespan) + ")"
entities/Graph.py
from itertools import combinations
import numpy as np
import base_uploader import knn_imputation from entities import ACOProvider from entities.Flower import Flower
tau = 100
class Graph:
def _init_(self, fields: list, df, provider: ACOProvider):
self.fields = fields self.fields_count = len(self.fields) self.combinations = self.construct_combinations() self.nodes = [self.construct_indices(node) for node in
self.combinations] # [(0,), (1,), (2,), (3,), (4,), (5,), (6,), (0, 1), (0, 2), (0, 3),...] self.lifespan_limit = 3 self.df = df
self.provider = provider self.nodes_count = len(self.nodes) self.prepared_costs = {} self.calculations = 0 self.flowers = [ Flower(
node=field_idx,
pheromone=np.random.sample() / tau, heuristic=self.calculate_cost_by_node_idx(field_idx), lifespan=self.lifespan_limit ) for field_idx in range(self.fields_count)
]
self.rank = len(self.flowers) # genetic flowers
self.max_flower_count = self.fields_count * 2 self.selection_count = self.fields_count // 2 self.p_pollination = 0.9 self.p_linebreeding = 0.2
def construct_combinations(self):
sets = []
for i in range(self.fields_count):
for j in combinations(self.fields, i + 1): sets.append(tuple(j)) return sets
def construct_indices(self, node):
return tuple(self.fields.index(field) for field in node)
def update_pheromone(self, evaporation, ants): for flower in self.flowers:
flower.pheromone = flower.pheromone * (1 - evaporation) + sum( [ant.pheromone_bit[flower.node] for ant in ants]
)
def construct_field_list(self, vertices):
return list({self.fields[idx] for indices in vertices for idx in indices})
def construct_formula(self, vertices):
return '+'.join([self.node_to_features_formula(node) for node in vertices])
def node_to_features_formula(self, node):
return ':'.join([self.fields[idx] for idx in node])
def calculate_cost_by_node_idx(self, node_idx):
return self.calculate_cost({self.nodes[node_idx]})
def calculate_cost(self, vertices): vertices = sorted(vertices) hashable = frozenset(vertices)
if self.prepared_costs.__contains__(hashable):
return self.prepared_costs[hashable] else:
field_set = self.construct_field_list(vertices) formula = self.construct_formula(vertices) data = self.prepare_data(field_set)
self.prepared_costs[hashable] = self.fit(data, formula) return self.prepared_costs[hashable]
def prepare_data(self, field_set):
filter_fields = self.provider.get_filter(field_set) filter_nan_fields = self.provider.get_filter_nan(field_set) imputation_fields = self.provider.get_imputation(field_set)
filtered = base_uploader.remove_extra_fields(self.df, filter_fields) filtered_nan = base_uploader.take_notna_rows(filtered,
filter_nan_fields)
data = knn_imputation.imput_missing(filtered_nan, imputation_fields)
return data
def fit(self, data, formula): self.calculations += 1
return self.provider.fit_model(data, formula)
def get_concordance(self, vertices):
field_set = self.construct_field_list(vertices) formula = self.construct_formula(vertices) data = self.prepare_data(field_set) return self.provider.get_concordance(data, formula)
def vertices_to_nodes(self, path):
return tuple(self.nodes[flower] for flower in path)
# pollination-ga-algorithm def pollinate_flowers(self):
# selection
stochastic = np.array([])
for flower in self.flowers:
stochastic = np.append(stochastic, flower.pheromone)
if stochastic.sum():
stochastic = stochastic / stochastic.sum()
selected = np.random.choice(self.flowers, self.selection_count, p=stochastic)
# crossbreeding
pairs = [(male, female) for male in selected for female in selected] max_ph = max([flower.pheromone for flower in selected]) for (male, female) in pairs:
randvalue = np.random.sample()
p_pollination = self.p_pollination * (male.pheromone + female.pheromone) / (
2 * max_ph)
if randvalue < p_pollination: # pollination
if male.node == female.node:
male.lifespan = self.lifespan_limit + 1 else:
new_node = tuple(set(self.nodes[male.node] + self.nodes[female.node]))
new_node = tuple(sorted(new_node)) new_node_idx = self.nodes.index(new_node) repeat_flower = [flower for flower in self.flowers if flower.node == new_node_idx]
if len(repeat_flower):
repeat_flower[0].lifespan = self.lifespan_limit + 1 else:
self.flowers.append( Flower(
node=new_node_idx,
pheromone=(male.pheromone +
female.pheromone) / 2,
heuristic=self.calculate_cost_by_node_idx(new_node_idx),
lifespan=self.lifespan_limit + 1
)
)
# linebreeding
randvalue = np.random.sample() if randvalue < self.p_linebreeding:
new_node_idx = np.random.choice(range(self.fields_count)) repeat_flower = [flower for flower in self.flowers if flower.node == new_node_idx]
if len(repeat_flower):
repeat_flower[0].lifespan = self.lifespan_limit + 1 else:
self.flowers.append( Flower(
node=new_node_idx, pheromone=np.random.sample() / tau,
heuristic=self.calculate_cost_by_node_idx(new_node_idx),
lifespan=self.lifespan_limit + 1
)
)
# aging
for flower in self.flowers:
flower.lifespan = flower.lifespan - 1 self.flowers = [flower for flower in self.flowers if flower.lifespan >
0]
def update_calculation_hash(self, ants): for ant in ants:
self.prepared_costs.update(ant.graph.prepared_costs)
entities/Metric.py
import numpy as np
class Metric:
def _init_(self, lower, upper, accuracy):
self.lower = lower self.upper = upper self.accuracy = accuracy
self.interval_number = (self.upper - self.lower) / self.accuracy
self.value = lower
self.genom = (self.value - self.lower) / self.accuracy
bit_number = 1
for i in range(0, 20):
if 2 ** bit_number < self.interval_number < 2 ** (bit_number +
1):
break bit_number += 1 bit_number += 1
self.bit_number = bit_number self.bitmask = (1 << bit_number) - 1
def set_value(self, value): self.value = value
self.genom = int((self.value - self.lower) / self.accuracy)
def set_genom(self, genom): self.genom = genom
self.value = self.lower + self.accuracy * genom
def set_random(self):
genom = int((self.upper - self.lower) / self.accuracy) self.set_genom(np.random.randint(genom))
base_uploader.py
def remove_extra_fields(df, filtered): clone = df.copy() for key in filtered:
if key in clone.columns: del (clone[key])
return clone
def take_notna_rows(df, filtered): selected = df for row in filtered:
selected = selected[selected[row].notna()] return selected
def get_not_null_data_base(df, filtered):
clone = remove_extra_fields(df, filtered) clone.dropna(inplace=True)
return clone
categorizer.py
def categorize_column(data, column):
for numb, val in enumerate(data[column].unique()): mask_val = data[column] == val data.loc[mask_val, column] = numb
knn_imputation.py
from sklearn.impute import KNNImputer
def imput_missing(dataframe, columns):
col_indices = [dataframe.columns.get_loc(col) for col in columns]
# split into input and output elements data = dataframe.values
imputer = KNNImputer(n_neighbors=5, weights='uniform',
metric='nan_euclidean')
# fit on the dataset imputer.fit(data)
# transform the dataset
Xtrans = imputer.transform(data)
for col_idx in col_indices:
new_col = [round(x) for x in Xtrans[:, col_idx]] dataframe[dataframe.columns[col_idx]] = new_col
return dataframe
main.py
import math
import pandas as pd
from lifelines import CoxPHFitter
from lifelines.datasets import load_rossi
from lifelines.exceptions import ConvergenceError
from lifelines.utils import concordance_index
from entities import ACOProvider
from polinatingAntColonyOptimizator import AntColonyOpt from polinatingAntColonyOptimizator import Graph
pd.options.mode.chained_assignment = None # default='warn'
rossi = load_rossi()
def fit_model(data_set, formula): cph = CoxPHFitter(')
try:
cph.fit(data_set, duration_col='week', event_col='arrest', fit_options={"step_size": 0.10}, formula=formula) except ConvergenceError:
cph.fit(data_set, duration_col='week', event_col='arrest', fit_options={"step_size": 0.05}, formula=formula)
idx = cph.concordance_index_
fields_count = len(data_set.columns) - 2
feature_count = len(category)
sets_size = math.log(2 ** feature_count - 1)
terms_count = formula.count('+') + 1
capacity_count = terms_count + formula.count(':')
concordance_part = balancing_1 * idx
feature_selection_part = balancing_2 * (1 - fields_count / feature_count) complexity_part = balancing_3 * math.log(terms_count) / sets_size capacity_part = balancing_4 * capacity_count / (terms_count * feature_count)
fitness = concordance_part + feature_selection_part - complexity_part -capacity_part
return fitness
def get_concordance(data_set, formula): cph = CoxPHFitter()
cph.fit(data_set, duration_col='week', event_col='arrest',
fit_options={"step_size": 0.50}, formula=formula)
idx = concordance_index(data_set['week'], -
cph.predict_partial_hazard(data_set), data_set['arrest']) return idx
# COX part For experiment category = {
"fin": "normal", "wexp": "normal", "age": "normal", "race": "normal", "mar": "normal", "paro": "normal", 'prio': "normal"
}
all_fields = [key for key in category]
sets = [tuple({field}) for field in all_fields]
print("sets:", sets)
def frange(start, stop, step): i = start while i < stop: yield i
i += step
def get_filter_nan(field_set): lst = []
for field in field_set:
if category[field] == "filter_nan": lst.append(field) return lst
def get_imputation(field_set): lst = []
for field in field_set:
if category[field] == "imputation": lst.append(field) return lst
def get_filter(field_set):
return [item for item in all_fields if item not in field_set]
df = rossi
acoProvider = ACOProvider.ACOProvider( fit_model=fit_model, get_filter_nan=get_filter_nan, get_imputation=get_imputation, get_filter=get_filter, get_concordance=get_concordance
)
aco = AntColonyOpt(
provider=acoProvider,
alpha=0.5,
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.