Регуляция и прогностическая значимость сплайс-вариантов CD44 при колоректальном раке тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Новосад Виктор Олегович

  • Новосад Виктор Олегович
  • кандидат науккандидат наук
  • 2025, «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 131
Новосад Виктор Олегович. Регуляция и прогностическая значимость сплайс-вариантов CD44 при колоректальном раке: дис. кандидат наук: 00.00.00 - Другие cпециальности. «Национальный исследовательский университет «Высшая школа экономики». 2025. 131 с.

Оглавление диссертации кандидат наук Новосад Виктор Олегович

Введение

1 Обзор литературы

1.1 Колоректальный рак: клиническая значимость и роль молекулярных маркёров

1.2 СБ44: биологические функции и роль в опухолевой прогрессии

1.2.1 Структура CD44

1.2.2 Сплайс-варианты СВ44б и СБ44у

1.2.3 Роль изоформ CD44 при КРР

1.2.4 CD44 и эпителиально-мезенхимальный переход

1.2.5 Противоречия в литературе

1.3 Клинические исследования и таргетные подходы, направленные на СБ44

1.3.1 Применение антител для направленной радиотерапии

1.3.2 Клиническое применение биватузумаба мертанзина: успехи и ограничения

1.3.3 Доставка siRNA, опосредованная гиалуроновой кислотой, и участие CD44 в эндоцитозе

1.3.4 Биомедицинские перспективы носителей, модифицированных гиалуроновой кислотой

1.3.5 Актуальные направления разработки

1.4 Сплайсинг и его роль в развитии злокачественных опухолей человека

1.4.1 Сплайсинг РНК у эукариот: общая характеристика и молекулярный механизм

1.4.2 Нарушения альтернативного сплайсинга при опухолях

1.4.3 ЯВР и регуляция альтернативного сплайсинга

1.5 Биоинформатические подходы к анализу альтернативного сплайсинга

1.5.1 Анализ сигналов сплайсинга на основе нуклеотидных последовательностей гена

1.5.2 Машинное обучение для предсказания сплайсинга

1.5.3 Ограничения и перспективы

1.6 Задачи классификации и анализ выживаемости в биомедицинском анализе

1.6.1 Общая постановка задачи

1.6.2 Проблема многомерности данных и отбор признаков

1.6.3 Сетевой анализ и молекулярные взаимодействия как источник признаков

1.6.4 Регуляторные сети сплайсинга

2 Материалы и методы

2.1 Сбор и обработка данных

2.1.1 Данные RNA-seq в тканях пациентов из проекта TCGA

2.1.2 Интеграция данных о ЯБР и факторах сплайсинга

2.2 Статистический анализ

2.2.1 Дифференциальная экспрессия мРНК

2.2.2 Функциональный анализ обогащения GSEA

2.2.3 Анализ мультиколлинеарности признаков

2.3 Реализация алгоритма SRPseq

2.3.1 Сбор данных об изоформах и структуре генов

2.3.2 Описание пайплайна

2.3.3 Выбор модели

2.3.4 Бета-регрессия и усиленная бета-регрессия

3

2.3.5 Линейная регрессия

2.3.6 Оценка качества моделей

2.3.7 Фильтрация когорт

2.3.8 Обучение и валидация моделей

2.3.9 Реализация

2.4 Методы статистического анализа

2.5 Методы машинного обучения

2.6 Анализ выживаемости

2.6.1 Выбор оптимального порога для дихотомизации

3 Результаты

3.1 Анализ экспрессии сплайс-вариантов гена СБ44 у пациентов с КРР

3.1.1 Данные и предварительная обработка

3.1.2 Соотношение CD44s/CD44v и клиническая стадия заболевания

3.2 Прогностическая значимость соотношения изоформ СБ448/СБ44у

3.3 Транскриптомные различия, ассоциированные с соотношением СБ44э/СВ44у

3.4 Вариабельность экспрессии изоформ CD44

3.5 Анализ мотивов связывания ЯБР

3.6 Применение алгоритма SRPseq для анализа регуляторов сплайсинга СБ44 в КРР

3.6.1 Архитектура модели и экзонная структура

3.6.2 Обучение модели и идентификация регуляторов

3.6.3 Результаты точности модели

3.6.4 Биологическая интерпретация

3.7 Мультиопухолевый анализ регуляторов сплайсинга CD44 с использованием SRPseq

3.7.1 Результаты модели

3.7.2 Оценка производительности модели

3.7.3 Анализ выявленных регуляторов сплайсинга на основе публичных данных

3.8 Валидация предсказаний SRPseq с использованием экспериментальных данных ENCODE

3.8.1 Сопоставление предсказаний с экспериментами ENCODE

3.8.2 Выбор клеточной модели

3.8.3 Основные экспериментальные подтверждения

3.8.4 Обобщение

Заключение

Выводы

Список сокращений и условных обозначений

Список литературы

Список рисунков

Список таблиц

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Регуляция и прогностическая значимость сплайс-вариантов CD44 при колоректальном раке»

Введение

Актуальность. Колоректальный рак (КРР) занимает одно из ведущих мест среди злокачественных новообразований по показателям заболеваемости и смертности как в мировом масштабе, так и в Российской Федерации [1,2]. Несмотря на успехи в диагностике, скрининге и терапии, значительная часть пациентов продолжает сталкиваться с поздним выявлением, агрессивным течением и рецидивами заболевания [3,4]. Это обусловливает необходимость поиска надёжных молекулярных маркёров, позволяющих более точно прогнозировать течение болезни и разрабатывать персонализированные подходы к лечению.

Одним из перспективных направлений исследований в области современной онкологии является исследование альтернативного сплайсинга — ключевого механизма посттранскрипционной регуляции, обеспечивающего разнообразие белковых изоформ. Нарушения в процессе альтернативного сплайсинга всё чаще рассматриваются как важный фактор опухолевой прогрессии, устойчивости к терапии и формирования инвазивного фенотипа клеток [5-7]. При этом особую роль играют РНК-связывающие белки (RBP), определяющие выбор сплайсинговых сайтов и формирование специфичных изоформ в зависимости от клеточного контекста [8-11].

Белок С044 — один из перспективных примеров молекулы, подверженной сложной сплайс-регуляции. Различные изоформы СЭ44 демонстрируют противоположные функциональные свойства: вариабельные формы (С044у) ассоциированы с эпителиальным фенотипом и стволовыми свойствами опухолевых клеток, тогда как стандартная изоформа (CD44s) способствует эпителиально-мезенхимальному переходу (ЭМП), инвазии и метастазированию [12-17]. Несмотря на накопленные данные о значимости CD44 в опухолевом процессе, конкретные регуляторные механизмы сплайсинга этого гена при КРР, а также прогностическая роль отдельных изоформ, остаются недостаточно изученными [18-21].

В мировой литературе накоплены данные о связи отдельных изоформ CD44 с прогнозом и фенотипом опухолевых клеток, однако большинство исследований носят локальный характер и не дают целостного представления о механизмах регуляции сплайсинга при КРР. Недостаточно изучено, какие именно РНК-связывающие белки определяют баланс между CD44s и CD44v, и как это отражается на клинических исходах.

Современные биоинформатические методы, включая машинное обучение и анализ больших данных РНК-секвенирования, позволяют не только выявлять сплайс-варианты, но и строить интерпретируемые модели их регуляции. Это особенно важно для клинического применения результатов, где критически значимы специфичность, воспроизводимость и возможность интерпретации полученных данных [22].

Цели и задачи исследования. Цель данной работы — выявить прогностическую значимость и механизмы регуляции сплайс-вариантов СЭ44 при КРР.

Для достижения поставленной цели были сформулированы следующие задачи:

1) Изучить прогностическую роль СЭ44 и его сплайс-вариантов при КРР с помощью биоинформатических методов;

2) Разработать метод выявления RBP, являющихся потенциальными регуляторами сплайсинга, на основе регрессионных моделей;

3) Провалидировать предсказанные с помощью разработанного метода RBP, регулирующие сплайсинг СЭ44 в модельных клеточных линиях.

Научная новизна диссертации заключается в комплексном исследовании сплайс-вариантов гена СЭ44, их прогностической значимости и механизмов регуляции на уровне RBP, с применением современных интерпретируемых моделей машинного обучения на больших выборках данных и последующей экспериментальной валидацией.

Установлена связь интегрального показателя соотношения изоформ CD44s/CD44v с клиническими показателями пациентов с колоректальным раком на данных проекта The Cancer Genome Atlas. Показано, что распределение этого показателя не различается между клиническими стадиями I-IV, при этом его прогностическая связь носит контекст-зависимый характер: для II-III стадий более высокие значения CD44s/CD44v соответствуют менее благоприятным оценкам общей выживаемости, тогда как на IV стадии направление эффекта меняется на противоположное. Использование соотношения CD44s/CD44v, в отличие от анализа отдельных транскриптов, позволяет отразить баланс сплайсинга CD44 и снизить множественность сопоставлений без потери информативности.

Разработан новый метод идентификации потенциальных регуляторов альтернативного сплайсинга, использующий регрессионные модели, позволяющие количественно оценивать вклад каждого признака и объяснять полученные результаты; в анализ интегрированы данные о вероятности включения экзонов, уровнях экспрессии RBP и участках их связывания в вариабельной области гена.

Теоретическая значимость работы заключается в углублении понимания молекулярных механизмов регуляции альтернативного сплайсинга гена CD44 в контексте КРР. В исследовании впервые предложен и реализован биоинформатический подход, позволяющий идентифицировать RBP, потенциально участвующие в регуляции сплайс-вариантов CD44, с использованием интерпретируемых регрессионных моделей. Полученные данные дополняют представления о взаимодействии между изоформами CD44 и прогрессии опухоли, а также о контекстно-зависимой роли RBP в онкогенезе.

Предложенный метод может быть применён для изучения регуляции сплайсинга и в отношении других генов, вовлечённых в прогрессию злокачественных опухолей. Это способствует формированию более общей модели посттранскрипционной регуляции в опухолевых клетках и открывает перспективы

для системной реконструкции регуляторных механизмов альтернативного сплайсинга.

Практическая значимость работы заключается в выделении интегрального показателя на основе отношения экспрессии изоформ CD44s/CD44v, обладающего прогностической значимостью при КРР. В частности, данный показатель продемонстрировал ассоциацию с неблагоприятным прогнозом и метастатическим потенциалом опухоли, что позволяет рассматривать его как потенциальный биомаркёр стратификации пациентов по уровню риска.

Разработанный подход к предсказанию регуляторов сплайсинга и подтверждённые экспериментально RBP могут служить основой для создания новых терапевтических стратегий, направленных на модуляцию сплайсинга в опухолевых клетках. В перспективе это может способствовать разработке таргетной терапии, основанной на подавлении или активации специфичных сплайсинг-изоформ, влияющих на инвазивность и резистентность опухоли.

Используемые методы и подходы. В работе использовались данные РНК-секвенирования из проектов TCGA для опухолей и прилегающих нормальных тканей пациентов и Cancer Cell Line Encyclopedia (CCLE) для опухолевых клеточных линий. Анализ включал оценку дифференциальной экспрессии, функциональный анализ обогащения и корреляционный анализ.

Разработан собственный алгоритм для выявления потенциальных регуляторов сплайсинга на основе регрессионных моделей, интегрирующих данные о вероятности сплайсинга экзонов, экспрессии РНК-связывающих белков, структуре изоформ и аннотациях мотивов их связывания, с последующей валидацией на независимых данных и в клеточных линиях.

Степень достоверности и апробация результатов. Диссертационная работа выполнена в соответствии с общепринятыми этическими нормами и современными научными принципами. Основные выводы и положения, выносимые на защиту, подтверждаются данными, полученными в ходе

биоинформатического анализа, и их всесторонней статистической обработкой. Все результаты являются достоверными и воспроизводимыми. Апробация исследования проведена на ряде международных научных конференций, где ключевые выводы получили положительную экспертную оценку.

Публикации. По результатам работы опубликовано 6 научных статей в рецензируемых научных журналах, индексируемых базами данных Web of Science и Scopus.

1. Nersisyan S., Novosad V., Engibaryan N., Ushkaryov Y., Nikulin S., Tonevitsky A. ECM-Receptor Regulatory Network and Its Prognostic Role in Colorectal Cancer. Front. Genet. (2021) 12:782699. doi: 10.3389/fgene.2021.782699.

2. Nersisyan S., Novosad V., Galatenko A., et al. ExhauFS: Exhaustive Search-Based Feature Selection for Classification and Survival Regression. PeerJ (2022) 10:e13200. doi:10.7717/peerj.13200.

3. Everest-Dass A., Nersisyan S., Maar H., et al. Spontaneous Metastasis Xenograft Models Link CD44 Isoform 4 to Angiogenesis, Hypoxia, EMT and Mitochondria-Related Pathways in Colorectal Cancer. Mol. Oncol. (2024) 18(1):62-90. doi:10.1002/1878-0261.13535.

4. Raigorodskaya M., Novosad V., Tonevitskaya S., et al. Expression of CD44 Isoforms in Human Colorectal Cancer Cell Lines. Appl. Biochem. Microbiol. (2022) 58:992-996. doi:10.1134/S0003683822090071.

5. Novosad V. Identification of Significant RNA-Binding Proteins in the Process of CD44 Splicing Using the Boosted Beta Regression Algorithm. Dokl. Biochem. Biophys. (2023) 510(1):99-103. doi:10.1134/S1607672923700199.

6. Novosad V., Maltseva D. The RNA-Binding Proteins OAS1, ZFP36L2, and DHX58 Are Involved in the Regulation of CD44 mRNA Splicing in Colorectal Cancer Cells. Bull. Exp. Biol. Med. (2023) 175(1):144-149. doi:10.1007/s10517-023-05826-x.

Доклады на конференциях и семинарах:

1. "Bioinformatics Workshop" с докладом "CD44 isoforms play different roles in colorectal cancer progression" Ереван, Армения, 30.04.2022

2. "Экспериментальные и информационные подходы к исследованию патологических состояний" с докладом "Регуляция и прогностическая значимость сплайс-вариантов CD44 при колоректальном раке", Москва, 17.06.2025

Основные положения, выносимые на защиту

1. Интегральное соотношение изоформ CD44s/CD44v является прогностически значимым признаком при КРР; направленность ассоциации зависит от клинической стадии: при II—III стадиях более высокие значения связаны с менее благоприятной общей выживаемостью, тогда как при IV стадии — с более благоприятной; для I стадии статистически значимого эффекта не выявлено.

2. Разработан новый алгоритм SRPseq, позволяющий моделировать регулирование альтернативного сплайсинга на основе экспрессии РНК-связывающих белков и их мотивов связывания.

3. С помощью SRPseq выявлены регуляторы сплайсинга CD44 в клетках КРР, включающие как ранее известные, так и новые кандидаты.

4. Корректность предсказаний алгоритма SRPseq подтверждена независимой валидацией на данных РНК-секвенирования клеточных линий после siRNA-выбивания РНК-связывающих белков.

5. Объединённый анализ данных TCGA различных типов опухолей с использованием SRPseq позволил выделить устойчивый набор предсказанных регуляторов сплайсинга CD44.

Личный вклад в положения, выносимые на защиту. Соискатель самостоятельно сформулировал цель и задачи исследования, разработал методологический подход и алгоритмическое обеспечение, выполнил сбор, обработку и анализ данных, участвовал в планировании и проведении экспериментальной валидации, а также подготовил текст диссертации и публикации по теме работы.

Объём и структура работы. Диссертация состоит из введения, 3 основных глав и заключения. Полный объём диссертации составляет 131 страницу, включая 10 рисунков и 2 таблицы. Список литературы содержит 175 наименований.

Во введении обоснована актуальность выбранной темы, сформулированы цель и задачи исследования, определены научная новизна и значимость работы.

В Главе 1 представлен подробный обзор литературы по молекулярной биологии КРР, роли альтернативного сплайсинга и изоформ CD44 в прогрессии опухолей. Рассматриваются механизмы регуляции сплайсинга с участием RBP, а также текущие подходы к их изучению, включая биоинформатические и экспериментальные методы.

В Главе 2 описаны материалы и методы, использованные в работе. Приведены характеристики транскриптомных данных из проектов TCGA и CCLE, подходы к нормализации RNA-seq, критерии отбора генов и образцов, методы стратификации по анатомической локализации опухоли, а также детальное описание разрабатываемого метода.

Глава 3 содержит основные результаты исследования. Показано, что интегральное соотношение изоформ CD44s/CD44v не отличается между клиническими стадиями I-IV КРР, но обладает прогностической значимостью на уровне всей когорты TCGA-COAD-READ. При этом направление ассоциации зависит от стадии: незначимо на I стадии, неблагоприятно при высоких значениях на II-III стадии, благоприятно на IV стадии. По группам, сформированным по этому показателю, выявлены согласованные транскриптомные сдвиги -

обогащение наборов генов, ассоциированных с

миграцей/ангиогенезом/воспалением при высоких значениях показателя и энергетических/пролиферативных модулей при низких. На основе распределений экспрессии обоснован фокус экзонного анализа на паре изоформа 3 / изоформа 4. Изложены принципы разработанного биоинформатического метода выявления потенциальных регуляторов сплайсинга. Описывается построение регрессионной модели на основе частот сплайсинга экзонов, экспрессии ЯВР и их мотивов. Показаны результаты идентификации ключевых ЯВР, вовлечённых в сплайсинг CD44 с помощью разработанного алгоритма. Наконец, представлены результаты экспериментальной валидации ЯВР-кандидатов на модельных клеточных линиях.

В Заключении подведены итоги исследования, обобщены основные научные результаты и обсуждены перспективы применения полученных данных в контексте прогностических и терапевтических подходов к лечению КРР.

1

Обзор литературы

1.1 Колоректальный рак: клиническая значимость и роль

молекулярных маркёров

Колоректальный рак — злокачественное новообразование эпителиального происхождения, развивающееся в толстой и прямой кишке, — на сегодняшний день занимает одно из ведущих мест в структуре онкологической заболеваемости и смертности как в мире, так и в Российской Федерации.

По данным GLOBOCAN (2020), опубликованным Международным агентством по изучению рака (International Agency for Research on Cancer, IARC), КРР занимает третье место по числу новых случаев (более 1,9 млн ежегодно) и второе место по смертности (свыше 935 тыс. летальных исходов в год) среди всех онкологических заболеваний [1].

В Российской Федерации, согласно данным ежегодного отчета «Злокачественные новообразования в России в 2023 году» под редакцией А.Д. Каприна и В.В. Старинского, в 2023 году было зарегистрировано 674 587 новых случаев злокачественных новообразований, что на 8% больше по сравнению с предыдущим годом. Колоректальный рак входит в тройку наиболее распространенных онкологических заболеваний как у мужчин, так и у женщин в России [2].

Несмотря на внедрение современных программ скрининга (включая колоноскопию, тесты на скрытую кровь и ДНК-тестирование стула) и совершенствование хирургических, химио- и таргетных методов лечения, значительная часть пациентов по-прежнему обращается за медицинской помощью на поздних стадиях заболевания. Так, примерно у 25% пациентов КРР выявляется уже с наличием отдалённых метастазов на момент постановки диагноза, а около 50% пациентов сталкиваются с развитием метастазов в процессе заболевания, несмотря на проведение радикального лечения [3,4].

Современные представления о биологии КРР выходят далеко за рамки гистологической классификации. Установлено, что КРР представляет собой гетерогенное заболевание, в основе которого лежат сложные молекулярно-генетические нарушения, включая мутации в ключевых онкогенах (APC, KRAS, BRAF, TP53 и др.), нарушения сигнальных путей (WNT, MAPK, TGF-P), а также изменения в эпигенетических и транскриптомных профилях опухоли. Особую роль играют механизмы альтернативного сплайсинга, приводящие к формированию различных мРНК-изоформ, способных модулировать поведение опухолевых клеток, их чувствительность к терапии и взаимодействие с микроокружением опухоли [23,24]. В этом контексте молекулярные маркёры приобретают всё большее значение как в диагностике, так и в прогнозировании течения заболевания, а также выборе индивидуализированных схем терапии. В частности, альтернативный сплайсинг CD44, регулирующий экспрессию различных изоформ этого поверхностного рецептора, всё чаще рассматривается как перспективный биомаркер прогноза безрецидивной выживаемости, степени агрессивности опухоли и ответа на химиотерапию при КРР [5-7]. Колоректальный рак развивается в результате сложного взаимодействия мутационных и немутационных молекулярных механизмов, затрагивающих регуляцию клеточной пролиферации, апоптоза, ангиогенеза, межклеточной адгезии и миграции. Эти процессы создают условия для трансформации нормального эпителия кишечника в злокачественную опухоль с высоким инвазивным и метастатическим потенциалом.

Классическая модель канцерогенеза, предложенная в работе [25] исходит из того, что на ранних этапах развития опухоли доминируют мутации в ключевых онкогенах и генах-супрессорах (APC, KRAS, TP53), что нарушает пролиферативный контроль и апоптотический ответ. Однако причинно-следственная связь между отдельными мутациями и клиническим фенотипом опухоли требует подтверждения на уровне функциональных моделей [26].

Дальнейшее прогрессирование опухоли, включая инвазию и метастазирование, определяется уже не только геномными, но и эпигенетическими и посттранскрипционными механизмами. Среди них ключевую роль играет эпителиально-мезенхимальный переход — процесс, при котором эпителиальные клетки теряют полярность и межклеточные контакты, приобретая свойства мезенхимальных клеток: подвижность, инвазивность и устойчивость к программируемой клеточной гибели. ЭМП сопровождается перестройкой цитоскелета, активацией транскрипционных факторов ZEB1, SNAI1, TWIST1, и снижением экспрессии E-cadherin, что делает его необходимым этапом для диссеминации опухолевых клеток [27].

Запуск ЭМП инициируется воздействием сигнальных молекул микроокружения опухоли — таких как TGF-в, Т^-а, EGF, WNT, — активирующих внутриклеточные сигнальные каскады. Одним из важнейших маркёров и медиаторов ЭМП считается поверхностный рецептор CD44, участвующий в адгезии, миграции и взаимодействии с внеклеточным матриксом. CD44 экспрессируется в виде нескольких альтернативных изоформ, формируемых в результате сплайсинга вариабельных экзонов. Переход от вариабельных изоформ (например, CD44v6 или CD44v8-10) к стандартной короткой изоформе CD44s играет функциональную роль в активации ЭМП. Так, в работе [28] показано, что именно CD44s, а не вариабельные изоформы, индуцируют инвазию и метастазирование, активируя путь Р13К/Ак и способствуя подавлению E-cadherin. Эти данные подчёркивают участие сплайс-изоформ в канцерогенезе.

Механизм альтернативного сплайсинга, определяющий экспрессию конкретных изоформ CD44 и других генов, регулируется набором RBP, таких как ESRP1/2, RBFOX2, Ы3^1, а также факторами семейства hnRNP. В опухолевых клетках часто наблюдается перепрограммирование сплайсинга, при котором меняется экспрессия этих белков, что приводит к формированию изоформ, способствующих инвазии и хеморезистентности [29,30].

Таким образом, прогрессия КРР — это не только результат накопления генетических мутаций, но и следствие динамических изменений в экспрессии и сплайсинге РНК, которые обеспечивают клеточную пластичность и адаптацию опухоли к неблагоприятным условиям. Альтернативный сплайсинг представляет собой важное направление как для фундаментальных исследований биологии опухоли, так и для разработки новых прогностических и терапевтических подходов в клинической онкологии.

1.2 СВ44: биологические функции и роль в опухолевой

прогрессии

СЭ44 — трансмембранный гликопротеин, широко представленный на поверхности различных типов клеток как в нормальных, так и патологических условиях. Он выполняет важные биологические функции, участвуя во взаимодействии клеток с внеклеточным матриксом (ВКМ), передаче сигнальных стимулов, а также регулируя клеточную адгезию, миграцию, пролиферацию и выживание [31,32].

Основным лигандом СЭ44 является гиалуроновая кислота — компонент ВКМ, играющий ключевую роль в поддержании тканевой структуры и гомеостаза. Помимо этого, СЭ44 способен взаимодействовать с рядом других молекул матрикса, включая коллагены, ламинин, фибронектин, остеопонтин и серглицин, а также с матриксными металлопротеиназами (MMPs), что делает его важным элементом в регуляции клеточно-матричных взаимодействий [33].

При злокачественном росте СЭ44 начинает выполнять расширенный спектр функций — от активации новых сигнальных каскадов до поддержки опухолевой иерархии — тем самым способствуя адаптации и выживанию опухолевых клеток. Он участвует в активации ключевых сигнальных путей, таких как Ras/MAPK, Р13К/Ак1, JNK и Wnt/p-катенин, что обеспечивает регуляцию пролиферации, устойчивости к апоптозу, клеточной пластичности и взаимодействия с опухолевым

микроокружением [34]. Благодаря этим механизмам CD44 оказывает системное влияние на поведение опухоли, выходя за рамки роли молекулы клеточной адгезии.

Многочисленные исследования демонстрируют, что повышенная экспрессия CD44 характерна для широкого спектра злокачественных опухолей — в том числе рака молочной железы, желудка, лёгких, поджелудочной железы и КРР [35]. Высокий уровень CD44 часто ассоциируется с агрессивным течением заболевания, метастатическим потенциалом и неблагоприятным прогнозом, что делает его потенциальным прогностическим маркёром.

Особое значение CD44 имеет в контексте опухолевых стволовых клеток (cancer stem cells, CSCs) — субпопуляции, обладающей способностью к самоподдержанию, инвазии и устойчивости к стандартной терапии. CD44 признан одним из наиболее надёжных маркёров CSC, а его экспрессия ассоциирована с рецидивами и метастазированием после химио- и радиотерапии [36,37]. Таким образом, CD44 представляет собой не просто поверхностный рецептор или адгезивную молекулу, а ключевой элемент клеточной регуляции в условиях злокачественного роста. Его участие в активации сигнальных каскадов, взаимодействии с компонентами внеклеточного матрикса и поддержании опухолевой иерархии подчёркивает его значение как потенциальной терапевтической мишени и молекулярного маркёра прогрессии опухолей.

1.2.1 Структура CD44

Ген CD44 локализуется на коротком плече хромосомы 11 (локус 11p13) и состоит из 19 экзонов, кодирующих различные участки трансмембранного гликопротеина CD44 (Рисунок 1). Он выполняет широкий спектр функций, связанных с клеточной адгезией, миграцией, межклеточными взаимодействиями и участием в сигнальных путях. Одной из ключевых особенностей гена CD44 является его способность к активному альтернативному сплайсингу, что

обеспечивает формирование большого количества изоформ с различной длиной и функциями [32,38].

Альтернативный сплайсинг СВ44 осуществляется за счёт включения или

Рисунок 1. Структура и изоформы CD44. Рисунок адаптирован на основе материалов работы [24].

исключения так называемого вариабельного домена, кодируемого экзонами v2-v10 (экзоны 6-15 по нумерации гена). Эти экзоны могут комбинироваться в различных последовательностях, что приводит к образованию изоформ, обладающих специфичными структурными и биохимическими свойствами. Такой механизм позволяет одному гену адаптироваться к разнообразным клеточным контекстам, физиологическим условиям и сигналам микроокружения [31].

1.2.2 Сплайс-варианты С044& и С044у

Наиболее представленной в большинстве здоровых тканей человека формой СЭ44 является стандартная изоформа (С044б), которая включает исключительно константные экзоны — с 1 по 5 и с 16 по 19 [39]. Эта изоформа играет важную роль в поддержании базовой клеточной адгезии, участвующей, например, в миграции лейкоцитов и регенерации эпителия [40].

Вариабельные изоформы CD44 (обозначаемые как CD44v) формируются при включении одного или нескольких экзонов из области v2-v10. Такие изоформы характеризуются большей длиной и обладают уникальными участками, обеспечивающими дополнительные функциональные возможности. Например, вариабельные экзоны могут кодировать участки, участвующие в связывании с ростовыми факторами, цитокинами и матриксными компонентами. Например, изоформа CD44v3 содержит сайты для связывания факторов роста (FGF, HGF), способствуя активации сигнальных путей пролиферации и выживания, в то время как CD44v6 участвует в ко-рецепторной активации рецептора MET и способствует инвазии опухолевых клеток [41]. Эти формы преимущественно экспрессируются в эпителиальных и опухолевых клетках, особенно в условиях активного роста, воспаления или метастатической трансформации [42].

По данным in silico моделирования, потенциальное количество возможных изоформ CD44 может превышать 20. Однако экспериментально подтверждено около 7-8 вариантов, что указывает на наличие механизмов тканеспецифичного контроля их экспрессии [43].

CD44s и CD44v демонстрируют различную ассоциацию с онкогенезом. Так, CD44s чаще коррелирует с мезенхимальным фенотипом клеток, способствующим инвазии и эпителиально-мезенхимальному переходу (ЭМП), тогда как CD44v может быть связан с сохранением эпителиального статуса и поддержанием стволового потенциала опухолевых клеток [44].

1.2.3 Роль изоформ CD44 при КРР

Ряд исследований указывает на то, что при КРР повышенная экспрессия CD44 чаще локализуется в инвазивных участках опухоли, а в циркулирующих опухолевых клетках обнаруживаются преимущественно вариабельные изоформы. Особенно интерес представляют CD44v3 и CD44v6 — изоформы, ассоциированные с метастазами в печень и лимфатические узлы. Их повышенная

экспрессия наблюдается преимущественно в агрессивных подтипах КРР и может выступать в роли маркёра неблагоприятного прогноза [12,13].

В нескольких клинических исследованиях высокий уровень CD44v6 коррелировал с метастазированием и неблагоприятным прогнозом при КРР. Показано, что CD44v6 участвует в активации MET- и PBK/Akt-сигнальных путей, способствуя инвазии, росту и ангиогенезу [14]. В мета-анализе [15] была подтверждена независимая связь CD44v6 с ухудшением 5-летней выживаемости и наличием метастазов. В качестве биомаркера CSCs CD44v6 ассоциируется со снижением эффективности первой линии химиотерапии у пациентов с метастазами [13].

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Новосад Виктор Олегович, 2025 год

Список литературы

1. Sung H. et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries // CA Cancer J Clin. Wiley, 2021. Vol. 71, № 3. P. 209-249.

2. Злокачественные новообразования в России в 2023 году (заболеваемость и смертность) / под ред. А. Д. Каприна [и др.]. — М.: МНИОИ им. П. А. Герцена — филиал ФГБУ «НМИЦ радиологии» Минздрава России, 2024. — 276 с.: ил. — ISBN 978-5-85502-298-8.

3. Siegel R.L. et al. Cancer statistics, 2023 // CA Cancer J Clin. Wiley, 2023. Vol. 73, № 1. P. 17-48.

4. Van Cutsem E. et al. ESMO consensus guidelines for the management of patients with metastatic colorectal cancer // Ann Oncol. 2016. Vol. 27, № 8. P. 1386-1422.

5. Orian-Rousseau V. CD44, a therapeutic target for metastasising tumours // Eur J Cancer. Elsevier BV, 2010. Vol. 46, № 7. P. 1271-1277.

6. Mao P. et al. Genome-wide maps of alkylation damage, repair, and mutagenesis in yeast reveal mechanisms of mutational heterogeneity // Genome Res. 2017. Vol. 27, № 10. P. 1674-1684.

7. Wielenga V.J.M. et al. CD44 Glycoproteins in Colorectal Cancer: Expression, Function, and Prognostic Value // Adv Cancer Res. Elsevier, 1999. P. 169-187.

8. Fu X.-D., Ares M. Context-dependent control of alternative splicing by RNA-binding proteins // Nat Rev Genet. Springer, 2014. Vol. 15, № 10. P. 689-701.

9. Dreyfuss G. et al. hnRNP proteins and the biogenesis of mRNA // Annu Rev Biochem. 1993. Vol. 62, № 1. P. 289-321.

10.Warzecha C.C. et al. ESRP1 and ESRP2 are epithelial cell-type-specific regulators of FGFR2 splicing // Mol Cell. 2009. Vol. 33, № 5. P. 591-601.

11.Maurin M. et al. RBFOX2 deregulation promotes pancreatic cancer progression and metastasis through alternative splicing // Nat Commun. 2023. Vol. 14, № 1. P. 8444.

12.Wang Z. et al. The prognostic and clinical value of CD44 in colorectal cancer: A metaanalysis // Front Oncol. 2019. Vol. 9. P. 309.

13.Nicolazzo C. et al. Baseline CD44v6-positive circulating tumor cells to predict firstline treatment failure in patients with metastatic colorectal cancer // Oncotarget. 2020. Vol. 11, № 45. P. 4115-4122.

14.Ma L., Dong L., Chang P. CD44v6 engages in colorectal cancer progression // Cell Death Dis. Springer, 2019. Vol. 10, № 1.

15.Wang J.-L. et al. CD44v6 overexpression related to metastasis and poor prognosis of colorectal cancer: A meta-analysis // Oncotarget. 2017. Vol. 8, № 8. P. 12866-12876.

16.Yan B. et al. Clinicopathological significance and prognostic implication of CD44 and its splice variants (v3 and v6) in colorectal cancer // Transl Cancer Res. 2020. Vol. 9, № 2. P. 1215-1224.

17.Giraud J. et al. CD44v3 is a marker of invasive cancer stem cells driving metastasis in gastric carcinoma // Gastric Cancer. 2023. Vol. 26, № 2. P. 234-249.

18.Zhao L.H. et al. CD44v6 expression in patients with stage II or stage III sporadic colorectal cancer is superior to CD44 expression for predicting progression // Int J Clin Exp Pathol. 2015. Vol. 8, № 1. P. 692-701.

19.Wang L. et al. CD44v6 down-regulation is an independent prognostic factor for poor outcome of colorectal carcinoma // Int J Clin Exp Pathol. 2015. Vol. 8, № 11. P. 1428314293.

20.Sawai K. et al. Presence of CD44v9-expressing cancer stem cells in circulating tumor cells and effects of carcinoembryonic antigen levels on the prognosis of colorectal cancer // Cancers. 2024. Vol. 16, № 8. P. 1556.

21.Zhang H. et al. CD44 splice isoform switching determines breast cancer stem cell state // Genes Dev. Cold Spring Harbor Laboratory, 2019. Vol. 33, № 3-4. P. 166-179.

22.Barash Y. et al. Deciphering the splicing code // Nature. Springer, 2010. Vol. 465, № 7294. P. 53-59.

23.van 't Veer L.J. et al. Gene expression profiling predicts clinical outcome of breast cancer // Nature. Springer, 2002. Vol. 415, № 6871. P. 530-536.

24.Sebestyén E. et al. Large-scale analysis of genome and transcriptome alterations in multiple tumors unveils novel cancer-relevant splicing networks // Genome Res. 2016. Vol. 26, № 6. P. 732-744.

25.Fearon E.R., Vogelstein B. A genetic model for colorectal tumorigenesis // Cell. Elsevier, 1990. Vol. 61, № 5. P. 759-767.

26.Markowitz S.D., Bertagnolli M.M. Molecular basis of colorectal cancer // N Engl J Med. 2009. Vol. 361, № 25. P. 2449-2460.

27.Nieto M.A. et al. EMT: 2016 // Cell. Elsevier, 2016. Vol. 166, № 1. P. 21-45.

28.Brown R.L. et al. CD44 splice isoform switching in human and mouse epithelium is essential for epithelial-mesenchymal transition and breast cancer progression // J Clin Invest. 2011. Vol. 121, № 3. P. 1064-1074.

29.Climente-Gonzalez H. et al. The functional impact of alternative splicing in cancer // Cell Rep. Elsevier, 2017. Vol. 20, № 9. P. 2215-2226.

30.0ltean S., Bates D.O. Hallmarks of alternative splicing in cancer // Oncogene. Springer, 2013. Vol. 33, № 46. P. 5311-5318.

31.Ponta H., Sherman L., Herrlich P.A. CD44: from adhesion molecules to signalling regulators // Nat Rev Mol Cell Biol. Springer, 2003. Vol. 4, № 1. P. 33-45.

32.Naor D. et al. Involvement of CD44, a molecule with a thousand faces, in cancer dissemination // Semin Cancer Biol. Elsevier, 2008. Vol. 18, № 4. P. 260-267.

33.Hassn Mesrati M. et al. CD44: a multifunctional mediator of cancer progression // Biomolecules. 2021. Vol. 11, № 12. P. 1850.

34.Jiang W. et al. CD44 regulates pancreatic cancer invasion through MT1-MMP // Mol Cancer Res. 2015. Vol. 13, № 1. P. 9-15.

35.Wielenga V.J. et al. Expression of CD44 variant proteins in human colorectal cancer is related to tumor progression // Cancer Res. 1993. Vol. 53, № 20. P. 4754-4756.

36.Li C. et al. Identification of pancreatic cancer stem cells // Cancer Res. 2007. Vol. 67, № 3. P. 1030-1037.

37.Dalerba P. et al. Phenotypic characterization of human colorectal cancer stem cells // Proc Natl Acad Sci USA. 2007. Vol. 104, № 24. P. 10158-10163.

38. Zöller M. CD44: can a cancer-initiating cell profit from an abundantly expressed molecule? // Nat Rev Cancer. Springer, 2011. Vol. 11, № 4. P. 254-267.

39.GTEx Portal [Электронный ресурс]. URL: https: //www. gtexportal. org/home/gene/CD44#gene-transcript-browser-block

40.Goodison S., Urquidi V., Tarin D. CD44 cell adhesion molecules // Mol Pathol. BMJ, 1999. Vol. 52, № 4. P. 189-196.

41.Günthert U. et al. A new variant of glycoprotein CD44 confers metastatic potential to rat carcinoma cells // Cell. 1991. Vol. 65, № 1. P. 13-24.

42.Prochazka L., Tesarik R., Turanek J. Regulation of alternative splicing of CD44 in cancer // Cell Signal. Elsevier, 2014. Vol. 26, № 10. P. 2234-2239.

43.Azevedo R. et al. CD44 glycoprotein in cancer: a molecular conundrum hampering clinical applications // Clin Proteomics. 2018. Vol. 15. P. 22.

44.Misra S. et al. Hyaluronan-CD44 interactions as potential targets for cancer therapy // FEBS J. Wiley, 2011. Vol. 278, № 9. P. 1429-1443.

45.Ziranu P. et al. CD44: a new prognostic marker in colorectal cancer? // Cancers. 2024. Vol. 16, № 8. P. 1569.

46.Dastych M. et al. Overexpression of CD44v8-10 in colon polyps — a possible key to early diagnosis // Pathol Oncol Res. 2021. Vol. 27. P. 614281.

47.Boman B.M. et al. The v8-10 variant isoform of CD44 is selectively expressed in the normal human colonic stem cell niche and frequently is overexpressed in colon carcinomas during tumor development // Cancer Biol Ther. 2023. Vol. 24, № 1. P. 2195363.

48.Goi T. et al. CD44 with variant exons 8-10 in colorectal tumors // Int J Oncol. 1996.

49.Yamaguchi A. et al. Expression of a CD44 variant containing exons 8 to 10 is a useful independent factor for the prediction of prognosis in colorectal cancer patients // J Clin Oncol. 1996. Vol. 14, № 4. P. 1122-1127.

50.Ishimoto T. et al. CD44 variant regulates redox status in cancer cells by stabilizing the xCT subunit of system xc- and thereby promotes tumor growth // Cancer Cell. Elsevier, 2011. Vol. 19, № 3. P. 387-400.

51.Yae T. et al. Alternative splicing of CD44 mRNA by ESRP1 enhances lung colonization of metastatic cancer cell // Nat Commun. Springer, 2012. Vol. 3, № 1.

52.Jyotsana N., Ta K.T., DelGiorno K.E. The role of cystine/glutamate antiporter SLC7A11/xCT in the pathophysiology of cancer // Front Oncol. 2022. Vol. 12. P. 858462.

53.Miyoshi S. et al. Inhibiting xCT improves 5-fluorouracil resistance of gastric cancer induced by CD44 variant 9 expression // Anticancer Res. 2018. Vol. 38, №2 11. P. 61636170.

54.Nguyen S.V. et al. Clinicopathological and prognostic value of CD44 gene polymorphism (rs187115) in Swedish patients with colorectal cancer // Nucleosides Nucleotides Nucleic Acids. 2023. Vol. 42, № 10. P. 807-817.

55.Mortensen A.C.L. et al. Selection, characterization and in vivo evaluation of novel CD44v6-targeting antibodies for targeted molecular radiotherapy // Sci Rep. 2023. Vol. 13, № 1.

56.Tijink B.M. et al. A phase I dose escalation study with anti-CD44v6 bivatuzumab mertansine in patients with incurable squamous cell carcinoma of the head and neck or esophagus // Clin Cancer Res. 2006. Vol. 12, № 20. P. 6064-6072.

57.Riechelmann H. et al. Phase I trial with the CD44v6-targeting immunoconjugate bivatuzumab mertansine in head and neck squamous cell carcinoma // Oral Oncol. 2008. Vol. 44, № 9. P. 823-829.

58.Tirella A. et al. CD44 targeted delivery of siRNA by using HA-decorated nanotechnologies for KRAS silencing in cancer treatment // Int J Pharm. 2019. Vol. 561. P. 114-123.

59.Rios De La Rosa J.M. et al. Binding and internalization in receptor-targeted carriers: the complex role of CD44 in the uptake of hyaluronic acid-based nanoparticles (siRNA delivery) // Adv Healthc Mater. 2019. Vol. 8, № 24.

60.Wickens J.M. et al. Recent advances in hyaluronic acid-decorated nanocarriers for targeted cancer therapy // Drug Discov Today. 2017. Vol. 22, № 4. P. 665-680.

61.Berget S.M., Moore C., Sharp P.A. Spliced segments at the 5' terminus of adenovirus 2 late mRNA // Proc Natl Acad Sci USA. 1977. Vol. 74, № 8. P. 3171-3175.

62. Chow L.T. et al. An amazing sequence arrangement at the 5' ends of adenovirus 2 messenger RNA // Cell. 1977. Vol. 12, № 1. P. 1-8.

63.Bentley D.L. Coupling mRNA processing with transcription in time and space // Nat Rev Genet. 2014. Vol. 15, № 3. P. 163-175.

64. Wahl M.C., Will C.L., Luhrmann R. The spliceosome: design principles of a dynamic RNP machine // Cell. 2009. Vol. 136, № 4. P. 701-718.

65.Will C.L., Luhrmann R. Spliceosome structure and function // Cold Spring Harb Perspect Biol. 2011. Vol. 3, № 7. P. a003707.

66. Shi Y. Mechanistic insights into precursor messenger RNA splicing by the spliceosome // Nat Rev Mol Cell Biol. 2017. Vol. 18, № 11. P. 655-670.

67.Le Hir H. The spliceosome deposits multiple proteins 20-24 nucleotides upstream of mRNA exon-exon junctions // EMBO J. 2000. Vol. 19, № 24. P. 6860-6869.

68.Pan Q. et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing // Nat Genet. 2008. Vol. 40, № 12. P. 1413-1415.

69.Wang E.T. et al. Alternative isoform regulation in human tissue transcriptomes // Nature. 2008. Vol. 456, № 7221. P. 470-476.

70.Merkin J. et al. Evolutionary dynamics of gene and isoform regulation in mammalian tissues // Science. 2012. Vol. 338, № 6114. P. 1593-1599.

71.Barbosa-Morais N.L. et al. The evolutionary landscape of alternative splicing in vertebrate species // Science. 2012. Vol. 338, № 6114. P. 1587-1593.

72.Luco R.F. et al. Regulation of alternative splicing by histone modifications // Science. 2010. Vol. 327, № 5968. P. 996-1000.

73.David C.J., Manley J.L. Alternative pre-mRNA splicing regulation in cancer: pathways and programs unhinged // Genes Dev. 2010. Vol. 24, № 21. P. 2343-2364.

74.Dvinge H. et al. RNA splicing factors as oncoproteins and tumour suppressors // Nat Rev Cancer. 2016. Vol. 16, № 7. P. 413-430.

75.Anczukow O., Krainer A.R. Splicing-factor alterations in cancers // RNA. 2016. Vol. 22, № 9. P. 1285-1301.

76.Oltean S., Bates D.O. Hallmarks of alternative splicing in cancer // Oncogene. 2014.

Vol. 33, № 46. P. 5311-5318. 77.Shapiro M.B., Senapathy P. RNA splice junctions of different classes of eukaryotes: sequence statistics and functional implications in gene expression // Nucleic Acids Res. 1987. Vol. 15, № 17. P. 7155-7174.

78.Reese M.G. et al. Improved splice site detection in Genie // J Comput Biol. 1997. Vol. 4, № 3. P. 311-323.

79.Yeo G., Burge C.B. Maximum entropy modeling of short sequence motifs with applications to RNA splicing signals // J Comput Biol. 2004. Vol. 11, № 2-3. P. 377394.

80.Dogan R.I. et al. SplicePort — an interactive splice-site analysis tool // Nucleic Acids Res. 2007. Vol. 35, Web Server issue. P. W285-W291.

81.Cui Y., Cai M., Stanley H.E. Comparative analysis and classification of cassette exons and constitutive exons // Biomed Res Int. 2017. Vol. 2017. P. 1-8.

82.Dror G., Sorek R., Shamir R. Accurate identification of alternatively spliced exons using support vector machine // Bioinformatics. 2005. Vol. 21, № 7. P. 897-901.

83.Cui Y., Cai M., Stanley H.E. Comparative analysis and classification of cassette exons and constitutive exons // Biomed Res Int. 2017. Vol. 2017. P. 1-8.

84.Bretschneider H. et al. COSSMO: predicting competitive alternative splice site selection using deep learning // Bioinformatics. 2018. Vol. 34, № 13. P. i429-i437.

85.Jaganathan K. et al. Predicting splicing from primary sequence with deep learning // Cell. 2019. Vol. 176, № 3. P. 535-548.e24.

86.Ha C., Kim J.-W., Jang J.-H. Performance evaluation of SpliceAI for the prediction of splicing of NF1 variants // Genes. 2021. Vol. 12, № 9. P. 1308.

87.Pan X. et al. RBPsuite: RNA-protein binding sites prediction suite based on deep learning // BMC Genomics. 2020. Vol. 21, № 1. P. 884.

88.Zhang Y. et al. OncoSplicing 3.0: an updated database for identifying RBPs regulating alternative splicing events in cancers // Nucleic Acids Res. 2025. Vol. 53, № D1. P. D1460-D1466.

89.Ryan M. et al. TCGASpliceSeq: a compendium of alternative mRNA splicing in cancer // Nucleic Acids Res. 2016. Vol. 44, № D1. P. D1018-D1022.

90.Kahles A. et al. SplAdder: identification, quantification and testing of alternative splicing events from RNA-Seq data // Bioinformatics. 2016. Vol. 32, № 12. P. 18401847.

91.Cheng J. et al. MMSplice: modular modeling improves the predictions of genetic variant effects on splicing // Genome Biol. 2019. Vol. 20, № 1. P. 48.

92.Xiong H.Y. et al. The human splicing code reveals new insights into the genetic determinants of disease // Science. American Association for the Advancement of Science (AAAS), 2015. Vol. 347, № 6218.

93.Cheng J. et al. MTSplice predicts effects of genetic variants on tissue-specific splicing // Genome Biol. 2021. Vol. 22, № 1. P. 94.

94.Scalzitti N. et al. Spliceator: multi-species splice site prediction using convolutional neural networks // BMC Bioinformatics. 2021. Vol. 22, № 1. P. 561.

95.Zeng T., Li Y.I. Predicting RNA splicing from DNA sequence using Pangolin // Genome Biol. 2022. Vol. 23, № 1. P. 103.

96.Li Y.I. et al. RNA splicing is a primary link between genetic variation and disease // Science. 2016. Vol. 352, № 6285. P. 600-604.

97.Riepe T.V. et al. Benchmarking deep learning splice prediction tools using functional splice assays // Hum. Mutat. 2021. Vol. 42, № 7. P. 799-810.

98. Chao K.-H. et al. OpenSpliceAI: An efficient, modular implementation of SpliceAI enabling easy retraining on non-human species. Genomics, 2025.

99.Kang L., Liu A., Tian L. Linear combination methods to improve diagnostic/prognostic accuracy on future observations // Stat Methods Med Res. 2016. Vol. 25, №2 4. P. 13591380.

100. Cruz J.A., Wishart D.S. Applications of machine learning in cancer prediction and prognosis // Cancer Inform. 2006. Vol. 2. P. 117693510600200.

101. Kourou K. et al. Machine learning applications in cancer prognosis and prediction // Comput Struct Biotechnol J. 2015. Vol. 13. P. 8-17.

102. Zhang M.-J. Cox proportional hazards regression models for survival data in cancer research // In: Biostatistical Applications in Cancer Research. Springer US, 2002. P. 59-70.

103. Kleinbaum D.G., Klein M. The Cox proportional hazards model and its characteristics // In: Survival Analysis. Springer, New York, 2012. P. 97-159.

104. Kamarudin A.N., Cox T., Kolamunnage-Dona R. Time-dependent ROC curve analysis in medical research: current methods and applications // BMC Med Res Methodol. 2017. Vol. 17, № 1. P. 53.

105. Salsburg D. Hundreds of patients, thousands of observations: the curse of dimensionality in clinical research // Drug Inf J. 1993. Vol. 27, № 3. P. 597-609.

106. Sánchez J.S., García V. Addressing the links between dimensionality and data characteristics in gene-expression microarrays // Proc Int Conf Learn Optim Algorit Theory Appl. ACM, 2018. P. 1-6.

107. Asyali M. et al. Gene expression profile classification: a review // Curr Bioinform. 2006. Vol. 1, № 1. P. 55-73.

108. Mirza B. et al. Machine learning and integrative analysis of biomedical big data // Genes. 2019. Vol. 10, № 2. P. 87.

109. Wang L., Wang Y., Chang Q. Feature selection methods for big data bioinformatics: A survey from the search perspective // Methods. 2016. Vol. 111. P. 21-31.

110. Chandrashekar G., Sahin F. A survey on feature selection methods // Comput Electr Eng. 2014. Vol. 40, № 1. P. 16-28.

111. Saeys Y., Inza I., Larranaga P. A review of feature selection techniques in bioinformatics // Bioinformatics. 2007. Vol. 23, № 19. P. 2507-2517.

112. Arakelyan A., Aslanyan L., Boyajyan A. On knowledge-based gene expression data analysis // Ninth Int Conf Comput Sci Inf Technol Revised Selected Papers. IEEE, 2013. P. 1-6.

113. Zhang J. et al. FS-GBDT: identification multicancer-risk module via a feature selection algorithm by integrating Fisher score and GBDT // Brief Bioinform. 2021. Vol. 22, № 3. P. bbaa189.

114. Rana P. et al. Relevant and non-redundant feature selection for cancer classification and subtype detection // Cancers. 2021. Vol. 13, № 17. P. 4297.

115. Galatenko V.V. et al. Highly informative marker sets consisting of genes with low individual degree of differential expression // Sci Rep. 2015. Vol. 5, № 1.

116. Galatenko V.V. et al. Cumulative prognostic power of laminin genes in colorectal cancer // BMC Med Genomics. 2018. Vol. 11, № S1.

117. Galatenko V.V. et al. Comprehensive network of miRNA-induced intergenic interactions and a biological role of its core in cancer // Sci Rep. 2018. Vol. 8, № 1.

118. Zhang B., Horvath S. A general framework for weighted gene co-expression network analysis // Stat Appl Genet Mol Biol. 2005. Vol. 4, № 1.

119. Shalgi R. et al. Global and local architecture of the mammalian microRNA-transcription factor regulatory network // PLoS Comput Biol. 2007. Vol. 3, № 7. P. e131.

120. Zhang S. et al. Determining modular organization of protein interaction networks by maximizing modularity density // BMC Syst Biol. 2010. Vol. 4, № S2.

121. Sun J. et al. Uncovering microRNA and transcription factor mediated regulatory networks in glioblastoma // PLoS Comput Biol. 2012. Vol. 8, № 7. P. e1002488.

122. Fan Y. et al. miRNet: dissecting miRNA-target interactions and functional associations through network-based visual analysis // Nucleic Acids Res. 2016. Vol. 44, № W1. P. W135-W141.

123. Do D.N. et al. Integration of miRNA weighted gene co-expression network and miRNA-mRNA co-expression analyses reveals potential regulatory functions of miRNAs in calf rumen development // Genomics. 2019. Vol. 111, № 4. P. 849-859.

124. Lu Y. et al. A Lasso regression model for the construction of microRNA-target regulatory networks // Bioinformatics. 2011. Vol. 27, № 17. P. 2406-2413.

125. Liu F. et al. Investigation of miRNA and mRNA co-expression network in ependymoma // Front Bioeng Biotechnol. 2020. Vol. 8.

126. Ule J. et al. An RNA map predicting Nova-dependent splicing regulation // Nature. 2006. Vol. 444, № 7119. P. 580-586.

127. Licatalosi D.D. et al. HITS-CLIP yields genome-wide insights into brain alternative RNA processing // Nature. 2008. Vol. 456, № 7221. P. 464-469.

128. Witten J.T., Ule J. Understanding splicing regulation through RNA splicing maps // Trends Genet. 2011. Vol. 27, № 3. P. 89-97.

129. Ibrahim E.C. et al. Serine/arginine-rich protein-dependent suppression of exon skipping by exonic splicing enhancers // Proc Natl Acad Sci USA. 2005. Vol. 102, № 14. P. 5002-5007.

130. Erkelenz S. et al. Position-dependent splicing activation and repression by SR and hnRNP proteins rely on common mechanisms // RNA. 2013. Vol. 19, № 1. P. 96-102.

131. Kanopka A., Mühlemann O., Akusjärvi G. Inhibition by SR proteins of splicing of a regulated adenovirus pre-mRNA // Nature. 1996. Vol. 381, № 6582. P. 535-538.

132. Wang Z. et al. Genome-wide analysis of PTB-RNA interactions reveals a strategy used by the general splicing repressor to modulate exon inclusion or skipping // Mol Cell. 2009. Vol. 36, № 6. P. 996-1006.

133. Llorian M. et al. Position-dependent alternative splicing activity revealed by global profiling of alternative splicing events regulated by PTB // Nat Struct Mol Biol. 2010. Vol. 17, № 9. P. 1114-1123.

134. Tollervey J.R. et al. Characterizing the RNA targets and position-dependent splicing regulation by TDP-43 // Nat Neurosci. 2011. Vol. 14, № 4. P. 452-458.

135. Wang Z. et al. iCLIP predicts the dual splicing effects of TIA-RNA interactions // PLoS Biol. 2010. Vol. 8, № 10. P. e1000530.

136. Yu Y. et al. Dynamic regulation of alternative splicing by sil encers that modulate 5' splice site competition // Cell. 2008. Vol. 135, № 7. P. 1224-1236.

137. Kim S.W. et al. Widespread intra-dependencies in the removal of introns from human transcripts // Nucleic Acids Res. 2017. Vol. 45, № 16. P. 9503-9513.

138. Drexler H.L., Choquet K., Churchman L.S. Splicing kinetics and coordination revealed by direct nascent RNA sequencing through nanopores // Mol Cell. 2020. Vol. 77, № 5. P. 985-998.e8.

139. Weinstein J.N. et al. The Cancer Genome Atlas Pan-Cancer analysis project // Nat Genet. 2013. Vol. 45, № 10. P. 1113-1120.

140. Robinson M.D., McCarthy D.J., Smyth G.K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data // Bioinformatics. 2010. Vol. 26, № 1. P. 139-140.

141. Baran B. et al. Difference between left-sided and right-sided colorectal cancer: a focused review of literature // Gastroenterol Res. 2018. Vol. 11, № 4. P. 264-273.

142. Love M.I., Huber W., Anders S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2 // Genome Biol. 2014. Vol. 15, № 12.

143. Subramanian A. et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles // Proc Natl Acad Sci USA. 2005. Vol. 102, № 43. P. 15545-15550.

144. Fang Z., Liu X., Peltz G. GSEApy: a comprehensive package for performing gene set enrichment analysis in Python // Bioinformatics. 2022. Vol. 39, № 1.

145. Akinwande M.O., Dikko H.G., Samson A. Variance inflation factor: as a condition for the inclusion of suppressor variable(s) in regression analysis // Open J Stat. 2015. Vol. 5, № 7. P. 754-767.

146. Homo sapiens - Ensembl genome browser 114 [Electronic resource]. URL: https: //www.ensembl .org/Homo_sapiens/Info/Index

147. Ferrari S., Cribari-Neto F. Beta regression for modelling rates and proportions // J Appl Stat. 2004. Vol. 31, № 7. P. 799-815.

148. Bühlmann P., Hothorn T. Boosting algorithms: regularization, prediction and model fitting // Stat Sci. 2007. Vol. 22, № 4.

149. Natekin A., Knoll A. Gradient boosting machines, a tutorial // Front Neurorobot. 2013. Vol. 7.

150. Pedregosa F. et al. Scikit-learn: Machine Learning in Python // arXiv preprint arXiv:1201.0490. 2012.

151. Harris C.R. et al. Array programming with NumPy // Nature. 2020. Vol. 585, № 7825. P. 357-362.

152. Virtanen P. et al. SciPy 1.0: fundamental algorithms for scientific computing in Python // Nat Methods. 2020. Vol. 17, № 3. P. 261-272.

153. Chen C. et al. The biology and role of CD44 in cancer progression: therapeutic implications // J Hematol Oncol. 2018. Vol. 11, № 1. P. 64.

154. Senbanjo L.T., Chellaiah M.A. CD44: A Multifunctional Cell Surface Adhesion Receptor Is a Regulator of Progression and Metastasis of Cancer Cells // Front Cell Dev Biol. 2017. Vol. 5.

155. Giulietti M. et al. SpliceAid-F: a database of human splicing factors and their RNA-binding sites // Nucleic Acids Res. 2013. Vol. 41, № D1. P. D125-D131.

156. Giudice G. et al. ATtRACT—a database of RNA-binding proteins and associated motifs // Database. 2016. Vol. 2016. P. baw035.

157. Van Nostrand E.L. et al. A large-scale binding and functional map of human RNA-binding proteins // Nature. 2020. Vol. 583, № 7818. P. 711-719.

158. Kuret K. et al. Positional motif analysis reveals the extent of specificity of protein-RNA interactions observed by CLIP // Genome Biol. 2022. Vol. 23, № 1. P. 191.

159. Zhou D. et al. RBFOX2 alters splicing outcome in distinct binding modes with multiple protein partners // Nucleic Acids Res. 2021. Vol. 49, № 14. P. 8370-8383.

160. Van Nostrand E.L. et al. A large-scale binding and functional map of human RNA-binding proteins // Nature. 2020. Vol. 583, № 7818. P. 711-719.

161. Hu X. et al. The RNA-binding protein AKAP8 suppresses tumor metastasis by antagonizing EMT-associated alternative splicing // Nat Commun. 2020. Vol. 11, № 1. P. 486.

162. Lyu J., Cheng C. Regulation of Alternative Splicing during Epithelial-Mesenchymal Transition // Cells Tissues Organs. 2022. Vol. 211, № 2. P. 238-251.

163. Reber S. et al. Minor intron splicing is regulated by FUS and affected by ALS-associated FUS mutants // EMBO J. 2016. Vol. 35, № 14. P. 1504-1521.

164. Ohno M. et al. PHAX, a Mediator of U snRNA Nuclear Export Whose Activity Is Regulated by Phosphorylation // Cell. 2000. Vol. 101, № 2. P. 187-198.

165. Oskarsson G.R. et al. Predicted loss and gain of function mutations in ACO1 are associated with erythropoiesis // Commun Biol. 2020. Vol. 3, № 1. P. 189.

166. Jun Y. et al. Comprehensive Analysis of Alternative Splicing in Gastric Cancer Identifies Epithelial-Mesenchymal Transition Subtypes Associated with Survival // Cancer Res. 2022. Vol. 82, № 4. P. 543-555.

167. Liu W. et al. IGF2BP2 orchestrates global expression and alternative splicing profiles associated with glioblastoma development in U251 cells // Transl Oncol. 2025. Vol. 51. P. 102177.

168. Arasaki Y., Hayata T. The RNA-binding protein Cpeb4 regulates splicing of the Id2 gene in osteoclast differentiation // J Cell Physiol. 2024. Vol. 239, № 4. P. e31197.

169. Ishii H. et al. Epithelial Splicing Regulatory Proteins 1 (ESRP1) and 2 (ESRP2) Suppress Cancer Cell Motility via Different Mechanisms // J Biol Chem. 2014. Vol. 289, № 40. P. 27386-27399.

170. Legge D. et al. The epithelial splicing regulator ESRP2 is epigenetically repressed by DNA hypermethylation in Wilms tumour and acts as a tumour suppressor // Mol Oncol. 2022. Vol. 16, № 3. P. 630-647.

171. García-Cárdenas J.M. et al. Post-transcriptional Regulation of Colorectal Cancer: A Focus on RNA-Binding Proteins // Front Mol Biosci. 2019. Vol. 6. P. 65.

172. Long J.C., Caceres J.F. The SR protein family of splicing factors: master regulators of gene expression // Biochem J. 2009. Vol. 417, № 1. P. 15-27.

173. Han S.P., Tang Y.H., Smith R. Functional diversity of the hnRNPs: past, present and perspectives // Biochem J. 2010. Vol. 430, № 3. P. 379-392.

174. Linares A.J. et al. The splicing regulator PTBP1 controls the activity of the transcription factor Pbx1 during neuronal differentiation // eLife. 2015. Vol. 4. P. e09268.

175. Urbanski L.M., Leclair N., Anczuków O. Alternative-splicing defects in cancer: Splicing regulators and their downstream targets, guiding the way to novel cancer therapeutics // WIREs RNA. 2018. Vol. 9, № 4. P. e1476.

Список рисунков

Рисунок 1. Структура и изоформы CD44. Рисунок адаптирован на основе

материалов работы [24]................................................................................................19

Рисунок 2. Соотношение экспрессий CD44s/CD44v при колоректальном раке по стадиям (TCGA-COAD-READ). Показаны коробчатые диаграммы для каждой

стадии и p-значение различий распределений между группами.............................75

Рисунок 3. Связь отношения CD44s/CD44v с выживаемостью при КРР (TCGA-COAD-READ). Кривые Каплана-Майера для всей когорты, p-значение логранкового теста приведено на панели. Аналогичный анализ в группах,

сформированных по клинической стадии заболевания............................................78

Рисунок 4. Анализ GSEA для когорты TCGA-COAD-READ при стратификации по порогу отношения CD44s/CD44v. Показаны нормированные коэффициенты обогащения (МЕЗ) для путей. Положительные значения NES соответствуют обогащению в подгруппе с высоким CD44s/CD44v, отрицательные — в подгруппе

с низким..........................................................................................................................81

Рисунок 5. Распределение экспрессии изоформ и показатели вариабельности в когорте. Боксплоты уровней экспрессии каждой изоформы. Зависимость коэффициента вариации от медианы экспрессии по изоформам. (С) Доля нулевых

значений для каждой изоформы..................................................................................84

Рисунок 6. Экзонное дерево изоформ CD44 с выделенным узлом, различающим

изоформы 3 и 4..............................................................................................................87

Рисунок 7. Зависимость наблюдаемой доли экспрессии изоформы 3 мРНК CD44 от предсказанных моделью значений на основе экспрессии восьми регуляторных RBP

(данные TCGA-COAD).................................................................................................89

Рисунок 8. График зависимости доли экспрессии изоформы 3 мРНК CD44 от экспрессии найденных с помощью алгоритма восемнадцати RBP на общем объеме данных TCGA................................................................................................................95

Рисунок 9. График распределения RBP по представленности в качестве значимого регулятора сплайсинга изоформы 3 (экзон 12) мРНК CD44 в различных типах опухолевых клеток согласно результатам алгоритма SRPSeq на данных TCGA. . 97 Рисунок 10. Результаты изменения доли изоформы 3 после нокдауна соответствующего РНК-связывающего белка в клеточной линии HepG2 в сравнении с контрольными клетками, согласно данным проекта ENCODE........101

Список таблиц

Таблица 1. RBP, полученные в результате моделирования доли изоформы 3 мРНК

CD44 на данных КРР проекта TCGA..........................................................................91

Таблица 2. Когорты проекта TCGA, включённые в анализ, с указанием медианы и стандартного отклонения уровней экспрессии изоформ 3 и 4 CD44......................92

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.