Новые способы обработки хроматомасс-спектрометрических данных с применением методов машинного обучения для поиска биомаркеров и классификации растений тема диссертации и автореферата по ВАК РФ 02.00.02, кандидат наук Турова Полина Николаевна

  • Турова Полина Николаевна
  • кандидат науккандидат наук
  • 2022, ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова»
  • Специальность ВАК РФ02.00.02
  • Количество страниц 167
Турова Полина Николаевна. Новые способы обработки хроматомасс-спектрометрических данных с применением методов машинного обучения для поиска биомаркеров и классификации растений: дис. кандидат наук: 02.00.02 - Аналитическая химия. ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова». 2022. 167 с.

Оглавление диссертации кандидат наук Турова Полина Николаевна

Введение

Глава 1. Применение методов машинного обучения в хроматомасс-спектрометрии (литературный обзор)

1.1. Организация (методы представления) данных

1.2. Фильтрация сигнала и сглаживание шума

1.3. Методы выравнивания размерностей данных

1.4. Методы обработки данных

1.4.1. Методы машинного обучения «без учителя»

1.4.2. Методы машинного обучения «с учителем»

Глава 2. Оборудование, материалы, техника эксперимента

2.1. Оборудование и материалы

2.2. Выполнение анализа

2.2.1. Схема эксперимента по анализу стандартных растворов и лекарственных растений

2.2.2. Схема эксперимента по анализу растений P. ginseng, G. glabra, A. precatorius и коммерческих чаев

2.2.3. Схема эксперимента по анализу образцов растений семейства Зонтичные

Глава 3. Идентификация и классификация растительных материалов на основе данных целевого ВЭЖХ-МС анализа

3.1. Определение условий детектирования биомаркеров

3.2. Идентификация по уникальным биомаркерам

3.3. Идентификация по группе характеристичных соединений

3.4. Идентификация с помощью маркеров качества

Глава 4. Разработка ВЭЖХ-МС-PARAFAC подхода для идентификации растительных экстрактов

4.1. Подготовка и анализ данных

4.2. Интерпретация результатов PARAFAC

4.3. Сравнение масс-хроматограмм характеристических фрагментных

ионов

Глава 5. Применение методов обработки ВЭЖХ-МС данных «без учителя» для поиска потенциальных хемотаксономических маркеров

5.1. Выбор условий экстракции и анализ образцов

5.2. Обработка данных ВЭЖХ-МСНР

5.3. Обработка данных ВЭЖХ-МСВР

5.4. Разложение тензора

5.5. Методы матричной факторизации

5.6. Сравнение работы алгоритмов

5.7. Идентификация биомаркеров

5.8. Применение разработанного комплекса подходов в хемотаксономических целях

Глава 6. Методы обработки ВЭЖХ-МС данных «с учителем» и их применение для поиска маркеров групп

6.1. Применение метода опорных векторов

6.2. Выделение и идентификация биомаркеров, характеристичных для каждой группы образцов

6.3. Сверточные нейронные сети

6.4. Аугментация для данных ВЭЖХ-МС

Заключение

Выводы

Список литературы

Приложение

Рекомендованный список диссертаций по специальности «Аналитическая химия», 02.00.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Новые способы обработки хроматомасс-спектрометрических данных с применением методов машинного обучения для поиска биомаркеров и классификации растений»

Введение

Актуальность темы. Одной из актуальных задач, решаемых с помощью хроматомасс-спектрометрических методов анализа является классификация и контроль качества растительных материалов и продуктов на их основе. Такие продукты могут содержать отдельные экстракты лекарственных трав или их комбинации. Обычно растительные экстракты представляют собой сложные смеси сотен основных и минорных соединений. Вторичные метаболиты растений, даже присутствуя на низких концентрациях, могут быть важны для качества, безопасности и эффективности конечного продукта. Из-за географических и сезонных изменений и условий окружающей среды химический состав экстрактов растений может сильно меняться. Кроме того, на содержание метаболитов могут влиять многие другие факторы, включая зрелость (период сбора урожая), процессы сушки и хранения, что в совокупности с вышеуказанными внешними факторами делает задачу классификации и определения состава таких объектов еще более сложной. Высокоинформативные хроматомасс-спектрометрические методы позволяют зарегистрировать сигналы разных по структуре компонентов растительных экстрактов и выявить значимые для проведения такой классификации маркеры. Однако применение таких современных методов анализа предполагает получение и последующую обработку больших объемов данных, что требует использования методов хемоинформатики и машинного обучения. Применение этих методов к так называемым «сырым» данным осложнено из-за присутствия шумовых сигналов и дрейфа базовой линии, и другими факторами, связанными с изменением условий измерения в ходе анализа большого числа образцов. По этой причине исходные данные обычно представляют в виде набора пиков, каждый из которых имеет свое значение времени удерживания и значение m/z основного сигнала, по которому этот пик был обнаружен. Для этого применяют разные алгоритмы фильтрации (и отсечения) шумовых сигналов, разметки, сглаживания и деконволюции пиков. Поскольку одному соединению на масс-хроматограмме может соответствовать несколько пиков (по сигналам изотопологов и аддуктных ионов), далее избыточные пики удаляют, формируют финальную таблицу

признаков и определив молекулярные формулы соответствующих им соединений по полученному точному значению молекулярной массы и паттерну изотопного расщепления. Такой подход, используемый в ненаправленном хроматомасс-спектрометрическом анализе, обладает как явными преимуществами, так и некоторыми недостатками. Преимуществом является прямая интерпретируемость получаемых выводов, так как статистически отличающиеся признаки для заданной группы образцов могут быть идентифицированы как соединения-маркеры этой группы. Недостатками же являются потери химической информации при объединении неразрешенных пиков и игнорировании сигналов некоторых молекулярных и фрагментных ионов. Кроме того, такой подход не применяют к данным, полученным методом высокоэффективной жидкостной хроматографии в сочетании с масс-спектрометрическим детектированием низкого разрешения, которые будут содержать гораздо больше перекрывающихся пиков по каждому значению m/z и также могут быть источником полезной информации. В этой связи, актуальным является создание алгоритмов анализа больших данных, основанных на разных способах предобработки и преобразования исходных ВЭЖХ-МС данных низкого и высокого разрешения с методами машинного обучения «с учителем» и «без учителя».

Цель работы заключалась в разработке аналитических подходов к проведению классификации растительных материалов и выявлению характеристических маркеров на основе высокоэффективного хроматографического разделения с масс-спектрометрическим детектированием и методов машинного обучения.

Для достижения поставленной цели необходимо было решить следующие задачи:

• Оценить возможность использования данных целевого ВЭЖХ-МС анализа для идентификации и классификации растительных материалов по выбранным соединениям-маркерам.

• Выбрать условия получения и ненаправленного ВЭЖХ-МС анализа экстрактов из разных частей растений.

• Разработать способы предобработки получаемых трехмерных массивов данных для последующего применения методов машинного обучения.

• Выбрать параметры применяемых вычислительных методов с обучением «с учителем» и «без учителя» для решения задач классификации и кластеризации образцов, а также для поиска маркеров, ответственных за отнесение образца к какой-либо группе или кластеру.

• Проверить работоспособность предложенных подходов с использованием наборов образцов растений разных видов и разного происхождения.

Научная новизна

Предложены оригинальные варианты предобработки и преобразования данных ВЭЖХ-МС профилей низкого и высокого разрешения и продемонстрирована их применимость для последующего использования алгоритмов машинного обучения. Предложен быстрый способ кластеризации для трехмерных массивов ВЭЖХ-МС данных с помощью тензорного разложения по методу PARAFAC.

Проведено сравнение эффективности работы предложенных подходов к кластеризации образцов и выявлению значимых для классификации маркеров, основанных на развертке тензора ВЭЖХ-МС данных в сочетании с методами главных и независимых компонент, методом неотрицательного матричного разложения или методом отбора признаков. Предложен алгоритм ранжирования по вариабельности содержания отдельных соединений в образцах.

Предложены новые способы предобработки и преобразования исходных данных ВЭЖХ-МС низкого разрешения, которые в сочетании с применением метода опорных векторов и сверточных нейронных сетей позволили классифицировать экстракты разных частей растений.

Практическая значимость

Предложен быстрый способ экстракции и ВЭЖХ-МС анализа в широком диапазоне по значениям m/z и по содержанию органического растворителя в подвижной фазе, который позволяет регистрировать наиболее полный профиль разных по свойствам компонентов растительного сырья.

Предложены алгоритмы обработки исходных ВЭЖХ-МС данных низкого и высокого разрешения, включающие устранение шумов, сглаживание, выравнивание и изменение шага для шкалы времени и шкалы m/z, которые позволяют представить полученные данные в удобном для дальнейшего применения методов машинного обучения формате.

Разработанные программные алгоритмы для решения задач предобработки ВЭЖХ-МС данных, классификации образцов и поиска биомаркеров доступны исследователям в сети Интернет1.

На основе ВЭЖХ-МС и метода PARAFAC предложен быстрой способ кластеризации образцов, позволяющий разбить исследуемые объекты на основные группы, а также выявить наиболее значимые хроматографические пики и m/z сигналы, характерные для образцов из выделенных групп.

В результате применения разработанных подходов выявлены и предварительно идентифицированы 23 потенциальных хемотаксономических маркера для разных видов растений из семейства Зонтичные, а также 8 маркеров, характерных для различных частей этих растений.

Положения, выносимые на защиту

1) Разработанная схема выбора уникальных характеристичных маркеров и маркеров качества с их последующим целевым ВЭЖХ-МС определением в режимах мониторинга выбранных ионов и ионных переходов позволяет проводить идентификацию лекарственных растений, находящихся в свободной продаже.

2) Разработанный на основе комбинации ВЭЖХ-МС анализа и тензорного разложения полученных массивов данных по методу PARAFAC подход позволяет разделять образцы, содержащие отдельные растительные материалы, их двойные и тройные модельные смеси, а также экстракты из продуктов, содержащих эти материалы в качестве ароматизирующих добавок без использования индивидуальных стандартных соединений.

1 https://github.com/turovapolina/HPLC-MS-PARAFAC. https://github.com/turovapolina/unsupervised-LC-MS-data-treatment

3) Предложенные способы предобработки и организации ВЭЖХ-МС данных низкого и высокого разрешения обуславливают успешность последующего применения методов машинного обучения «без учителя» для кластеризации экстрактов из листьев разных видов растений одного семейства (на примере семейства Зонтичных).

4) Комбинация извлечения водно-метанольной смесью и последующего разделения методом градиентной обращенно-фазовой ВЭЖХ в широком диапазоне концентраций органического растворителя с МС детектированием в режиме сканирования позволяет получать высокоинформативные хроматографические профили образцов растительных экстрактов, в которых были обнаруженны и идентифицированы компоненты, относящиеся к флавоноидам, кумаринам, гликозидам, липидам и хлорофиллам.

5) Разработанный подход на основе применения метода SVM к развернутому тензору предобработанных ВЭЖХ-МС данных низкого разрешения позволяет классифицировать образцы экстрактов из различных

и и и / и ГЛ \

частей растений одного семейства (на примере семейства Зонтичных): листьев, стеблей, корней, плодов/соцветий.

6) Представление ВЭЖХ-МС данных в виде двумерных массивов с равной размерностью по осям с последующим применением сиамских нейронных сетей позволяет достигать сопоставимой с методом 8УМ точности классификации растительных экстрактов.

7) Использование предложенных способов аугментации ВЭЖХ-МС данных повышает точность классификации как в случае использования метода 8УМ, так и нейронных сетей.

Степень достоверности

Степень достоверности результатов проведенных исследований обеспечивалась применением современного хроматографического и масс-спектрометрического оборудования.

Соответствие паспорту научной специальности

Выпускная квалификационная работа соответствует паспорту специальности 02.00.02 - Аналитическая химия по областям исследований:

- методы химического анализа (химические, физико-химические, атомная и молекулярная спектроскопия, хроматография, рентгеновская спектроскопия, масс-спектрометрия, ядерно-физические методы и др);

- теория и практика пробоотбора и пробоподготовки в аналитической химии;

- математическое обеспечение химического анализа;

- анализ природных веществ.

Апробация результатов исследования

Основные результаты работы были представлены на конференциях:

2022 год: Международная конференция «13th Winter symposium on Chemometrics», Москва, Россия, 28 февраля - 4 марта;

2021 год: Международная конференция «ROAD TO CAC 2022 // ZOOM CONFERENCE ON 20-21 JULY 2021», Курмайёр, Италия, 20 - 21 июля; VI Всероссийская конференция с международным участием «Разделение и концентрирование в аналитической химии и радиохимии», Краснодар, Россия, 26 сентября - 2 октября; X Всероссийская конференция с международным участием «Масс-спектрометрия и ее прикладные проблемы», Москва, Россия, 18 - 22 октября.

2020 год: IV Всероссийская конференция с международным участием «Аналитическая хроматография и капиллярный электрофорез», Краснодар, Россия, 28 сентября - 2 октября; Международная конференция «4th International Symposium on Phytochemicals in Medicine and Food», Сиань, Китай, 30 ноября - 4 декабря;

2019 год: «48th International Symposium on High-Performance Liquid Phase Separations and Related Techniques», Милан, Италия, 16 - 20 июня; III Всероссийская конференция по аналитической спектроскопии с международным участием, Краснодар, Россия, 29 сентября - 5 октября; IX Всероссийская конференция с международным участием «Масс-спектрометрия и ее прикладные проблемы», Москва, Россия, 15 - 18 октября;

Публикации

По материалам работы опубликовано 12 печатных работ, в том числе три статьи в рецензируемых научных изданиях, индексируемых международными базами данных (Web of Science, Scopus) и рекомендованных в диссертационном совете МГУ по специальности 02.00.02 «Аналитическая химия», и 9 тезисов докладов на российских и международных конференциях.

Личный вклад автора

Личный вклад автора состоял в общей постановке задач, систематизации литературных данных, подготовке и проведении всех экспериментальных этапов исследования, обработке, интерпретации и оформлении полученных экспериментальных данных, подготовке материалов к публикации и представлении полученных результатов на конференциях. Все исследования, описанные в работе, выполнены лично автором или в сотрудничестве с коллегами.

Структура и объем работы

Полный текст работы состоит из 6 глав и включает 167 страниц, в том числе 44 рисунка, 12 таблиц. Список литературы содержит 179 наименований.

Глава 1. Применение методов машинного обучения в хроматомасс-спектрометрии (литературный обзор) 1.1. Организация (методы представления) данных

Высокоэффективная жидкостная хроматография в сочетании с масс-спектрометрией (ВЭЖХ-МС) дает богатую информацию о биологических образцах и широко используется в анализе экстрактов растений. Одна из основных трудностей метода ВЭЖХ-МС заключается в том, что необработанные данные, которые имеют структуру трехмерного массива, трудно интерпретировать вручную.

Самый простой метод организации данных, полученных в результате ВЭЖХ-МС и ГХ-МС анализа, это создание таблиц, где признаки - это конкретные идентифицированные соединения, а ячейки - их содержание в разных образцах. Данный подход был удачно воплощен в различных работах [1-3]. Среди рода Panax три исчезающих вида P. notoginseng, P. vietnamensis и P. stipuleanatus имеют схожую морфологию и, в основном, распространены в Юго-Восточной Азии. Содержание данных трех растений часто неправильно идентифицируется или даже фальсифицируется. В данной работе для их идентификации были использованы хроматографические профили, полученные методом ВЭЖХ-МС. В список соединений, идентифицированных в полученных профилях, вошло 22 характеристичных пика. Полученные данные были обработаны с помощью хемометрических подходов, сделаны выводы по идентификации и взаимосвязи различных образцов и видов. В работе были использованы метод иерархической кластеризации (HCA) и метод главных компонент (PCA) и показано, что образцы, принадлежащие к одному виду, группируются вместе.

Другой, более сложный, но гораздо более популярный метод работы с ВЭЖХ-МС данными - метаболомный. В этом случае широко используется так называемая процедура разметки выбранных пиков («peak picking») для преобразования трехмерного набора данных в набор пиков, которые тем или иным образом определены как наиболее информативные [4]. Общая проблема

этого подхода состоит в том, что некоторая информация неизбежно будет потеряна, так как многие пики будут отброшены.

Остальные методы организации ВЭЖХ-МС данных обычно сводятся к двум вариантам [5]. В первом случае конструируется трехмерный массив данных и непосредственно к нему применяются многомерные методы анализа. Каждый образец представляет собой матрицу со следующими двумя осями: времена удерживания и значения m/z, а в ячейках этой матрицы - интенсивности сигналов. Соответственно, в тензоре, составленном из таких образцов, размерностей будет три: образцы - времена удерживания - значения m/z. Далее такой тензор может быть подвергнут различным разложениям и многомерным методам анализа.

Альтернативный подход состоит в том, чтобы развернуть трехмерные данные в двумерный массив путем преобразования тензора размера X х Y х Z в матрицу X х N (где N = Y х Z), которую затем можно разложить на множители, используя широкий спектр методов для матричной факторизации [6]. Два различных режима развертки показаны на Рис. 1:

А 1 1 1 1 1 1 ^-^— X / - / / Ук X-|(/xJ) (ixJ) — " N ^K(lxJ)

j ¿44-у JK

—п IX / 1 Л - (IxK) — ^J(lxK)

J JK

Рис. 1. Развертка тензора [6].

Однако, преобразование многомерных массивов в двумерные наборы данных и их анализ двумерными методами может привести к потере пространственной информации и, как следствие, неправильной интерпретации

результатов, особенно если данные «зашумлены». Причина этого заключается в объединении двух ортогональных измерений.

В ВЭЖХ-МС измерениями, которые объединяются при изменении формы, являются время удерживания и значения m/z. Развертка тензора для данных ВЭЖХ-МС не так широко описана в литературе, но она успешно использовалось для данных масс-спектрометрической визуализации (или mass-spectrometry imaging, MSI) [7] и данных, полученных с помощью ВЭЖХ с диодно-матричным детектированием (ДАД) [8]. Преимуществом такой развертки данных является возможность применения гораздо более широкого спектра потенциальных методов последующей факторизации.

1.2. Фильтрация сигнала и сглаживание шума

При анализе хроматографических данных и обработке сигналов химики-аналитики всегда сталкиваются с такими задачами, как подавление шума, усиление полезного сигнала, детектирование пиков, повышение разрешения и т.д. Одна из причин появления шума в данных - колебания сигнала детектора. Эти колебания могут быть обусловлены каким-либо процессом, либо носить случайный характер. Примером первого является синусоидальное изменение базовой линии, вызванное периодическим движением поршня в хроматографическом насосе. Также, в хроматографии с МС-детектированием важную роль могут играть шумы, имеющие химическую природу и возникающие из-за примесей в подвижной фазе, выщелачивания неподвижной фазы и т. д. [9].

Для решения этих проблем были предложены различные хемометрические подходы. В том числе применяли такие техники, как преобразование Фурье, преобразование Лапласа и преобразование Хартли [10]. В настоящее время более популярными техниками сглаживания хроматографических данных являются следующие подходы: непрерывное вейвлет-преобразование [11], фильтр Савицки-Голея [12] и оценка базовой линии и устранение шума с разрежением [13].

Вейвлет преобразование вошло в аналитическую химию в 1992 г как оценка интенсивности пиков в проточно-инжекционном анализе в среде энтальпиметрических измерений с высоким уровнем шума [14]. Большинство

методов разделения основаны на непрерывной подаче потока и имеют такие источники шума, как пульсации насоса, регуляторы обратного давления, смешение растворителей, мешающий шум детектора, дрейф сигнала и т.д. Это сочетается с серьезной проблемой нежелательного частичного или полного перекрывания пиков. Вейвлет-анализ помогает ученым улучшить соотношение сигнал/шум и обнаружить ранее неразделенные пики. Непрерывное вейвлет-преобразование используется для разложения сигнала на вейвлеты. Вейвлеты — это небольшие колебания, которые сильно локализованы во времени. В то время, как преобразование Фурье разлагает сигнал на синусы и косинусы бесконечной длины, теряя всю информацию о временной локализации, базовые функции непрерывного вейвлет-преобразование являются масштабированными и сдвинутыми версиями локализованного по времени первоначального вейвлета. Непрерывное вейвлет-преобразование используется для построения частотно-временного представления сигнала, которое обеспечивает очень хорошую временную и частотную локализацию. Непрерывное вейвлет-преобразование хорошо зарекомендовало себя в качестве инструмента для коррекции дрейфа базовой линии (А), усиления сигнала и подавления шума (В), обнаружения пиков и улучшения разрешения (С) (Рис. 2) [11].

Рис. 2. Вейвлет-преобразования для коррекции дрейфа базовой линии (А), усиления сигнала и подавления шума (Б), обнаружение пиков и улучшение разрешения (В) [11].

В работе [15] вейвлет преобразование применялось к хроматографическим данным для уменьшения шума (Рис. 3), определения базовой линии (Рис. 4), определения числа компонент в многокомпонентной хроматограмме с перекрыванием пиков.

Рис. 3. ЭБ картина необработанных данных ВЭЖХ-ДАД (А), 3Б картина сглаженных с помощью вэйвлет-преобразования данных ВЭЖХ-ДАД (Б) [15].

Тлте(тт)

Рис. 4. Хроматограмма с дрейфующей базовой линией (А), уровень базовой линии, определенный вейвлет преобразованием (Б) [15].

Фильтр Савицкого-Голея — это цифровой фильтр, который может применяться к набору точек с целью сглаживания данных. Она достигается с помощью процесса, известного как свертка, путем аппроксимации последовательных подмножеств соседних точек данных полиномом низкой степени с помощью метода наименьших квадратов. Фильтр Савицкого-Голея может быть успешно применен к ВЭЖХ-МС данным несколькими способами [16]. Например, он может быть использован для сглаживания масс-

спектров (Рис. 5), локализации максимума пиков, сглаживания масс-хроматограмм (Рис. 6).

Рис. 5. Сглаживание шума фильтром Савицкого-Голея. Необработанные данные МС. (Б) Данные МС после трех итераций с девятиточечным фильтром Савицкого Голея [16].

Рис. 6. Хроматограммы по выделенным ионам двух разных пептидов с разным уровнем шума и разрешением пиков. Синяя линия представляет необработанные данные, а зеленая - сглаженные с использованием автоматически оптимизированного геометрического среднего и фильтра Савицкого-Голея [16].

Основным вопросом в применении фильтра Савитского-Голея является определение оптимальных значений параметров фильтра. Этот вопрос обсуждался в рамках использования данного фильтра для данных ЯМР, ВЭЖХ и масс-спектрометрии [17]. Предлагаемый способ решения этой задачи включает следующие три этапа: (1) вычисление значения автокорреляции шума прибора из

бланкового сигнала с запаздыванием на единицу времени; (2) применение фильтра Савицкого-Голея с использованием различных размеров окна; (3) размер окна, который дает автокорреляцию остатков наиболее близкую к автокорреляции шума прибора, считается оптимальным. Недостатком этого метода является необходимость оценки бланкового сигнала для определения шума прибора, поскольку такие сигналы имеются в наличии не в каждом эксперименте.

Подход, основанный на оценке базовой линии и устранении шума с разрежением [13] базируется на формулировке задачи выпуклой оптимизации, предназначенной для создания непараметрической модели для описания базовой линии и пиков хроматограммы. Базовая линия, в частности, описывается как низкочастотный сигнал, а набор пиков хроматограммы как разреженный и имеющий разреженные производные. Кроме того, для учета неотрицательности хроматографических пиков используются как асимметричные, так и симметричные функции штрафов (симметричные для производных). Эффективность коррекции базовой линии была оценена на смоделированной хроматограмме, результаты сравнили с двумя другими современными методами. Такой метод превосходит методы, основанные на полиномиальном моделировании, поскольку полиномы низкого порядка неэффективны для описания базовой линии. Наконец, поскольку он одновременно описывает базовую линию и хроматографические пики, то может использоваться одновременно как для коррекции базовой линии, так и для сглаживания шума.

1.3. Методы выравнивания размерностей данных

В большинстве методов анализа стоит проблема создания единой шкалы по каждой из размерностей. Например, для размерности времени удерживания возникает такая ситуация, что сигнал детектируется через равные промежутки времени, но с небольшой флуктуацией этого шага. Таким образом, возникают проблемы при соотнесении сигналов, принадлежащим к одной временной точке. Кроме того, могут возникнуть различия в количестве точек по оси времени удерживания для разных образцов. Такой тип данных называется непостоянно отобранными данными [18]. Больше всего с данной проблемой работали в рамках

обработки временных рядов, часто сводя задачу к проблеме недостающих данных, путем дискретизации временной оси на неперекрывающиеся интервалы. Интервалы, в которых не окажется наблюдений будут считаться пропущенными. Данная задача обсуждалась в литературе и предлагались различные решения, в основном основанные на подборе размера данного интервала [19]. Также имеются работы, где проблема решалась с помощью интерполяции и использования для этого глубокого обучения [18]. Такой же вопрос обсуждался при обработке хроматографических данных. В работе [20] для данных ГХ-ГХ данная проблема решалась с помощью применения кубической интерполяции, с её помощью повышалась плотность данных и все образцы приводились к единой шкале.

Похожая проблема отмечается при изучении шкалы масс в хроматомасс-спектрометрических данных или данных MSI. Она возникает из-за погрешности измерения масс, из-за дефекта масс и наличия изотопов. В работе [21] пытались создать единую шкалу масс для данных MSI высокого разрешения и для этого оценивали величину изотопного паттерна для одного сигнала (то есть количество сигналов, которые относятся к одному изотопу). При подборе этого параметра учитывался тот факт, что с ростом величины m/z измеряемой массы падает разрешение прибора. В данной работе воспользовались ранее предложенной моделью [22] оценки величины изотопного паттерна, основанной на вычислении этого значения для модельной молекулы и применения распределения Бернулли к теоретически рассчитанным массам. Авторами была установлена отсечка в 0.005 для отбрасывания наименее вероятных изотопов (Рис. 7).

Рис. 7. Количество сигналов, принадлежащих одному изотопу (bins) показано синим цветом. При увеличении m/z число сигналов уменьшается несмотря на рост числа пиков. Число сигналов, обозначенное отсечкой показано красной линией [21].

Для масс-спектрометрии низкого разрешения как правило для приведения масс, полученных из сырых данных эксперимента, проведенного в режиме полного ионного сканирования, массы группировались по целочисленным значениям [23].

Похожие диссертационные работы по специальности «Аналитическая химия», 02.00.02 шифр ВАК

Список литературы диссертационного исследования кандидат наук Турова Полина Николаевна, 2022 год

Список литературы

1. Xia P., Bai Z., Liang T., Yang D., Liang Z., Yan X., Liu Y. High-performance liquid chromatography based chemical fingerprint analysis and chemometric approaches for the identification and distinction of three endangered Panax plants in Southeast Asia // J. Separation Science. 2016. Vol. 39, № 20. P. 3880-3888.

2. Planinc A., Dejaegher B., Heyden Y. vander, Viaene J., van Praet S., Rappez F., van Antwerpen P., Delporte C. LC-MS analysis combined with principal component analysis and soft independent modelling by class analogy for a better detection of changes in N-glycosylation profiles of therapeutic glycoproteins // Anal. Bioanal. Chem. 2017. Vol. 409, № 2. P. 477-485.

3. Doble P., Sandercock M., du Pasquier E., Petocz P., Roux C., Dawson M. Classification of premium and regular gasoline by gas chromatography/mass spectrometry, principal component analysis and artificial neural networks // Forensic Sci. Int. 2003. Vol. 132, № 1. P. 26-39.

4. Arbona V., Iglesias D.J., Talón M., Gómez-Cadenas A. Plant phenotype demarcation using nontargeted LC-MS and GC-MS metabolite profiling // J. Agric. Food Chem. 2009. Vol. 57, № 16. P. 7338-7347.

5. Sun W., Braatz R.D. Opportunities in tensorial data analytics for chemical and biological manufacturing processes // Comput. Chem. Eng. 2020. Vol. 143. P. 107099.

6. Acar E., Yener B. Unsupervised multiway data analysis: A literature survey // IEEE Transactions on Knowledge and Data Engineering. 2009. Vol. 21, № 1. P. 6-20.

7. Siy P.W., Moffitt R.A., Parry R.M., Chen Y, Liu Y, Sullards M. C, Merrill A.H., Wang M.D. Matrix factorization techniques for analysis of imaging mass spectrometry data // 2008 8th IEEE International Conference on BioInformatics and Bio Engineering. 2008. P. 1-6.

8. Marini F., D'Aloise A., Bucci R., Buiarelli F., Magri A.L., Magri A.D. Fast analysis of 4 phenolic acids in olive oil by HPLC-DAD and chemometrics // Chemom. Intell. Lab. Syst. 2011. Vol. 106. № 1. P. 142-149.

9. Asnin L.D. Peak measurement and calibration in chromatographic analysis // Trends Analyt. Chem. 2016. Vol. 81. P. 51-62.

10. Felinger A. Data Analysis and Signal Processing in Chromatography / ed. Felinger A. Amsterdam: Elsevier, 1999. Vol. 21. 414 p.

11. Chau F., Kai-man Leung A. Application of Wavelet Transform in Processing Chromatographic Data // Wavelets in Chemistry. 2000. P. 205-223.

12. Danielsson R., Bylund D., Markides K.E. Matched filtering with background suppression for improved quality of base peak chromatograms and mass spectra in liquid chromatography-mass spectrometry // Anal. Chim. Acta. 2002. Vol. 454. № 2. P. 167-184.

13. Ning X., Selesnick I.W., Duval L. Chromatogram baseline estimation and denoising using sparsity (BEADS) // Chemom. Intell. Lab. Syst. 2014. Vol. 139. P. 156-167.

14. Bos M., Hoogendam E. Wavelet transform for the evaluation of peak intensities in flow-injection analysis // Anal. Chim. Acta. 1992. Vol. 267. № 1. P. 73-80.

15. Shao X., Cai W., Pan Z. Wavelet transform and its applications in high performance liquid chromatography (HPLC) analysis // Chemom. Intell. Lab. Syst. 1999. Vol. 45. № 1-2. 249-256.

16. Matthiesen R. LC-MS spectra processing // Methods Mol. Biol. Humana Press Inc., 2013. Vol. 1007. P. 47-63.

17. Vivo-Truyols G., Schoenmakers P.J. Automatic selection of optimal Savitzky-Golay smoothing // Anal. Chem. 2006. Vol. 78. № 13. P. 4598-4608.

18. Shukla S.N., Marlin B.M. Interpolation-Prediction Networks for Irregularly Sampled Time Series. 2019.

19. Marlin B.M., Kale D.C., Khemani R.G., Wetzel R.C. Unsupervised pattern discovery in electronic health care data using probabilistic clustering models //

Proceedings of the 2nd ACM SIGHIT symposium on International health informatics - IHI '12. New York, New York, USA: ACM Press, 2012. P. 389.

20. Fraga C.G., Prazen B.J., Synovec R.E. Comprehensive Two-Dimensional Gas Chromatography and Chemometrics for the High-Speed Quantitative Analysis of Aromatic Isomers in a Jet Fuel Using the Standard Addition Method and an Objective Retention Time Alignment Algorithm // Anal. Chem. 2000. Vol. 72. № 17. P. 4154-4162.

21. Behrmann J., Etmann C., Boskamp T., Casadonte R., Kriegsmann J., Maa¡3 P. Deep learning for tumor classification in imaging mass spectrometry // Bioinformatics. 2018. Vol. 34. № 7. P. 1215-1223.

22. Senko M.W., Beu S.C., McLaffertycor F.W. Determination of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions // J. Am. Soc. Mass Spectrom. 1995. Vol. 6. № 4. P. 229-233.

23. Sadygov R.G., Martin Maroto F., Huhmer A.F.R. ChromAlign: A Two-Step Algorithmic Procedure for Time Alignment of Three-Dimensional LC-MS Chromatographic Surfaces // Anal. Chem. 2006. Vol. 78. № 24. P. 8207-8217.

24. Rabanser S., Shchur O., Gunnemann S. Introduction to Tensor Decompositions and their Applications in Machine Learning. arXiv: 1711.10781. 2017.

25. Kharyuk P., Nazarenko D., Oseledets I., Rodin I., Shpigun O., Tsitsilin A., Lavrentyev M. Employing fingerprinting of medicinal plants by means of LC-MS and machine learning for species identification task // Sci. Rep. 2018. Vol. 8, № 1. P. 17053.

26. Siren K., Fischer U., Vestner J. Automated supervised learning pipeline for non-targeted GC-MS data analysis // Anal. Chim. Acta: X. 2019. Vol. 1. P. 100005.

27. Kopriva I., Jukic A., Cichocki A. Feature Extraction for Cancer Prediction by Tensor Decomposition of 1D Protein Expression Levels // Intelligent Systems and Control. 2011. P. 277-283.

28. Kumar K., Mishra A.K. Application of parallel factor analysis to total synchronous fluorescence spectrum of dilute multifluorophoric solutions:

Addressing the issue of lack of trilinearity in total synchronous fluorescence data set // Anal. Chim. Acta. 2012. Vol. 755. P. 37-45.

29. Bro R. Tutorial PARAFAC. Tutorial and applications // Chemom. Intell. Lab. Syst. 1997. Vol. 38. P. 149-171.

30. Bro R. Exploratory study of sugar production using fluorescence spectroscopy and multi-way analysis // Chemom. Intell. Lab. Syst. 1999. Vol. 46. P. 133-147.

31. Amigo J.M., Skov T., Bro R., Coello J., Maspoch S. Solving GC-MS problems with PARAFAC2 // Trends Analyt. Chem. 2008. Vol. 27. № 8. P. 714-725.

32. Hoggard J.C., Synovec R.E. Parallel factor analysis (PARAFAC) of target analytes in GC * GC-TOFMS data: Automated selection of a model with an appropriate number of factors // Anal. Chem. 2007. Vol. 79. № 4. P. 1611-1619.

33. Arroyo D., Ortiz M.C., Sarabia L.A. Multiresponse optimization and parallel factor analysis, useful tools in the determination of estrogens by gas chromatography-mass spectrometry // J. Chromatogr. A. 2007. Vol. 1157. № 12. P. 358-368.

34. Khakimov B., Amigo J.M., BakS., Engelsen S.B. Plant metabolomics: Resolution and quantification of elusive peaks in liquid chromatography-mass spectrometry profiles of complex plant extracts using multi-way decomposition methods // J. Chromatogr. A. 2012. Vol. 1266. P. 84-94.

35. Wünsch U.J., Hawkes J.A. Mathematical chromatography deciphers the molecular fingerprints of dissolved organic matter // Analyst. 2020. Vol. 145. № 5. P. 1789-1800.

36. Bylund D., Danielsson R., Malmquist G., Markides K.E. Chromatographic alignment by warping and dynamic programming as a pre-processing tool for PARAFAC modelling of liquid chromatography-mass spectrometry data // J. Chromatogr. A. 2002. Vol. 961. № 2. P. 237-244.

37. Jollife I.T., Cadima J. Principal component analysis: A review and recent developments // Phil. Trans. A. Math. Phys. Eng. Sciences. 2016. Vol. 374. № 2065. P. 20150202.

38. Siless G.E., Gallardo G.L., Rodriguez M.A., Rincón Y.A., Godeas A.M., Cabrera G.M. Metabolites from the Dark Septate Endophyte Drechslera sp. Evaluation by LC/MS and Principal Component Analysis of Culture Extracts with Histone Deacetylase Inhibitors // Chem. Biodivers. 2018. Vol. 15. № 8. P. 1800133.

39. Idborg-Bjorkman H., Edlund P.O., Kvalheim O.M., Schuppe-Koistinen I., Jacobsson S.P. Screening of biomarkers in rat urine using LC/electrospray ionization-MS and two-way data analysis // Anal. Chem. 2003. Vol. 75. №2 18. P. 4784-4792.

40. t'Kindt R., Morreel K., Deforce D., Boerjan W., van Bocxlaer J. Joint GC-MS and LC-MS platforms for comprehensive plant metabolomics: Repeatability and sample pre-treatment // J. Chromatogr. B. 2009. Vol. 877. № 29. P. 3572-3580.

41. Pierce K.M., Hope J.L., Johnson K.J., Wright B.W., Synovec R.E. Classification of gasoline data obtained by gas chromatography using a piecewise alignment algorithm combined with feature selection and principal component analysis // J. Chromatogr. A. 2005. Vol. 1096. № 1-2. P. 101-110.

42. Habchi B., Kassouf A., Padellec Y., Rathahao-Paris E., Alves S., Rutledge D.N., Maalouly J., Ducruet V. An untargeted evaluation of food contact materials by flow injection analysis-mass spectrometry (FIA-MS) combined with independent components analysis (ICA) // Anal. Chim. Acta. 2018. Vol. 1022. P. 81-88.

43. MorgenthalK., Wienkoop S., ScholzM., Selbig J., Weckwerth W. Correlative GC-TOF-MS-based metabolite profiling and LC-MS-based protein profiling reveal time-related systemic regulation of metabolite-protein networks and improve pattern recognition for multiple biomarker selection // Metabolomics. 2005. Vol. 1. № 2. P. 109-121.

44. Trindade G.F., Abel M.L., Watts J.F. Non-negative matrix factorisation of large mass spectrometry datasets // Chemom. Intell. Lab. Syst. 2017. Vol. 163. P. 7685.

45. Sarycheva A., Grigoryev A., SidorchukD., Vladimirov G., Khaitovich P., Efimova O., Gavrilenko O., Stekolshchikova E., Nikolaev E.N., Kostyukevich Y. Structure-

preserving and perceptually consistent approach for visualization of mass spectrometry imaging datasets // Anal. Chem. 2021. Vol. 93. №2 3. P. 1677-1685.

46. Rapin J., Souloumiac A., Bobin J., Larue A., Junot C., Ouethrani M., Starck J.L. Application of non-negative matrix factorization to LC/MS data // Signal Process. 2016. Vol. 123. P. 75-83.

47. Gut Y., Boiret M., Bultel L., Renaud T., Chetouani A., Hafiane A., Ginot Y., Jennane R. Application of chemometric algorithms to MALDI mass spectrometry imaging of pharmaceutical tablets // J. Pharm. Biomed. Anal. 2015. Vol. 105. P. 91-100.

48. Bridges C.C. Hierarchical Cluster Analysis // Psychol. Rep. 1966. Vol. 18. № 3.

49. Hong Y., LiaoX., Chen Z. Determination of bioactive components in the fruits of Cercis chinensis Bunge by HPLC-MS/MS and quality evaluation by principal components and hierarchical cluster analysis // J. Pharm. Anal. 2020. Vol. 11. № 4. P. 465-471.

50. Caesar L., Kvalheim O., Cech N. Hierarchical cluster analysis of technical replicates to identify interferents in untargeted mass spectrometry metabolomics // Anal. Chim. Acta. 2018. Vol. 1021. P. 69-77.

51. Ahmed S., Zhang M., Peng L. Enhanced feature selection for biomarker discovery in LC-MS data using GP // 2013 IEEE Congress on Evolutionary Computation. IEEE. 2013. P. 584-591.

52. Solorio-Fernández S., Carrasco-Ochoa J.A., Martínez-Trinidad J.Fco. A review of unsupervised feature selection methods // Artif. Intell. Rev. 2020. Vol. 53. № 2. P. 907-948.

53. Weigt D., Sammour D.A., Ulrich T., Munteanu B., Hopf C. Automated analysis of lipid drug-response markers by combined fast and high-resolution whole cell MALDI mass spectrometry biotyping // Sci. Rep. 2018. Vol. 8. № 1.

54. Plyushchenko I., Shakhmatov D., Bolotnik T., Baygildiev T., Nesterenko P.N., Rodin I. An approach for feature selection with data modelling in LC-MS metabolomics // Anal. Methods. 2020. Vol. 12. № 28. P. 3582-3591.

55. Huang H., Ji L., Song S., Wang J., Wei N., Jiang M., Bai G., Luo G. Identification of the major constituents in Xuebijing injection by HPLC-ESI-MS // Phytochem. Anal. 2011. Vol. 22. № 4.

56. Lucio-Gutiérrez J.R., Coello J., Maspoch S. Enhanced chromatographic fingerprinting of herb materials by multi-wavelength selection and chemometrics // Anal. Chim. Acta. 2012. Vol. 710.

57. Aliakbarzadeh G., Parastar H., Sereshti H. Classification of gas chromatographic fingerprints of saffron using partial least squares discriminant analysis together with different variable selection methods // Chemom. Intell. Lab. Syst. 2016. Vol. 158. P. 165-173.

58. Chen Y, Zhu S.-B., Xie M.-Y., Nie S.-P., Liu W., Li C, GongX.-F, Wang Y.-X. Quality control and original discrimination of Ganoderma lucidum based on highperformance liquid chromatographic fingerprints and combined chemometrics methods // Anal. Chim. Acta. 2008. Vol. 623. № 2. P. 146-156.

59. Ni Y., Mei M., Kokot S. One- and two-dimensional gas chromatography-mass spectrometry and high performance liquid chromatography-diode-array detector fingerprints of complex substances: A comparison of classification performance of similar, complex Rhizoma Curcumae samples with the aid of chemometrics // Anal. Chim. Acta. 2012. Vol. 712.

60. Zhang X.-K., Lan Y.-B., Huang Y., Zhao X., Duan C.-Q. Targeted metabolomics of anthocyanin derivatives during prolonged wine aging: Evolution, color contribution and aging prediction // Food Chem. 2021. Vol. 339. P. 127795.

61. Ni Y., Mei M., Kokot S. One- and two-dimensional gas chromatography-mass spectrometry and high performance liquid chromatography-diode-array detector fingerprints of complex substances: A comparison of classification performance of similar, complex Rhizoma Curcumae samples with the aid of chemometrics // Anal. Chim. Acta. 2012. Vol. 712. P. 37-44.

62. Guan W., Zhou M., Hampton C.Y., Benigno B.B., Walker L.D., Gray A., McDonald J.F., Fernández F.M. Ovarian cancer detection from metabolomic

liquid chromatography/mass spectrometry data by support vector machines // Bioinformatics. 2009. Vol. 10. № 1. P. 259.

63. Gurney K. An Introduction to Neural Networks. CRC Press, 2018.

64. Goodacre R., KellD.B., Bianchi G. Neural networks and olive oil // Nature. 1992. Vol. 359. № 6396.

65. Goodacre R., York E. v., Heald J.K., Scott I.M. Chemometric discrimination of unfractionated plant extracts analyzed by electrospray mass spectrometry // Phytochemistry. Elsevier Ltd, 2003. Vol. 62. № 6. P. 859-863.

66. Eshuis W., Kistemaker P.G., Meuzelaar H.L.C. Some numerical aspects of reproducibility and specificity // Anal. Pyrolysis. 1977. Vol. 9. № 9. P. 1-19.

67. Behrmann J., Etmann C., Boskamp T., Casadonte R., Kriegsmann J., Maa¡3 P. Deep learning for tumor classification in imaging mass spectrometry // Bioinformatics. 2018. Vol. 34, № 7. P. 1215-1223.

68. Liu Z., Portero E.P., Jian Y., Zhao Y., Onjiko R.M., Zeng C., Nemes P. Trace, Machine Learning of Signal Images for Trace-Sensitive Mass Spectrometry: A Case Study from Single-Cell Metabolomics // Anal. Chem.. 2019. Vol. 91, № 9. P. 5768-5776.

69. Lecun Y., Bottou L., Bengio Y., Haffner P. Gradient-based learning applied to document recognition // Proceedings of the IEEE. 1998. Vol. 86. № 11. P. 22782324.

70. Skarysz A., Alkhalifah Y., Darnley K., Eddleston M., Hu Y., McLaren D.B., Nailon W.H., Salman D., Sykora M., Thomas C.L.P., Soltoggio A. Convolutional neural networks for automated targeted analysis of raw gas chromatography-mass spectrometry data // 2018 International Joint Conference on Neural Networks (IJCNN). 2018. P. 1-8.

71. Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556. 2014.

72. Bald T., Barth J., Niehues A., Specht M., Hippler M., Fufezan C. pymzML--Python module for high-throughput bioinformatics on mass spectrometry data // Bioinformatics. 2012. Vol. 28. № 7. P. 1052-1053.

73. Virtanen P., Gommers R., Oliphant T.E., HaberlandM., Reddy T., Cournapeau D., Burovski E., Peterson P., Weckesser W., Bright J., van der Walt S.J., Brett M., Wilson J., Millman K.J., Mayorov N., Nelson A.R.J., Jones E., Kern R., Larson E. et al. SciPy 1.0: fundamental algorithms for scientific computing in Python // Nat. Methods. 2020. Vol. 17. № 3. P. 261-272.

74. https: //peakutils.readthedocs.io/en/latest/

75. Kossaifi J., Panagakis Y., Anandkumar A., PanticM. TensorLy: Tensor Learning in Python. arXiv:1610.09555. 2016.

76. Hunter J. Matplotlib: A 2D Graphics Environment // Comput Sci Eng. 2007. Vol. 9. № 3. P. 90-95.

77. Mckinney W. pandas: a Foundational Python Library for Data Analysis and Statistics // Python for high performance and scientific computing. 2011. Vol. 14. № 9. P. 1-9.

78. Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O., Blondel M., Müller A., Nothman J., Louppe G., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M.,

r

Duchesnay E. Scikit-learn: Machine Learning in Python // J. Mach. Learn. Res. 2012. Vol. 12. № 85. P. 2825-2830.

79. Andersson C.A., Bro R. The N-way Toolbox for MATLAB // Chemom. Intell. Lab. Syst. 2000. Vol. 52. № 1. P. 1-4.

80. Назаренко Д. Химический анализ для идентификации лекарственных растений: хромато-масс-спектрометрия с интерпретацией данных методами машинного обучения: дис. канд. хим. наук - М.: Московский Государственный Университет им. М.В.Ломоносова. 2019. - 140 С.

81. Mathon C., Duret M., Kohler M., Edder P., Bieri S., Christen P. Multi-targeted screening of botanicals in food supplements by liquid chromatography with tandem mass spectrometry // Food Chem. 2013. Vol. 138. № 1. P. 709-717.

82. Glazowska J., Kamihski M.M., Kamihski M. Chromatographic separation, determination and identification of ecdysteroids: Focus on Maral root (Rhaponticum carthamoides, Leuzea carthamoides) // J. Sep. Sci. 2018. Vol. 41. № 23. P. 4304-4314.

83. Rodin I.A., Stavrianidi A.N., Braun A. v., Shpigun O.A., PopikM. v. Simultaneous determination of salidroside, rosavin, and rosarin in extracts from Rhodiola rosea by high performance liquid chromatography with tandem mass spectrometry detection // J. Anal. Chem.. 2012. Vol. 67. № 13. P. 1026-1030.

84. Baygildieva D.I., Braun A. v., Stavrianidi A.N., Rodin I.A. Determination of Eleutheroside B and Eleutheroside E in Extracts from Eleutherococcus senticosus by Liquid Chromatography/Mass Spectrometry // J. Anal. Chem. 2020. Vol. 75, № 14. P. 1832-1837.

85. van Beek T.A., Wintermans M.S. Preparative isolation and dual column highperformance liquid chromatography of ginkgolic acids from Ginkgo biloba // J. Chromatogr. A. 2001. Vol. 930, № 1-2. P. 109-117.

86. Baygildieva D.I., Baygildiev T.M., Stavrianidi A.N., Shpigun O.A., Rodin I.A. Simultaneous Determination of Wogonin, Scutellarin, Baicalin, and Baicalein in Extracts from Scutellariae Baicalensis by High-Performance Liquid Chromatography with Tandem Mass Spectrometry // J. Anal. Chem. 2018. Vol. 73. № 14. P. 1317-1322.

87. Serebryanaya F., Imachueva D. Hedysarum Species from Caucasus // Legume Crops - Prospects, Production and Uses. 2020. P. 147-166.

88. Stavrianidi A.N., Rodin I.A., Braun A. v., Stekolshchikova E.A., Shpigun O.A. HPLC-MS/MS determination of biomarkers of P. quinquefolius in plant materials and commercial products // J. Anal. Chem. 2014. Vol. 69, № 14. P. 1323-1329.

89. Zhu L., Li B., LiuX., Huang G., MengX. Isolation and purification of schisandrol A from the stems of Schisandra chinensis and cytotoxicity against human hepatocarcinoma cell lines // Pharmacogn. Mag. 2015. Vol. 11. № 41. P. 131.

90. Stavrianidi A.N., Stekolshchikova E.A., Turova P.N., Rodin I.A., Shpigun O.A. Quantitative analysis of a multicomponent system for liquid chromatography-mass spectrometry determination of diosgenin, dioscin and protodioscin in plant extracts of Tribulus terrestris // Mosc. Univ. Chem. Bull. 2017. Vol. 72. № 3. P. 135-143.

91. Stekolshchikova E., Turova P., Shpigun O., Rodin I., Stavrianidi A. Application of quantitative analysis of multi-component system approach for determination of ginsenosides in different mass-spectrometric conditions // J. Chromatogr. A. 2018. Vol. 1574. P. 82-90.

92. Yang B., Liu P. Composition and health effects of phenolic compounds in hawthorn (Crataegus spp.) of different origins // J. Sci. Food Agric. 2012. Vol. 92. № 8. P. 1578-1590.

93. Skala E., Kicel A., Olszewska M.A., Kiss A.K., Wysokinska H. Establishment of Hairy Root Cultures of Rhaponticum carthamoides (Willd.) Iljin for the Production of Biomass and Caffeic Acid Derivatives // Biomed Res. Int. 2015. Vol. 2015. P. 1-11.

94. Lech K, Witkos K, JaroszM. HPLC-UV-ESI MS/MS identification of the color constituents of sawwort (Serratula tinctoria L.) // Anal. Bioanal. Chem. 2014. Vol. 406. № 15. P. 3703-3708.

95. Oboh G., Adebayo A.A., Ademosun A.O. Phenolic-rich extracts of Eurycoma longifolia and Cylicodiscus gabunensis inhibit enzymes responsible for the development of erectile dysfunction and are antioxidants // J. Basic Clin. Physiol. Pharmacol. 2018. Vol. 29. № 6. P. 689-696.

96. Miliauskas G., Venskutonis P.R., van Beek T.A. Screening of radical scavenging activity of some medicinal and aromatic plant extracts // Food Chem. 2004. Vol. 85. № 2. P. 231-237.

97. Caceres S., Zambrano G., Montenegro M., Caceres A. Extraction of natural colors with potential industrial application from smilax domingensis rhizome // Acta Hortic. 2014. № 1030. P. 71-75.

98. Pelozo M.I. de G., Cardoso M.L.C., Mello J.C.P. de. Spectrophotometric determination of tannins and caffeine in preparations from Paullinia cupana var. sorbilis // Braz. Arch. Biol. Technol. 2008. Vol. 51. № 3. P. 447-451.

99. Uehara A., Akiyama S., Iwashina T. Foliar Flavonoids from Tanacetum vulgare var. boreale and their Geographical Variation // Nat. Prod. Commun. 2015. Vol. 10. № 3. P. 1934578X1501000.

100. Abou El-Kassem L., Hawas U., AwadH., Taie H. Flavonoids from the aerial parts of Eryngium campestre L. with antioxidant and anti-alzheimer activities // Planta Med. 2013. Vol. 79. № 13. P. PJ2.

101. Wu T.-S., Shi L.-S., Kuo S.-C. Alkaloids and other constituents from Tribulus terrestris // Phytochemistry. 1999. Vol. 50. № 8. P. 1411-1415.

102. Ali B.H., Wabel N. al, Blunden G. Phytochemical, pharmacological and toxicological aspects of Hibiscus sabdariffa L.: a review // Phytotherapy Res. 2005. Vol. 19. № 5. P. 369-375.

103. Zhu L., Liang Z.-T., Yi T., Ma Y., Zhao Z.-Z., Guo B.-L., Zhang J.-Y., Chen H.-B. Comparison of chemical profiles between the root and aerial parts from three Bupleurum species based on a UHPLC-QTOF-MS metabolomics approach // BMC Complement. Altern. Med. 2017. Vol. 17. № 1. P. 305.

104. Avallone R., Zanoli P., Puia G., Kleinschnitz M., Schreier P., Baraldi M. Pharmacological profile of apigenin, a flavonoid isolated from Matricaria chamomilla // Biochem. Pharmacol. 2000. Vol. 59. № 11. P. 1387-1394.

105. Kaurinovic B., Popovic M., Vlaisavljevic S., Schwartsova H., Vojinovic-Miloradov M. Antioxidant Profile of Trifolium pratense L. // Molecules. 2012. Vol. 17. № 9. P. 11156-11172.

106. Heimler D., Isolani L., Vignolini P., Romani A. Polyphenol content and antiradical activity of Cichorium intybus L. from biodynamic and conventional farming // Food Chem. 2009. Vol. 114. № 3. P. 765-770.

107. Vlase L., Benedec D., Hanganu D., Damian G., Csillag I., Sevastre B., Mot A., Silaghi-Dumitrescu R., Tilea I. Evaluation of Antioxidant and Antimicrobial Activities and Phenolic Profile for Hyssopus officinalis, Ocimum basilicum and Teucrium chamaedrys // Molecules. 2014. Vol. 19. № 5. P. 5490-5507.

108. Zhang X.-L., Guo Y.-S., Wang C.-H., Li G.-Q., Xu J.-J., Chung H.Y., Ye W.-C., Li Y.-L., Wang G.-C. Phenolic compounds from Origanum vulgare and their antioxidant and antiviral activities // Food Chem. 2014. Vol. 152. P. 300-306.

109. Zhang Y., Smuts J.P., Dodbiba E., Rangarajan R., Lang J.C., Armstrong D.W. Degradation Study of Carnosic Acid, Carnosol, Rosmarinic Acid, and Rosemary Extract ( Rosmarinus officinalis L.) Assessed Using HPLC // J. Agric. Food Chem. 2012. Vol. 60. № 36. P. 9305-9314.

110. SouthwellI.A., Bourke C.A. Seasonal variation in hypericin content of Hypericum perforatum L. (St. John's Wort) // Phytochemistry. 2001. Vol. 56. № 5. P. 437441.

111. Privalova E.G. A few representatives of asteroidae (asteraceae) subfamily and geranium (geraniaceae) genus in the baikal region (review) // Pharmacol. Pharm. 2021. Vol. 9. № 6. P. 426-440.

112. Zanoli P., Avallone R., Baraldi M. Behavioral characterisation of the flavonoids apigenin and chrysin // Fitoterapia. 2000. Vol. 71. P. S117-S123.

113. Pirvu L., Neagu G., Terchescu I., Albu B., Stefaniu A. Comparative studies of two vegetal extracts from Stokesia laevis and Geranium pratense: polyphenol profile, cytotoxic effect and antiproliferative activity // Open Chem. 2020. Vol. 18. № 1. P. 488-502.

r

114. Alonso-Esteban J.I., Pinela J., Barros L., Ciric A., Sokovic M., Calhelha R.C., Torija-Isasa E., de Cortes Sánchez-Mata M., Ferreira I.C.F.R. Phenolic

composition and antioxidant, antimicrobial and cytotoxic properties of hop (Humulus lupulus L.) Seeds // Ind. Crops Prod. 2019. Vol. 134. P. 154-159.

115. Petrul'ova-Poracka V., RepcakM., VilkovaM., Imrich J. Coumarins of Matricaria chamomilla L.: Aglycones and glycosides // Food Chem. 2013. Vol. 141. №2 1. P. 54-59.

116. Государственная Фармакопея Российской Федерации. ФС.2.5.0036.15. Родиолы розовой корневища и корни.

117. Stavrianidi A., Rodin I., Braun A., Stekolshchikova E., Shpigun O. Single-run HPLC/ESI-LITMS profiling of ginsenosides in plant extracts and ginseng based products // Biomed. Chromatogr. 2015. Vol. 29. № 6. P. 853-859.

118. Vorst O., Vos C.H.R. de, Lommen A., Staps R. v., Visser R.G.F., Bino R.J., Hall R.D. A non-directed approach to the differential analysis of multiple LC-MS-derived metabolic profiles // Metabolomics. 2005. Vol. 1. № 2. P. 169-180.

119. Wagstaff K., Cardie C., Rogers S., Schroedl S. Constrained K-means Clustering with Background Knowledge // Proceedings of the Eighteenth International Conference on Machine Learning. 2001. P. 577-584.

120. Stavrianidi A., Stekolshchikova E., Rodin I., Godovikov I., Shpigun O. Structure elucidation of sweet-tasting cycloartane-type saponins from ginseng oolong tea and Abrusprecatorius L. leaves // Nat. Prod. Res. 2018. Vol. 32. № 20. P. 24902493.

121. Tanaka O. Improvement of taste of natural sweeteners // Pure Appl. Chem. 1997. Vol. 69, № 4.

122. Zhang C., Wang X., Lin Z., Wang H., Qian Y., Li W., Yang W., Guo D. Highly selective monitoring of in-source fragmentation sapogenin product ions in positive mode enabling group-target ginsenosides profiling and simultaneous identification of seven Panax herbal medicines // J. Chromatogr. A. 2020. Vol. 1618. P. 460850.

123. Qi L.-W., Wang H.-Y., Zhang H., Wang C.-Z., Li P., Yuan C.-S. Diagnostic ion filtering to characterize ginseng saponins by rapid liquid chromatography with time-of-flight mass spectrometry // J. Chromatogr. A. 2012. Vol. 1230. P. 93-99.

124. Montoro P., Maldini M., Russo M., Postorino S., Piacente S., Pizza C. Metabolic profiling of roots of liquorice (Glycyrrhiza glabra) from different geographical areas by ESI/MS/MS and determination of major metabolites by LC-ESI/MS and LC-ESI/MS/MS // J. Pharm. Biomed. Anal. 2011. Vol. 54, № 3. P. 535-544.

125. Zheng Y.-F., Qi L.-W., Zhou J.-L., Li P. Structural characterization and identification of oleanane-type triterpene saponins in Glycyrrhiza uralensis Fischer by rapid-resolution liquid chromatography coupled with time-of-flight mass spectrometry // Rapid Commun. Mass Spectrom. 2010. Vol. 24, № 22. P. 3261-3270.

126. Li B., Zhang X., Wang J., Zhang L., Gao B., Shi S., Wang X., Li J., Tu P. Simultaneous characterisation of fifty coumarins from the roots of angelica dahurica by off-line two-dimensional high-performance liquid chromatography coupled with electrospray ionisation tandem mass spectrometry // Phytochem. Anal. John Wiley and Sons Ltd, 2014. Vol. 25. № 3. P. 229-240.

127. Mouri C., Mozaffarian V., ZhangX., Laursen R. Characterization of flavonols in plants used for textile dyeing and the significance of flavonol conjugates // Dyes Pigm. 2014. Vol. 100, № 1. P. 135-141.

128. Gholivand M.B., Yamini Y., Dayeni M., Shokoohinia Y. The influence of the extraction mode on three coumarin compounds yield from Prangos ferulacea (L.) Lindl roots // J. Iran. Chem. Soc. 2015. Vol. 12. № 4. P. 707-714.

129. Farooq S., Shakeel-U-Rehman, Dangroo N.A., Priya D., Banday J.A., Sangwan P.L., Qurishi M.A., Koul S., Saxena A.K. Isolation, cytotoxicity evaluation and hplc-quantification of the chemical constituents from prangos pabularia // PLoS ONE. 2014. Vol. 9. № 10. P. 135-141.

130. Su J., Zhang C., Zhang W., Shen Y., Li H., Liu R., ZhangX., Hu X.-J., Zhang W. Qualitative and quantitative determination of the major coumarins in Zushima by

high performance liquid chromatography with diode array detector and mass spectrometry // J. Chromatogr. A. 2009. Vol. 1216. № 11. P. 2111-2117.

131. Ahn M.J., Lee M.K., Kim Y.C., Sung S.H. The simultaneous determination of coumarins in Angelica gigas root by high performance liquid chromatography-diode array detector coupled with electrospray ionization/mass spectrometry // J. Pharm. Biomed. Anal. 2008. Vol. 46. № 2. P. 258-266.

132. Zheng X., Zhang X., Sheng X., Yuan Z., Yang W., Wang Q., Zhang L. Simultaneous characterization and quantitation of 11 coumarins in Radix Angelicae Dahuricae by high performance liquid chromatography with electrospray tandem mass spectrometry // J. Pharm. Biomed. Anal. 2010. Vol. 51. № 3. P. 599-605.

133. Benesty J., Chen J., Huang Y. Time-Delay Estimation via Linear Interpolation and Cross Correlation // IEEE Transactions on Speech and Audio Processing. 2004. Vol. 12. № 5. P. 509-519.

134. Murphy K.R., Stedmon C.A., Graeber D., Bro R. Fluorescence spectroscopy and multi-way techniques. PARAFAC // Anal. Methods. 2013. Vol. 5. № 23. P. 6557.

135. Krylov I.N., Drozdova A.N., Labutin T.A. Albatross R package to study PARAFAC components of DOM fluorescence from mixing zones of arctic shelf seas // Chemom. Intell. Lab. Syst. 2020. Vol. 207. P. 104176.

136. Lorenzo-Seva U., ten Berge J.M.F. Tucker's Congruence Coefficient as a Meaningful Index of Factor Similarity // Methodology. 2006. Vol. 2. № 2. P. 5764.

137. Kuhnert N., Jaiswal R., Eravuchira P., El-Abassy R.M., Kammer B. von der, Materny A. Scope and limitations of principal component analysis of high resolution LC-TOF-MS data: The analysis of the chlorogenic acid fraction in green coffee beans as a case study // Anal. Methods. 2011. Vol. 3. № 1. P. 144155.

138. Ferreira J.A., Santos J.M., BreitkreitzM.C., Ferreira J.M.S., LinsP.M.P., Farias S.C., de Morais D.R., Eberlin M.N., Bottoli C.B.G. Characterization of the lipid

profile from coconut (Cocos nucifera L.) oil of different varieties by electrospray ionization mass spectrometry associated with principal component analysis and independent component analysis // Int. Food Res. J. 2019. Vol. 123. P. 189-197.

139. Jouan-Rimbaud Bouveresse D., Moya-González A., Ammari F., Rutledge D.N. Two novel methods for the determination of the number of components in independent components analysis models // Chemom. Intell. Lab. Syst. 2012. Vol. 112. P. 24-32.

140. Hutchins L.N., Murphy S.M., Singh P., Graber J.H. Position-dependent motif characterization using non-negative matrix factorization // Bioinformatics. 2008. Vol. 24. № 23. P. 2684-2690.

141. Li J., Cheng K., Wang S., Morstatter F., Trevino R.P., Tang J., Liu H. Feature selection: A data perspective // ACM Computing Surveys. Association for Computing Machinery, 2017. Vol. 50. № 6. P. 94-139.

142. Vendramin L., Campello R.J.G.B., Hruschka E.R. Relative clustering validity criteria: A comparative overview // Statistical Analysis and Data Mining: The ASA Data Science Journal. 2010. Vol. 3, № 4. P. 209-235.

143. Cichocki A., Phan A.-H. Fast Local Algorithms for Large Scale Nonnegative Matrix and Tensor Factorizations // IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences. 2009. Vol. 92. № 3. P. 708-721.

144. Kozachok S., Pecio L., Kolodziejczyk-Czepas J., Marchyshyn S., Nowak P., Moldoch J., Oleszek W. y-Pyrone compounds: flavonoids and maltol glucoside derivatives from Herniaria glabra L. collected in the Ternopil region of the Ukraine // Phytochemistry. 2018. Vol. 152. P. 213-222.

145.http://gnps.ucsd.edu/ProteoSAFe/gnpslibraryspectrum.jsp?SpectrumID=CCMSLI B00000847715.

146. Wittig J., Herderich M., Graefe E.U., Veit M. Identification of quercetin glucuronides in human plasma by high-performance liquid chromatography-tandem mass spectrometry // J. Chromatogr. B. 2001. Vol. 753. № 2. P. 237-243.

147. Scigelova M., Hornshaw M., Giannakopulos A., Makarov A. Fourier transform mass spectrometry // Mol. Cell. Proteom. 2011. Vol. 10. № 7. P. M111.009431.

148. Mottaghipisheh J., Kiss T., Toth B., Csupor D. The Prangos genus: a comprehensive review on traditional use, phytochemistry, and pharmacological activities // Phytochemistry Rev. 2020. Vol. 19. № 6. P. 1449-1470.

149. Sevda Suzgeg-Selguka, Tugge Dikpinar. Phytochemical evaluation of the Ferulago genus and the pharmacological activities of its coumarin constituents // J. Herb. Med. 2021. Vol. 25. P. 100415.

150. Bruno M., Ilardi V., Lupidi G., Quassinti L., Bramucci M., Fiorini D., Venditti A., Maggi F. The Nonvolatile and Volatile Metabolites of Prangos ferulacea and Their Biological Properties // Planta Med. 2019. Vol. 85. № 11-12. P. 815-824.

151. Chen Y., Fan G., Zhang Q., Wu H., Wu Y. Fingerprint analysis of the fruits of Cnidium monnieri extract by high-performance liquid chromatography-diode array detection-electrospray ionization tandem mass spectrometry // J. Pharm. Biomed. Anal. 2007. Vol. 43. № 3. P. 926-936.

152. Wang B., Liu X., Zhou A., Meng M., Li Q. Simultaneous analysis of coumarin derivatives in extracts of Radix Angelicae pubescentis (Duhuo) by HPLC-DAD-ESI-MSntechnique // Anal. Methods. 2014. Vol. 6. № 19. P. 7996-8002.

153. Xu Y., Cai H., Cao G., Duan Y., Pei K., Tu S., Zhou J., Xie L., Sun D., Zhao J., Liu J., WangX., Shen L. Profiling and analysis of multiple constituents in Baizhu Shaoyao San before and after processing by stir-frying using UHPLC/Q-TOF-MS/MS coupled with multivariate statistical analysis // J. Chromatogr. B. 2018. Vol. 1083. P. 110-123.

154. Paudel S., Kim Y., Choi S.M., Kim J.H., Bae J.S., Lee T., Lee S. Identification of suberosin metabolites in human liver microsomes by high-performance liquid chromatography combined with high-resolution quadrupole-orbitrap mass spectrometer // J. Mass Spectrom. 2020. Vol. 56, № 4. P. e4623.

155. Duan L., Guo L., Liu K., Liu E.H., Li P. Characterization and classification of seven Citrus herbs by liquid chromatography-quadrupole time-of-flight mass

spectrometry and genetic algorithm optimized support vector machines // J. Chromatogr. A. 2014. Vol. 1339. P. 118-127.

156. Concannon S., Ramachandran V.N., Smyth W.F. A study of the electrospray ionisation and ion trap fragmentation of hemiterpenoid and dimeric coumarin derivatives // Rapid Commun. Mass Spectrom. 2000. Vol. 14. № 23. P. 22602270.

157. GuzN.R., Lorenz P., Stermitz F.R. New coumarins from Harbouria trachypleura: isolation and synthesis // Tetrahedron Lett. 2001. Vol. 42, № 37. P. 6491-6494.

158. Yuan Z., Xu H., Wang K., Zhao Z., Hu M. Determination of osthol and its metabolites in a phase I reaction system and the Caco-2 cell model by HPLC-UV and LC-MS/MS // J. Pharm. Biomed. Anal. 2009. Vol. 49. № 5. P. 1226-1232.

159. Figueroa M., Rivero-Cruz I., Rivero-Cruz B., Bye R., Navarrete A., Mata R. Constituents, biological activities and quality control parameters of the crude extract and essential oil from Arracacia tolucensis var. multifida // J. Ethnopharmacol. 2007. Vol. 113. № 1. P. 125-131.

160. Shukla V., Singh P., kumar D., Konwar R., Singh B., Kumar B. Phytochemical analysis of high value medicinal plant Valeriana jatamansi using LC-MS and it's in-vitro anti-proliferative screening // Phytomedicine Plus. 2021. Vol. 1. № 2. P. 100025.

161. Spencer G.F., Tjarks L.W., Powell R.G. Analysis of linear and angular furanocoumarins by dual-column high-performance liquid chromatography // J. Agric. Food Chem. 1987. Vol. 35. № 5. P. 803-805.

162. Zhang J., Li L., Hale T.W., Chee W., Xing C., Jiang C., Lu J. Single oral dose pharmacokinetics of decursin and decursinol angelate in healthy adult men and women // PLoS ONE. 2015. Vol. 10. № 2. P. e0114992.

163. Kang S.Y., Lee K.Y., Sung S.H., ParkM.J., Kim Y.C. Coumarins isolated from Angelica gigas inhibit acetylcholinesterase: Structure-activity relationships // J. Nat. Prod. 2001. Vol. 64. № 5. P. 683-685.

164. Singh R. Chemotaxonomy: A Tool for Plant Classification // J. Med. Plants Stud. 2016. Vol. 4. № 2. P. 90-93.

165. Dugrand-Judek A., Olry A., Hehn A., Costantino G., Ollitrault P., Froelicher Y., BourgaudF. The distribution of coumarins and furanocoumarins in Citrus species closely matches Citrus phylogeny and reflects the organization of biosynthetic pathways // PLoS ONE. 2015. Vol. 10. № 11. P. e0142757.

166. Al-Musayeib N., Ebada S.S., Gad H.A., Youssef F.S., Ashour M.L. Chemotaxonomic diversity of three Ficus species: Their discrimination using chemometric analysis and their role in combating oxidative stress // Pharmacogn. Mag. 2017. Vol. 13. № 51. P. S613-S622.

167. Forycka A., Buchwald W. Variability of composition of essential oil and coumarin compounds of Angelica archangelica L. // Herba Pol. 2019. Vol. 65. № 4. P. 62-75.

168. Bertolucci S.K. v., Pereira A.B.D., Pinto J.E.B.P., Oliveira A.B., Braga F.C. Seasonal Variation on the Contents of Coumarin and Kaurane-Type Diterpenes in Mikania laevigata and M. glomerata Leaves under Different Shade Levels // Chem. Biodivers. 2013. Vol. 10. № 2. P. 288-295.

169. Figueiredo A.C., Barroso J.G., Pedro L.G., Scheffer J.J.C. Factors affecting secondary metabolite production in plants: Volatile components and essential oils // Flavour Fragr. J. 2008. Vol. 23. № 4. P. 213-226.

170. Wang J., Liu X., Shen H.W. High-dimensional data analysis with subspace comparison using matrix visualization // Inf. Vis. 2019. Vol. 18. № 1. P. 94-109.

171. Hwang H, Jeong H.K., Lee H.K., Park G.W., Lee J.Y., Lee S.Y., Kang Y.-M., An H.J., Kang J.G., Ko J.-H., Kim J.Y., Yoo J.S. Machine Learning Classifies Core and Outer Fucosylation of N-Glycoproteins Using Mass Spectrometry // Sci. Rep. 2020. Vol. 10. № 1. P. 318.

172. Numonov S., Bobakulov K., Numonova M., Sharopov F., Setzer W.N., Khalilov Q., Begmatov N., Habasi M., Aisa H.A. New coumarin from the roots of Prangos pabularia // Nat. Prod. Res. 2018. Vol. 32. № 19. P. 2325-2332.

173. Liu G.-Q., Dong J., Wang H., Hashi Y., Chen S.-Z. Differentiation of Four Pairs of Furocoumarin Isomers by Electrospray Ionization Tandem Mass Spectrometry // Eur. J. Mass Spectrom. 2010. Vol. 16. № 2. P. 215-220.

174. Niu X.-M., Li S.-H., Wu L.-X., Li L., Gao L.-H., Sun H.-D. Two New Coumarin Derivatives from the Roots of Heracleum rapula // Planta Med.. 2004. Vol. 70. № 6. P. 578-581.

175. Luo L., Liu X., Jin X., Liu Y., Ma J., Zhang S., Zhang D., Chen X., Sheng L., Li Y. Simultaneous determination of skimmin, apiosylskimmin, 7-hydroxycoumarin and 7-hydroxycoumarin glucuronide in rat plasma by liquid chromatography-Orbitrap mass spectrometry and its application to pharmacokinetics // Biomed. Chromatogr. 2022. Vol. 36. № 1. P. e5223.

176. Ni Z., Milic I., Fedorova M. Identification of carbonylated lipids from different phospholipid classes by shotgun and LC-MS lipidomics // Anal. Bioanal. Chem. 2015. Vol. 407. № 17. P. 5161-5173.

177. Viera I., Roca M., Perez-Galvez A. Mass Spectrometry of Non-allomerized Chlorophylls a and b Derivatives from Plants // Curr. Org. Chem. 2018. Vol. 22. № 9. P. 842-876.

178. He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770-778.

179. Figueroa-Mata G., Mata-Montero E. Using a Convolutional Siamese Network for Image-Based Plant Species Identification with Small Datasets // Biomimetics. 2020. Vol. 5. № 1. P. 8.

Приложение

S

18.3 - Bilacunaria microcapra 18.2 - Bilacunaria microcapra 18.1 - Bilacunaria microcapra

16.3 - Seseli olivieri 16.2 - Seseli olivieri 16.1 - Seseli olivieri

9.3 - Ferulago angulata

9.2 - Ferulago angulata

9.1 - Ferulago angulata

6.3 - Ferulago subvelutira

6.2 - Ferulago subvelutira 6.1 - Ferulago subvelutira

14.3 - Ferulago phialocarpa

14.2 - Ferulago phialocarpa

14.1 - Ferulago phialocarpa

11.3 - Ferulago contracta

11.2 - Ferulago contracta 11.1 - Ferulago contracta

7.2 - Prangos ammophila

7.3 - Prangos ammophila

"че;

rEÍ kE: ME

ríi íi

ríi

4!

£

7.1 - Prangos ammophila

j— 13.3 - Diplotaenia cachrydifolia П— 13.2 - Diplotaenia cachrydifolia '— 13.1 - Diplotaenia cachrydifolia 12.3 - Cachrys pungens

12.2 - Cachrys pungens

12.1 - Cachrys pungens

10.3 - Cachrys sicula

10.2 - Cachrys sicula 10.1 - Cachrys sicula

19.3 - Seseli ghafoorianum

19.2 - Seseli ghafoorianum

19.1 - Seseli ghafoorianum

17.3 - Prangos crossoptera

17.2 - Prangos crossoptera 17.1 - Prangos crossoptera

15.2 - Azília eryngioides

15.3 - Azília eryngioides 15.1 - Azília eryngioides

j— 8.3 - Prangos trifida __P— 8.2 - Prangos trifida I— 8.1 - Prangos trifida 5.3 - Prangos didyma

5.2 - Prangos didyma

5.1 - Prangos didyma

4.3 - Prangos ferulacea

4.2 - Prangos ferulacea 4.1 - Prangos ferulacea

i— 3.2 - Prangos acaulis 4— 3.3 - Prangos acaulis 1— 3.1 - Prangos acaulis 2.3 - Cachrys libanotis

2.2 - Cachrys libanotis

2.1 - Cachrys libanotis

1.3 - Prangos pabularía

1.2 - Prangos pabularía 1.1 - Prangos pabularía

-E

В

É

Рис. П1. Дендрограмма по данным ВЭЖХ-МСНР, обработанных с помощью UFC.

18.3 ■ 18.2 18.1 ■

Bilacunaria microcarpa Bilacunaria microcarpa Bilacunaria microcarpa

-9.3 - Ferulago angulata

-9.2 - Ferulago angulata

-9.1 - Ferulago angulata

6.3 - Ferulago subvelutina 6,2 - Ferulago subvelutina — 6.1 - Ferulago subvelutina

I—14.3 - Ferulago phialocarpa

-14.2 - Ferulago phialocarpa

-14.1 - Ferulago phialocarpa

i-11.3 - Ferulago contracta

I '-11.2 - Ferulago contracta

I 11.1 - Ferulago contracta

7.3 - Prangos ammophlla - Prangos ammophila

10.3 - Cachrys sicula 10.2 - Cachrys sicula 10.1 - Cachrys sicula

17.3 - Prangos crossoptera

T— 7 1

r¿

17.2 - Prangos crossoptera 17.1 - Prangos crossoptera j— 13.3 - Diplotaenia cachrydifolia П— 13.2 - Diplotaenia cachrydifolia

I-13.1 - Diplotaenia cachrydifolia

i- 8.3 - Prangos trífida П- 8.2 - Prangos trífida

I-8.1 - Prangos trifida

i— 12.3 - Cachrys pungens P- 12.2 - Cachrys pungens I-12.1 - Cachrys pungens

С 15.3 - Azilia eryngioides 15.2 - Azilia eryngioides I— 19.2 - Seseli ghafoorianum Ъ— 19.3 - Seseli ghafoorianum 1— 14 1 - Seseli ghafoorianum - Azilia eryngioides

\

5.3 - Prangos didyma 5.2 - Prangos didyma 4.2 - Prangos ferulacea 4.1 - Prangos ferulacea

-c

3.3 - Prangos acaulis 3.1 - Prangos acaulis

■c.

■ 2.3 - Cachrys libanotis

■ 2.2 - Cachrys libanotis 16.3 - Seseli olivieri 16.2 - Seseli olivieri 16.1 - Seseli olivieri 1.3 - Prangos pabularia

2 - Prangos pabularia

Рис. П2. Дендрограмма по данным ВЭЖХ-МСНР, обработанных с помощью UFC.

Рис. П3. Молекулярно-филогенетическое дерево.

x105 1.0-

L.I.Ii. ■■ i,. I ■

411.1737 389.1922

лЛ-

Рис. П4. МС спектр вербенона гликозида (соединение 1).

45.0329 . . .

III llll.li.il

185.1373 209.0837

■ I ■| ll ■ . I I. ' .' .1"

_l' ll. I . . I

1621_100_1_366.d: +MS2(329.1595), 22.0-32.9eV, 4.3min #776

386.6624 430.8799

Рис. П5. МС/МС спектр (соединение 1), m/z 329.

иона-предшественника вербенона гликозида

I . .1

2021_103_1_369.d: +MS, 4.1min #741

Рис. П6. МС спектр ликоагрозида B (соединение 2).

x105 1.0-

85.0279 ___

2021_103_1_369.d: +MS2(433.1342), 26.4-39.6eV, 4.1min #742

600 m/z

Рис. П7. МС/МС спектр иона-предшественника ликоагрозида B (соединение 2), m/z 433.

0.8-

0.6-

0.4 -

0.2-

0.0

100

200

300

400

500

600

700

1250

1000

/50

500

250

50

100

150

200

250

300

350

400

450

500 m/z

x105 -

2.0

0.5

0.0

100

200

300

400

500

600

/00

0.8-

0.6 -

0.4-

0.2-

0.0

100

200

300

400

500

4L

500 щ/z

Рис. П8. МС/МС спектр натриевого аддукта ликоагрозида B (соединение 2), m/z 455.

x106 2.5

1021_97_1_363.d: +MS, 4.9min #886

Рис. П9. МС спектр of рутарина (соединение 3).

145.0284 163.0388

171.0806

229.0498

1021_97_1_363.d: +MS2(263.0919), 19.9-29.9eV, 4.9min #882

Рис. П10. МС/МС спектр иона-предшественника рутарина (соединение 3), m/z 425.

191.0336

203.0341

1021_97_1_363.d: +MS2(425.1454), 26.0-39.0eV, 4.9min #884

Рис. П11. МС/МС спектр иона-предшественника агликона (соединение 3), m/z 263.

рутарина

25

00

0.75

0.50

0.25

0.00

50

l00

l50

200

250

300

350

400

450

2.0

0.5

0.0

l00

200

300

400

500

600

700

x104

3.0

2.5

2.0

0.5

0.0 -

350 m/z

100

150

200

250

300

x104

25

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.