Марковские модели и методы распознавания образов в сигналах с изменяющимися вероятностными свойствами тема диссертации и автореферата по ВАК РФ 05.13.16, доктор технических наук Моттль, Вадим Вячеславович

  • Моттль, Вадим Вячеславович
  • доктор технических наукдоктор технических наук
  • 1993, Москва
  • Специальность ВАК РФ05.13.16
  • Количество страниц 367
Моттль, Вадим Вячеславович. Марковские модели и методы распознавания образов в сигналах с изменяющимися вероятностными свойствами: дис. доктор технических наук: 05.13.16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук). Москва. 1993. 367 с.

Оглавление диссертации доктор технических наук Моттль, Вадим Вячеславович

Содержание

Стр.

Введение

Специфика задач распознавание образов в сигналах (экспериментальных кривых) со сложной структурой

1.1. Практические задачи структурного анализа экспериментальных кривых как задачи распознавания образов

1.2. Классические постановки задачи обучения распознаванию образов

1.3. Методы обнаружения изменений свойств случайных процессов

1.4. Цели и задачи исследования

Основные модели и задачи анализа экспериментальных кривых...^

2.1. Базовые модели источника данных и задачи распознавания

последовательности событий

2.1 Л. Общая базовая модель данных и задача

распознавания потока случайных событий

2.1.2. Базовая детерминированная модель источника данных и задача распознавания последовательности событий с фиксированной грубостью..

2.2. Общая характеристика задач обучения и самообучения

2.3. Модели последовательности событий

2.4. Модели реакции на отдельное событие

2.5. Модели наблюдаемого процесса (экспериментальной

кривой)

2.6. Некоторые частше вероятностные модели

экспериментальных кривых

2.6.1. Бесфазовая модель - условно марковский случайный процесс, управляемый марковской цепью

2.6.2. Случайный процесс с фрагментами повторяющейся формы

Оптимальные решающие правила и алгоритмы распознавания потока случайных событий

3.1. Постановка задачи

3.2. Сопровождающий случайный процесс потока случайных событий

3.3. Функции потерь

3.4. Оптимальные решающие правила распознавания

3.5. Алгоритмы распознавания для сингулярной функции потерь. У 02*

3.6. Алгоритмы распознавания для аддитивной функции потерь.. Обучение распознаванию потока случайных событий путем оценивания параметров модели данных

4.1. Оценивание параметров модели потока событий

и реакции на события каждого класса

4.2. Оценка корня счетной системы уравнений регрессии

и условия ее состоятельности

4.3. Состоятельность оценок параметров в задаче обучения----

4.4 Состоятельность оценок параметров для частных моделей эксперментальных кривых

Обучение путем прямого восстановления апостериорного

потока событий

5.1. Основная схема обучения

5.2. Пространство признаков и критерий обучения

5.3. Алгоритм обучения

5.4. Вычисление градиента логарифмической функции апостериорной вероятности

5.5. Выбор признаков формы кривой и.модельный эксперимент

6.1. Дискриминантные функционалы

6.2. Разрешимость задачи распознавания

6.3. Алгоритмы распознавания

Обучение распознаванию последовательностей событий

для детерминированной модели источника данных

7.1. Постановка задачи обучения

7.2. Алгоритмы обучения

7.3. Сходимость процесса обучения

7.4. Выбор базисных функционалов

7.5. Модельный эксперимент и пример выбора базисных функционалов

Самообучение распознаванию последовательности событий

8.1. Задача самообучения как параметрическая задача разделения смеси распределений с зависимыми гипотезами и зависимыми наблюдениями

8.2. Метод максимального правдоподобия

8.2.1. Функция правдоподобия

8.2.2. Общая схема алгоритма

8.2.3. Вычисление оценок параметров для частных

моделей экспериментальных кривых

8.3. Метод обратной связи

8.3.1. Общая схема алгоритма

8.3.2. Вычисление очередных приближений сегментации и оценок параметров для частных моделей экспериментальных кривых

Применение алгоритмов обучения и самообучения для

решения прикладных задач

9.1. Обучение распознаванию событий в составе сейсмических сигналов вулканического происхождения

9.1.1. Структура сейсмических сигналов

9.1.2. Результаты эксперимента

9.2. Исследование процесса длительного поддержания позы человеком на основе иерархической модели данных физиологических экспериментов

9.2.1. Дискретная модель данных физиологических экспериментов

9.2.2. Описание эксперимента и структура экспериментального материала

9.2.3. Исследование'элементарных программ действия

9.2.4. Исследование иерархии программ действия

9.2.5. Анализ взаимосвязи типовых режимов на разных компонентах полиграммы

9.2.6. Результаты исследования

9.3. Диагностика биений валков стана холодной прокатки

9.3.1. Задача определения причин разнотолщинности прокатанной полосы

9.3.2. Алгоритм диагностики клети типа дуо

9.3.3. Алгоритм диагностики многовалковой клети

9.4. Автоматическое расчленение геологического разреза

по данным сейсморазведки

9.4.1. Задача расчленения сейсмических разрезов и особенности анализа многомерных

экспериментальных кривых

9.4.2. Модель поля сейсмических трасс относительно отдельной трассы

9.4.3. Алгоритм расчленения сейсмического разреза

и экспериментальные результаты

Основные научные результаты работы

Приложение I. Классические методы обучения распознаванию

образов

Приложение 2. Методы обнаружения изменений свойств

случайных процессов

П.2.1. Апостериорные методы обнаружения моментов

изменений свойств случайных процессов

П.2.2. Последовательные методы обнаружения моментов

изменения свойств случайных процессов

Приложение 3. Доказательства теорем

Доказательство теоремы 2.1

Доказательство теоремы 3.1

Доказательство теоремы 4.1

Доказательство теоремы 4.2

Доказательство теоремы 4.4

Доказательство теоремы 4.5

Доказательство теоремы 6.1

Доказательство теоремы 6.2

Доказательство теоремы 6.3

Доказательство теоремы 6.4

Доказательство теоремы 7.1

Доказательство теоремы 7.2

Доказательство теоремы 8.1

Литература

Рекомендованный список диссертаций по специальности «Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)», 05.13.16 шифр ВАК

Введение диссертации (часть автореферата) на тему «Марковские модели и методы распознавания образов в сигналах с изменяющимися вероятностными свойствами»

♦ Введение

Проблематика распознавания образов неизменно привлекает внимание исследователей на протяжении последних десятилетий. Это объясняется типичностью для практики технических и научных исследований задачи .отнесения предъявленного'объекта или ситуации, представленных некоторым вектором наблюдаемых признаков, к одному из конечного множества классов. Не менее важное обстоятельство, '♦-определяющее интерес к проблеме распознавания, заключается в том, что способность к формированию абстрактных понятий является одним из основных элементов интеллектуального поведения. В постановку проблем и развитие методов распознавания образов внесли большой вклад советские ученые М.М. Бонгард, М.А. Айзерман, Э.М. Браверман, Л.И. Розоноэр, Я.З. Цыпкин, В.И. Вапник, Н.Г. Загоруйко, А.Л. Горелик, Ю.И. Журавлев, Л.А. Расстригин, В.А. Ковалевский, М.И. Шлезингер, A.A. Дорофеюк, И.Б. Мучник, В.А. Якубович, В.Н. Фомин, A.A. Первозванский. Среди иностранных ученых авторами наиболее значительных работ являются Г. Себастиан, Р. Гонсалес, М. Минский, С. Пейперт, Н. Нильсон, К. Фу, Дж. Ту, Р. ** Харалик, К. Фукунага, Э. Патрик, Д. Редди, Р. Нарасимхан, А. Шоу, А. Розенфельд, Т. Павлидис, Л. Кэнал.

Несмотря на высокую степень общности основной постановки задачи распознавания образов [1-9], она характеризуется существенными ограничениями, налагаемыми на априорную информацию о различаемых классах ситуаций.

Основное ограничение заключается в том, что при каждом акте распознавания принимается решение о принадлежности к определенному классу только одного отдельно взятого объекта. Хотя оценка качества решающего правила принципиально опирается на результат ^ его многократного применения, порядок предъявления объектов либо

другие взаимные связи между ними никак, не отражаются в обычной постановке задачи распознавания образов. Это обстоятельство формально выражается предположением о независимости вероятности появления объекта того или иного класса в данном испытании от того, представители каких классов были предъявлены в других испытаниях.

Второе ограничение связано с предположением, что в множестве значений вектора признаков при массовом решении задачи распознавания каждое измерение вектора связывается с одним отдельно взятым вполне определенным объектом, хотя и недоступным, вообще говоря, для непосредственного наблюдения. При этом распределение вектора наблюдаемых признаков предполагается зависящим только от индекса класса, к которому относится данный объект, и не зависящим от значений признаков, измеренных на других объектах.

В то же время в задачах распознавания, возникающих при построении алгоритмов обработки трехмерных сцен [10], плоских изображений till и экспериментальных кривых [ 12-153, одна из главных трудностей заключается в том, что положение объектов, составляющих анализируемое поле данных и подлежащих распознаванию, заранее неизвестно. Мх необходимо уметь выделять из общей ситуации или процесса, не владея априори достаточно детальными математическими моделями их образов в поле данных.

Для преодоления этой трудности в практических разработках было предложено большое число эвристических процедур выделения объекта, не требующих априорного знания модели его образа [13-16]. Однако они в принципе не могли быть согласованы с классическими моделями распознавания образов, в которых объект, подлежащий распознаванию, предполагается выделенным.

Таким образом, возникла необходимость построения более сложных формальных моделей распознавания образов, которые давали бы целостное описание двух процессов - поиска объектов в поле данных и их распознавания. Вариант решения именно этой проблемы и предлагается в настоящей диссертации.

Важная особенность развиваемого подхода заключается в предположении, что анализируемая ситуация содержит множество объектов. Предполагается, что объекты имеют характерное взаимное расположение, причем положение отдельного объекта относительно других объектов в поле данных несет существенную дополнительную информацию как о его локализации, так и о принадлежности к определенному классу.

Принципиальное отсутствие в исходной информации сведений о положении объектов в поле данных усложняет процесс распознавания, в то же время наличие особой структуры их взаимного расположения упрощает этот процесс. В целом ситуация оказывается существенно отличной от классической постановки задачи распознавания. Даже в условиях полного знания модели порождения наблюдаемого поля данных задача распознавания требует специального исследования. Для ее решения необходима разработка особых алгоритмов анализа всего поля данных, содержащего анализируемое множество объектов, в то время как в классическом случае алгоритм распознавания сводится к простому вычислению функции принадлежности объекта к классам по вектору его признаков.

В настоящей диссертации исследуется только одномерный случай, когда структура анализируемого множества объектов определяется их расположением на оси скалярной переменной, которая далее интерпретируется как время (случай экспериментальных кривых). Предлагаемые методы существенно используют одномерный характер

поля данных, реализуя динамический подход к построению моделей и алгоритмов распознавания образов, поэтому они не могут быть непосредственно перенесены на случаи двух- и трехмерного пространства (случаи плоских изображений и трехмерных сцен):

Динамический подход к проблеме распознавания образов рассматривается здесь как обобщение классической постановки задачи распознавания. Обобщение заключается в непосредственном учете вполне определенной огранизации появления объектов или ситуаций во времени, а также в том, что значения вектора признаков предполагаются зависящими от времени, прошедшего с момента появления нового объекта или изменения ситуации. Фактор времени характерен для большинства прикладных задач, рассматриваемых как задачи распознавания образов, и вынужденно игнорируется в классической постановке задачи распознавания.

Например, при распознавании состояния некоторой технической системы при трех классах состояний ("норма", "предаварийный режим" и "авария") вероятность внезапного появления аварийного состояния вслед за нормальным мала, в то же время переход системы в предаварийный режим значительно повышает априорную вероятность аварии. Естественно предположить, что после наступления аварии по мере развития вызванных ею процессов или хотя бы в силу инерционности датчиков изменяются и значения переменных, регистрируемых как внешние признаки состояния диагностируемой системы в виде экспериментальных кривых. При этом характер изменения этих переменных может нести не меньшую информацию о состоянии системы, чем их средние значения.

Примером давно развивающейся области приложения методов распознавания, для которой узки рамки классической постановки задачи распознавания образов, может служить распознавание речи

[17-203. Распознавание как отдельных слов, так и слитной речи связано с необходимостью анализа динамики изменения вектора спектральных признаков речи, например, путем их представления в виде последовательности эталонных сигналов [19,20]. Аналогичная проблема возникает при распознавании моментов вступления сейсмических волн на сейсмограммах [21-24], границ отдельных пластов породы в скважине на каротажных кривых [25-291, зубцов на электрокардиограммах и звуков на фонокардиограммах, вызванных последовательностью фаз сокращения сердечной мышцы и работы клапанов [30-323, спайков, сонных веретен и К-комплексов на электроэнцефалограммах [33-353 и т.п. Для решения этих и других подобных задач разрабатываются узко специализированные алгоритмы, эксплуатирующие специфические особенности каждого вида экспериментальных кривых и практически не использующие достижения из других прикладных областей.

Стремление к созданию универсальной идеологии построения алгоритмов обработки кривых как последовательностей отдельных характерных фрагментов привело к появлению лингвистического подхода к анализу экспериментальных кривых [12-143. В основе этого подхода лежали эвристические алгоритмы выделения на кривой локальных особенностей, предположительно несущих отдельные единицы информации о породившей ее скрытой последовательности событий в составе исследуемого физического процесса. Классы "похожих" фрагментов, выделенные посредством автоматической классификации в некотором признаковом пространстве, рассматривались как символы языка сокращенного описания кривых данного вида. Однако алгоритмы лингвистического подхода, решая в сущности задачу распознавания, не были связаны с классической теорией распознавания образов, не опирались на единую модель порождения данных и оставались в этом

смысле эвристическими алгоритмами.

Обобщением традиционной постановки задачи распознавания образов, вовлекающим в процесс принятия решения информацию, заключенную в характере зависимости значений признаков от времени, являются задачи распознавания случайных процессов [36-37]. При таком подходе анализируемый сигнал рассматривается как единое целое и при этом игнорируется его возможная внутренняя структура в виде последовательности отдельных событий.

Как дальнейшее обобщение, направленное на учет также возможных изменений ситуации в процессе наблюдения, могут рассматриваться различные постановки задачи обнаружения изменений свойств случайных процессов [38-41]. Здесь в сущности решается .задача распознавания образов при известных описаниях классов текущего и ожидаемого случайных процессов, однако отсутствуют такие моменты, неотъемлемые для классического понимания проблемы распознавания, как обучение и самообучение.

В данной диссертации предлагается динамический подход к проблеме распознавания образов, понимаемый как единый взгляд на все аспекты распознавания на оси времени. Рассматриваемый подход включает в себя модельное представление о последовательности подлежащих распознаванию объектов и о процессе изменения наблюдаемых признаков, методы обучения распознаванию по данным "учителя" либо без них, понимаемые как методы восстановления недостающей информации о проявлениях искомых объектов в наблюдаемом процессе, а также методы собственно распознавания при наличии достаточной информации об этих проявлениях. Предъявление очередного объекта распознавания либо изменение ситуации рассматривается как случайное событие, последовательность которых образует случайный поток классифицированных случайных событий с

определенными вероятностными свойствами, а изменение во времени наблюдаемых признаков - как случайный процесс, в общем случае векторный, регистрируемый в виде экспериментальной кривой либо нескольких кривых. Предполагается, что появление в некоторый момент времени события определенного класса вызывает характерное для данного класса возмущение наблюдаемого процесса. Модельное представление о характере возмущения выражается для каждого класса событий в виде условного распределения наблюдаемого случайного процесса в интервале от момента появления данного события до следующего события относительно предшествующей части реализации процесса.

Исходной информацией для обучения распознаванию последовательности событий с "учителем" является достаточно представительная реализация наблюдаемого процесса (обучающая кривая), на которой "учитель" указал моменты появления событий и их классы. Задача обучения понимается как задача восстановления вероятностных свойств потока случайных событий и условных относительно него вероятностных свойств наблюдаемого случайного процесса либо как задача непосредственного формирования решающего правила распознавания. Аналогично понимается и задача самообучения, однако в этом случае единственным источником информации о восстанавливаемых вероятностных свойствах потока событий и наблюдаемого процесса является достаточно длинная экспериментальная кривая без данных "учителя" о моментах появления событий. Предполагается лишь, что априори известны параметрические семейства, к которым принадлежат искомые распределения вероятностей.

Задача распознавания заключается в восстановлении на предъявленной экспериментальной кривой моментов появления событий

и их классов в предположении, что известны, полностью либо частично, вероятностные свойства потока случайных событий и условные вероятностные свойства наблюдаемого случайного процесса для фиксированной последовательности событий. Заметим, что в классической теории распознавания образов нетривиальна лишь задача обучения, а распознавание, т.е. определение класса предъявленного объекта, сводится к простому вычислению значения решающей функции для данного вектора признаков. Динамический подход к проблеме распознавания образов приводит к необходимости определения на анализируемой экспериментальной кривой прежде всего моментов появления событий, что превращает задачу собственно распознавания в одну из разновидностей задачи обнаружения изменений свойств случайного процесса. Нетривиальность задач такого рода обусловила появление упоминавшегося выше целого научного направления [38-413, занимающегося поиском их формальных постановок и путей решения в предположении, что вероятностные свойства наблюдаемого случайного процесса известны полностью или частично как до, так и после каждого искомого момента времени.

Основной текст диссертации состоит из девяти глав. В первой главе приведен ряд примеров прикладных задач структурного анализа экспериментальных кривых и даны краткие характеристики современных моделей и методов распознавания образов и обнаружения изменений свойств случайных процессов как основных идейных инструментов решения таких задач. Показана целесообразность развития классических моделей распознавания образов с учетом линейной упорядоченности распознаваемых объектов на оси аргумента в задачах анализа экспериментальных кривых со сложной структурой. В качестве направления такого развития сформулированы цели и задачи исследования, ориентированного на создание нового динамического

подхода к проблеме распознавания образов и базирующиеся на понимании последовательности объектов распознавания как последовательности событий, происходящих в определенные моменты времени.

Необходимо заметить, что в современной теории распознавания образов существует ряд направлений, обслуживающих разные классы прикладных задач. Различия между отдельными направлениями обусловлены прежде всего соглашением о множестве возможных значений компонент вектора признаков объекта распознавания х=(х1,... )т и априорным отношением к справедливости гипотезы

7 ТЬ

компактности, предполагающей, что образы объектов одного класса близки друг к другу в признаковом пространстве в смысле некоторой достаточно простой метрики.

В частности, понимание отдельных признаков как действительных чисел х^К, а образа объекта в целом как точки в конечномерном действительном пространстве хейп вместе с принятием гипотезы компактности образует геометрическое направление в теории распознавания. В первой главе рассматриваются только модели и методы распознавания образов в рамках геометрического направления, поскольку именно на этих методах базируются предлагаемое динамическое обобщение задачи распознавания. В приводимой краткой характеристике теории распознавания образов опущены логическое направление, обслуживающее случай конечного множества значений для каждого признака [42,43], алгебраическое направление, основанное на введении алгебры над некоторым множеством разных алгоритмов распознавания [44,45]. Не упоминается также обширное структурное направление, обслуживающее прежде всего задачи распознавания сложных изображений, для которых не выполняется гипотеза компактности [46-483.

Однако тот факт, что предлагаемый в данной диссертации динамический подход к проблеме распознавания образов развивает только геометрическое направление в теории распознавания, вовсе не означает, что остальные направления непригодны для динамической интерпретации. Задачам распознавания образов на экспериментальных кривых особенно адекватно структурное направление, может быть, даже в большей степени, чем задачам анализа сложных изображений, поскольку цепочка символов из некоторого алфавита естественным образом отражает последовательность элементарных событий, породивших анализируемую кривую. Первые шаги в этом направлении отражены в работах [12-14,303.

Порядок изложения моделей и методов распознавания последовательностей событий в дальнейших главах диссертации определяется следующей аналогией с классическими моделями и методами распознавания.

В классической геометрической постановке задачи распознавания образов с каждым классом объектов связывается некоторое распределение вероятностей в признаковом пространстве. В общем случае область ненулевых значений плотности распределения вероятностей каждого класса может совпадать со всем признаковым пространством, или, по крайней мере, области концентрации плотностей разных классов могут пересекаться между собой. Методы обучения, вытекающие из этого общего предположения, обычно называют вероятностными методами. Естественно, что полученные при этом решающие правила распознавания не могут гарантировать безошибочное определение класса предъявленного объекта. Разные методы построения решающих правил реализуют стремление обеспечить наименьшее среднее число ошибок при разных способах подсчета этого среднего числа и при разном объеме доступной информации о

распределении вероятностей каждого класса.

К специфическим методам обучения приводит предположение, что области признакового пространства, в которых сконцентрированы распределения вероятностей разных классов, не пересекаются между собой. В этом случае существует принципиальная возможность построить решающее правило распознавания, обеспечивающее безошибочное определение класса объекта. Методы обучения, основанные на таком специальном предположений, называют * детерминистскими, хотя в их основе лежит вероятностная модель, активно используемая при формализации понятия представительности обучающего материала и в доказательствах сходимости алгоритмов обучения. Такое название обусловлено еще и тем, что при непересекающихся областях разных классов в признаковом пространстве вид решающего правила распознавания определяется только формой этих областей и не зависит от конкретного вида сконцентрированных в них плотностей распределений.

Аналогичное разделение моделей и методов распознавания на вероятностные и детерминистские оказалось вполне естественным и в терминах динамического подхода к проблеме распознавания образов. В Л главах 2-5 изложены методы обучения и распознавания, вытекающие из наиболее общей в данной диссертации вероятностной модели последовательности подлежащих распознаванию событий и реакции наблюдаемого случайного процесса на события определенного класса. В этой части диссертации рассматриваются две постановки задачи обучения по данным учителя, аналогичные двум соответствующим постановкам в классической теории распознавания образов.

В первой постановке задача обучения трактуется как оценивание параметров вероятностных моделей потока событий и реакции на события каждого класса в предположении, что априори известны

соответствующие параметрические семейства распределений. В тех же предположениях далее в главе 8 рассматривается и задача самообучения при отсутствии данных учителя.

Вторая постановка основана на понимании задачи обучения как задачи формирования оператора, ставящего в соотетствие каждой реализации наблюдаемого процесса комплекс вероятностных характеристик апостерионого потока классифицированных случайных событий. Общий метод формирования такого оператора существенно основан на марковском свойстве сопровождающего случайного процесса апостериорного потока. Алгоритм обучения разработан для наиболее типичной частной модели априорного потока событий.

Задача собственно распознавания решается для известных вероятностных характеристик апостериорного потока событий, соответствующего анализируемой экспериментальной кривой как реализации наблюдаемого случайного процесса, в частности, для полностью известных вероятностных моделей потока событий и реакции наблюдаемого процесса на события каждого кдасса. Задача распознавания поставлена как задача формирования решающего правила определения оценок моментов появления событий и их классов по предъявленной экспериментальной кривой, обеспечивающего минимум среднего риска ошибки для заданной функции потерь от несовпадения оцененных и истинных моментов появления и классов событий.

Для каждой конкретной последовательности событий общая вероятностная модель определяет некоторое распределение вероятностей на множестве экспериментальных кривых. Детерминистская задача распознавания последовательности событий, постановка и методы решения которой рассмотрены в главах 6 и 7, предполагает, что всякое такое распределение сконцентрировано в некоторой области в пространстве экспериментальных кривых, называемой

образом данной последовательности событий. Задача ' распознавания называется разрешимой с некоторой определенной грубостью, если эти области не пересекаются для последовательностей событий, отличающихся друг от друга по моментам появления событий больше, чем на величину грубости распознавания. В этом случае существует решающее правило распознавания, позволяющее по предъявленной экспериментальной кривой восстановить инициировавшую ее последовательность событий с ошибкой по моментам их появления, не превышающей данного значения грубости. При некоторых дополнительных предположениях для построения алгоритма распознавания с заданной грубостью достаточно иметь набор дискриминантных функционалов для каждого класса событий, отличающих фрагменты кривых, ограниченные моментами появления соседних событий, от фрагментов, крайние точки которых сдвинуты более, чем на величину грубости распознавания. Задача обучения понимается как задача формирования таких дискриминантных функционалов по данным учителя.

В последней девятой главе диссертации рассмотрены методики и результаты решения четырех прикладных задач.

Решение задачи распознавания вулканических землетрясений основано на использовании детерминистской модели данных. Каждое землетрясение отражается на регистрируемой сейсмограмме в виде следующих друг за другом возмущений, первое из которых вызвано приходом продольной сейсмической волны, а второе - поперечной волны, распространяющейся с меньшей скоростью. Решающее правило распознавания вступлений сейсмических волн формировалось как результат обучения по данным эксперта, выступавшего в роли учителя и указавшего моменты вступлений на обучающих сейсмограммах. Работа выполнена совместно с Институтом вулканологии АН СССР, г.

Петропавловск-Камчатский.

При исследовании процесса длительного поддержания вертикальной позы человеком по результатам стабилографического эксперимента использовалась вероятностная модель данных. В основу исследования положена принятая в физиологии концепция системного квантования поведения [49,503, согласно которой всякое сложное действие, в данном случае длительное поддержание вертикальной позы человеком, осуществляется путем чередования элементарных программ действия, подчиняющегося определенной закономерности. В качестве искомой последовательности событий рассматривалась последовательность моментов скачкообразной смены элементарных программ. Исследования проводились совместно с ЦНИИ "Спорт", г. Москва. В результате исследования получены новые данные о квантовом механизме формирования континуального поведения при выполнении целенаправленных действий человеком.

Решение задачи расчленения геологических разрезов по данным сейсморазведки основано на специально разработанной методике структурного анализа векторных случайных процессов с упорядоченными компонентами (двумерных случайных полей). Области поля сейсмических трасс с однородными вероятностными свойствами соответствуют отдельным пластам породы в составе геологического разреза. Работа выполнена по заказу Центральной геофизической экспедиции, г. Москва.

Вероятностная модель данных при специальных предположениях о реакции наблюдаемого процесса на отдельное скрытое событие использована для построения алгоритма диагностики биений валков стана холодной прокатки на основе анализа кривой измеряемой разнотолщинности проката. Работа выполнена по заказу завода им. С.М. Кирова, г. Тула.

I. Специфика задач распознавание образов в сигналах (экспериментальных кривых) со сложной структурой

1.1. Практические задачи структурного анализа экспериментальных кривых как задачи распознавания образов

Задачи обработки данных, упорядоченных вдоль оси некоторого аргумента - времени, частоты, пространственной координаты, -являются типичными для практики технических и естественно-научных исследований. В качестве обобщающего названия для экспериментальных данных такого вида мы будем использовать термин "экспериментальные кривые" наряду с несколько более узко трактуемым термином "сигналы", ориентированным преимущественно на обозначение функций времени.

Экспериментальные кривые регистрируют, как правило, с целью косвенного изучения недоступных для непосредственного наблюдения физических явлений через некоторые сопутствующие процессы, которые могут наблюдаться непосредственно. Экспериментальные данные такого вида практически всегда избыточны как первичный носитель информации об исследуемом объекте, поэтому процесс их обработки, как правило, с применением вычислительных машин, в сущности, представляет собой процесс сжатия информации. Способ обработки кривых определяется прежде всего основной рабочей гипотезой о механизме функционирования изучаемого объекта. Можно выделить две точки зрения на источник кривой и соответственно два существенно разных подхода к построению алгоритмов их анализа.

Если проводимое исследование позволяет допустить, что в течение всего времени регистрации кривой состояние исследуемого процесса не изменялось или изменялось по единому достаточно простому закону, то нет оснований предполагать, что отдельные

участки кривой несут существенно разную ..информацию об исследуемом процессе. В этом случае обработка кривых сводится к подбору некоторой математической модели, достаточно хорошо согласующейся с усредненным поведением всей кривой в целом. Такие методы анализа экспериментальных кривых естественно назвать интегральными.

Например, осциллограммы шума турбины либо другой машины непрерывного действия могут рассматриваться как реализации стационарного случайного проциииа, олЪмИоттвоте - характеристики которого связаны с техническим состоянием машины. Обработка осциллограмм заключается в данном случае в оценивании этих характеристик [52,533. Аналогично, обработка кривой изменения выходного сигнала динамического объекта управления при известном графике изменения его входного сигнала сводится к подбору коэффициентов дифференциального либо разностного уравнения, решение которого в среднем мало отличается от обрабатываемой кривой [54,553.

Значительно чаще целью либо вынужденным элементом исследования является изучение функционирования источника кривой как последовательности элементарных событий. Каждое такое элементарное событие приводит к появлению характерных особенностей формы кривой на соответствующем фрагменте. Результат обработки таких кривых должен сохранять информацию о чередовании элементарных событий в ходе развития исследуемого процесса.

Анализ экспериментальных кривых, обладающих внутренней структурой, неизбежно связан с необходимостью выделения и классификации сравнительно коротких фрагментов, несущих отдельные единицы информации об исследуемом объекте. Такие методы обработки экспериментальных кривых будем называть структурными методами. Рассмотрим несколько примеров прикладных задач, приводящих к

проблеме структурного анализа эксперименталных кривых.

Пожалуй, наиболее богатым источником задач такого вида являются медико-биологические исследования [16,30,56]. Это не удивительно, поскольку живой организм является типичным примером сложной системы, внутренние процессы в которой, во-первых, не могут наблюдаться непосредственно без нарушения их естественной обособленности от окружающей среды, и, во-вторых, в силу своей сложности характеризуются существенной дискретностью развития во времени.

В качестве примера экспериментальных кривых, обладающих внутренней структурой, чаще всего приводят электрокардиограммы (ЭКГ), представляющие собой записи электрического потенциала на поверхности грудной клетки и отражающие динамику электрической активности сердечной мышцы в процессе ее квазипериодического сокращения [16,30,31]. Кривая ЭКГ может разбиваться на части по различным признакам, но в любом случае это разбиение направлено на выделение отдельных фаз сокращения. Обычно на ЭКГ выделяют пять типов зубцов характерной формы, обозначаемых символами Р,0,И,3,Т и называемых в совокупности РОИЗТ-комплексом. Практически все алгоритмы диагностики заболеваний сердца предполагают выделение РОИЗТ-комплекса как основной этап анализа сигнала. Форма комплекса в пределах одной ЭКГ обычно достаточно постоянна, исключение составляет лишь небольшое число заболеваний, признаком которых является именно нестабильность его формы. В то же время ЭКГ разных пациентов характеризуются большим ранообразием формы РОНБТ-комплекса. Кроме того, при регистрации ЭКГ фиксируются сигналы не только от сердца, но и от других органов вместе с внешними помехами, что значительно искажает форму кривой. В силу этих обстоятельств задачу выделения РОЕЗТ-комплекса и отдельных зубцов

в его составе естественно рассматривать" как задачу распознавания образов, осложненную необходимостью определять границы искомого фрагмента вместе с его классификацией.

Столь же ярким примером структурной экспериментальной кривой является фонокардиограмма (ФКГ) [32], но в этом случав на поверхности грудной клетки с помощью специального микрофона регистрируются характерные звуки, сопровождающие процесс сокращения сердечной мышцы. Обычно на ФКГ требуется распознавать так называемые первый и второй звуки (тоны), разделяющие систолический и диастолический периоды внутри цикла сокращения, щелчок открытия митрального клапана, а также систолический и диастолический шумы.

Кардиосигналы обычно регистрируют в виде векторных кривых, компоненты которых соответствуют отдельным стандартным точкам расположения электродов на поверхности грудной клетки в случае ЭКГ и нескольким узким полосам частот в случае ФКГ, выделяемым из единого сигнала с помощью предварительной полосовой фильтрации.

Электроэнцефалограммы (ЭЭГ) представляют собой векторные записи электрических потенциалов, измеряемых в нескольких точках на поверхности черепа и рассматриваемых как внешние следы скрытой электрической активности головного мозга [16]. При стандартной схеме регистрации одновременно записывают от 8 до 21 отведений ЭЭГ. Если анализируются сравнительно короткие записи, то ЭЭГ обычно интерпретируют как векторный стационарный случайный процесс, характеризующийся спектральным составом колебаний как отдельных компонент, так и их взаимными спектральными связями, в простейшем случае коэффициентами корреляции. В зависимости от преобладающей частоты различают несколько типов ритмов квазистационарных колебаний, обозначаемых греческими буквами, в

* частности, а-, |3-, 6-, а-ритмы.

Однако при анализе длительных записей, например, при изучении сна [33,34], такой подход оказывается совершенно недостаточным. В течение длительного эксперимента, даже если пациент находился в состоянии кажущегося покоя, характер колебаний компонент ЭЭГ существенно меняется, причем интервалы времени, в течение которых колебания нестабильны, как правйло, значительно короче, чем квазистационарные интервалы. В целом более адекватной моделью ЭЭГ является векторный локально стационарный случайный процесс со скачкообразно изменяющимися вероятностными свойствами [34,35]. В частности, различают несколько стадий сна, порядок чередования которых у здорового человека относительно стабилен, но нарушается специфическим образом в случае некоторых заболеваний. Проведение исследований такого рода требует применения алгоритмов определения границ и классификации квазистационарных фрагментов векторной ЭЭГ.

Кроме квазистационарного поведения для ЭЭГ характерны также сравнительно короткие и относительно редкие фрагменты специфической повторяющейся формы, наблюдаемые в виде специфических аномалий на однородном фоне, выделение и распознавание которых играет важную роль при диагностике ряда заболеваний [16,33]. Чаще всего выделяют так называемые спайки, имеющие форму острых коротких импульсов, сонные веретена, представляющие собой короткие фрагменты высокочастотных колебаний с плавно нарастающей и плавно уменьшающейся амплитудой, и К-комплексы, состоящие из острого импульса с последующей плавной полуволной.

Спайки выделяют также на электромиограммах (ЭМГ) электрических сигналах, управляющих мышечной активностью и регистрируемых на поверхности тела [57]. В частности, корреляция между появлением спайков в ЭЭГ и ЭМГ часто рассматривается как

один из симптомов склонности к эпилепсии«

Не менее богатым источником экспериментальных кривых с ярко выраженой внутренней структурой являются геофизические исследования.

Наибольшее число публикаций посвящено задаче распознавания землетрясений и ядерных взрывов при автоматическом анализе сейсмограмм, представляющих собой временные записи смещения либо скорости смещения земной поверхности в точке регистрации [213. В качестве объектов распознавания здесь выступают моменты прихода сейсмических волн, вызванных исходным землетрясением или взрывом, точнее, моменты первого движения, связанного с вступлением волн кавдого вида [22-243. Обычно стремятся как можно более точно определить моменты вступления продольных и поперечных волн, называемых соответственно Р- и Б-волнами, первые из которых переносятся упругим сжатием-растяжением породы вдоль направления распространения волны, а вторые - смещением в направлении, ортогональном направлению распространения.

В разведочной геофизике в качестве одного из наиболее информативных методов исследования слоистой структуры подповерхностной толщи пород широко используется каротаж, заключающийся в измерении и последующей интерпретации некоторой физической характеристики породы (или одновременно нескольких характеристик) как функции глубины относительно земной поверхности. Такие зависимости, называемые каротажными кривыми, регистрируют с помощью соответствующих датчиков в специально пробуренных разведочных скважинах [263. Основной задачей интерпретации каротажных кривых является определение границ однородных пластов и распознавание типа породы в каждом таком пласте [253. При совместной интерпретации каротажных кривых, зарегистрированных в совокупности скважин, первостепенное значение

приобретает так называемая проблема корреляции, заключающаяся в поиске соответствий между границами однотипных пластов в разных скважинах и восстановлении тем самым целостного геологического строения исследуемого региона [27-291.

Другой метод исследования скрытой геологической структуры толщи пород дает сейсмическая разведка [58]. На поверхности земли, обычно вдоль некоторой прямой линии, располагается множество (несколько сотен) сейсмических датчиков. В некотором отдалении от линии измерений тем или иным способом, например, посредством взрыва, инициируется сейсмический импульс. Сейсмические волны, распространяющиеся вглубь толщи пород, отражаются от границ между однородными пластами, возвращаются к поверхности и регистрируются линейкой сейсмоприемников. Получаемую в результате совокупность

I

сейсмограмм называют сейсмическим временным разрезом. После весьма глубокой предварительной обработки, направленной прежде всего на учет различия скоростей распространения сейсмических волн в породах разной плотности и устранение интерференции волновых фронтов, приходящих к сейсмоприемникам с разных направлений, ось времени фактически можно интерпретировать как ось глубин залегания тех геологических неоднородностей, от которых отразился импульс, регистрируемый в каждый момент времени [583.

Как и в задаче анализа данных каротажа, обработка

!

сейсмического временного разреза направлена в конечном итоге на выделение границ однородных пластов и распознавание типа породы в каждом таком пласте. Обратим внимание, что в отличие от случая каротажных кривых, где суждение о границах пластов, хотя, еозможно, и несколько менее детальное, может быть сформировано и по одной кривой, в данном случае мы имеем дело с принципиально многомерным сигналом, в котором каждая кривая практически не может

интерпретироваться отдельно от остальных или, по крайней мере, соседних кривых. Будучи естественным образом изображены в одной плоскости при ориентации оси времени сверху вниз, сейсмограммы в составе временного разреза образуют плоское изображение, в котором подлежащие выделению объекты воспринимаются при визуальном анализе как области с однородной текстурой, причем в силу слоистого характера исследуемой среды эти области вытянуты не вдоль, а поперек вертикальной оси времени (глубины).

Общая концепция структурного анализа экспериментальных кривых адекватна также многим задачам технической диагностики. В частности, если в отличие от примера турбины, приведенного в начале раздела, изучается работа двигателя внутреннего сгорания, функционирование которого имеет квазипериодический характер, то сигнал шума, регистрируемый на поверхности корпуса, либо кривую вибрации уже нецелесообразно рассматривать как реализации стационарного случайного процесса. Отдельные фазы работы такой машины и соударения ее частей проявляются в осциллограмме в виде вполне различимых фрагментов с разным характером колебаний либо в виде отдельных характерных Есплесков. Например, в работе [143 исследовалась связь формы кривой шума тракторного дизеля с величиной зазора одного из клапанов. Было показано, что величина зазора может устойчиво контролироваться путем распознавания и выделения всплесков, характеризующейся определенной формой и положением в пределах цикла работы двигателя. В целом кривую шума оказалось целесообразным представлять как последовательность символов из конечного алфавита, каждый из которых отражал положение в рабочем цикле характерных особенностей определенного вида. Такие цепочки символов трактовались как фразы некоторого специального языка, максимально приспособленного для описания

сигналов в некоторой предметной области, в данном "случае кривых шума тракторного дизеля, а процесс выделения локальных особенностей сигнала и их объединение в небольшое число типовых классов - как процесс формирования элементарных единиц (символов) такого языка.

Пожалуй, наиболее ярким примером сигналов, анализ которых неизбежно связан с проблемой выделения и распознавания их локальных особенностей, могут служит сигналы речи [17-20]. Преобразование непрерывного сигнала в дискретную последовательность символов, роль которых в данном случае играют слова или отдельные морфемы естественного языка, составляет конечную цель работы всякой системы распознавания речи. В сущности, в этом смысле задача распознавания речи приниципиально не отличается от других задач структурного анализа экспериментальных кривых, однако в то же время эта задача глубоко специфична. Эта специфика, по-видимому, определяется двумя факторами, связанными с априорной информацией о допустимых последовательностях символов, один из которых, казалось бы, облегчает задачу распознавания, а второй затрудняет ее. С одной стороны, распознавание может опираться на всю известную в принципе структуру языка, включающую его фонетический и лексический состав вместе с грамматикой. С другой стороны, именно чрезвычайно большой объем этой априорной информации делает ее практически не поддающейся достаточно полному учету. Одной из главных проблем при построении систем распознавания речи является выбор разумного компромисса между сложностью системы и ее способностью учитывать априорную структуру искомой последовательности слов либо морфем.

Таким образом, задачи структурного анализа экспериментальных кривых могут быть квалифицированы как задачи распознавания

образов, осложненные необходимостью выделения объектов распознавания из общего процесса, ориентируясь на его локальные особенности, специфические для объектов данного типа. Этому второму аспекту анализа экспериментальных кривых со сложной структурой наиболее адекватен круг формальных моделей, задач и методов, сформировавшийся в основном в течение двух последних десятилетий в рамках прикладной статистики случайных процессов и получивший название методов обнаружения изменений свойств случайных процессов.

В следующих двух разделах дана краткая характеристика классических методов обучения распознаванию образов и методов обнаружения неоднородностей в случайных процессах как основных идейных предпосылок развиваемой в данной работе методологии распознавания образов в сигналах со сложной структурой.

1.2. Классические постановки задачи обучения распознаванию образов

Классические постановки задачи распознавания образов [1-93 оперируют с неделимыми объектами, каждый из которых предполагается целиком принадлежащим к одному из конечного множества классов. Задачей наблюдателя является определить скрытую принадлежность объекта к тому или иному классу, анализируя вектор значений некоторых его признаков, число которых обычно принимается конечным. Информацию о связи между значениями признаков объекта и его принадлежностью к определенному классу наблюдатель должен извлечь из обучающей совокупности объектов, для которых известны как значения их признаков, так и классы, либо только значения признаков. В первом случае задача называется задачей обучения распознаванию образов с учителем, а во втором - без учителя.

Разумеется, такой подход к анализу данных адекватен лишь одному из двух аспектов двуединой задачи распознавания локальных особенностей экспериментальной кривой, а именно, собственно распознаванию класса вполне определенного фрагмента, рассматриваемого как внешнее проявление некоторого скрытого события. При этом вынужденно предполагается уже решенной задача сегментации, т.е. определения границ фрагментов, каждый из которых допустимо рассматривать как единое целое.

В то же время рассматриваемый в данной работе комплексный подход к совместному решению этих двух задач существенно опирается на методы решения классической задачи распознавания. В связи с этим мы кратко остановимся здесь на основных методологических концепциях, лежащих в основе современной теории распознавания образов. В дальнейшем при постановке и решении задач распознавания

событий в экспериментальных кривых мы будем использовать понятия и обозначения, введенные в этом разделе, как базу для дальнейших обобщений.

Центральными понятиями классической формальной постановки задачи обучения распознаванию образов являются [2,33:

- гипотетическое множество (генеральная совокупность) ü объектов распознавания соей;

- индикаторная функция g(o)): Ü —> Л, Л1={1,... ,тя>, объективно разбивающая множество ß на т непересекающихся классов kV,...,Qm и неизвестная наблюдателю;

- пространство наблюдений в пределах которого некоторая функция x(oj) : Q —► также неизвестная наблюдателю, ставит в соответствие каждому объекту weü его образ х(ш)е$, непосредственно воспринимаемый наблюдателем.

Конечной целью наблюдателя является построение решающего

л

правила g(x): X —*■ Л, которое позволило бы распознавать класс g(w) скрытого объекта шей, опираясь на его образ х(о) в пространстве наблюдений и "не слишком часто" ошибаться. При этом доступная наблюдателю информация о функциях g(w) и x(w), составляющих вместе с множествами Q, Л и X первичную модель источника данных, ограничивается результатами измерений над конечным числом объектов со, J=1,...,N, составляющих так называемую обучающую совокупность. В зависимости от того, какие измерения могут быть произведены на объектах обучающей совокупности, различают задачи обучения распознаванию образов с учителем, без учителя, а также промежуточный вариант задачи обучения.

Задача обучения с учителем предполагает, что каждый объект w в обучающей совокупности представлен номером своего класса SrS(u> ) и образом в пространстве наблюдений х =х(ш ), т.е.

ф

обучающая совокушость в целом есть., конечное множество пар

Такую задачу называют также задачей обучения

«7 •/

по классифицированной обучающей совокупности.

В случае задачи обучения без учителя в обучающей совокупности отсутствуют данные о принадлежности объектов к классам, и обучающая совокупность в целом представляет собой просто конечное множество образов объектов в пространстве наблюдений х^, /=1,... . При таком понимании задачи обучения говорят об обучении

ш

по неклассифицированной обучающей совокупности.

Наконец, если в обучающей совокупности принадлежность объектов к классам известна для части объектов и неизвестна для остальных, то обучающую совокупность называют частично классифицированной.

В принципе пространство наблюдений X может иметь любую природу, однако, как правило, под наблюдением х(ш) понимают вектор с некоторым фиксированным числом компонент х=(хх ),

7 71»

называемых признаками объекта. Обычно полагают, что признаки принимают действительные х^Я либо дискретные значения, в последнем случае обычно а:{е{0,1}. Это различие не имеет принципиального значения для нашего краткого обзора подходов к решению задачи распознавания. Мы остановимся на первом варианте, полагая в дальнейшем, что пространство наблюдений Ж является ?г-мерным евклидовым пространством Вп, и называя его пространством признаков или признаковым пространством.

Качество решающего правила распознавания, содержательно интерпретируемое в простейшем случае как "частота" правильных решений о классе объекта, обычно формализуют, вводя предположение о существовании некоторой вероятностной меры на множестве объектов 0. Тогда решающее правило следует выбирать из условия минимума вероятности ошибки Р^[х(ш) . В более сложном случае

качество решающего правила оценивается средним риском ошибки распознавания, под которым понимается математическое ожидание потерь от несовпадения оцененного и истинного класса объекта:

= Е|Л.[£[х(Ш)], Я(со)]}, (1.2.1)

где Л.я) - некоторая функция потерь.

Вместе с функциями g(ь)) и х(ш) вероятностная мера на множестве О определяет двухкомпонентный случайный вектор (£,х), принимающий значения из множества Д*Ип. Источник данных полностью характеризуется априорными вероятностями появления объекта каждого класса в очередном испытании

т

= Р^(ш)=&], ^ дк = 1, &=1,... (1.2.2)

к=Г

и условными распределениями вероятностей в пространстве признаков для каждого класса объектов. Если предположить, что эти распределения непрерывны в Яп, то они полностью определяются соотетствующими условными плотностями распределения:

Р[х(ш)^8(£)и(ш)=!г ] фк(£) = 11л- ,

(1.2.3)

| = 1, й=1 яп

где |л[?е(£)] - мера Лебега е-окрестности ) точки

Другой исчерпывающей характеристикой источника данных является полное распределение вероятностей в пространстве признаков /(£) вместе с апостериорными вероятностями классов относительно фиксированных предположений о значениях вектора признаков

т

гк(£) = Р[я(а))=]г х(ш)=е] , £ = 1, &=1.....т. (1.2.4)

к=1

Функции гк(%), в некоторых руководствах называют функциями

степени достоверности.

В дальнейшем, где это не будет вызывать недоразумений, мы будем отдавать предпочтение записям /(х), ф^(х), гк(х), обозначая аргумент плотности распределения в признаковом пространстве тем же символом х, что и отдельные значения вектора признаков.

Средний риск ошибки распознавания «Г^*)] (1.2.1) как

л.

функционал на множестве решающих правил полностью

определяется парой /(х), гк(х) либо парой дк, ф^(х), &=1,...,т,

•Гр(-)] = | [ 2 ^(2(х),&]гА(х)]/(х)сйЕ =

т

Н**-' . (1.2.5)

дП 15— Т

Эти выражения, вообще говоря, эквивалентны, поскольку оба представления вероятностной модели данных могут быть пересчитаны друг в друга:

1=1

и наоборот,

т „Ъ. фЬ(з

/(X)

VII к я" Ф~(х) /(X) = 2 ц1 фг(Х), 7* (X) = -— (1.2.6)

гк(х)/{х)

чк = [ Г&(х)/(х)йх, = -. (1.2.7)

-.тг

я'

В то же время первое из выражений (1.2.5) более удобно в том смысле, что непосредственно указывает структуру оптимального (байесовского) решающего правила:

т

¿(х) = агвлт1п ^ гк(х). (1.2.8)

8 ъ=1

Однако наблюдателю неизвестны вероятностные характеристики источника данных. Он располагает лишь обучающей совокупностью (е ,х,), С=1,...,ЯГ в случае обучения с учителем либо х,, £=1,.. .Ж

Ъ Ъ ■ Ь

при обучении без учителя, которую в обоих случаях естественно рассматривать как случайную выборку, состоящую из N независимых реализаций соответствующих случайных векторов, определяемых исходной вероятностной мерой на множестве объектов 0. Общая классическая постановка задачи обучения распознаванию образов требует, опираясь на обучающую выборку, найти решающее правило

л

g(z), которое позволило бы в дальнейших экспериментах определять класс предъявляемых объектов с минимальным или, по крайней мере, приемлемым средним риском ошибки (1.2.1).

В тех случаях, когда невозможно принять какие-либо достаточно простые априорные предположения об аналитической форме условных плотностей распределения ^(х) и, следовательно, функциях достоверности гк(х), то нет оснований и надеяться, что оптимальное решающее правило, минимизирующее средний риск (1.2.1), можно будет представить в конструктивном виде. Тогда обычно ограничивают класс

л

решающих правил g(x) некоторым простым параметрическим семейством

А

£(х;с). В случае двух классов т=2, к которому последовательной

дихотомией можно свести задачу распознавания при любом т, такие

решающие правила удобно строить на основе некоторой

дискриминантной функции <3(х;с) в пространстве признаков

Г 1, если (3(х;с)>0, 8(х;с) = { (1.2.9)

Похожие диссертационные работы по специальности «Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)», 05.13.16 шифр ВАК

Список литературы диссертационного исследования доктор технических наук Моттль, Вадим Вячеславович, 1993 год

Лйтература

1. Бонгард M.M. Проблема узнавания. M.: Наука, 1967, 320 с.

2. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М: Наука, 1974, 415 с.

3. Фомин В.Н. Математическая теория обучаемых опознающих систем. Л: Издательство Ленинградского университета, 235 с.

4. Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин. М.: Наука, 1970 , 384 с.

5. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978, 416 с.

6. Горелик А.Л., Гуревич И.Б., Скрипник В.А. Современное состояние проблемы распознавания. М: Радио и связь, 1985, 161 с.

7. Верхаген К., Дейн Р., Грун Ф., йостен й., Вербен П. Распознавание образов. Состояние и перспективы. М: Радио и связь, 1985, 103 с.

8. Патрик Э. Основы теории распознававния образов. М.: Советское радио, 1980, 408 с.

9. McLachlan G.J. Discriminant Analysis and Statistical Pattern Recognition. John Willey & Sons, 1992.

10. Дуда P. , Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976, 511 с.

11. Розенфельд А. Распознавание и обработка изображений. М.: Мир,

1972, 230 с.

12. Pavlidis Т. Linguistic analysis of waveforms // Software Engineering. J.T. Tou, Ed. Vol. 2. New York, Academic Press, 1971, pp. 203-225.

13. Мучник И.Б., Мучник Р.Б. Алгоритмы формирования языка для описания экспериментальных кривых // Автоматика и телемеханика,

1973. .№ 3. С. 86-96.

14. Mottl V.V., Muchnik I.В. Linguistie analysis of experimental curves // Proceedings IEEE. 1-979. Vol. 67. No. 5, pp. 714-736.

15. Яковлев В.Г. Алгоритм выделения всплесков на физиологических кривых // Автоматика и телемеханика. 1977. Л 12. С. 94-105.

16. Сох J.R., Nolle. P.M., Arthur R.M. Digital analysis of the electroencephalogram, the blood pressure wave, and the electrocardiogram // Proceedings IEEE. 1972. No. 10, pp. 1137--1164.

17. Цемель Г.И. Опознавание речевых сигналов. М.: Наука, 1971, 148 с.

18. Методы автоматического распознавания речи. Под ред. У. Ли. В 2-х томах. М.: Мир, 1983, 716 с.

19. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова думка, 1987 , 262 с.

20. Rabiner L.R. A tutorial on hidden Markov models and selected applications in speech recognition // Proceedings IEEE. 1989. Vol. 77. No. 2, pp. 257-285.

21. Рихтер Ч.Ф. Элементарная сейсмология. M.: Изд. иностр. лит., 1963, 670 с.

22. Раите 'С., Soldano Н.Van Der Pyl Th. Descriptive methods and processing of seismic signals // Proceedings of the 3rd International Symposium on Computer Aided Seismic Analysis and Discrimination. Washington, D.C.: The Catholic University of America, 1983, pp. 81-88. .

23. Тихонов И.Н. Оценка момента вступления продольной волны по трехмерной записи с помощью ЭВМ // Алгоритмы интерпретации геофизических данных. Владивосток: ДВНЦ АН СССР, СахКНИИ, 1976, с. 105-111.

24. Никифоров И.В., Тихонов И.Н. Автоматическое обнаружение и оценка моментов вступлений объемных сейсмических волн близких землетрясений по записям станции "Кипапа" // Параметры очагов цунамигенных землетрясений и особенности цунами. Владивосток: ДВНЦ АН СССР, СахКНИИ, 1980, с. 64-75.

25. Куленкович А.Е., Сохранов H.H., Чуринова И.М. Отбивка границ пластов и выделение песчанников по данным электрического каротажа с помощью цифровых вычислительных машин // Прикладная

«

геофизика. Вып. 39. М.: 1964.

Ш 26. Davis R., Austin Н., Carlbom I. The DIPMETER ADVISOR: Interpretation of geologic signals // Proceedings of the 7th IJCAT, 1981.

27. Жданов M.G., Шрайбман В.И. Корреляционный метод разделения геофизических аномалий. М.: Недра, 1973.

28. Губерман Ш.А., Овчинникова М.И. О машинной корреляции пластов в разрезах скважин по геофизическим данным // Изв. АН COOP. Физика Земли. 1972. № 3.

щ 29. Губерман Ш.А. Неформальный анализ данных в геологии и ^ геофизике. М.: Недра, 1987, 257 с.

30. Немирко А.П. Цифровая обработка биологических сигналов. М.: Наука, 1984, 145 с.

31. Валужис А.К., Рашимас А.П. Статистический алгоритм анализа электрокардиосигнала // Кибернетика. 1979. Ji 3. С. 91-95.

И If

32. Böhme Н. Herz- und Gefaßschall in Bild und Ton. Leipzig: Johann Ambrosius Barth, 1972, 116 S.

33. Шеповальников A.H. Активность спящего мозга. Л.: Наука, 1971, 186 с.

* %

34. Гринявичус К., Лесене В., Липейка А.* Автоматическое определение стадий сна // Статистические проблемы управления. Вып. 51. Вильнюс, Институт математики и кибернетики АН ЛитССР, 1981, с. 83—99.

35. Bodenstein G., Praetorius Н.М. Feature extraetion from th.e electroencephalogram by adaptive segmentation // Proceedings IEEE. 1977. No. 5, pp. 642-652.

■ 36. Сенин А.Г. Распознавание случайных сигналов. Новосибирск: Наука, Сибирское отд., 1974, 76 с. ^ 37. Шпилевский Э.К. Динамическая классификация стохастических процессов и систем. 1,11 // Автоматика и телемеханика. 1980. * II, с. 45-52. № 12, 45-54.

38. Willsky A.S. A survey of design methods for failure detection in dinamic systems // Automática. 1976. Vol. 12, pp. 601-611.

39. Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов. М.: Наука, 1983, 199 с.

40. Клигене Н., Телькснис Л. Методы обнаружения моментов изменения ^ свойств случайных процессов (обзор) // Автоматика и

телемеханика. 1983. J6 10. С. 5-56.

41. Обнаружение изменения свойств сигналов и динамических систем. Под ред. М. Бассевиль и А. Банвенисте. М.: Наука, 1989, 278 с.

42. Гуревич И.Б., Журавлев Ю.И. Минимизация булевых функций и эффективные алгоритмы распознавания // Кибернетика. 1974. № 3. С. 16-20.

43. Вайнцвайг М.Н. Алгоритм обучения распознаванию образов "Кора" // Алгоритмы обучения распознаванию образов. Под ред. В.Н. Вапника. М.: Советское радио, 1973, с. II0-II6.

♦ *

44. Журавлев Ю.М. Корректные алгебры над* множествами неккорректных (эвристических) алгоритмов. 1,11,111 //Кибернетика. 1977. № 4, с. 14-21. 1977. J6 6, с. 21-27. 1978. Я 2, с. 35-43.

45. Журавлев Ю.М. Об алгебраическом подходе к решению- задач распознавания и классификации // Проблемы кибернетики. Вып. 33. М.: Наука, 1978, с. 5-68.

46. Фу К.О. Структурные методы в распознавании образов. М.: Мир, 1977, 319 с.

«

47. Завалишин Н.В., Мучник И.Б. Модели зрительного восприятия и m алгоритмы анализа изображений. М.: Наука, 1974, 344 с.

48. Автоматический анализ сложных изображений. Под ред. Э.М. Бравермана. М.: Мир, 1969, 309 с.

49. Функциональные системы организма. Под ред. К.В. Судакова. М.: Медицина, 1987, 432 с.

50. Агаян Г.Ц. Квантовая модель системной организации целенапрвленной деятельности человека. Ереван: Айастан, 1991, 224 с.

51. Акаике X. Развитие статистических методов /'/ Современные л методы идентификации систем. Под ред. П. Эйкхоффа. М.: Мир,

^ 1983, с. 148-176.

52. Андерсон Т.В. Статистический анализ временных рядов. М.: Мир, 1971.

53. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. Вып. 1,2. М.: Мир, 1971.

54. Бокс Дж., Лденкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1,2. М.: Мир, 1974.

55. Современные методы идентификации систем. Под ред. П. Эйкхоффа. М.: Мир, 1983.

56. Распознавание образов и медицинская диагностика. М.: Наука, % ^ 1972, 172 с.

% #

57. Grauper D.t Magnussen Т., Beex A. A "microprocessor system for multifunctional control of upper limb prostheses via EMG signal identification // Proc. of the 4th International Joint Oonf. on Pattern Recognition IAPR. Kioto, Japan, 1978, pp. 1113-1117.

58. Мак-Куиллин P., Бекон M., Барклай У. Введение в сейсмическую л интерпретацию. М.: Недра, 1985, 309 с.

щ 59. Lehmann E.L. Efficient likelihood estimators // American Statistician. 1980. Vol. 34, pp. 233-235.

** 60. Lehmann E.L. Theory of point estimation. New York: Wiley, 1983.

61. Миленький A.B. Классификация сигналов в условиях неопределенности. М.: Советское радио, 1975, 237 с.

62. Шлезингер М.И. Взаимосвязь обучения и самообучения в распознавании образов /7 Кибернетика. 1968. № 2. С. 81-88.

63. Teicher Н. Identiflability of mixtures // Ann. Math. Stat. 1961. Vol. 32, pp. 244-248.

* 64. Teicher H. Ident inability of finite mixtures // Ann. Math.

4 Stat. 1963. Vol. 34. No. 4, pp. 1265-1269.

65. Teicher H. Identiflability of mixtures of product measures // Ann. Math. Stat. 1967. Vol. 38. No. 4, pp. 1300-1302.

66. Jakowits S.T., Spragins J.D. On the Identifiability of finite mixtures // Ann. Math. Stat. 1968. Vol. 39. No. 1, pp. 209-214.

67. Вазан M. Стохастическая аппроксимация. M.: Мир, 1972.

68. Robb ins H., Monro S. A stochastic approximation method // Ann. Math. Stat. 1951. Vol. 22. No. 1.

69. Kiefer E., Wolfowitz J. Stochastic estimation of the maximum of a regression function // Ann. Math. Stat. 1952. Vol. 23.

* ^ No. 3.

70. Hlghleyman W.H. Linear decision functions with application to pattern recognition // Proc. IRE. 1962. NO. 6.

71. Логинов В.И., Хургин Я.И. Общий подход к проблеме распознавания образов // Сб. трудов ММНХ и ГП. Вып. 62. М.: Недра, 1966.

72. Вапник В.Н., Червоненкис А.Я. Об одном классе алгоритмов обучения распознаванию образов // Автоматика и телемеханика. 1964. Я 6.

73. Вапник В.Н., Червоненкис А.Я. Алгоритмы с полной памятью и рекуррентные алгоритмы обучения распознаванию образов // Автоматика' и телемеханика. 1968. № 4.

74. Вапник В.Н., Червоненкис А.Я. О равномерной сходимости частот появления событий к их вероятностям // Теория вероятностей и. ее применения. 1971. Т. XVI. № 2.

75. Вапник В.Н., Червоненкис А.Я. Теория равномерной сходимости частот появления событий к их вероятностям и задача поиска оптимального решения по эмпирическим данным // Автоматика и телемеханика. 1971. $2.

76. Фомин В.Н. Стохастические аналоги конечно-сходящихся алгоритмов обучения опознающих систем // Вычислительная техника и вопросы программирования. Вып. 6. Л.: 1971, с. 68-87.

77. Козинец В.Н. Об одном алгоритме обучения линейного перцептрона // Вычислительная техника и вопросы программирования. Вып. 3. Л.: 1964, с. 80-83.

78. Козинец Б.Н. Рекуррентный алгоритм разделения двух множеств // Алгоритмы общения распознаванию образов. М.: 1973, с. 43-49.

79. Page E.S. Continuous inspection schemes /7 Biometrica. 1954. Vol. 41 , pp. 100-114-.

80. Isermann R., Appel W. , Preyermuth В., Fuchs A., Janik W.,

. Neumann D., Reiss Th., Wanke P. Model based fault diagnosis

% *

and supervision of machines and drives // Preprints of the 11-th IFAC World Congress, Tallinn, Estonia, USSR, August 13-17, 1990. Vol. 7, pp. 1-12.

81. Lipeika A. On the determination of change-points in multivariate autoregressive sequences // Preprints of the Second IPAG Symposium on Stochastic Control. Vilnius, USSR, 19-23 May, 1986. Part II, pp. 224-226.

82. Липейка А., Липейкене И. Использование метода, динамического программирования для определения нескольких моментов изменения

** свойств авторегрессионных случайных, последовательностей //

i

Статистические проблемы управления. Вып. 83. Вильнюс: Интситут математики и кибернетики АН ЛитССР, 1988, с. 193-197.

83. Stone Н. Approximation of curves by line segments // Mathematical Computation. 1961. Vol. 15. No. 6, pp. 40-47.

84. Bellman R. On the approximation of curves by line segments using dynamic programming // Comm. ACM. 1961. Vol. 4. No. 6, p. 284.

^ 85. Иванова Т.О. Определение числа классов в составе случайного V процесса- авторегрессии со скачкообразно изменяющимися свойствами методом проверки статистических гипотез. // Статистические проблемы управления. Вып. 89. Вильнюс: Институт маткматики и кибернетики АН ЛитССР, 1990, с. 168-174.

86. Иванова Т.О. Разработка и практическое использование алгоритмов выбора статистической модели структурной кривой. Канд. дисс. Москва, Институт проблем управления, 1991.

87. Telksnys L.A. Determination of changes In the properties of random processes by the Bayes method // Proceedings of the second IFAC Symposium on Identification and System Parameter

w Estimation, Hague/Delft, the Netherlands, 1973.

88. Телькснис Л.А. Измерение параметров распределений случайных процессов методом Байеса // Теория и практика измерений статистических (вероятностных) характеристик. Материалы I Всесоюзной конференции. Ленинград, 1973, с. 87-96.

89. Telksnys L.A. Determination of changes in the properties of random processes with incomplete a,priori data // Preprints of the VI IPAC World Congress. Boston/Cambridge, Massachusetts, USA, August 24-30, 1975.

90. Ширяев A.H. К обнаружению разладки производственного процесса ^ // Теория вероятностей и ее применения. 1963. Т. 8. Вып. 3,

с. 264-281. Вып. 4, с. 431-443.

91. Ширяев А.Н. Некоторые точные формулы в задачах о разладке // Теория вероятностей и ее применения. 1965. Т. 10. Вып. 2, с. 380-385.

92. Lorden G. Procedures for reacting to a change in distribution // Ann. Math. Stat. 1971. Vol. 42. No. 6, pp. 1897-1908.

93. Hlnkley D.V. Inference about the change-point from cumulative sum tests // Biometrika. 1971. Vol. 58. No. 3, pp. 509-523.

^ 94. Basseville M., Espiau B. Edge detection using sequential methods for change in level. Parts I,II // IEEE Trans, on ASSP. 1981. Vol. ASSP-29. No. 1.

95. Лумельский В.Я. Один алгоритм обнаружения момента времени изменения свойств случайного процесса // Автоматика и телемеханика. 1972. Ji 10. С. 67-73.

96. Никифоров И.В. Применение кумулятивных сумм для обнаружения изменения характеристик случайного процесса /У Автоматика и телемеханика. 1979. $ 2. С. 48-58.

97. Wlllsky A.S., Jones H.L. A generalised likelihood ratio ** W approach to the detection and estimation of Jump in linear

+ *

systems // IEEE Trans, on Aut. Control. 1976. Vol. AC-21. No. 1, pp. 108-112. r 98. Basseville M., Benveniste A. Sequential detection of abrupt changes in spectral characteristics of digital signals ■// IEEE Trans, on Inf. Theory. 1983. Vol. 20. No. 5, pp. 709-723.

99. Basseville M., Benveniste A. Sequential segmentation of nonstationary digital signals using spectral analysis // IEEE

^ Trans, on Inf. Theory. 1983. Vol. 20, pp. 57-73.

100. Bodenstein G., Praetorius H.M. Feature extraction from the encephalogram by adaptive segmentation //' Proc. IEEE. 1977. Vol. 65, pp. 642-652.

101. Segen J., Sanderson A.C. Detecting changes In a time series // IEEE Trans, .on Inf. Theory. 1980. Vol. IT-26. No. 2,

SP"

pp. 249-255. i t

102. Jones R.,H., Crowell D.H., Kapuniai L.E. Change detection model for serially correlated multivariate data // Biometrics. 1970. Vol. 26. No. 2, pp. 269-280.

о

ф 103. Вородйин Л.И., Моттлв В.В. Алгоритм обнаружения моментов ^ изменения параметров уравнения случайного процесса //

Автоматика и телемеханика. 1976. JI 6, с. *$3-32.

104. Большаков И.А. Статистические проблемы выделения потока сигналов из шума. М.: Советское радио, 1969, 464 с.

105. Уилкс С. Математическая статистика. М.: Наука, 1967, 632 с.

106. Буробин Н.В., Моттль В.В. Алгоритмы оптимальной регистрации событий в, реальном времени // Автоматика и телемеханика. 1987. # 2, с. II9-I28.

»

106. Костров Б.В. Механика очага тектонического землетрясения. М.: Наука, 1978, 83 с.

* f

107. Мансуров M.C. Сейсмология и сейсмометрия. М.: Знание, 1982, 48 с.

108. Никольский М.Н. Организация систем регистрации и обработки сейсмических данных с применением алгоритмов автоматического выделения событий. Кандидатская диссертация. Петропавловск-Камчатский, Институт вулканологии ДВНЦ АН СССР, 1986.

109. Судаков К.В. Функциональные системы организма как объект ^ физиологического анализа // Вестник АМН СССР, 1985, No. 2,

с. З-И.

л

НО. Судаков К.В. Общая теория функциональных систем. М., 1984.

111. Агаян Г.Д. Изучение системных механизмов сомато-вегетативного обеспечения целенаправленной деятельности человека. Докторская диссертация. Москва, 1981.

112. Агаян Г.Ц. Системные механизмы стадии эфферентного синтеза в целенаправленных поведенческих актах человека // Вестник АМН СССР, 1985, No. 2, с. 53-60.

113. Агаян Г.Ц., Моттль В.В., Мучник И.Б. Иерархическая дискретная Ш модель данных физиологических экспериментов // Биологический

журнал Армении, 1988, No. 3, с. I79-I9I.

114. Агаян Г.Ц., Иванова Т.О., Моттль В.В., Мучник И.Б. Алгоритмы анализа данных физиологических экспериментов // Биологический журнал Армении, 1988, No. 7, с. 547-556.

115. Агаян Г.Ц., Иванова Т.О., Моттль В.В., Мучник И.Б. Исследование элементарных программ действия в составе процесса длительного поддержания позы человеком .// Биологический журнал Армении, 1989, No. 4, с. 353-363.

116. Агаян Г.Ц., Иванова Т.О., Моттль В.В., Мучник И.Б. Исследование иерархии программ действия в процессе длительного

*. »

поддержания позы человеком // Биологический журнал Армении, 1989, No. 9, с. 363-373.

117. Иванова Т.О. Разработка и практическое использование алгоритмов выбора статистической модели структурной кривой. Кандидатская диссертация. Москва, Институт проблем управления, 1991.

118. Гурфинкель B.C., Коц Я.М., Шик М.Л. Регуляция позы человека. ^ М.: Наука, 1965.

119. Закс Л. Статистическое оценивание. М.: Статистика, 1976.

Ф 120. Вуд Л., Трейтел С. Обработка сейсмических сигналов // ТИИЭР, 1975, т..63, No. 4, с. 125-140.

121. Терайен C.B., Куатьерри Т.Е., Даджеон Д.Е. Алгоритмы анализа изображений, основанные на статистических моделях // ТИИЭР, 1986, т. 74, No. 4, с. 532-551.

122. Моттль В.В., Мучник И.Б. Сегментация и оценивание параметров .случайных полей со скачкообразно изменяющимися свойствами //

I

Статистические проблемы управления. Вып. 83. Вильнюс, Инстиут £ математики и кибернетики АН ЛитССР, 1988. С. 252-256.

Фч 123. Моттль В.В., Мучник И.Б. Параллельные алгоритмы анализа условно марковских случайных полей // Тезисы докладов 3-ей Всесоюзной конференции "Математические методы распознавания образов". Часть II. Львов, 1987. С. 16-17.

124. Гришин М.В. Оптимальное нелинейное оценивание на плоскости //' Автоматика и телемеханика. 1985. № 3. С. 45-52.

125. Коуэлмен Г.Б., Эндрюс Х.С. Сегментация изображений при помощи автоматической классификации // ТИИЭР. 1979. Т.67. № 5. С. 82—98.

126. Розенфельд А., Дейвис Л.С. Сегментация и модели изображений /7 % у ТИИЭР. 1979.Д.67. Л 5.

% *

127. Харалик P.M. Статистический и структурный подходы к описанию текстур /7 ТИИЭР. 1979. Т.67. Л 5.

128. Джайн А.К. Успехи в области математических моделей для обработки изображений // ТИИЭР. 1981. Т.69. $ 5. С. 9-39.

129. Прет У.К., Фожара О.Д., Гагшалович А. Применение моделей стохастических текстур для обработки изображений // ТИИЭР. 1981. Т.69. Jfe 5. С. 64-54.

^ 130. Вайнберг Я.М. Статистические методы расчленения неоднородных объектов с использованием марковских условных вероятностей // Геология и геофизика. 1982. Л 7. С. I12-120.

131. Функциональный анализ. Под ред. С.Г. Крейна. М.: Наука, 1972, 544 с.

132. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 1,2. М.: Мир, 1984.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.