Методология поиска логических закономерностей в предметной области с нечеткой системологией: На примере клинико-экспериментальных исследований тема диссертации и автореферата по ВАК РФ 05.13.01, доктор технических наук Дюк, Вячеслав Анатольевич

  • Дюк, Вячеслав Анатольевич
  • доктор технических наукдоктор технических наук
  • 2005, Санкт-Петербург
  • Специальность ВАК РФ05.13.01
  • Количество страниц 309
Дюк, Вячеслав Анатольевич. Методология поиска логических закономерностей в предметной области с нечеткой системологией: На примере клинико-экспериментальных исследований: дис. доктор технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Санкт-Петербург. 2005. 309 с.

Оглавление диссертации доктор технических наук Дюк, Вячеслав Анатольевич

ВВЕДЕНИЕ.

1. АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ ПОИСКА ЗАКОНОМЕРНОСТЕЙ В ПРЕДМЕТНОЙ ОБЛАСТИ С НЕЧЕТКОЙ СИСТЕМО ЛОГИЕЙ.

1.1. Специфика предметных областей с нечеткой системологией.

1.2. Современные подходы к "обнаружению знаний в базах данных". 1.3. Методы поиска логических закономерностей в данных. 1.4. Тестирование систем поиска логических закономерностей.

1.5. Выводы.

2. ПОИСК IF-THEN ПРАВИЛ В ДАННЫХ НА ОСНОВЕ ПРЕДСТАВЛЕНИЙ ЛОКАЛЬНОЙ ГЕОМЕТРИИ.

2.1. Используемые понятия и обозначения.

2.2. Общие положения локальной геометрии.

2.3. Построение локальной метрики как задача отбора переменных

2.4. Поиск логических закономерностей средствами линейной алгебры и интерактивной графики.

2.5. Эффект информационного структурного резонанса.

2.6. Возможности и перспективы разработанного подхода.

• 2.7. Выводы.

3. ИССЛЕДОВАНИЕ СТРУКТУРЫ МНОЖЕСТВА ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ НА ОСНОВЕ ГЕОМЕТРИЧЕСКИХ ПРЕДСТАВЛЕНИЙ.

3.1. D '-преобразование как мера расстояний между логическими правилами

3.2. Методы визуализации данных.

3.3. Алгоритмы автоматического группирования.

3.4. Примеры отображения структуры множества логических правил . 200 Ф 3.5. Выводы.

4. АЛГОРИТМИЗАЦИЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ.

4.1. Общие характеристики системы Deep Data Diver.

4.2. Работа с системой.

4.3. Подсистема поиска ассоциаций в данных.

4.4. Результаты исследования алгоритма.

4.5. Выводы.

5. ПРАКТИЧЕСКИЕ ПРИМЕРЫ. ф 5.1. Прогнозирования продолжительности жизни пациентов, 251 перенесших сердечный приступ, по данным эхокардиограммы

5.2. Прогнозирование характера ремиссии у больных бронхиальной астмой по результатам исследования плазмы крови методом лазерной корреляционной спектроскопии.

5.3. Диагностика заболеваний почек по данным ультразвукового 262 исследования.

5.4. Прогнозирование продолжительности ремиссий при алкоголизме

5.5. Исследование влияния экзогенных и эндогенных факторов на выраженность гемодепрессивного эффекта субтотального облучения тела у больных злокачественными лимфомами. ф 5.6. Выводы.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методология поиска логических закономерностей в предметной области с нечеткой системологией: На примере клинико-экспериментальных исследований»

Развитие современных систем поддержки принятия решений в различных предметных областях со сложной системной организацией идет по пути наращивания возможностей аналитических инструментов баз и хранилищ данных. Важная роль здесь отводится системам "обнаружения знаний в базах данных", реализующим методы автоматического поиска закономерностей в данных, так называемые методы "раскопки данных" (Data Mining).

В самом общем виде Data Mining - это задача обработки баз данных (БД) с целью перехода к базам знаний (БЗ). В БД накапливаются и хранятся эмпирические факты из исследуемой предметной области (фактические данные, примеры экспертных заключений, элементарные высказывания с некоторой оценкой и т.п.), представленные в виде троек собъект-признак-значение признаках В БЗ заносятся сведения, выражающие закономерности структуры множества эмпирических фактов, релевантные прикладному контексту.

Контекст определяет отношения между объектами из БД. Он может задаваться извне БД (например, экспертом) и также продуцироваться признаком или совокупностью признаков из БД. Чаще всего на практике встречаются отношения эквивалентности и порядка. Отношения эквивалентности присущи, в частности, задачам классификации, диагностики и распознавания образов. Отношения порядка свойственны задачам шкалирования, прогнозирования и т.п.

Методы Data Mining имеют много общего с методами решения упомянутых задач классификации, диагностики и распознавания образов. Но их одной из главных отличительных черт является функция интерпретации закономерностей, кладущихся в основу правил вхождения объектов в классы эквивалентности. Поэтому сегодня все большее распространение получают логические методы, например, "эмпирического предсказания" (Загоруйко Н.Г.,

1979), "индуктивного формирования понятий" (Гладун В.П., 1977; Ханти др., 1970), "построения квазиаксиоматической теории" (Финн В.К., 1991) и др.

Есть еще одна важная причина, обусловившая приоритет логических методов. Она заключается в сложной системной организации областей, составляющих предмет приложения современных информационных технологий. Эти области относятся, как правило, к надкибернетическому уровню организации систем (Boulding К.Е., 1956; Поляков А.О. и др., 2000), закономерности которого не могут быть достаточно точно описаны на языке статистических или иных аналитических математических моделей (Дж. Ван Гик, 1981). Гибкость и многообразие логических конструкций индуктивного вывода позволяют нередко добиваться успешных результатов при описании таких сложных систем.

Вместе с тем, главной проблемой создания таких конструкций остается комбинаторная проблема в пространстве элементарных логических событий. При этом отмечается, что совершенно не ясно, как можно распараллелить символьную операцию логического вывода. Отсюда применение логических" методов часто вынуждено опираться на эвристические соображения, не имеющие строгого обоснования.

Описанными выше обстоятельствами обусловлена актуальность разработки новых подходов к поиску логических закономерностей в данных.

Альтернативу логическим символьным методам составляет геометрический подход, использующий язык геометрических соотношений между эмпирическими фактами, выступающими целостными информационными единицами и отображаемыми точками в пространстве признаков. Это, с одной стороны, делает более прозрачными критерии и принципы построения правил вхождения объектов в определенные классы эквивалентности, которые основываются на сравнении объектов с помощью мер, имеющих интерпретацию расстояний. С другой стороны, следует иметь в виду, что использование геометрического подхода при неограниченном расширении множества эмпирических фактов автоматически приводит к минимальным теоретически достижимым ошибкам принятия решений. Кроме того, многие операции легко распараллеливаются, а визуализация геометрической структуры множества точек позволяет организовать исследование логических закономерностей в совокупности эмпирических фактов средствами интерактивной когнитивной графики. Важность геометрического подхода к решению задач искусственного интеллекта неоднократно подчеркивалась Д.А. Поспеловым.

В отличие от символьных логических методов, реализующих операции над признаками (интенсиональный подход), в геометрическом подходе главными элементами выступают объекты (экстенсиональный подход), а основным видом операций является операция определения расстояния между объектами в многомерном пространстве признаков. Геометрический и логический подходы составляют оппозицию, которой соответствует ряд других оппозиций: конкретное-абстрактное, параллельное-последовательное, синтез-анализ, дискретное-непрерывное, безусловное-условное, экстенсиональное-интенсиональное представление знаний, интуитивное-рациональное, правополушарный-левополушарный механизмы мышления и т.п.

В современном представлении логические закономерности, характерные для объектов определенного класса, интерпретируются как геометрические системы инцидентностей в пространстве комбинаторных ситуаций типа "точка Р лежит на линии L" или "линия L содержит точку Р". Простейшими геометрическими комбинаторными системами являются конечные плоскости (системы инцидентности двух конечных множеств линий и точек), подчиненных системе аксиом проективной геометрии. Вместе с тем, теория геометрических комбинаторных систем в настоящее время не разработана в достаточной мере. Прозрачность геометрической интерпретации комбинаторной проблемы поиска логических закономерностей в данных не привела к ясной и продуктивной методологии такого поиска.

Целью настоящей диссертации является разработка методологии обнаружения логических закономерностей в данных на основе геометрического подхода.

Для реализации поставленной цели в диссертации решались следующие задачи:

1. Разработка теоретических основ, методов и алгоритмов поиска логических закономерностей в данных на базе геометрических представлений.

2. Разработка методов исследования структуры множества логических закономерностей на основе геометрических представлений.

3. Разработка и сравнительное исследование программной реализации технологии поиска логических закономерностей в данных на основе геометрических представлений.

4. Решение диагностических и прогностических задач из области клинико-экспериментальных исследований с помощью разработанной методологии.

Методы исследования основаны на использовании аппарата прикладной статистики, теории нечетких множеств, теории распознавания образов, имитационного моделирования. Результаты исследований получены путем теоретических и компьютерных расчетов, ориентированы на создание конкретных алгоритмических и программных средств, их апробацию и внедрение.

Положения, выносимые на защиту. 1. Сформированы теоретические основы методологии поиска логических закономерностей в данных высокой размерности на основе представлений локальной геометрии. 2. Разработана технология поиска if then правил в данных, основанная на комбинированном применении аппарата линейной алгебры и средств интерактивной графики. 3. Исследован эффект информационного структурного резонанса в многомерных данных и предложена схема активного формирования и использования этого эффекта. 4. Предложен подход, позволяющий исследовать совокупность if-then правил на основе геометрических представлений.

5. Разработан подход, позволяющий оперировать анализируемыми объектами с нечётким описанием. 6. Получены специальные формулы для формирования локального бинарного пространства, использование которых позволяет реализовывать правило обхода пропусков в многомерных данных.

6. Разработан и исследован специализированный подход "данные + шум", использование которого улучшает сходимость процесса поиска закономерностей и повышает стабильность получаемых решений.

Научная новизна работы определяется практически полным отсутствием методологии поиска логических закономерностей на основе геометрических представлений в экспериментальных данных высокой размерности. Все выносимые на защиту положения имеют научную новизну.

В первой главе описывается специфика и дается определение предметных областей с нечеткой системологией, приводится обзор современных подходов и методов Data Mining, предназначенных для автоматического обнаружения закономерностей в базах данных, рассматриваются известные алгоритмы поиска логических закономерностей в данных, и с помощью специально разработанного комплекса тестов высвечиваются основные проблемы этих алгоритмов.

Делается вывод, что, несмотря на обилие методов Data Mining, приоритет постепенно все более смещается в сторону алгоритмов поиска в данных if-then правил. С их помощью решаются задачи прогнозирования, классификации, распознавания образов, сегментации БД, извлечения из данных "скрытых" знаний, интерпретации данных, установления ассоциаций в БД и др. Результаты таких алгоритмов эффективны и имеют прозрачную интерпретацию.

Описывается разработанный комплекс тестов для оценки алгоритмов поиска логических закономерностей в данных, включающий тесты на "умение решать очевидные задачи", тесты на "умение находить наиболее полные и точные правила" и тесты на "ложные закономерности".

Разработанный комплекс тестов показал, что наиболее популярные аналитические инструменты Data Mining, реализующие деревья решений или ограниченный перебор в пространстве комбинаторных ситуаций, в ряде случаев не способны решать даже простейшие очевидные задачи. Они выявляют лишь неточные фрагменты истинных логических закономерностей в данных и не могут отличать "ложные закономерности" от устойчивых регулярностей. Кроме того, известные системы для поиска if-then правил не поддерживают функцию обобщения найденных правил и функцию поиска оптимальной композиции таких правил. Вместе с тем, указанные функции являются весьма существенными для построения баз знаний, требующих умения вводить понятия, метапонятия и семантические отношения на основе множества фрагментов знаний о предметной области.

Выявлены и разобраны основные проблемы методов поиска логических закономерностей в данных. Общая проблема для традиционных методов — проблема "первого шага" (сегментация признаков). Известные алгоритмы поиска if-then правил допускают ошибку уже в самом начале своей работы, используя при сегментации эвристические допущения для ограничения дальнейшего перебора. В диссертации обоснован тезис, что первый шаг работы алгоритма, претендующего на "высокий результат", должен заключаться в максимально мелком (с учетом доступных вычислительных мощностей) разбиении исходных признаков на интервалы.

Кроме того, как показало проведенное исследование, в настоящее время до сих пор не разработан вопрос о критерии для оценки систем поиска логических закономерностей в данных. В главе сформулирован такой критерий. Он основан на том, что эффективность какой-либо системы для поиска if-then правил определяется способностью находить за приемлемое время наиболее полные при заданной точности правила для каждой записи базы данных.

Выявленные проблемы явились побудительным мотивом для разработки принципиально нового подхода к решению задачи поиска логических закономерностей данных.

Вторая глава посвящена теоретическим основам технологии поиска логических закономерностей в данных. Здесь даны представления о локальной геометрии и показано, что задача поиска логических закономерностей может быть сведена к задаче конструирования контекстно-зависимых локальных метрик для различных объектов выборки.

Описанные в главе свойства локального пространства позволяют использовать для определения локальных контекстно-зависимых метрик аппарат линейной алгебры, применяемый в ряде методов многомерного анализа данных. В выборе конкретного многомерного метода конструирования локальных взвешенных метрик для объектов обучающей выборки, который сводится к построению линейной модели с неотрицательными коэффициентами, исследователю на первый взгляд предоставляется большой простор. Однако, как показало специально проведенное исследование, наиболее продуктивной зарекомендовала себя процедура, основанная на комбинированном применении методов линейной алгебры и средств интерактивной графики. Одним из наиболее важных моментов в этой процедуре обработки данных является смещение акцента на манипулирование объектами выборки, часть из которых по результатам визуального анализа исключаются из текущей обработки.

Испытание разработанной процедуры поиска логических закономерностей с использованием представлений локальной геометрии и средств интерактивной графики на ряде высоразмерных тестовых задач показало, что данная процедура приводит к результатам, существенно превосходящим результаты известных алгоритмов построения деревьев решений и реализующих ограниченный перебор. Более того, показанные результаты оказались близкими или совпадающими по полноте и точности найденных и логических закономерностей с результатами, которые можно получить лишь полным комбинаторным перебором. Дальнейшее исследование предложенной процедуры показало, что ее высокая эффективность может быть объяснена с позиций резонансных явлений.

В главе сформулировано определение информационного структурного резонанса как явления резкого изменения значения показателя, характеризующего гомологию группировок объектов, на некотором шаге алгоритма агрегации многомерной информации. Описаны общие аспекты информационного резонанса - среда, возбудитель резонанса и наблюдаемое явление. С позиций информационного структурного резонанса предложена и детально описана схема активного формирования этого резонанса в локальной области пространства признаков.

В главе с позиций геометрического подхода рассмотрен и проанализирован вариант нечеткого представления логических правил. Его основное отличие заключается в том, что функции принадлежности строятся не на субъективных оценках и мнениях экспертов, а на эмпирических распределениях расстояний объектов выборки до логического правила. Другое важное отличие связано с интерпретацией нечеткости. Нечеткое логическое правило в представлениях локальной геометрии позволяет оперировать нечеткими интервалами -расстояние от объекта до логического правила для количественных признаков имеет смысл смещения границ интервалов, описываемых элементарными логическими событиями.

Кроме того, предложены специальные формулы формирования локального бинарного пространства, использование которых позволяет процедуре интерактивного поиска логических закономерностей реализовывать правило обхода пропусков в данных.

Предложен прием "данные + шум", использование которого, с одной стороны, способствует более "плавной" сходимости процедуры интерактивного поиска логических закономерностей. С другой стороны, "шумящие" объекты выполняют важную функцию фальсификаторов, "столкновение" с которыми способствует повышению робастности получаемых решений.

Рассмотрены возможности поиска методами локальной геометрии сложных шаблонов с джокерами, имеющих переменный период в последовательностях чисел и символов, которые представляют интерес для целого ряда областей, например, в биологии и медицине. Особую ценность данные методы, по-видимому, имеют в современных молекулярно-генетических исследованиях, в которых наступил этап выяснения функционального смысла различных участков секвенированной ДНК. Кроме того, методы локальной геометрии продемонстрировали принципиальную возможность получения новых результатов при анализе электрофизиологических измерений.

В третьей главе рассмотрены вопросы исследования структуры множества логических закономерностей на основе геометрических представлений. Здесь привлекательным является использование мощного и хорошо развитого аппарата компьютерного анализа структур многомерных данных, опирающегося на геометрическую метафору. Единственным препятствием для этого служит лишь то, что каждому логическому правилу в разработанном подходе соответствует собственная, специально сконструированная локальная метрика (собственное описание), а не общее пространство признаков с одинаковыми для всех объектов метрическими свойствами.

Для преодоления отмеченного препятствия предложена специальная метрика, которая является мерой различия иерархий близости объектов обучающей выборки к сравниваемым логическим правилам. Иначе говоря, расстояние в предложенной метрике между двумя логическими правилами выражает различие отношений их сходства с объектами выборки. В главе показано, что эффективным приемом для перехода к этим расстояниям, не требующим подгонки аддитивной константы для удовлетворения метрической аксиомы неравенства треугольника, является вариант, основанный на сравнении двух ранговых последовательностей.

В результате проведенного аналитического обзора сделан вывод, что после перехода к предложенным метрикам для исследования структуры множества логических правил наиболее пригодны методы многомерного шкалирования и иерархические агломеративные процедуры кластерного анализа. Эти методы позволяют получать наглядные визуальные представления о геометрической структуре совокупности логических закономерностей, их результаты дополняют друг друга. При этом деревья, получаемые с помощью агломеративных иерархических процедур кластерного анализа, отображают метаструктуру исследуемых логических закономерностей, в которой на нижнем уровне находятся ранее найденные логические правила, а на более высоких уровнях эти правила объединяются в понятия и метапонятия.

Четвертая глава посвящена алгоритмизации и программной реализации разработанной методологии поиска логических закономерностей на основе представлений локальной геометрии. Одной из главных решенных проблем явилась алгоритмизация действий оператора, участвующего в процессе интерактивного поиска логических закономерностей в данных. Алгоритм, составляющий ядро вычислительной процедуры автоматического поиска if-then правил, представляет собой формализацию действий оператора, преобразующего средствами интерактивной графики выборку объектов в соответствии с разработанной схемой активного формирования информационного структурного резонанса.

В главе описано программное воплощение разработанной технологии — система Deep Data Diver. Эта система содержит следующие структурные блоки: мастер создания нового проекта, мастер формирования задания на поиск логических закономерностей в данных, процедура поиска логических правил в данных, мастер отображения результатов и манипулирования найденными логическими правилами, мастер сохранения и экспорта результатов.

Показано, что уникальные свойства системы Deep Data Diver позволяют находить в данных высокоточные ассоциации элементов исходного множества транзакций с заданным элементом. Множества ассоциаций с заданными элементами образуют корзины с высоким уровнем обеспечения (support) и длинным набором (long itemsets). На одних и тех же экспериментальных данных продемонстрировано, что система Deep Data Diver способна выявлять корзины с характеристиками обеспечения и длинами наборов в несколько раз превышающими результаты других известных систем. Этот факт послужил стимулом для разработки модификации системы Deep Data Diver, получившей название Big Basket.

В процессе многочисленных испытаний системы Deep Data Diver на экспериментальных данных из различных предметных областей было подтверждено важное свойство - способность находить лучшие или близкие к лучшим (наиболее полным при заданной точности) if-then правила для каждой записи базы данных. Такой вывод, с одной стороны, сделан на основании сравнения результатов с показателями других алгоритмов - каждый раз удавалось обнаруживать в данных существенно более полные логические правила (при заданной точности), чем выдавали известные программные продукты в области Data Mining. С другой стороны, для подтверждения указанного свойства было применено имитационное моделирование с применением разработанного и описанного ранее комплекса специальных тестов.

Одним из важнейших свойств любой программы, предназначенной для решения задач поиска логических закономерностей в данных, является его вычислительная сложность. Результаты тестирования системы Deep Data Diver продемонстрировали масштабируемость алгоритма поиска логической закономерности по отношению к отдельным параметрам таблицы данных, то есть линейную зависимость времени поиска от количества объектов или числа признаков в таблице анализируемых данных. Дальнейшие испытания алгоритма позволили дать оценку его сложности в задачах классификации как 0(/?N2).

В пятой главе рассмотрены практические примеры применения разработанной методологии для решения диагностических и прогностических задач клинико-экспериментальных исследований. Представленные примеры затрагивают различные актуальные области медицины - сердечно-сосудистые заболевания, лечение бронхиальной астмы, диагностика заболеваний почек, лечение алкоголизма, методики проведения лучевой терапии при онкологических заболеваниях. Характерной общей чертой этих примеров является то, что традиционные методы статистического анализа здесь показывают маловыразительные результаты при решении задач диагностики и прогнозирования. Вместе с тем, алгоритмы поиска логических закономерностей в экспериментальных данных практически во всех случаях приводят к продуктивному в той или иной мере, полезному решению. Это, в первую очередь, конечно, связано со спецификой медицины как предметной области с нечеткой системологией.

Во всех рассмотренных примерах проводилось сопоставление трех различных подходов к поиску логических закономерностей в данных -деревьев решений, ограниченного перебора комбинаторных ситуаций и разработанного нами подхода, основанного на представлениях локальной геометрии и использующего схему активного формирования информационного структурного резонанса. Система Deep Data Diver, реализующая геометрический подход, продемонстрировала существенные преимущества перед другими алгоритмами. Это выразилось, как в более высокой точности обнаруженных в данных логических закономерностей, так и в их более высокой полноте. Кроме того, в ряде случаев система Deep Data Diver выявила в данных гораздо более сложные логические правила (включающие большое количество элементарных логических событий), принципиально не доступные для их обнаружений другими известными алгоритмами. В целом разработанная методология поиска логических закономерностей в данных на основе представлений локальной геометрии достаточно убедительно продемонстрировала свою полезность и продуктивность в клинико-экспериментальных исследованиях.

Автор выражает глубокую признательность профессору, доктору технических наук Д.А. Поспелову, который в самом начале работы над проблематикой геометрического подхода к поиску логических закономерностей в данных отметил плодотворность этой разработки и поддержал автора ценными советами.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Дюк, Вячеслав Анатольевич

Основные результаты диссертационной работы

1. Сформулированы основные характеристики предметных областей с нечеткой системологией и показано, что для построения моделей принятия решения в таких областях важное значение приобретают алгоритмы поиска в данных логических закономерностей.

2. Разработан комплекс тестов для испытания алгоритмов поиска логических закономерностей в данных и сформулированы основные проблемы известных подходов.

3. Предложен новый критерий оценки эффективности алгоритмов поиска if-then правил в данных, который отражает способность алгоритма находить за приемлемое время наиболее полные при заданной точности правила для каждой записи базы данных

4. Разработаны теоретические основы технологии поиска логических закономерностей в данных на базе представлений локальной геометрии, в которых задача поиска логических закономерностей в данных сводится к конструированию локальных контекстно-зависимых метрик для объектов выборки.

5. Разработана технология поиска логических закономерностей в данных, основанная на комбинированном применении методов линейной алгебры и средств интерактивной графики. Показано, что высокая эффективность этой процедуры может быть объяснена с позиций резонансных явлений.

6. Дано определение информационного структурного резонанса и предложена схема активного формирования этого резонанса в локальном пространстве признаков.

7. Показано, что логическое правило в представлениях локальной геометрии позволяет оперировать нечеткими интервалами - расстояние от объекта до логического правила (опорного объекта в его собственной метрике) для количественных признаков имеет смысл смещения границ интервалов, описываемых элементарными логическими событиями.

8. Получены формулы для формирования локального бинарного пространства, использование которых позволяет процедуре интерактивного поиска логических закономерностей реализовывать правило обхода пропусков в данных.

9. Предложен прием "данные + шум", использование которого способствует более "плавной" сходимости процедуры интерактивного поиска логических закономерностей т повышению стабильность получаемых решений.

10. Показано, как методами локальной геометрии может быть решена проблема поиска сложных шаблонов с джокерами и изменяющимся периодом в последовательностях чисел и символов, которая представляет интерес для целого ряда областей, связанных с анализом временных и иных рядов.

11. Предложен подход, позволяющий исследовать структуру множества логических правил методами, опирающимися на геометрическую метафору.

12. Разработана программная реализация (система Deep Data Diver), в которой автоматизирована технология интерактивного поиска логических закономерностей в данных на основе представлений локальной геометрии.

13. Проведено сравнительное исследование эффективности разработанной методологии на ряде практических примеров из области клинико-экспериментальных исследований. Система Deep Data Diver продемонстрировала существенные преимущества перед другими алгоритмами.

Разработанная в диссертации методология поиска логических закономерностей в данных на основе представлений локальной геометрии отнесена к важнейшим результатам Российской академии наук в 1998 году и за период с 1997 по 2001 г.

ЗАКЛЮЧЕНИЕ

Список литературы диссертационного исследования доктор технических наук Дюк, Вячеслав Анатольевич, 2005 год

1. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. -М.: Статистика, 1974.

2. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.

3. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Статистическое оценивание зависимостей. М.: Финансы и статистика, 1985.

4. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. -М.: Статистика, 1989.

5. Аккерман Р.И., Далецкий К.П., Дюк В.А., Ефимов Ю.С., Полянкин Г.А. Диагностирование состояния колец ЦПГ ДГ14-10 виброакустическим методом//Морскойтранспорт, 7(555), 1983.-С. 12-16.

6. Аккерман Р.И., Далецкий К.П., Дюк В.А. Виброакустическое диагностирование топливной аппаратуры дизеля. Двигателестроение, 1984, № 2. С. 23-26.

7. Александров В.В., Алексеев А.И., Горский Н.Д. Анализ данных на ЭВМ (на примере системы СИТО). М.: Финансы и статистика, 1990.

8. Александров В. В., Лачинов В.И., Поляков А.О. Рекурсивная алгоритмизация кривой, заполняющей многомерный интервал // Изв. АН СССР: Техн. кибернетика, 1978, № 1. С. 192-197.

9. Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях: Монография. Тюмень: Издательство Тюменского государственного университета, 2000.

10. Алтунин А.Е., Чуклеев С.Н., Семухин М.В., Крел Л.Д. Методическое руководство по технологическим расчетам сложных систем газодобычи при неточных параметрах, Тюмень, 1984.

11. Альтшулер С.А., Козырев Б.М. Электронный парамагнитный резонанс. — М.: Наука, 1972.

12. Андрианов И.В., Маневич Л.И. Асимптология: идеи, методы, результаты. М: Аслан, 1994.

13. Аркадьев А. Г. Браверманн Э.М. Обучение машины классификации объектов. -М.: Наука, 1971.

14. Барабаш Б.А. Минимизация описания в задачах автоматического распознавания образов // Изв. АН СССР. Техн. кибернетика, № 3, 1964.

15. Беллман Р., Заде JI. Принятие решений в расплывчатых условиях // В кн.: Вопросы анализа и процедуры принятия решений. М.: Мир, 1976.

16. Блажис А.К., Дюк В.А. Телемедицина. СПб: "СпецЛит", 2000.

17. Бланк М.А., Бланк О.А., Дюк В.А. Гемодепрессивный эффект облучения человека // Доклады Академии Наук. 2003, том 393, № 3. - С. 1-3

18. Бланк М. А., Бланк О. А. Мониторирование основных показателей у онкологических больных // Вестник РАМН, №8. 2000. - С. 33-35.

19. Блишун А.Ф. Сравнительный анализ методов измерения нечеткости //Изв. АН СССР. Техн. кибернетика. 1988. N 5.- С. 152-175.

20. Блишун А.Ф., Знатнов С.Ю. Обоснование операций теории нечетких множеств. В кн.: Нетрадиционные модели и системы с нечеткими знаниями. -М.: Энергоатомиздат, 1991. С. 21-33.

21. Бодякин В.И. "Каждый выбирает сам как ему поступать и это его право священно" http://nicst.ipu.rssi.ru/stran/bod/every.htm.

22. Бонгард М.М. Проблема узнавания. М.: Наука, 1967.

23. Боннер Р.Б. Некоторые методы классификации // Автоматический анализ изображений. -М.: Мир, 1969. С. 205-234.

24. Борисов А.Н., Крумберг О.А., Федоров И.П. Принятие решений на основе нечетких моделей. Примеры использования. Рига: Зинатне, 1990.

25. Браверманн Э.М., Мучник И.Б. Структурные методы обработки эмпирических данных. — М.: Наука, 1983.

26. Будущее искусственного интеллекта // Под ред. К.Е. Левитина и Д.А. Поспелова. М.: Наука, 1991.

27. Букатова И. Л. Эволюционное моделирование и его приложения М.: Наука, 1979.

28. Варакин Л.Е. Системы связи с шумоподобными сигналами. М.: Радио и связь, 1985.

29. Вассерман Л.И., Дюк В.А., Иовлев Б.В., Червинская К.Р. Психологическая диагностика и новые информационные технологии. СПб: "СЛП", 1997.

30. Вейль Г. Математическое мышление. -М., 1989.

31. Вейр Б. Анализ генетических данных: Пер. с англ. М.: Мир, 1995.

32. Вертхейм Г. Эффект Мессбауэра. М.: Мир, 1966.

33. Викторов В.А. О развитии медико-технической науки // Журнал "Вестник РАМН" N5, 2001 г.-С. 3-7.

34. Воробьев В.М., Дюк В.А., Иовлев Б.В., Сенопальников Е.В., Чигирев В.А. Разработка автоматизированной системы массового обследования в профилактических целях // Журнал неврологии и психиатрии им.

35. С.С. Корсакова. JL: Психоневрологии, ин-т им. В.М. Бехтерева, 1981.• С. 137-141.

36. Воробьев В.М., Дюк В.А. Адаптивные свойства личности и принципы их машинной диагностики//Тез. докл. VI Всесоюзн. Съезда психологов. М.: 1983. - С. 223-224.

37. Воробьев В.М., Буров В.В., Дюк В.А. Опыт медико-психологического обследования некоторых контингентов молодежи//Здравоохранение РСФСР, 1982, №2.-С. 37-39.

38. Г.С.Осипов. Приобретение знаний интеллектуальными системами. М.: Наука. Физматлит, 1997.

39. Генкин А.А. Новая информационная технология анализа медицинских данных (программный комплекс ОМИКС). СПб: Политехника, 1999.

40. Гик Дж., ван. Прикладная общая теория систем. М.: Мир, 1981.

41. Главные компоненты временных рядов: метод "Гусеница" (Под ред. Д.Л.Данилова и А.А.Жиглявского). Санкт-Петербург Государственный университет, 1997.

42. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. -М.: Прогресс, 1976.

43. Горский Н. Д. Рекурсивный метод отображения многомерного ф пространства при решении задач хранения и обработки данных вавтоматизированных системах научных исследований. — Автореф. на соиск. уч. степ. канд. техн. наук. Л., 1981.

44. Десять лет спустя (интервью с Д. Мичи) // Будущее искусственного интеллекта. М.: Радио и связь. 1991. - С. 213-216.

45. Диксон Р.К., Широкополосные системы: пер. с англ./Под ред.

46. B.И.Журавлева. М., Связь, 1979 .

47. Дрейпер Н., Смит Г. Прикладной регрессионый анализ. Т. 1. М.: Машиностроение, 1988.

48. Дрейпер Н., Смит Г., Прикладной регрессионный анализ. Т.2. М.: Финансы и статистика, 1986.

49. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976.

50. Дэйвисон М. Многомерное шкалирование: Методы наглядного представления данных. -М.: Финансы и статистика, 1988.

51. Дюк В.А. Data Mining интеллектуальный анализ данных/ZByte (Россия), №9, 1999.-С. 18-24.

52. Дюк В.А. Data Mining технология золотых воротничков // Образование и карьера в Санкт-Петербурге, № 2, 2000. - С. 42-45.

53. Дюк В.А.Дюк А.В., Технологии Data Mining в социальных исследованиях/Информатика Исследования и Инновации. Выпуск 3, Межвузовский сборник научных трудов. - СПб: РГПУ им. А.И. Герцена, 1999. -С. 171-172.

54. Дюк В.А. Ключевые вопросы психологической диагностики//Тр. Межд. научн. конф. "Интеллектуальные системы и информационные технологии управления (Псков, 19-23 июня 2000 г.). СПб.: Изд-во СПбГТУ, 2000.1. C. 399-403.

55. Дюк В.А. Компьютерная психодиагностика. СПб: "Братство", 1994.

56. Дюк В.А. Новые информационные технологии в психодиагностике// Тр. V Межд. конф. "Региональная информатика-96", СПб, 1996. С. 261-267.

57. Дюк В.А. Новый класс метрик//Тез. докл. международн. конф. по бионическому моделированию. "Биомод-92", СПб, 1992. С. 231-233.

58. Дюк В.А. Обнаружение знаний в базах данных: проблемы и перспективы (заказной доклад) // Сб. трудов 1-го Регионального молодежного форума "Информационные технологии в XXI веке", 23-24 апреля 2003 г., Днепропетровск. С. 13-18.

59. Дюк В.А. Обнаружение знаний в базах данных: проблемы и перспективы // Мат. конф. "Инфокоммуникации. Подготовка кадров и кадровая политика", Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А.Бонч-Бруевича. 2003. 26-28.

60. Дюк В.А. Обработка данных на ПК в примерах. СПб: Питер, 1997.

61. Дюк В.А. Осколки знаний// Экспресс-Электроника, 2002, № 6. С. 60-65.

62. Дкж В.А. От данных к знаниям новые возможности обработки баз данных//Тр. Межд. научн. конф. "Интеллектуальные системы и информационные технологии управления (Псков, 19-23 июня 2000 г.). - СПб.: Изд-во СПбГТУ, 2000. - С. 438-440.

63. Дкж В.А. Поиск сложных непериодических шаблонов в последовательностях числе и символов методами локальной геометрии // Тр. СПИИРАН. 2002. - Т.2, № 1. - С. 263-268.

64. Дкж В.А. Проблемы применения формальных методов формирования метапонятий при концептуальном анализе знаний//Методы и средства принятия решений. Системы поддержки процессов проектирования на основе знаний. -Рига: Рижск. техн. ун~т, 1991. С. 90-95.

65. Дюк В.А. Разработка базы знаний экспертной системы для прогнозирования продолжительности ремиссий при алкоголизме // Материалы научно-практического семинара "Телемедицина становление и развитие", Санкт-Петербург, 2000. - С. 64-75.

66. Дюк В.А. Современные информационные технологии в психодиагностике: экстенсиональный подход альтернатива традиционной методологии//Тр. IV Межд. конф. "Региональная информатика-95", СПб, 1995. - С. 175-176.

67. Дюк В.А. Сравнение структуры интеллекта "физиков" и "лириков"// Тр. Межд. научн. конф. "Интеллектуальные системы и информационные технологии управления (Псков, 19-23 июня 2000 г.). СПб.: Изд-во СПбГТУ, 2000. - С. 403-406.

68. Дюк В.А. Тестирование систем для поиска if-then правил в данных // Материалы VIII Санкт-Петербургской международной конференции "Региональная информатика-2002", Часть 2, 2002. С. 42.

69. Дюк В.А. Технологии Data Mining в медико-биологических исследованиях. "Новости ИИ", № 3, 2004. - С. 15-23.

70. Дюк В.А. Формирование знаний в системах искусственного интеллекта: геометрический подход // Вестник академии технического творчества. СПб.: изд-во СПбГТУ, 1996, № 2. - С. 46-67.

71. Дюк В.А. Формирование знаний в системах искусственного интеллекта: геометрический подход (ч. 4, глава 2)/В кн. Телемедицина. Новые информационные технологии на пороге XXI века. СПб: "Анатолия", 1998. С. 367-389.

72. Дюк В.А., Воробьев В.М. Совершенствование автоматизированных методов обработки психологических измерений//Тез. докл. Всесоюзн. конф. по инженерной психологии. — JI.: ЛГУ им. А.А. Жданова, 1984. С. 58-60.

73. Дюк В.А., Ельяшевич A.M., Коваленко А.А., Петрова Е.Ю., Рейнин Г.Р., Филимонов А.В. О разработке типологического теста с применением методов распознавания образов//Соционические чтения, № 7(28), 1999. С. 1-2.

74. Дюк В.А., Калягина JI. Современные технологии "обнаружения знаний в базах данных". Вестник КрасГАУ, Научно-технический журнал, Выпуск 4. -Красноярск 2004.79. С. 27-33.

75. Дюк В.А., Мирошников А.И. Эволюция Statgraphics. Мир ПК, 1995, № 12. - С. 32-34.

76. Дюк В.А., Русаков Ю.М. Телемедицина // Экспресс-Электроника, № 9, 2002. С. 52-57.

77. Дюк В.А., Самойленко А.П. Data Mining: учебный курс. Изд-во "Питер", 2001.

78. Дюк В.А.,. Красильников И.А, Эмануэль B.JI. Информационные технологии в клинической лабораторной диагностике // Клиническая лабораторная диагностика, № 9, 2004. С. 16.

79. Дюк В.А., Эммануэль B.JI. Информационные технологии в медико-биологических исследованиях. Изд-во: "Питер", 2003.

80. Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов (Статистические методы классификации и измерения связи).-М.: Статистика, 1977.

81. Енюков И.С. Методы, алгоритмы, программы многомерного статистического анализа: Пакет 1111С А. -М.: Финансы и статистика, 1986.

82. Житков Г.Н. Некоторые методы автоматической классификации //Структурные методы опознавания и автоматическое чтение. М.: ВИНИТИ, 1970.-С. 68-85.

83. Загоруйко Н.Г. Методы распознавания и их применение. М.: Сов. радио, 1972.

84. Загоруйко Н.Г. Методика оценки информационной эффективности независимых параметров речевого сигнала // Тр. ИМ Сиб. отд. АН СССР: Вычислительные системы, 1964, вып. 10. С. 77-89.

85. Загоруйко Н.Г., Ёлкина В.Н., Лбов Г.С. Алгоритмы обнаружения эмпирических закономерностей. Новосибирск: Наука, 1985.

86. Загоруйко Н.Г. К вопросу об определении понятия закономерность. -Вычислительные системы, 1979, вып. 79. С. 3-6.

87. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М: Мир, 1976.

88. Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных // Computer Modelling & New Technologies, 2002, v. 6, N.l. P. 51-61.

89. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными системами.//К.: "Техника", 1975.

90. ЮО.Ивахненко А.Г. Самообучающиеся системы распознавания и автоматического регулирования-Киев: Техника, 1969.

91. Искусственный интеллект. В 3-х кн. Кн.1. Системы общения и экспертные системы: Справочник // Под ред. Э.В. Попова. - М.: Радио и связь, 1990.

92. Искусственный интеллект. В 3-х кн. Кн.2. Модели и методы: Справочник // Под ред. Д.А. Поспелова. - М.: Радио и связь, 1990 - 304 с.

93. Искусственный интеллект. В 3-х кн. Кн.З. Программные и аппаратные средства: Справочник // Под ред. В.Н. Захарова, В.Ф. Хорошевского. - М.: Радио и связь, 1990.

94. Капица С.П., Курдюмов С.П., Малинецкий Г.Г. Синергетика и прогнозы будущего. -М: Наука, 1997.

95. Кендалл М. Методы ранговой корреляции. -М.: Статистика, 1974. Юб.Кендалл М., Стъюарт А., Статистические выводы и связи. М.: Наука, 1973.

96. Киевский институт кибернетики, домашняя страничка разработчиков МГУА http://inf.kiev.ua/GMDH-home/.

97. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах // Открытые системы, № 4, 1997, С. 41-44.

98. Клайн М. Математика. Поиск истины. -М.: Мир, 1988.

99. Классификация и кластер // Под ред. Дж. Вэн Райзин. М.: Мир, 1980.

100. П.Клейн Ф. Лекции о развитии математики в XX столетии. М.-Л., 1937, ч. 1.

101. Койре А. Очерки истории философской мысли. Москва, 1985.

102. Колесов В.В. Отражение русского менталитета в слове // Человек в зеркале наук. Л.: ЛГУ, 1991. С. 106-124.

103. Кофман А. Введение в прикладную комбинаторику. М.: Наука, 1975.

104. Кофман А., Хил Алуха X. Введение теории нечетких множеств в управлении предприятиями. Минск: Вышэйшая школа, 1992.

105. Кречетов Н. Продукты для интеллектуального анализа данных. Рынок программных средств, № 14-15, 1997. - С. 32-39.

106. Крылов В.Ю. Метод многомерной геометризации психологических данных. Системный подход в математической психологии // Принцип системности в психологических исследованиях. М.: Наука, 1990. - С. 33-48.

107. Кузнецов А.С. Методы поиска оптимальных групп признаков при статистическом распознавании образов Л.: ВИКИ им. А. Ф. Можайского, 1982.-С. 14-23.

108. Кучин Б.Л., Алтунин А.Е. Информационные системы управления объектами газоснабжения. М: Недра, 1989.

109. Лбов Г. С. Выбор эффективной системы зависимых признаков // Труды Сиб. отд. АН СССР: Вычислительные системы.- Новосибирск, 1965, вып. 19. -С. 87-101.

110. Лбов Г.С. Методы обработки разнотипных экспериментальных данных. — Новосибирск: Наука, 1981.

111. Лбов Г.С., Котюков В.И., Манохин А.Н. Об одном алгоритме распознавания в пространстве разнотипных признаков. Вычислительные системы, 1973, вып. 55. - С. 98-107.

112. Литтл Р. Дж. А., Рубин Д.Б. Статистический анализ данных с пропусками. -М.: Финансы и статистика, 1991.

113. Лоули Д., Максвелл А. Факторный анализ как статистический метод. М.: Мир, 1967.

114. Малинецкий Г.Г. Нелинейная динамика и историческая механика. // Общественные науки и современность, 1997, N2. С. 99-111.

115. Малинецкий Г.Г. Синергетика. Король умер. Да здравствует король! -http://sky.kuban.ru/socioetno/iphrRAS/~mifs/index.htm.

116. Малинецкий Г.Г. "Историческая механика" и нелинейная динамика // Изв. ВУЗов, сер. Прикладная нелинейная динамика, 1997, т.5, N4. С. 76-88.

117. Манохин А.Н. Методы прогнозирования перспективности объектов, основанные на логических решающих функциях. Дисс. на соиск. учен. степ, канд. тех. наук. Новосибирск, Ин-т математики СО АН СССР, 1978.

118. Математические методы для анализа последовательностей ДНК: Пер. с англ. // Под ред. М.С. Уотермена М.: Мир, 1999.

119. Математические предвестники единства (Беседа члена-корреспондента Академии наук СССР С.П. Курдюмова с К. Левитиным) // "ЗС" № 10, 11/1988.

120. Миркин Б.Г. Анализ качественных признаков и структур. М.: Статистика, 1980.

121. Налимов В.В. Теория эксперимента. М.: Наука, 1971.

122. Нариньяни А.С. Недоопределенные модели и операции с недоопределенными значениями. Препринт ВЦ СО АН СССР, N 400, 1982.

123. Нариньяни А. С. Недоопределённость в системах представления и обработки знаний//Изв. АН СССР. Техн.кибернетика. 1986. №5. С.3-28.

124. Нечёткие множества в моделях управления и искусственного интеллекта // Под ред. Поспелова Д.А. М.: Наука, 1986.

125. Никифоров A.M., Фазылов Ш.Х. Методы и алгоритмы преобразования типов признаков в задачах анализа данных. Ташкент: Фан, 1988.

126. Онтология и эпистемология синергетики. М.: Институт философии РАН, 1997.

127. Орлов А.И. // Заводская лаборатория. 1990. Т.56. № 3. С.76-83

128. Орлов А.И. // Заводская лаборатория. 1995. Т.61. № 3. С.43-52.

129. Орлов А.И. Задачи оптимизации и нечеткие переменные. М.: Знание, 1980.

130. Орлов А.И. Общий взгляд на статистику объектов нечисловой природы: Анализ нечисловой информации в социологических исследованиях М.: Наука, 1985.

131. Паскаль Б. О геометрическом уме и об искусстве убеждать // Приложение к кн.: Стрельцова "Г.Я. Паскаль и европейская культура. Москва, 1994".

132. Поляков А.О. Технология интеллектуальных систем: Учебное пособие. СПб: СПбГТУ, 1995.

133. Попечителев Е. П., Романов С.В. Анализ числовых таблиц в биотехнических системах обработки экспериментальных данных. Л.: Наука, 1987.

134. Попов Э.В. Экспертные системы,- М: Наука, 1987.

135. Поппер К. Логика и рост научного знания. М.: Прогресс, 1983.

136. Поспелов Г.С. Искусственный интеллект основа новой информационной технологии: Сер. Академические чтения. -М.: Наука, 1988.

137. Поспелов Г.С., Ириков В.А. Системно-программное планирование. М.: Советское радио, 1975.

138. Поспелов Д.А. Логико-лингвистические модели в системахуправления-М.: Энергоиздат, 1981.

139. Поспелов Д.А. Моделирование рассуждений-М.: Радио и связь, 1989.

140. Поспелов Д.А. Моделирование человеческих рассуждений в интеллектуальных системах: Лекции Всесоюзной школы по основным проблемам искусственного интеллекта и интеллектуальным системам. Ч. 1. -Тверь: Центр программных систем, 1990.

141. Поспелов Д.А. Ситуационное управление: теория и практика М. Наука, 1986.

142. Поспелов Д.А. Искусственный интеллект: фантазии и реальность // "Наука и жизнь", 1995, № 6.

143. Представление и использование знаний // Под ред. X. Уэно, М. Исидзука. -М.: Мир, 1989.

144. Проблемы представления и обработки не полностью определённых знаний // Под ред. Нариньяни А. С. М.: РосНИИ ИИ, 1996.

145. Прокис Дж. Цифровая связь. М.: Радио и связь, 2000.

146. Пфанцагль И. Теория измерений. М.: Мир, 1976.

147. Рейнгольд Э., Нивергельт Ю., Део Н. Комбинаторные алгоритмы. Теория и практика-М.: Мир, 1980.

148. Ростовцев П.С., Костин B.C., Олех А.Л. Множественные сравнения в детерминационном и типологическом анализе. // Анализ и моделирование экономических процессов переходного периода в России. Выпуск 3. — Новосибирск, ИЭиОПП СО РАН, 1998. С. 209-222.

149. Ростовцев П.С., Костин B.C., Олех А.Л. Множественные сравнения в таблицах для неальтернативных вопросов // Анализ и моделирование экономических процессов переходного периода в России. Выпуск 4.-Новосибирск, ИЭиОПП СО РАН, 1999. С. 148-164.

150. Русско-русский современный толковый словарь изд. "Большая Советская Энциклопедия", OCR Палек, 1998.

151. Рыбников К.А. Комбинаторный анализ // Энциклопедия кибернетики. -Главная редакция Украинской советской энциклопедии, т. 1, 1975. С. 471-475.

152. Рыжов А.П. Элементы теории нечетких множеств и измерения нечеткости. -М.: Диалог-МГУ, 1998.

153. Григорьев С.Г., Перфилов A.M., Левандовский В.В., Юнкеров В.И. STATGRAPHICS на персональном компьютере. Санкт Петербург, 1992.

154. Соложенцев Е.Д., Карасев В.В., Соложенцев Е.В. Логико-вероятностные модели риска в банках, бизнесе и качестве. СПб: Наука, 1999.

155. Справочник по прикладной статистике. В 2-х т. Т. 2 // Под ред. Э. Ллойда, У. Ледермана, С.А. Айвазяна, Ю.Н. Тюрина. М.: Финансы и статистика. -1990.

156. Статистические методы анализа информации в социологических исследованиях // под ред. Осипова Г. В. -М.: Наука, 1979.

157. Суппес П., Зинес Дж. Основы теории измерений. В кн.: Психологические измерения. - М.: Мир, 1967. - С. 9-110.

158. Тараканов А.О. Математические модели ключевых молекулярно-биологических механизмов обработки информации. СПб: Изд-во СПИИРАН, 1998.

159. Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ. М.: Финансы и статистика, 1990.

160. Терехина А.Ю. Анализ данных методами многомерного шкалирования. -М.: Наука, 1986.

161. Трухаев Р.И. Модели принятия решений в условиях неопределенности. — М.: Наука, 1981.

162. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.

163. Тьюки Дж. Анализ результатов наблюдений. Разведочный анализ. — М.: Мир, 1981.

164. Фогель Л., Оуэне А., Уолш М. Искусственный интеллект и эволюционное моделирование. -М.: Мир, 1969.

165. Франселла Ф., Баннистер Д. Новый метод исследования личности. М.: Прогресс, 1987.

166. Хитрова А. Н., Дифференциальная диагностика кист почечного синуса и гидронефрозов методом комплексного ультразвукового обследования. Диссертация на соискание ученой степени кандидата медицинских наук. Москва, 1996.

167. Черепанов В.И. Резонансные методы исследования вещества. // Соросовский Образовательный журнал, №9, 1997.

168. Шапошникова В.И., Нарциссов Р.П., Барбараш Н.А. Многолетние и годовые циклы // Хронобиология и хрономедицина / Под ред. Комарова Ф.И., Раппопорта С.И., 2 е изд. М.: Триада-Х, 2000. - С.115-139

169. Шахмаев Н.М. Физика. Ч. 2: Колебания и волны. Оптика. Строение атома. -М.: Высш. шк., 1977.

170. Шпенглер О. Закат Европы, 2 т. Москва, 1993. - С. 487.

171. Электрические эффекты в радиоспектроскопии // Под ред. М.Ф. Дейгена. -М.: Наука, 1981.

172. Яглом И.М. Почему высшую математику открыли одновременно Ньютон и Лейбниц? // Число и мысль. Вып. 6. М; 1983. - С. 99-125.

173. Яглом И.М. Различие путей творческого поиска (создание векторного исчисления Г. Грассманом и У. Гамильтоном) // В кн. Человек в зеркале наук. Л.: ЛГУ, 1991.-С. 130-146.

174. Agraval R., Imielinski Т., Swami A. Mining Association Rules between Sets of Items in Very Large Databases. ACM SIGMOD Conference Proceedings, 1993. - P 207-216.

175. Backer E., Shipper J.A. On the max-min approach for feature ordering and selection//Proc. Seminar on Pattern Recognition, Liege, Nov., 1977.

176. BakP., Tang C., Weisenfeld K. Self-organized criticality. Phys. Rev. A, 1988, v.38, N1. P. 364-374.

177. Banzhaf W., Nordin P., Keller R. E., Francone F.D. Genetic programming. An Introduction. // Morgan Kaufmann Publishers, Inc. San Francisco, California, 1998.

178. Bellachhok L, Malinetskii G. Tricks of Jokers on one-dimensional maps. Proc. 5 Int. Specialist Workshop Nonlinear Dynamics of Electronic Systems, Moscow, 1997.-P. 40-45.

179. Bezdek J.C. Pattern recognition with fuzzy objective function algorithms. New York: Plenum Press, 1981.

180. Blank M. A., Blank O. A., Duke V.A. The Hemodepressive Effect of Irradiation in Humans // Doklady biological sciences, v. 393. 2003. - P. 1-3.

181. Bonissone P.P., Tong R.M. Editorial: reasoning with uncertainty in expert systems."Int. J. Man-Mach. Stad.", 1985, N3. P. 241-250.

182. Boulding К. E. General Systems Theory The Skeleton of Science // Management Science, 2, 1956.

183. Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. Classification and regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software. -1984.

184. Bronzino J.D. The Biomedical Engineering Handbook. Second Edition, IEEE Press, 2000.

185. Carrol J.D., Chang J.J. Analysis of Individual Differences in Multidimensional Scaling via an Generalization of Ecart-Young Decomposition // Psychometrica,1970, v. 35, N 5. P. 283-319.

186. Chang C. Y. Dinamic programming as applied to feature selection in pattern recognition systems/ЛЕЕЕ Trans., v. SMC-3, 1973. P. 166-171.

187. Charu C. Aggarwal. Towards Long Pattern Generation in Dense Databases. — SIGKDD Explorations, v. 3, Issue 1, 2001. P. 20-26.

188. Cover T. The best two independent measurement are not the two best // IEEE Trans, v. SMC-4, 1974.-P. 116-117.

189. Cover T, Hart P. Nearest neighbour pattern classification // IEEE Trans. Inform. Theory, v. IT-13, 1967. P. 21-27.

190. Devroye L. Some properties of the k-nearest neighbour rule // Proc. 5th Conf. Pattern Recogn. Miami Beach, Fla, v. 1-2, 1980. - P. 103-105.

191. Doyle, P. The use of Automatic Interaction Detection and similar search procedures. Operational Research Quarterly, 24. 1973. - P. 465-466.

192. Fayyad U.M, Piatetsky-Shapiro G, Smyth P, Uthrsamy R. Advances in knowledge discovery and data mining. -Menlo Park, California: AAAI Press, 1996.

193. Ganti V, Gehrke J, Ramakrisnan R. Mining Very Large Databases. IEEE Computer, August 1999. P. 38-45

194. Glass G. V. Note on rank-biserial correlation//Educational and Psychological Measurement, 26, 1966. P. 332-337.

195. Hoerl, A. E., Kennard, R. W. Ridge regression: Applications to nonorthogonal problems. Technometrics, 12, 1970. - P. 69-82.

196. Hunt E.B., Marin J., Stone P.J. Experiments in Induction. New York: Academic Press, 1966.

197. Kan, G., Visser, C., Kooler, J., & Dunning, A. Short and long term predictive value of wall motion score in acute myocardial infarction. British Heart Journal, 56, 1986.-P. 422-427

198. Kittler J. A. Feature set search algorithms // Proc. Conf. om Pattern Recogn. and Signal Processing Paris, France, 25 June - 4 July, 1978. - P. 41-60

199. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? -Tandem Computers Inc., 1996.

200. Koza, J.R. Hierarchical genetic algorithms operating on populations of computer programs. //Proceedings of the Eleventh International Joint Conference on Artificial Intelligence IJCAI-89, volume 1, Morgan Kaufmann, San Francisco, CA, 1989. P. 768-774.

201. Lewis P. M. The characteristics selection problem in recognition systems // IRE Trans, v. IT-8, 1962, N2.

202. Lim, T.S, Loh, W.Y., Shih, Y.S. An emprical comparison of decision trees and other classification methods. Technical Report 979, Department of Statistics, University of Winconsin, Madison. 1997.

203. Loh, W.Y, Shih, Y.S. Split selection methods for classification trees. Statistica Sinica, 7.-1997. P. 815-840.

204. Loh, W.Y, Vanichestakul, N. Tree-structured classification via generalized discriminant analysis (with discussion). Journal of the American Statistical Association, 83. 1988. - P. 715-728.

205. Mamdani E.H, Efstathion H.J. Higher-order logics for handling uncertainty in expert systems. "Int. J. Man-Mach. Stud.", 1985, N3. -P.243-259.

206. Marill T, Green D. M. On the effectivness of receptors in recognition systems//IEEE Trans, v. IT 9, 1963. - P. 11-17.

207. Michael M, Lin W.C. Experimental study of information measures and inter-intra class distance rations of features selection and ordering // IEEE Trans, v. SMC -3, 1973.-P. 172-181.

208. Narendra P.M., Fukunaga K.A. A branch and bound algorithm for feature subset selection/ZProc. Cybernetic and Society Inf. Conf. Washington, D.C, 1976.

209. Osgood Ch. E, Susi G.E, Tannenbaum P.N. The Measurement of Meaning. Urbana: 111, press, 1957.

210. Pettis K.W, Bailey T.A, Jain A.K, Dubes R.C. An intrinsic dimensionality estimator from nearneighbour information. // IEEE Trans. Pattern Anal, and Mach. Intel, v. 1, N 1, 1979. P. 25-37.

211. Poly Analyst Tutorials. Megaputer Intelligence Inc., http://www.megaputer.com.

212. Quinlan J.R. C4.5: Programs for Machine Learning. San Mateo, CA: Morgan Kaufinann, 1993.

213. Quinlan J.R. Generating production rules from decision trees // In Proceedings of the 10th International Joint Conference on Artificial Intelligence (IJCAI-87).

214. Morgan Kaufinann, 1987. P. 304-307.

215. Quinlan J.R. Induction of decision trees // Machine Learning. 1986. - 1. - P. 81-106.

216. Quinlan J.R. Simplifying decision trees // International Journal of Man-Machine Studies. 1987. - 27. - P. 221-234.

217. Quinlan, J.R., Cameron-Jones, R.M. Oversearching and layered search in empirical learning. Proceedings of the 14th International Joint Conference on Artificial Intelligence, Montreal (Vol. 2). Morgan Kaufinan. 1995. - P. 1019-1024.

218. Saito T. The problem of the additive Constante and eigenvalues in metric multidimsional scaling/ZPsychometrika, v. 43, N 2, 1978.

219. Salzberg, S. Exemplar-based learning: Theory and implementation (Technical Report TR-10-88). Harvard University, Center for Research in Computing Technology, Aiken Computation Laboratory, 1988.

220. Sammon J.W. A nonlinear mapping for Data Structure Analysis//IEEE Trans. Comput. v. C-18, N 5, 1969. - P. 401-409.

221. Schwan H.P. Biomedical Engineering. A 20th Century Interscience. Journal of International Federation for Medical & Biological Engineers, v. 37, 1999.

222. Torgerson W.S. Multidimensional Scaling. Theory and Method // Psychometrika, v. 17, № 4, 1952.

223. Toussaint G.T. Note on optimal selection of independed binary features for pattern recognition // IEEE Trans., v. IT-17, 1971. P. 618-620.

224. Tukey J.W. The Future of Data Analysis, Ann. Math. Stat. 33, 1, 1962. P. 1-67.

225. Wolberg W.H., Street W.N., Heisey D.M., Mangasarian O.L. Computer-derived nuclear "grade" and breast cancer prognosis. Analytical and Quantitative Cytology and Histology, Vol. 17, 1995. P. 257-264.

226. XELOPES Library. Prudential Systems. Software GmbH. - Chemnitz, 2002.

227. Zadeh L.A. Personal Internet homepage. http://http.cs.berkeley.edu/People /Faculty /Homepages/zadeh.html.

228. Zadeh L.A. Fuzzy sets as a basis for a theory of possibility // Fuzzy Sets and Systems. 1978. - Vol.1, №1.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.