Метод адаптивной нечеткой кластеризации на основе субъективных оценок для управления качеством производства светотехнических изделий тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Мальков, Александр Анатольевич

  • Мальков, Александр Анатольевич
  • кандидат технических науккандидат технических наук
  • 2009, Тверь
  • Специальность ВАК РФ05.13.01
  • Количество страниц 248
Мальков, Александр Анатольевич. Метод адаптивной нечеткой кластеризации на основе субъективных оценок для управления качеством производства светотехнических изделий: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Тверь. 2009. 248 с.

Оглавление диссертации кандидат технических наук Мальков, Александр Анатольевич

Введение.

Глава I. Основные методы и алгоритмы кластеризации в задаче управления качеством производства деталей светотехнических изделий.

1.1. Технологический процесс литья под давлением деталей светотехнических изделий из поликарбоната.

1.1.1. Технологические параметры, определяющие качество деталей светотехнических изделий из поликарбоната.

1.2. Управление технологическими режимами процесса литья под давлением деталей светотехнических изделий на основе методов кластерного анализа.

1.3. Понятие о кластеризации.

1.4. Цели и задачи кластеризации.

1.5. Функционалы качества кластеризации.

1.6. Меры сходства в методах кластеризации.

1.7. Методы кластерного анализа.

1.7.1. Иерархические методы кластеризации.

1.7.1.1. Иерархические агломеративные методы.

1.7.1.2. Иерархические дивизимные методы.

1.7.2. Неиерархические методы кластеризации.

1.8. Функция принадлежности как субъективная оценка технологического режима по параметрам.

1.9. Алгоритм A-Means.

1.10. Алгоритм Fuzzy c-Means.

1.11. Метод эволюционной кластеризации ЕСМ.

1.12. Виды неопределенностей, характерные для задачи кластеризации объектов по параметрам технологического процесса.

1.13. Нечеткая модель процесса кластеризации.

1.14. Выводы.

1.15. Постановка задачи адаптивной нечеткой кластеризации.

Глава II. Нейро-нечеткий алгоритм динамической кластеризации данных в задаче управления качеством производства деталей.

2.1. Алгоритм нечёткой самоорганизации.

2.2. Алгоритм кластеризации на основе конкуренции и кооперации.

2.2.1. Описание алгоритма.

2.3. Формальные критерии качества кластеризации.

2.3.1. Показатели четкости.

2.3.2. Энтропийные показатели.

2.3.3. Показатель компактности и изолированности.

2.3.4. Индекс эффективности.

2.4. Задача динамической кластеризации при выборе технологического режима.

2.4.1. Нечётко-логический алгоритм динамической кластеризации.

2.4.2. Выявление новых кластеров.

2.4.3. Выявление сливающихся кластеров.

2.4.4. Алгоритм выявления сливающихся кластеров.

2.4.5. Выявление расщепляющихся кластеров.

2.4.6. Алгоритм выявления расщепляющихся кластеров.

2.4.7. Выявление дрейфа центров кластеров.

2.4.8. Выявление изменений геометрических размеров кластеров.

2.5. Выводы.

Глава III. Гибридный метод кластеризации на основе субъективных оценок и визуализации результатов кластеризации.

3.1. Классификация проблем принятия решений.

3.2. Схема гибридного метода адаптивной кластеризации и понятие рационального выбора режима ведения технологического процесса.

3.3. Методы визуализации данных.

3.3.1. Система визуализации данных.

3.3.2. Метод главных компонент.

3.4. Формализация нечеткой многокритериальной задачи выбора варианта кластеризации - режима ведения технологического процесса производства деталей светотехнических изделий.

3.4.1. Формирование множества альтернатив для выбора оптимального технологического режима.

3.4.2. Нечеткая модель оценивания альтернатив по множеству критериев.:.

3.4.3. Нечеткая модель согласования важности критериев.

3.4.4. Нечеткая модель выбора альтернативы из множества взаимно недоминируемых альтернатив по предпочтениям эксперта.

3.5. Алгоритм решения нечеткой многокритериальной задачи выбора варианта кластеризации — оптимального технологического режима объектов.

3.6. Сравнительный анализ эффективности разработанного метода на классическом тесте Фишера для алгоритмов кластеризации.

3.7. Выводы.

Глава IV. Интеллектуальная система анализа данных технологического процесса производства деталей светотехнических изделий.

4.1. Включение субъективных представлений эксперта в процедуру кластеризации.

4.1.1. Обобщенный алгоритм построения базы нечетких правил.

4.1.2. Формальное описание алгоритма.

4.1.3. Реализация алгоритма построения базы нечетких правил.

4.1.4. Генерация нечетких правил.

4.1.5. Алгоритм построения базы нечетких правил по результатам кластеризации формальным методом.

4.2. Процедура настройки режимов функционирования оборудования на основе результатов кластеризации.

4.3. Нечеткая модель выбора режима ведения технологического процесса по результатам нечеткой кластеризации.

4.4. Реализация программного комплекса.

4.5. Выводы.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Метод адаптивной нечеткой кластеризации на основе субъективных оценок для управления качеством производства светотехнических изделий»

Современные системы управления сложными производственными процессами, реализованные с использованием информационных технологий, вызвали бурный рост компьютерных средств обработки и интеллектуального анализа экспериментальных данных.

Задачей интеллектуального анализа данных является извлечение из них знаний, нахождение закономерностей которые могут быть использованы для выбора режима ведения технологического процесса с целью увеличения производительности и уменьшения производства бракованных изделий.

Для эффективного анализа технологического процесса необходимо определить, какие параметры должны быть включены в план анализа, выявить факторы, которые оказывают существенное влияние на ход процесса. При этом количество параметров превосходит число измерений в десятки раз, что приводит к ситуации малой выборки. Вторая особенность интеллектуального анализа данных технологического процесса — формулировка целевых критериев, поскольку известно много фактов значительного расхождения диагностических оценок разных специалистов, даже принадлежащих одной научной школе. Третья проблема - наличие шумящих данных, учет которых повлечет ошибки при нахождении закономерностей в экспериментальных данных. Четвертая проблема связана с получением данных путем проведения трудоемких и растянутых во времени экспериментов. За это время возникает целый ряд субъективных и объективных причин появления пропуска в данных. Пятый аспект анализа данных — одинаковые внешние проявления обусловлены различными внутренними механизмами, что приводит к существенной неоднородности классов данных, которая формируется на основании заданных внешних критериев. Последняя проблема связана со структурной ассиметрией классов данных, что приводит к эффекту полиморфности в пространстве признаков.

Таким образом, анализ структур данных связан с:

• высокой размерностью задачи;

• разнотипностью данных;

• неопределенностью внешнего описания;

• нечеткостью внешних критериев;

• большим количеством шумящих и дублирующих данных;

• неоднородностью классов объектов;

• пропусками в данных;

• наличие выбросов;

• значительным превышением количества признаков над числом измерений;

• проблемой представления данных в виде таблицы «объект-признак»;

• структурной ассиметрией классов объектов исследований;

• существенной непериодичностью паттернов с джокерами при описании последовательностей.

Обычные статистические методы (регрессионный, дисперсионный анализ), позволяющие выявить закономерности процесса, как правило, не могут быть применимы по нескольким причинам. Во-первых, изначально неизвестно, какое количество факторов будет влиять на производство деталей в конкретной ситуации. Существенные факторы может выявить только эксперт-технолог на базе прошлого опыта, измеренных на текущий момент времени данных и в сложившейся ситуации. Во-вторых, обычные статистические методы используют различные статистики для определения законов распределения и нахождения оценок параметров этих законов. Как правило, априори неизвестна информация о распределении данных и вычисление статистик проблематично. В-третьих, из литературных источников известно, что закон распределения измерений либо меняется от выборки к выборке, либо появляются значительные ошибки в оценках параметров закона распределения из-за динамично меняющихся входных воздействий (параметры сырья, производство деталей на различных станках и т.п.). В-четвертых, количество параметров экспериментальных данных значительно превышает количество измерений, что также делает затруднительным проверку статистических гипотез о том или ином законе распределения.

Возможным вариантом извлечения знаний из экспериментальных данных (объектов) является поиск структуры в этих данных, если таковая существует. Это позволит перейти от описания сравнительно небольших выборок объектов к описанию классов объектов и отношений между ними. После выделения групп схожих объектов применяются другие методы, для каждой группы строится отдельная модель. Модель структуры данных определяется наборами «схожих» по параметрам данных, объединенных в группы (кластеры), с указанием количества таких групп, их центров и степеней принадлежности каждого измеренного объекта каждой группе. Каждому кластеру можно поставить в соответствие некоторый технологический режим. Кроме этого, необходимо определить группы коррелированных параметров для их объединения и представления каждой такой группы одним «латентным» фактором. Следовательно, при интеллектуальном анализе экспериментальных данных необходимо представить их в виде групп объектов схожих по набору коррелированных факторов, оказывающих наиболее существенное влияние на технологический процесс, т.е. найти структуру в данных.

Наиболее подходящим способом нахождения структуры данных являются методы кластерного анализа, позволяющие разбить множество объектов на группы по заданным критериям. Это позволит найти структуру в данных и на ее основе выявить знания, которые технолог сможет использовать для выбора режима ведения технологического процесса производства различных деталей путем построения нечеткой системы управления качеством производства деталей, а сам результат кластеризации будет представлять собой модель сложной системы в виде найденной структуры данных. Поэтому разработка простых и быстрых методов кластеризации, не зависящих от параметров, значения которых редко можно знать априори, имеет особую актуальность при решении практических задач в различных областях деятельности человека, когда точность полученных кластерных решений имеет решающее значение.

Задача кластеризации впервые была рассмотрена в 1930-х годах. Эту проблему в её различных аспектах изучали как зарубежные, так и отечественные исследователи, в том числе: МакКуин Д., Ланс У., Уильяме Д., Хартиган Д., Вонг М., Кохонен Т., Фрицке Б., Колмогоров А.Н., Загоруйко Н.Г., Ёлкина В.Н., Айвазян С.А., Дорофеюк А.А., Вагин В.Н., Мхитарян B.C., Шумский С.А. и другие.

На сегодняшний день существует более сотни методов кластеризации и их модификаций. Это связано с разнообразием задач, для решения которых используют кластеризацию.

Кластерные процедуры для нахождения схожих объектов разделяют на два основных типа — агломеративные (дивизимные) и итеративные. Вычислительная сложность агломеративных и дивизимных процедур резко возрастает при увеличении объёма выборки. Итеративные методы сильно зависят от выбора начального разбиения, что приводит к необходимости повторного решения задачи с новыми условиями. Недостатки указанных групп методов не позволяют применять их как универсальные, круг их применения ограничивается данными сравнительно небольших объёмов при априори известной информации о кластерной структуре.

Исходным предположением для всех методов кластеризации является выполнение гипотезы о «разделимости» данных. Существующие методы и алгоритмы позволяют выделить группы в исходных данных даже при отсутствии структуры в данных, т.е. не учитывают семантику задачи. Поэтому для успешного решения задачи кластеризации требуется наличие эксперта — аналитика в предметной области, который на основе своих знаний, интуиции, опыта мог бы выдвигать различные гипотезы, касающиеся вида структуры данных, и проверять эти гипотезы в ходе решения задачи кластеризации, в результате чего изменяется степень убежденности эксперта в правильности результата кластеризации. Это предполагает выбор среди вариантов кластеризации альтернативы, на которой достигается максимум этой величины.

Алгоритмы кластеризации используют для анализа вектора признаков объектов. Признаки - это координаты объектов в некотором пространстве, в котором может быть задана некоторая формальная мера близости, и на ее основе разными способами ищутся «схожие» объекты. Однако признаки могут быть числовые или категорийные. Поэтому в качестве меры близости для разных категорий признаков применяют различные метрики: для числовых признаков часто используется Евклидова метрика, для категорийных — метрика Хемминга. Более того, для категорийных данных разработаны отдельные методы. Однако, они применимы только для узкого круга задач.

Очевидно, что возможность кластеризации объектов, с признаками которых невозможно производить арифметические действия, необходима. Это нужно, например, для возможности выделения осмысленных групп симптомов и диагнозов в медицине, товаров на рынке, акций на бирже и т.д. Для этого нужно создать инструмент, предоставляющий возможность проведения такой кластеризации, которая вместе с формулами, предлагающими некоторый желаемый результат, использовала бы субъективные оценки эксперта.

Кроме этой проблемы есть еще проблема масштабируемости, т.е. проблема создания такого алгоритма кластеризации, который смог бы работать на гигантских базах данных.

Для кластеризации измеряемых данных можно использовать стандартные алгоритмы. С другой стороны, существует и огромное число качественных данных, таких, как, например, болезненность цвета лица пациента, кредитоспособность заемщика, качество изделия и др. Человек сравнительно легко может оценивать эти свойства исходя из своих накопленных знаний, интуиции и сложившейся ситуации, и они были бы очень полезны при анализе. Возможно, среди них и будут находиться ключевые факторы, которые позволят провести более качественную, с точки зрения эксперта, кластеризацию. Однако зачастую они не измеряются автоматически, и нет удобной возможности их учитывать и работать с ними. Инструменты, позволяющие фиксировать подобного рода данные, имеются, но эксперт часто «зажат» шаблонной процедурой, которая предлагается ему в заранее установленном порядке, зависящей от уже представленных ответов, и не имеет возможности просмотреть, каков будет результат при некоторой подвижке этого шаблона.

Таким образом, эксперт сам может являться измерителем некоторых признаков объектов разбиваемого множества. В этом случае, используются его знания о том, что такое конкретный признак рассматриваемого объекта, как этот признак может изменяться, каков его вклад в описание модели, какова его информативность и нужно ли добавить новые признаки для увеличения или уменьшения степени абстрагирования при описании задачи. То есть, введение эксперта в решение задачи кластеризации позволит качественно оценивать полученные результаты и, если это нужно, вносить коррективы на этапе решения задачи.

Еще одной проблемой является измерение данных с некоторой точностью. Например, при производстве деталей возможны так называемые допуски по их параметрам. На технологических линиях возможны отклонения по некоторым параметрам. В связи с этим возникают различные виды неопределенностей, которые необходимо учитывать при кластеризации данных. Это может быть сделано при помощи теории нечетких множеств. В этом случае будет возможным сохранять знания человека об объекте, учитывать неопределенности, возникающие при той или иной ситуации, накапливать их со временем, выделять среди них значимые, анализировать накопленный опыт.

При использовании опыта, знаний эксперта должна проявляться эволюция системы. Внимание эксперта практически всегда уделяется ограниченному числу характеристик, используемыми остаются только самые значимые. Так, постепенно на основе «старых» знаний появляются новые характеристики, которые, может быть, вытеснят накопленные ранее. При этом «старые» знания должны оставаться в системе для того, чтобы их можно было бы продолжить использовать. Такие действия потребуют много внимания от эксперта и практически не содержат никакой автоматики, а лишь помогут по-новому и с разных «углов» взглянуть на проблему, и не позволят пропасть результатам «накопленных» решений. В итоге получается база знаний эксперта о множестве объектов, с которыми он работает, а кластеризация может быть представлена как итерационный процесс выбора экспертом оптимального с его точки зрения варианта кластеризации. Следовательно, задача кластеризации может быть сведена к задаче нечеткого многокритериального выбора альтернативы - варианта кластеризации, полученного на базе некоторого метода адаптивной кластеризации с участием эксперта.

Переход от одного варианта к другому предполагает наличие критериев оценки их качества. Дополнительной информацией для получения оценок от эксперта может служить визуализация решения, которая позволит оценить возможность продолжения поиска или останова. Такого рода информация позволит ускорить процесс принятия решений.

Эксперт не всегда может четко сравнить варианты решений по предложенным критериям или, вообще, сказать какой из двух вариантов предпочтительнее. Для решения данной проблемы можно по предпочтениям эксперта построить нечеткое множество взаимно недоминируемых альтернатив с функцией принадлежности их этому множеству. Значение функции принадлежности будет означать степень истинности высказывания о том, какая из альтернатив является более предпочтительной, что количественно определяет степень убежденности эксперта в оптимальности альтернативы.

Процесс выбора альтернативы должен быть закончен при достижении некоторой цели. В качестве целевой функции здесь может быть выбрана степень убежденности эксперта в оптимальности текущего решения. Обычные методы оптимизации не могут быть здесь применены по следующим причинам.

1. Оптимизируемая функция - степень убежденности — задана неявно.

2. Ограничения не могут быть описаны четко.

3. При решении подобного рода задач не всегда оправданы допущения для скрытия возникающих неопределенностей.

Таким образом, актуальность настоящей работы обусловлена необходимостью расширения функциональных возможностей алгоритмов и методов кластеризации и связана с разработкой математического, алгоритмического и программного обеспечения методов обработки больших объемов информации, определением критериев и моделей описания кластерных разбиений.

Объектом настоящего исследования является технологический процесс производства изделий из поликарбоната методом литья под давлением.

Предметом исследования является интеллектуальный анализ данных для нахождения в них структуры с учетом семантики предметной области.

Целью диссертационной работы является совершенствование и расширение функциональных возможностей методов кластеризации путем введения нечетких оценок эксперта и визуализации результатов кластеризации для нахождения структуры в данных технологического процесса для управления качеством производимых деталей.

Для достижения поставленной цели в диссертационной работе решаются следующие основные задачи.

1. Исследовать методы и алгоритмы кластеризации и визуализации данных.

2. Разработать базовый алгоритм кластеризации для получения варианта разбиения данных на кластеры с целью последующего анализа всех вариантов.

3. Разработать алгоритм выбора варианта кластеризации на основе оценок, знаний и предпочтений эксперта.

4. Разработать алгоритм проверки истинности нечеткого высказывания о степени улучшения решения в соответствие с системой предпочтений эксперта.

5. Программная реализация комплекса диагностики текущего состояния технологического процесса производства изделий с целью настройки системы нечеткого управления качеством производства изделий с использованием результатов исследований данной работы.

Методы исследования. Поставленные задачи решаются с использованием теории нечетких множеств, методов визуализации данных, нечеткой логики, искусственного интеллекта и теории принятия решений.

Научная новизна работы заключается в следующем:

1. Предложен алгоритм самоорганизации нейронных сетей на основе механизмов конкуренции и кооперации, при помощи которого оказалось возможным решить проблему определения первоначального, разбиения множества объектов на кластеры, т.е. получить первое приближение решения задачи поиска структуры данных для выбора режима ведения технологического процесса производства деталей светотехнических изделий.

2. Разработан алгоритм нейро-нечеткой динамической кластеризации для выбора технологического режима, в который введены нечеткие правила для определения степени принадлежности текущего объекта каждому кластеру, либо образования нового кластера. Математически обоснован выбор оптимального значения «порога», определяющего момент расщепления кластера на новые при изменении его структуры во времени.

3. Разработан алгоритм определения истинности высказывания об оптимальности решения в соответствие с системой предпочтений эксперта при помощи построения нечеткого множества взаимно недоминируемых альтернатив, что в отличие от множества Парето позволяет учитывать нечеткие оценки эксперта.

4. Разработан метод поиска оптимального варианта кластеризации состояний технологического процесса, позволяющий на основе оценок эксперта-технолога, визуализации результатов кластеризации и разработанных алгоритмов получить решение, наиболее полно отвечающее требованиям задачи управления качеством производства деталей, что отсутствует в существующих методах кластеризации.

5. Предложена методика поиска структуры классов данных в задаче управления качеством производства деталей светотехнических изделий.

Практическая значимость работы вытекает из ее актуальности. Создание интеллектуальной системы анализа данных технологического процесса позволяет находить структуру (если она существует) в параметрах этого процесса. Для ее реализации разработан программный комплекс диагностики текущего состояния технологического процесса производства светотехнических изделий с целью настройки системы нечеткого управления качеством производства изделий с использованием результатов исследований данной работы.

Практическая значимость работы подтверждается использованием полученных результатов в подсистеме анализа режимов работы инженерного оборудования, о чем имеется акт о внедрении.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Мальков, Александр Анатольевич

4.5. Выводы

Совсем недавно описание сложных технических систем сводилось к написанию математических моделей систем в виде дифференциальных уравнений в частных производных и соответствующих ограничений. Решение таких систем, как правило, занимает достаточно много времени и средств. Поэтому для получения решения подобного рода систем начали использовать различные методы, позволяющие некоторым образом адаптировать дискретные аналоги дифференциальных уравнений для распараллеливания процесса вычисления соответствующих функций. Для этого требуются достаточно серьезные технические средства. После произведенных расчетов может оказаться, что модель оказалась неадекватной и процесс необходимо начать заново.

Бартоломей Коско, доказав теорему об аппроксимации нечеткой моделью любой модели, описанной математически, практически обозначил другой подход к моделированию сложных технических систем.

Построение нечетких (логико-лингвистических) моделей основано на теории нечетких множеств и нечеткой логике. Логико-лингвистические методы описания систем основаны на том, что поведение исследуемой системы описывается на естественном языке в терминах лингвистических переменных. Входные и выходные параметры системы рассматриваются как лингвистические переменные, а качественное описание процесса задается совокупностью нечетких правил. Совокупность нечетких правил отражает функциональную взаимосвязь входных и выходных переменных, а композиционное правило вывода в этом случае задает закон функционирования нечеткой модели системы.

Построение баз нечетких правил существенно упрощается, если найти структуру во входных данных. Эту проблему можно решить, проведя их кластеризацию. Кластеры будут представлять собой такие совокупности входных воздействий, реакция системы на которые будет примерно одинакова для всех элементов одной совокупности. С другой стороны, процесс кластеризации может дать некую «последовательность» моделей, из которых нужно выбрать оптимальную. Для этого в процесс кластеризации необходимо включить эксперта-аналитика. Только на основе его субъективных оценок, полученных из его знаний, интуиции, опыта можно сделать более-менее серьезные выводы о «качестве» полученной модели.

При помощи разработанного метода кластеризации можно во входных данных для любой системы выделить нечеткие кластеры. Однако, таких разбиений входных переменных может быть несколько. Поэтому для получения оценок эксперта каждого решения вводятся критерии для оценивания полученной модели.

Исходя из визуализации результата кластеризации, эксперт может получить новую информацию для оценки полученного решения. Кроме того, на основе предпочтений эксперта может быть вычислена степень его убежденности в оптимальности найденного решения. В итоге работы получается разбиение входных данных оптимальным, с точки зрения эксперта, образом.

Полученные кластеры будут представлять собой нечеткие множества с известными функциями принадлежности входных объектов каждому такому множеству.

В завершении используются стандартные библиотеки системы Matlab для создания базы нечетких правил по результатам работы предложенного метода, их корректировки и реализации нечеткого вывода для получения управляющих воздействий до начала производства продукции.

Таким образом, в процессе поиска оптимального решения происходит «качественная» аппроксимация модели системы. В результате работы алгоритма получается оптимальное разбиение множества входных воздействий на нечеткие кластеры, которое позволяет создавать базу нечетких правил для управления некоторым процессом, например, управлением производством деталей определенного качества на этапе подготовки технологического оборудования.

Заключение

В работе обозначены основные проблемы, возникающие при поиске структур данных, определяющих входные воздействия при моделировании сложных систем и условия, по которым применение традиционных методов моделирования и статистических методов анализа данных невозможно. Обоснована актуальность проведения кластеризации для построения моделей сложных систем, для чего требуется применить знания и опыт эксперта при проведении кластеризации данных.

Выполнен системный анализ отечественных и зарубежных работ, посвященных кластерному анализу. Определены цели и задачи кластеризации. Предложена классификация методов кластеризации в зависимости от вида выделяемых кластеров, меры «схожести» объектов, способов построения кластеров, определения функций принадлежности и др. Рассмотрены виды неопределенностей, характерные при моделировании систем и решении задачи кластеризации. Выявлены недостатки существующих методов кластеризации. Предложена нечеткая модель кластеризации объектов системы. Выполнена постановка задачи адаптивной нечеткой кластеризации.

Выделены основные проблемы решения задачи кластеризации: метод определения количества кластеров, метод получения варианта кластеризации, определение оптимального варианта кластеризации на основе оценок эксперта с учетом его предпочтений и визуализации решений.

Указанные проблемы успешно решены в диссертационной работе. Предложено применить нейро-нечеткий динамический алгоритм для получения разбиения входных данных на нечеткие кластеры. Для этого на первом этапе проводилось первоначальное разбиение множества объектов при помощи алгоритма, основанного на механизмах конкуренции и кооперации нейронов. Это позволило осуществлять настройку такого параметра как количество кластеров. В известных методах либо задается значение этого параметра, либо применяется эвристическая процедура, что значительно увеличивает время получения первоначального разбиения. На базе полученного решения применялся алгоритм нечеткой самоорганизации для получения окончательного разбиения и таблицы разбиения, по которой возможно построений функций принадлежности для каждого найденного кластера. В алгоритме показано как в режиме реального времени может быть осуществлено дополнительное разбиение или объединение кластеров. При этом для увеличения скорости работы алгоритма предложено использовать нечеткие правила для определения кластера, к которому может быть отнесен новый объект. Приведен способ определения количественной оценки оптимальности разбиения с точки зрения восприятия человека.

Для решения второй проблемы разработан метод адаптивной нечеткой кластеризации, основанный на визуализации результатов кластеризации, оценках эксперта и его предпочтениях. Применение такой гибридной схемы позволило представить решение задачи кластеризации как процесс поиска оптимального решения.

Для формирования вариантов решения предложено, комбинируя признаки объектов или немного изменяя границы интервалов значений признаков, получать, вообще говоря, различные разбиения одного и того же множества объектов. Все разбиения оцениваются по множеству критериев. Это позволило извлекать информацию о несущественных признаках и, тем самым, сузить признаковое пространство, т.е. уменьшить размерность объектов. Извлечение подобной информации возможно только при визуализации результатов кластеризации. Для этого выделяются два или три наиболее существенных фактора, на плоскости которых проецируется облако данных. Кроме решения проблемы визуальной оценки решения, данный подход позволяет уменьшить вычислительную сложность алгоритма, т.к. используется меньшее количество признаков.

Для поиска варианта кластеризации, который наиболее полно отвечает представлениям эксперта о возможном решении задачи, осуществляется итерационная процедура, суть которой заключается в следующем. Для каждой альтернативы вычисляются формальные критериальные оценки, а эксперт дает лингвистические субъективные оценки каждого варианта кластеризации. По предложенной нечеткой модели оценивания альтернатив вычисляется «обобщенная» оценка и строится функция принадлежности «обобщенного» критерия. По заданному экспертом ос-уровню отбираются взаимно недоминируемые альтернативы — варианты разбиения на кластеры, о приоритете которых эксперт затрудняется дать ответ в виде утверждения «Лучше», «Хуже» и ставит оценку «Не знаю» (среди лучших).

Для указанных вариантов по предложенному алгоритму экспертом задается нечеткое отношение, позволяющее построить нечеткое множество взаимно недоминируемых альтернатив, по функции принадлежности которого определяется степень убежденности эксперта в оптимальности некоторого варианта кластеризации. На основе этих значений выбирается оптимальное разбиение на кластеры и производится автоматическое построение базы правил с лингвистическими переменными для параметров в левой части каждого правила. В левой части правил комбинируются нечеткие переменные с функциями принадлежности, по которым определяются степени принадлежности каждому кластеру. Нечеткий вывод позволяет классифицировать объекты, что облегчает решение задачи управления качеством производства светотехнической продукции.

Предложенные и разработанные методы, алгоритмы и их программная реализация проверены на практике, о чем имеется акт о внедрении. Решена актуальная задача определения качества светотехнических изделий до этапа их производства. Использование описанного подхода позволяет существенно снизить временные и материальные ресурсы при производстве деталей на современном оборудовании, требующем наладки режимов его функционирования в режиме реального времени.

В ходе исследования использовались методы теории нечетких множеств, нечеткой логики, нейронных сетей, системного анализа и принятия решений, объектно-ориентированного программирования, визуализации.

В работе получены следующие научные и практические результаты.

1. Предложен алгоритм самоорганизации нейронных сетей на основе механизмов конкуренции и кооперации, при помощи которого оказалось возможным получить первое приближение решения задачи поиска структуры данных для выбора режима ведения технологического процесса производства деталей светотехнических изделий.

2. Разработан алгоритм нейро-нечеткой динамической кластеризации для выбора технологического режима. Для оптимизации алгоритма предложено использовать нечеткие правила для определения степени принадлежности текущего объекта каждому кластеру, либо образования нового кластера. Предложена формула вычисления «порога», определяющего момент расщепления кластера на новые при изменении его структуры.

3. Разработан алгоритм определения истинности высказывания об оптимальности решения в соответствие с предпочтениями эксперта при помощи построения нечеткого множества взаимно недоминируемых альтернатив, что позволяет учитывать лингвистические оценки эксперта.

4. Разработан метод поиска оптимального варианта кластеризации состояний технологического процесса, позволяющий на основе оценок эксперта-технолога, визуализации результатов кластеризации и разработанных алгоритмов получить решение, наиболее полно отвечающее требованиям задачи управления качеством производства светотехнических деталей, что отсутствует в существующих методах кластеризации.

5. Разработан программный комплекс диагностики текущего состояния технологического процесса производства изделий с целью настройки системы нечеткого управления качеством производства изделий с использованием результатов исследований данной работы.

6. Предложена методика поиска структуры классов данных в задаче управления качеством производства деталей светотехнических изделий.

Основные положения и результаты диссертационного исследования докладывались и обсуждались: на VIII Международной научной конференции «Современные сложные системы управления» (Тверь, 2008), на XXI Международной научной конференции «Математические методы в технике и технологиях» (Саратов, 2008), на VIII Международной научно-технической конференции «Интеллектуальные системы» (AIS'08) (Дивноморское, 2008), на V Всероссийской школе-семинаре молодых ученых «Управление большими системами-08» (Липецк, 2008).

Список литературы диссертационного исследования кандидат технических наук Мальков, Александр Анатольевич, 2009 год

1. О.Ю. Сабсай, Н.М. Чалая. Технологические свойства термопластов. // Пластические массы, 1992, № 1, с. 5-13.

2. Исикава К. Японские методы управления качеством. — М.: Изд-во «Экономика», 1988. 215 с.

3. Дюк В. А., Самойленко A. Data Mining: учебный курс. СПб: Питер, 2001. 366с.

4. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский — СПб: Питер, 2000. 384с.

5. Вагин В.Н. Дедуктивные модели // Представление знаний в человеко-машинных и робототехнических системах. Т.А.: Фундаментальные исследования в области представления знаний. М.: ВИНИТИ, 1984. С. 36-47.

6. Мандель И.Д. Кластерный анализ — М.: Финансы и статистика. 1988 — 176с.

7. Дюран Б., Одел П. Кластерный анализ. Пер. с англ. Е.З. Демиденко. Под ред А .Я. Боярского-М.: Статистика, 1977.

8. Факторный, дискриминантный и кластерный анализ: Пер. с англ./Дж.-О. Ким, Ч. У. Мьюллер, У. Р. Клекка и др.; Под ред. И. С. Енюкова. М.: Финансы и статистика, 1989. - 215 с.

9. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. — СПб.:БХВ-Петербург, 2004. -336с.

10. Рутковская Д., Пилиньский М., Рутковский JI. Нейронные сети, генетические алгоритмы и нечеткие системы/ Пер. с польского И.Д. Рудинского. — М.: Горячая линия-Телеком, 2006. 452с.

11. Нечеткие множества и нейронные сети: Учебное пособие/ Г.Э. Яхъяева. — М.:Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2006. 316с.

12. Орловский С.А. Проблемы принятия решений при нечеткой исходной информации. М. :Наука, 1981.

13. Халов Е.А. Одномерные многопараметрические функции принадлежности в задачах нечеткого моделирования и управления./ТПриложение к журналу «Мехатроника, автоматизация, управление». 2007. №4. С.2-11.

14. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.:Наука, 1974. С. 131.

15. Девятков В.В. Системы искусственного интеллекта: Учеб. пособие для вузов. М.: Изд - во МГТУ им. Н.Э. Баумана, 2001. 352с.

16. Bezdek J.C. Pattern recognition with fuzzy objective function algorithms. — Plenum Press, New York. 1982.

17. Krishnapuram R., Keller J.M. The possibilistic с means algorithm: insights and recommendation. // IEEE Transactions on Fuzzy Systems. - 1996. - Vol. 4, No. 3 -P. 385-393.

18. Barny M., Cappellini V., Mecocci A. A possibilistic approach to clustering. // IEEE Transactions on Fuzzy Systems. 1996. - Vol. 4, No. 3. - P. 393 - 396.

19. Timm H., Borget C., Doring C., Kruse R. An extension to possibilistic fuzzy cluster analysis. // Fuzzy Sets and Systems. 2004. - Vol.147, No. 1. - P. 3 -16.

20. Pal N.R., Pal K., Keller J.M., Bezdec J.C. A possibilistic fuzzy с means clustering algorithm. // IEEE Transactions on Fuzzy Systems. — 2005. - Vol. 13. — No. 4.-P. 517-530.

21. Frigui H., Krishnapuram R. A robust algoritlim for automatic extraction of an unknown number of clusters from noisy data. // Pattern Recognition Letter. 1996. -Vol. 17.-P. 1223-1232.

22. Dave R.N. Robust clustering methods: A unified view. // IEEE Transactions on Fuzzy Systems. 1997. - Vol. 5. - P. 270 - 293.

23. Dave R.N., Sen S. Robust fuzzy clustering of relation data. // IEEE Transactions on Fuzzy Systems. 2002. - Vol. 10, No. 6. - P. 713 - 727.

24. Leski J. Towards a robust fuzzy clustering. // Fuzzy Sets and Systems. 2003. — Vol. 137.-P. 215-233.

25. Алтунин А.Е., Чуклеев С.Н., Семухин М.В., Крел Л.Д. Методические рекомендации по применению теории нечеткости в процессах контроля и управления объектами газоснабжения. Тюмень, 1983, 136с.

26. Bonissone P.P., Tong R.M. Editorial: reasoning with uncertainty in expert systems. «Int. J. Man-Mach. Stad.», 1985, N3, p.241-250.

27. Mamdani E.H., Efstathion H.J. Higher-order logics for handling uncertainty in expert systems. «Int. J. Man-Mach. Stud.», 1985, N3, p.243-259.

28. Борисов A.H. и др. Модели принятия решений на основе лингвистической переменной. — Рига: Зинатне, 1982. 256с.

29. Заде JI.A. Понятие лингвистической переменной и его применение к принятию приближенных решений. М: Мир, 1976, 165с.

30. Цыпкин Я.З. Адаптивные методы выбора решений в условиях неопределенности. Автоматика и телемеханика, 1976, N 4, с.78-91.

31. Кашьян P.JL, Рао А.Р. Построение динамических стохастических моделей по экспериментальным данным. — М: Наука, 1983, 384с.

32. Нечеткие множества и теория возможностей. Последние достижения. М: Радио и связь, 1986, 408с.

33. Виноградов Г.П., Мальков А.А. Нечеткая многокритериальная оптимизация процесса кластеризации. V Всероссийская школа молодых ученых «Управление большими системами»: сборник трудов, г.Липецк, 2008. С. 47-53.

34. Виноградов Г.П., Мальков А.А. Эволюционные методы кластеризации, основанные на четком и нечетком отношении сходства и технологии Visual Mining. Вестник ТГТУ №13, Тверь, 2008. с.140-146.

35. Zade L.A. Fuzzy sets. // Information and Control. 1965. - Vol. 8. - P. 338-353.

36. Ruspini E. A new approach to clustering. // Information and Control. — 1969. Vol. 15, No. l.-P. 22-32.

37. Ruspini E. Numerical methods for fuzzy clustering. // Information and Science. 1970. -Vol. 2.-P. 319-350.

38. Dunn J.C. A fuzzy relative of the ISODATA process and its use in detecting compact well-separated cluster. // J. Cybernet. 1973. - Vol. 3, No. 3. - P. 32-57.

39. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. М.: Финансы и статистика, 2002. - 344с.

40. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. 2-е изд., стереотип. — М.: Горячая линия-Телеком, 2002. — 382с.

41. T.Kohonen, «Self-Organizing Maps» (2-nd edition), Springer, 1997.

42. Chiu S.L. Fuzzy model identification based on cluster estimation // J. Intell. Fuzzy Syst. 1994. - Vol. 2 - P. 267-278. «

43. Yager R.R., Filev D.P. Generation of fuzzy rules by mountain clustering // J. Intel. Fuzzy Syst. 1994. - Vol. 2. - P. 209-219.

44. Борисов B.B., Круглов B.B., Федулов A.C. Нечеткие модели и сети. — М.: Горячая линия Телеком, 2007. — 284с.

45. Kosko В. Differencial hebbeian learning // AIP Conference Proceedings. V. 151. 1986. P. 265-270.

46. Zyrada J., Barski M., Jedruch W. Sztuczne sieci neuronowe. — Warsawa, PWN, 1997.

47. Виноградов Г.П., Мальков А.А. Кластеризация на основе конкуренции и кооперации. «Системы управления и информационные технологии» №1.1(31), Москва-Воронеж: Научная книга, 2008. — с. 133-137.

48. Виноградов Г.П., Мальков А.А. Модели поиска структур данных на основе конкуренции и кооперации. «Управление большими системами». Выпуск 22. М.: ИПУ РАН, 2008. С.21-32.

49. Виноградов Г.П., Мальков А.А. Эволюционные методы кластеризации, использующие нечеткие отношения и субъективные оценки. Сборник трудов

50. Международной научно-технической конференции AIS'08, CAD-2008, «Интеллектуальные системы», «Интеллектуальные САПР», т.1, М.: Физматлит., с.7-15.

51. Ту Д., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.

52. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974.

53. Фукунага К. Введение в статическую теорию распознавания образов. М.: Наука, 1979.

54. Кузин JI.T. Основы кибернетики: в 2-х томах. Т.2. Основы кибернетических моделей. М.: Энергия, 1979.

55. Патрик Э. Основы теории распознавания образов. М.: Сов. Радио, 1980.

56. Распознавание образов: состояние и перспективы./К.Верхаген, Р. Дёйн и др. М.: Радио и связь, 1985.

57. Лбов Г.С., Сиарцева Н.Г. Логические решающие функции и вопросы статистической устойчивости решений. Новосибирск: Издательство института математики, 1999.

58. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Издательство института математики, 1999.

59. Singh S. Dynamic Pattern Recognition for Temporal Data.//Proc. 5 European Congress on Intelligent Techniques and Soft Computing (EUFTT' 97), Aachen, Germany, 1997. Vol.3, p. 1993-1997.

60. Чернявский А.Л., Бауман E.B., Дорофеюк A.A. Методы динамического классификационного анализа данных.//Искусственный интеллект, 2002, №2, с.290-297.

61. Бауман Е.В., Дорофеюк А.А. Классификационный анализ данных.// Избранные труды международной конференции по проблемам управления, т. 1. М.:Синтез,1999, с.62-67.12.

62. Дорофеюк А.А. Задача многомерного структурного прогнозирования и методы ее решения.// Искусственный интеллект, 2002, №2, с. 108-109.

63. Ибрагимова С.Р. Алгоритмы точной классификации аэрокосмических изображений.// Современные наукоемкие технологии, 2006, №1, с.8-13.

64. В. Е. Жуковин. Нечеткие многокритериальные модели принятия решений. -Тбилиси: МЕЦНИЕРЕБА, 1988. 72с.

65. Кини P.JL, Райфа X. Принятие решений при многих критериях: предпочтения и замещения. Пер. с англ./Под ред. И.Ф. Шахнова. М.: Радио и связь, 1981.-560с.

66. Черноморов Г.А. Теория принятия решений: Учебное пособие/Юж.-Рос. Гос.техн.ун-т. Новочеркасск: Ред. Журн. «Изв. Вузов. Электромеханика», 2002. -276с.

67. Орлов А.И. Теория принятия решений. Учебное пособие / А.И.Орлов. — М.: Издательство «Март», 2004. 656с.

68. Bezdek (ed.) Analysis of fuzzy information . Vols. 1,2,3. CRC Press. 1987, p. 385.

69. Джоффрион А., Дайер Дж., Файнберг А. Решение задач оптимизации при многих критериях на основе человеко-машинных процедур. В кн. Вопросы анализа и процедуры принятия решений. М.: Мир, 1976, с. 126-145.

70. Ногин В. Д. Принятие решений в многокритериальной среде: количественный подход. — 2-е изд., испр. и доп. — М.: ФИЗМАТЛИТ, 2004.

71. Bruske J., Ahrns L., Sommer G. An integrated architecture for learning of reactive behaviors based on dynamic cell structures. Robotics and Autonomous Systems. 22, 1998. pp. 81-102.

72. Горбань A.H., Зиновьев А.Ю., Питенко A.A. Визуализация данных методом упругих карт.// Информационные технологии, изд-во «Машиностроение». — М. -2000. №6, С.26-35.

73. A. Buja, D. Cook, D. Asimov, and С. Hurley. Dynamic Projections in High-Dimensional Visualization: Theory and Computational Methods. Technical report, AT&T Labs, Florham Park, NJ, 1997.

74. Айвазян С.А., Бухштабер В.М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности. — М.: Финансы и статистика, 1989. 607с.

75. Россиев А. А. Моделирование данных при помощи кривых для восстановления пробелов в таблицах // Методы нейроинформатики / Под ред. А.Н.Горбаня. Красноярск: Изд-во КГТУ, 1998. С. 6-22.

76. Справочник по прикладной статистике. В 2-х т. Т. 2 // под ред. Ллойда Э., Ледермана У., Айвазяна С.А., Тюрина Ю.Н. М.: Финансы и статистика, 1990. 526 с.

77. Гафт М.Г. Принятие решений при многих критериях. М.: Знание, 1979.

78. Гуткин Л.С. О синтезе систем по безусловному критерию предпочтения. — Изв. АН СССР, сер Техн. кибернентика, 1972.

79. Подиновский В.В. О решении многокритериальной задачи как задачи по одному критерию в условиях неопределенности. М.: Автоматика и вычислительная техника, 1976.

80. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999.

81. Bellman R.E., Zadeh L.A. Decision-making in a fuzzy environment.// Management Science, 1970, №17, p. 141 -164.

82. Thole U., Zimmerman H., Zysno P. On the suitability of minimum operators for the intersection of fuzzy sets.// Fuzzy Sets and Systems, 1979, №2, p. 167-180.

83. Дюбуа и Прад. Теория возможностей. Приложение к представлению знаний в информатике. Пер. с фр. М.: Радио и связь, 1990.

84. Зернов М. М. Способ построения нечеткой многокритериальной оценочной модели.// Нейрокомпьютеры: разработка, применение №1 —2007. С.40-50.

85. Борисов В.В., Бычков И.А., Деменьтьев А.В., Соловьёв А.П., Федулов А.С. Компьютерная поддержка сложных организационно-технических систем. — М.: Горячая линия — Телеком, 2002.

86. А.В. Андрейчиков О.Н. Андрейчикова. Анализ, синтез, планирование решений в экономике. Москва, «Финансы и статистика», 2000.

87. Ларичев О. И. Теория и методы принятия решений, а также хроника событий в волшебных странах. М.: Логос, 2000.90. http://www.delphikingdom.com

88. Бровкова М.Б.Системы искусственного интеллекта в машиностроении: Учеб. пособие. Саратов: Сарат. гос. техн. ун-т, 2004. 119 с.

89. Sugeno М., Yasukawa Т. A fuzzy-logic-based approach to qualitative modeling.// IEEE Transactions on Fuzzy Systems. — 1993. Vol. 1. - P. 7-31.

90. Mamdani E.H. Application of fuzzy algorithms for control of a simple dynamic plant.// Proc. Inst. Elect. Eng. 1974. - Vol. 121. - P. 1585-1588.

91. Takagi Y., Sugeno M. Fuzzy identification of Systems and its application to modeling and control.// IEEE Transactions Systems, Man and Cybernetics. 1985. -Vol. SMC - 15. - P. 116-132.

92. Штовба С.Д. Проектирование нечетких систем средствами Matlab.-M.: Горячая линия Телеком, 2007.

93. Леоненков А. В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. -СПб.:БХВ, Петербург, 2005. 736 с.

94. Вагин В. Н., Головина Е. Ю., Загорянская А. А., Фомина М. В. Достоверный и правдоподобный вывод в интеллектуальных системах./ Под ред. В.Н. Вагина, Д.А. Поспелова. -М.: ФИЗМАТЛИТ, 2004. 704 с.

95. Нечеткие множества в моделях управления и искусственного интеллекта./ Под ред. Д.А. Поспелова. М.:Наука, 1986. - 321с.

96. О 8 0.6 04 О 2 0 -02 -0.4 -0.6

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.