Разработка и исследование непараметрических вероятностных моделей стохастических систем тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат физико-математических наук Слонова, Лидия Адольфовна

  • Слонова, Лидия Адольфовна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2004, Красноярск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 132
Слонова, Лидия Адольфовна. Разработка и исследование непараметрических вероятностных моделей стохастических систем: дис. кандидат физико-математических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Красноярск. 2004. 132 с.

Оглавление диссертации кандидат физико-математических наук Слонова, Лидия Адольфовна

Введение.

Глава 1. Методы оценивания плотности вероятностей.

1.1. Параметрическое оценивание плотностей.

1.2. Сведения о непараметрических оценках плотности.

1.3. Непараметрические оценки плотности Розенблатта-Парзена.

1.4. Непараметрические оценки условной плотности. Теорема сходимости.

Глава 2. Непараметрические вероятностные алгоритмы идентификации.

2.1. Постановка задачи идентификации, приводящая к определению моды условной плотности.

2.2. Оптимизация непараметрических оценок.

2.3. О некоторых оценках функции распределения.

2.4. О нахождении оптимального параметра размытости при восстановлении плотности одномерного распределения.

Глава 3. Алгоритмы нахождения наиболее вероятного значения плотности.

3.1. Аналитическое нахождение моды.

3.2. Способы нахождения параметра х0 при логарифмической трансформации исходных данных.

3.3. Нахождение моды плотности, используя систему кривых Пирсона.

3.4. Численные исследования применения метода логарифмической трансформации и применения аналитических формул определения моды.

Глава 4. Численные исследования работы регрессионной и модально-ре^эессионных моделей.

4.1. Имитационное моделирование объекта.

4.2. Сравнительный анализ работы регрессионной и модально-регрессионной (вида А) моделей.

4.3. Сравнительный анализ работы регрессионной и модально-регрессионной (вида В) моделей.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и исследование непараметрических вероятностных моделей стохастических систем»

Актуальность темы. В связи с развитием таких направлений науки и информационных технологий, как математическое моделирование, системный анализ, обработка статистической информации стало возможным построение математических моделей сложных систем. Прогрессивная методология системного анализа [2], имеющая общетеоретическое значение при рассмотрении сущности и общих принципов исследования сложных систем, позволяет поставить задачу познания объекта (процесса, явления) в конкретных науках и выбрать эффективную стратегию его изучения как системы. Эта методология на основе сравнительного анализа альтернативных решений позволяет выбрать соответствующую концепцию построения и совершенствования моделей сложных систем, сформулировать общие условия, обеспечивающие успешную работу ряда компонент при их объединении в одно целое. Высокая результативность методологии системного анализа позволяет ставить и решать задачи организации, функционирования и дальнейшего развития сложных систем, у которых состав и границы далеко не очевидны.

Попытки моделирования сложных систем привели к появлению множества приемов, подходов, которые постепенно обобщались, образуя определенную технологию преодоления количественных и качественных сложностей. Такие ситуации возникали в разных сферах практической деятельности, а соответствующие технологии вместе с их теоретическими основами получали разные названия: в инженерной деятельности - «методы проектирования», «системотехника»; в экономике - «исследование операций»; в административном и политическом управлении — «системный подход», «политология»; в прикладных научных исследованиях - «имитационное моделирование» и т. п.

Построение математических моделей является эффективным методом исследования различных объектов и систем. Внимание к вопросам построения моделей объектов и систем в условиях их функционирования обусловлено высокой практической значимостью. В работах [5,12,21] рассматриваются проблемы моделирования, отличающиеся и методами и алгоритмами. В [71] особое внимание уделяется построению математических моделей (аналитических или имитационных), реализуемых на современных ЭВМ. Моделирование используется для принятия обоснованных решений в различных сферах деятельности.

Создание моделей может быть осуществлено на основе изучения некоторой совокупности входных и выходных величин, которые описывают поведение объекта. Моделирование на основе результатов реализаций «вход-выход» известно в настоящее время как идентификация объектов или систем.

Задача идентификации состоит в оценивании функции на основе выборки в форме: = /5(х,у1ух(), (В.1) где у>1 - выходные, а. X; =(х};х?;.;х£) - входные измеряемые величины, = 1,5, 5 - объем выборки. Для нахождения оценки (В.1) могут быть применены как параметрические, так и непараметрические методы. В зависимости от применяемых методов формулы типа (В.1) являются параметрическими или непараметрическими моделями объекта.

Любые данные, представляющие собой количественные характеристики каких-либо объектов или систем, формируются под воздействием множества факторов, не все из которых доступны внешнему контролю. Обычно предполагают, что все факторы, не учтенные явно в модели, оказывают на объект или систему некоторое результирующее воздействие, значение которого невозможно предсказать заранее. Его можно рассматривать как некоторую случайную величину % с неизвестной плотностью распределения р(£,). При построении моделей с использованием данных экономического, медицинского, экологического характера все факторы, не учтенные в модели, обычно, носят не аддитивный, а мультипликативный характер. С помощью центральной предельной теоремы можно показать, что их закон распределения близок к логарифмически нормальному при самых общих условиях, аналогично тому, как нормальное распределение имеет место при сложении ошибок. Введение случайного компонента в модель приводит к тому, что взаимосвязь остальных ее переменных перестает быть строго детерминированной и становится стохастической. Наличие стохастической (вероятностной) связи между входными и выходными измеряемыми величинами предполагает, что каждому фиксированному значению входной переменной соответствует определенное (условное) распределение вероятностей выходной переменной с плотностью р(у/х). Можно рассматривать некоторую типичную характеристику этого распределения, такую, как среднее, мода, медиана и т. п. [32]. Вообще говоря, это значение будет зависеть от х и может быть обозначено ух. При изменении х, точка (х, ух) описывает некоторую кривую, которая называется модельной линией регрессии, а саму функцию — модельной функцией регрессии. Если в качестве ух выбирать условное среднее, то будем получать среднюю регрессию, если за ух принимать моду, то получается модальная регрессия, в случае выбора за ух медианы, говорят о медианной регрессии.

Стохастическая природа данных обуславливает необходимость применения специальных адекватных им статистических методов для их анализа и обработки. Для одного и того же объекта в зависимости от конкретных требований практики и типа решаемой задачи может быть построен ряд моделей. В математической статистике можно выделить два подхода к решению одних и тех же задач. Эти подходы обусловили возникновение двух больших групп методов: параметрического и непараметрического, в определенной мере конкурирующих и противостоящих друг другу.

Группа параметрических методов предполагает достаточный объем априорной информации о закономерностях функционирования изучаемых объектов, поскольку в этом случае необходимо на первом этапе определить параметрический класс моделей с точностью до набора вектора параметров. Если класс моделей, к которому принадлежит изучаемый объект, задан, то рассматривают постановку задачи идентификации в «узком смысле», которая трактуется как оценивание коэффициентов алгебраического или дифференциального уравнения объекта.

Общим вопросам идентификации в узком смысле посвящено много научной литературы. В книгах П. Эйкхоффа [72,84] рассмотрены основные понятия и определения модели, постановка задач оценивания параметров и методы решения задач для различных классов объектов. Э.П. Сейдж и Д.Л. Мелса в [63] рассматривают классические методы получения модели, базирующиеся на корреляционной теории случайных функций, методы стохастической аппроксимации. Исследуют оптимальные байесовские оценки и оценки максимума правдоподобия. В работах Н.С. Райбмана и В.М. Чадеева [57,58] рассматриваются общие методы и алгоритмы построения моделей, на базе которых решаются задачи выбора структуры параметров на основе данных «вход-выход». Формулируется постановка задачи идентификации и предлагаются методы построения линейных и нелинейных моделей. Все эти модели изучаются с точки зрения математического описания, т. е. приводятся соотношения, использующие данные наблюдения объекта. В книге ЯЗ. Цыпкина [82] в основном изложение касается идентификации линейных объектов, описывающихся линейными разностными уравнениями. Среди разнообразных алгоритмов, предназначенных для оценивания коэффициентов уравнений по наблюдаемым данным, чаще всего используются рекуррентные методы. У Ф. Фишера [77] рассмотрены вопросы идентификации экономических систем, а именно, вопросы оценивания параметров зависимостей, выражающих технологию или экономическое поведение систем на основе эмпирических исследований. Дается систематическое изложение проблем, связанных с идентификацией моделей больших размерностей. Рассматриваются условия, накладываемые на систему, а также проблемы, связанные с нелинейностью уравнений.

Для сложных реальных объектов приходится предварительно решать такие задачи, как: выбор структуры или задание класса моделей, оценивание степени и формы влияния входных переменных на выходные. Часто из-за отсутствия достаточных априорных сведений эти проблемы становятся неразрешимыми. В этом случае рассматривают задачу идентификации в «широком смысле» [43,72 и др.].

Принципы формирования алгоритмов идентификации тесно связаны с выбором аппроксимирующего уравнения объекта, выбором критерия качества этой аппроксимации (функции потерь) и выбором метода оптимизации критерия [56,83]. До сих пор этот выбор был в значительной степени произвольным, и поэтому предпочитали квадратичную функцию потерь. В этом случае получали в качестве оценки выходов среднеквадратичную (среднюю) регрессию, которую обычно называют просто регрессией, т. е. традиционно при сглаживании данных применяют модели вида: y = M{Y/x}. (В .2)

Построение и исследование регрессионных моделей можно рассматривать как с позиций параметрического подхода [5,21,27,32,33], так и непараметрического [26,48,64,80]. Следует заметить, что использование моделей средней регрессии оправдано, если условная плотность распределения выходных переменных при данном значении входа имеет симметричный или близкий к нему вид. В последнее время появилась потребность многих наук в обработке данных, не имеющих характерное гауссовское распределение. В частности, таковы многие задачи экономики, социологии, биологии и т. д. В этом случае, более разумно в качестве оценки выхода выбирать наиболее вероятное значение условного распределения [43,80,93], т. е. строить модели вида: у = mod р(у / х), (В.З) которые назовем модально-регрессионными. Следует отметить, при использовании модально-регрессионных моделей получаемые оценки выходов являются робастными, т. е. менее чувствительны к «засорениям» статистических данных и влиянию грубых ошибок, попавших в статистический материал. Пропагандой робастных методов оценивания занимались Д. Тьюки

75], Н. Джонсон и Ф. Лион [14]. В книге В. Хардле [80] упоминается о таком простом и устойчивом методе оценивания, как медианное сглаживание и говорится об устойчивости этого метода по отношению к большим выбросам. В этой же работе рассматривается ".задача предсказания на один шаг для одномерных временных рядов", а одним из способов предсказания будущих значений является метод, основанный на функции моды условной плотности (в предположении ее однозначности).

Ясно, что применение моделей (В.З) при идентификации различных объектов предпочтительнее, т. к. оценки выходов, получаемые по этим моделям, будут точнее, чем оценки, полученные с использованием обычных регрессионных моделей (В.2), но здесь возникает задача оценивания моды условной плотности. Естественный путь ее решения — восстановить плотность и найти абсциссу максимума оценки. Этот прием основан на том, что Парзеном была введена оценка в$ моды в распределения, а именно: р5{в5) = шахр5 (х) . X

Причем в случае, когда мода 0-единственна, доказана состоятельность и асимптотическая нормальность этой оценки 65~. Сама по себе задача восстановления плотности распределения по результатам наблюдений является центральной задачей математической статистики. Для ее решения могут применяться как параметрические, так и непараметрические подходы. При параметрическом подходе на основании некоторых априорных сведений выдвигается гипотеза о том, что закон распределения наблюдаемых данных принадлежит к тому или иному параметрическому семейству - гауссовскому, показательному и т. п. Эти распределения считаются зависящими от конечного числа параметров, которые оцениваются по выборочным данным. К настоящему времени разработаны различные алгоритмы оценивания неизвестных параметров по наблюдениям входа и выхода объектов с привлечением, как правило, классических методов - метода наименьших квадратов, метода максимального правдоподобия и метода моментов [10,33,56]. На следующем этапе проверяется адекватность выбранного распределения с

2 2 использованием критериев согласия типа % Пирсона, Колмогорова, со Мизеса и др. Применение критериев согласия для проверки простых и сложных гипотез рассматривается в [39,65,68].

Естественно, что ограниченное множество типов параметрических распределений, используемых на практике, не всегда позволяет адекватно описать реально существующие зависимости, или априорной информации недостаточно для того, чтобы выдвинуть ту или иную гипотезу относительно предполагаемого закона распределения. В этом случае применяют методы обработки данных, которые не предполагает знания априори параметрического семейства законов распределений, т.е. применяют непараметрические методы. Они начали развиваться значительно позднее, чем гауссовские и обладают перед ними рядом преимуществ. Основные из них — более широкое поле приложений, а также возможность их использования для выборок малого объема. Вопросам непараметрического оценивания плотностей последнее время в научной литературе посвящено много работ и монографий [13, 15-18]. Внимание к этой проблеме вызвано как ее теоретическим значением, так и важностью для приложений.

Предварительными простейшими оценками плотностей можно считать гистограмму и полиграмму первого и более высокого порядков [60,68,74].

Последующий вклад в теорию непараметрического оценивания плотности внесли М. Розенблатт, Е. Парзен [88, 89], В.А. Епанечников [18]. В работах этих и других авторов вводятся новые классы оценок, обобщающие гистограмму. Так, один из этих классов, называемых "ядерными оценками", был предложен Розенблаттом и Парзеном. В работах [16,44,49,64] исследуются вопросы несмещенности оценок, асимптотика и скорость сходимости отклонений, изучается влияние формы ядра на качество приближения оценки к функции плотности. В статьях [24,31] рассматриваются варианты определения параметра размытости (сглаживания) непараметрических оценок плотности, в частности, с гауссовым ядром. Определяются границы области поиска экстремума по параметру размытости функционала правдоподобия или эмпирического риска, исследуется скорость сходимости к нулю интегральной среднеквадратичной ошибки. Mark Brewer в работе "Байесовская модель для локального сглаживания в ядерной оценке плотности" [86] предлагает процедуру для управления шириной окна в ядерной оценке одномерной плотности с использованием перекрестной проверки и анализа графической модели. Процедура допускает гибкий выбор ширины окна в терминах требуемой величины степени сглаживания. Показывается особое преимущество метода с точки зрения квадратичного риска при малых объемах выборок, что подтверждено на примере оценки плотности по реальным данным.

При построении оценок естественными являются вопросы исследования их асимптотического поведения и сходимости к оцениваемым функциям. Задачи статистического оценивания, свойства параметрических и непараметрических оценок рассматриваются в книгах JL Девроя и JL Дьерфи [13], И.А. Ибрагимова и Р.З. Хасьминского [23], Г.М. Мания [41], Э.А. Надарая [49], Ф.П. Тарасенко [74], в статьях Ю.А. Кошевника [30], Г.М. Кошкина [31], С.Ю. Новака [52,53].

Работа посвящена построению модально-регрессионных моделей, причем рассматривается несколько подходов к их построению, т. е. применяются как параметрические, так и непараметрические методы.

Вопрос о том, какую группу методов следует использовать при анализе данных, составлял предмет спора с давних времен. Примером тому могут служить разногласия между Пирсоном и Фишером, о которых пишет в своей монографии В. Хардле [80]: ".обе точки зрения по-своему интересны. Пирсон отмечал, что цена, которую мы должны заплатить за чисто параметрическое приближение, - это возможность грубой ошибки при спецификации, приводящей к слишком большому смещению модели. С другой стороны, Фишер выражал обеспокоенность в связи с рассмотрением моделей без параметров в чистом виде, которые могут приводить к большому разбросу оценок, особенно для выборок малого объема".

В научной литературе разрабатывается идея о совместном использовании тех и других методов для наиболее полного учета априорной информации. В.Хардле отмечает, что совмещение параметрических и непараметрических составляющих может даже привести к построению лучших моделей. В последнее время получены успешные результаты при восстановлении стохастических зависимостей, использующих учет частичных сведений об их виде и данных экспериментальных исследований. Такой комплексный подход имеет место в работах Г.М. Мания [41], А.В. Лапко, В.А. Лапко, С.В.Ченцова [35-37].

В диссертационной работе при построении модально-регрессионных моделей (В.З) для нахождения оценки моды условной плотности предлагается несколько способов. Один из них состоит в том, что, сначала, используя непараметрические оценки Розенблатта-Парзена, восстанавливается условная плотность, а затем находится абсцисса ее максимума (модель А). Применение ядерных оценок связано с нахождением оптимального параметра размытости. Этому вопросу посвящены работы [24,31,42]. В данной работе предлагается несколько видов новых критериев для его нахождения, проведен их численный сравнительный анализ.

Другой подход предусматривает для некоторого типа данных нахождение моды плотности без восстановления последней (модель В).

Цель работы состоит в построении модально-регрессионных моделей идентификации стохастических объектов по наблюдениям входа и выхода, измеренными с помехами с неизвестными функциями распределения. Для достижения поставленной цели необходимо решить следующие задачи:

- сформировать выборку условного распределения выходов при каждом фиксированном значении вектора входных переменных;

- найти оценку условной плотности одномерного распределения выходов;

- предложить критерий нахождения оптимального параметра размытости;

- предложить алгоритмы нахождения моды условной плотности;

- при нахождении моды с использованием аналитических формул предложить способ определения параметра л:0.

Методы исследования. При выполнении диссертационной работы использован современный вероятностно-статистический аппарат, методы теории оптимизации и статистического моделирования, элементы аналитической геометрии, а также методы непараметрического оценивания плотностей вероятностей.

Научная новизна работы состоит в следующем:

1. Предложен новый метод идентификации стохастических систем, а именно, новый класс модально-регрессионных моделей;

2. Сконструирована непараметрическая оценка условной плотности и доказана с помощью трех лемм теорема ее асимптотической сходимости к условной плотности в среднеквадратическом смысле;

3. Предложены критерии выбора оптимального значения параметра размытости в оценках одномерных плотностей Розенблатта-Парзена, в которых используется новая непараметрическая оценка функции распределения и доказана ее сходимость к оцениваемой функции;

4. Выведены формулы определения моды плотности в зависимости от асимметрии распределения для некоторого вида изучаемых данных и аналитически построен интервал, которому принадлежит мода;

5. Предложены некоторые виды нелинейных преобразований статистических данных, сводящие их распределение к нормальному, и метод определения параметра таких преобразований.

Практическая ценность. Результаты работы могут найти применение в математическом моделировании, в обработке статистической информации и системном анализе при изучении работы сложных стохастических объектов и систем, наблюдаемые входные и выходные данные которых осуществляются с помехами с неизвестными функциями плотностей распределения. Предлагаемые в диссертации методы могут быть использованы в широком круге приложений экономики - инвестиционный анализ, принятие решений, управление риском и др.

На защиту выносятся:

1. Методы построения модально-регрессионных моделей;

2. Критерии нахождения оптимального параметра размытости при непараметрическом ядерном восстановлении плотностей;

3. Методы определения оценки моды плотности;

4. Результаты сравнительного анализа оценивания выходов по регрессионной и модально-регрессионным моделям, проведенного на модельных примерах;

5. Теоремы об асимптотической сходимости непараметрических оценок условной плотности и функции распределения в среднеквадратическом смысле к оцениваемым функциям.

Апробация работы. Основные результаты диссертации докладывались и обсуждались:

- на V, VII Всероссийских научно-практических конференциях "Проблемы информации региона. ПИР", Красноярск, 1999, 2001 гг.;

- на I, II Всесибирских конгрессах женщин-математиков, Красноярск, 2000, 2001 гг.;

- на IV, V Международных симпозиумах "Интеллектуальные системы" INTELS '2000,2002, Москва, 2000г., Калуга, 2002г.;

- на Международной научной конференции 'Интеллектуальные системы и информационные технологии управления IS&ITC - 2000", Псков, 2000г.;

- на VIII Международной конференции "Математика. Компьютер. Образование.", Пущино, 2001г.;

- на Межрегиональной научно-практической конференции преподавателей и работников торговли, Красноярск, 2001г.;

- на Всероссийской научно-практической конференции с международным участием "Достижения науки и техники - развитию сибирских регионов", Красноярск, 2001г.;

- на VI Международной конференции "Computer Data Analysis and Modeling", Минск, 2001г.;

- на III Международной конференции "Кибернетика и технологии XXI века", Воронеж, 2002г.;

- на I, II Всероссийских конференциях по финансово-актуарной математике и смежным вопросам. ФАМ' 2002, 2003, Красноярск,2002, 2003гг.;

- на Межрегиональной конференции "Математические модели природы и общества", Красноярск, 2002г.;

- на Международной конференции САКС-2002;

- на семинарах в Научно-исследовательском институте СУВПТ (20002003гг.);

- семинарах кафедры высшей и прикладной математики КГТЭИ (20002004гг.).

Публикации. По результатам работы опубликовано 15 печатных работ; в том числе, лично -8; в виде статей - 13 и тезисов докладов - 2.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка используемой литературы из 104 названий и приложения. Содержание работы изложено на 130 страницах печатного текста, проиллюстрировано 78 рисунками.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Слонова, Лидия Адольфовна

Заключение

В диссертационной работе было предложено при идентификации стохастических объектов использовать не общепринятые регрессионные, а новые модально-регрессионные модели. Построение таких моделей осложнено тем, что необходимо оценивать моду условных плотностей. Поскольку сами условные плотности априори неизвестны, в работе сконструированы их непараметрические оценки и доказана, с помощью трех лемм, теорема об асимптотической сходимости оценки условной плотности в среднеквадратическом смысле к условной плотности. Эти оценки, в случае к -мерных входных переменных, зависят от (/: + 1)-мерных векторов параметров размытости, задача нахождения которых пока не решена. В диссертации предложен алгоритм формирования одномерной выборки выходов при каждом фиксированном значении вектора входных переменных. По этим выборкам осуществляется оценивание моды, которая и принимается за оценку выхода. Задача нахождения оценки моды плотности условного распределения решается разными методами, каждый из которых имеет свои сложности. Один из методов построения модально-регрессионных моделей предполагает восстановление условной плотности с использованием непараметрических оценок Розенблатта-Парзена. В этом случае качество восстановление существенно зависит от выбора параметра размытости С5. В работе предложено несколько критериев для настройки этого параметра, проведено численное исследование восстановления плотностей по выборкам как большого, так и малого объемов, где параметр С5 находился по одному из этих критериев. После чего был сделан вывод, что наиболее оправдано применение критерия (С5). При выборе параметра размытости по этому критерию требуется меньше машинного времени, чем при работе с критериями

ПРИ этом У восстановленной плотности видны ее все особенности. Это очень важно, если учесть, что целью восстановления является определение моды. В каждом из этих критериев используется новая непараметрическая оценка функции распределения, которая была предложены в данной работе. Доказана теорема об ее асимптотической сходимости в среднеквадратическом смысле к функции распределения.

Другой метод может применяться в таких областях как экономика, медицина, экология и др. В этом случае можно показать, что условные плотности будут иметь распределения близкие к логарифмически нормальным. В работе выведены формулы нахождения моды плотности Мох, аналитические выражения которых зависят от таких характеристик как медиана Мех и среднее квадратичное отклонение <7. Они легко определяются по имеющимся данным. Также в этих формулах присутствует параметр х0, для однозначного определения которого, предложен критерий И^Осо). Применение этих формул значительно упрощает задачу построения модально-регрессионных моделей, т. к. в этом случае нет необходимости восстанавливать условную плотность, но может применяться только для определенного типа данных.

В диссертации предложен способ преобразования данных, имеющих асимметричную функцию плотности, к данным, распределение которых имеет близкий к нормальному вид. Так же аналитически получен интервал, которому принадлежит мода, что позволит уменьшить объем вычислений при нахождении моды по восстановленной плотности.

Применяя методы имитационного моделирования, были проведены численные исследования применения модально-регрессионных и регрессионных моделей при идентификации стохастических объектов и систем. Предложенные и построенные модально-регрессионные модели показали лучшую точность восстановления зависимостей по статистическим данным с точки зрения абсолютных ошибок, посчитанных по моделям.

Сформулируем кратко заключительные выводы.

1. Предложен новый класс модально-регрессионных моделей при идентификации объектов и несколько методов их построения.

2. Сконструирована непараметрическая оценка условной плотности и предложена новая непараметрическая оценка функции распределения, доказаны теоремы асимптотической сходимости этих оценок к оцениваемым функциям в среднеквадратическом смысле.

3. Предложены критерии выбора параметров размытости для оценок плотности Розенблатта-Парзена и исследовано их применение на различных выборках.

4. Выведены формулы нахождения моды для данных, имеющих распределение близкое к логнормальному или зеркально ему отраженному.

5. Предложен способ преобразования статистических данных, имеющих логнормальное распределение к нормальному.

Список литературы диссертационного исследования кандидат физико-математических наук Слонова, Лидия Адольфовна, 2004 год

1. Александров, П.С. Курс аналитической геометрии и линейной алгебры / П.С. Александров. М.: Наука, 1979. - 512 с.

2. Беляков, Г.П. Основы системотехники / Г.П. Беляков, В.А. Сарычев,

3. B.А. Сорокин и др. Томск: МГП «РАСКО», 1992. - 312с.

4. Браунли, К.А. Статистическая теория и методология в науке и технике / К.А. Браунли. М.: Наука, 1977. - 407 с.

5. Вадзинский, Р.Н. Справочник по вероятностным распределениям / Р.Н. Вадзинский. Спб.: Наука, 2001. - 295 с.

6. Вапник, В.Н. Восстановление зависимостей по эмпирическим данным / В.Н. Вапник. М.: Наука, 1979. - 446 с.

7. Венедякин, Г.В. Общая методика экспериментального исследования и обработки опытных данных / Г.В. Венедякин. М.: Колос, 1972. - 315 с.

8. Вентцель, Е.С. Теория вероятностей и ее инженерные приложения / Е.С. Вентцель, Л.А. Овчаров. М.: Наука, 1988. - 480 с.

9. Гитник, А.П. О статистической оценке вероятности случайного события / А.П. Гитник // Автоматика и вычислительная техника. 1975. - №5. —1. C. 62-69.

10. Гихман, И.И. Непараметрические методы статистики / И.И. Гихман, Б.В. Гнеденко, Н.В. Смирнов // Тр. 3-го Всесоюз. математ. съезда. М., 1958.-Т.З.-С. 320-334.

11. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учеб. пособие / В.Е. Гмурман. М.: Высш. шк., 1998. - 478 с.

12. Гнеденко, Б.В. Курс теории вероятностей: Учебник / Б.В. Гнеденко. М.: Наука, 1988. - 448 с.

13. Гроп, Д. Методы идентификации систем / Д. Гроп. М.: Мир, 1979. -426с.

14. Деврой, Л. Непараметрическое оценивание плотности. Ь —подход / Л.Деврой, Л. Дьерфи. М.: Мир, 1988. - 407 с.

15. Джонсон, Н. Статистика и планирование эксперимента в технике и науке. Т. 1,2 / Н. Джонсон, Ф. Лион. М.: Мир, 1980. - 610 с.

16. Дмитриев, Ю. Г. Статистическое оценивание распределений вероятностей с использованием дополнительной информации / Ю.Г. Дмитриев, Ю.К.Устинов; Под ред. В.В. Конева. Томск: Изд-во Томск, гос. ун-та, 1988. -194 с.

17. Добровидов, A.B. Непараметрическое оценивание сигналов / A.B. Добровидов, Г.М. Кошкин. М.: Наука. 1997. - 336 с.

18. Елисеенко, И.Л. Некоторые задачи непараметрического оценивания плотности распределения: Автореф. дис. . канд. физ. мат. наук. / И.А.Елисенко. - Л., 1988. - 14 с.

19. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности / В.А. Епанечников//ТВиП. 1969.- Т.14. - С.156-161.

20. Живоглядов, В.П. Непараметрические алгоритмы адаптации / В.П. Живоглядов, A.B. Медведев. Фрунзе: Илим, 1974. - 136 с.

21. Загоруйко, Н.Г. Алгоритмы обнаружения эмпирических закономерностей / Н.Г. Загоруйко, В.Н. Елкина, Г.С. Лбов. Новосибирск: Наука. Сиб. отд-ние, 1985.-108 с.

22. Замков, О.О. Математические методы в экономике: Учебник / О.О. Замков, A.B. Толстопятенко, Ю.Н. Черемных; Под ред. A.B. Сидоровича. М.: ДИС, 1998. - 368 с.

23. Золотарев, В.М. Одномерные устойчивые распределения / В.М. Золотарев -М.: Наука, 1983.-304с.

24. Ибрагимов, H.A. Асимптотическая теория оценивания / И.А. Ибрагимов, Р.З. Хасьминский. М.: Наука, 1979. - 527 с.

25. Иванова, Н.В. Определение параметров сглаживания в непараметрических оценках функции плотности по выборке / Н.В. Иванова, К.Т. Протасов // Математическая статистика и ее приложения. Томск: изд-во Томск, гос. ун-та, 1982. - Вып. 8. - С. 50-65.

26. Ильин, E.B. К задаче восстановления плотности вероятности в условиях непараметрической неопределенности: Препринт ВЦ СО АН СССР / Е.В.Ильин, A.B. Лапко. Красноярск, 1980. - 26 с.

27. Катковник, А. Я. Непараметрическая идентификация и сглаживание данных / А.Я. Катковник. М.: Наука, 1985. - 415 с.

28. Кендал, М. Теория распределений / М. Кендал, А. Стьюарт. М.: Наука, 1966. - 587 с.

29. Кендал, М. Статистические выводы и связи / М. Кендал, А. Стьюарт. М.: Наука, 1973.-899 с.

30. Корн, Г. Справочник по математике / Г. Корн, Т. Корн. М.: Наука, 1977. -832 с.

31. Кошевник, Ю.А. О некоторых предельных свойствах непараметрических оценок функции распределения / Ю.А. Кошевник // ТВиП. 1984. - Т. 29. -№ 4. - С. 772-778.

32. Кошкин, Г.М. Улучшенная неотрицательная ядерная оценка плотности / Г.М. Кошкин // ТВиП. 1988. - Т. 33. - № 4. - С. 816-822.

33. Крамер, Г. Математические методы статистики / Г. Крамер. М.: Мир, 1975.-648 с.

34. Кремер, Н.Ш. Теория вероятностей и математическая статистика: Учебник / Н.Ш. Кремер. М.: Юнити-Дана, 2000. - 543 с.

35. Кудрявцев, Л. Д. Математический анализ: Учебник. Т. 2 / Л.Д. Кудрявцев. М.: Высш. шк., 1973. - 470 с.

36. Лапко, A.B. Непараметрические системы обработки информации: Учеб. пособие / A.B. Лапко, C.B. Ченцов. М.: Наука, 2000. - 350 с.

37. Лапко, В.А. Синтез и анализ непараметрических моделей коллективного типа / В .А. Лапко И Автометрия. 2001. - № 6. - С. 98-106.

38. Лапко, B.Â. Непараметрические коллективы решающих правил / В.А. Лапко; Под ред. C.B. Ченцова. Новосибирск: Наука. Сиб. отд-ние, 2002. -168 с.

39. Лемешко, Б.Ю. Статистический анализ одномерных наблюдений случайных величин / Б.Ю. Лемешко; НГТУ. Новосибирск, 1995. - 125 с.

40. Лемешко, Б.Ю. К применению непараметрических критериев согласия для проверки адекватности непараметрических моделей / Б.Ю. Лемешко, С.Н. Постовалов, A.B. Французов // Автометрия. 2002. - № 2. - С. 3-14.

41. Льюнг, Л. Идентификация систем / Л. Льюнг. М.: Наука, 1991.-421 с.

42. Мания, Г.М. Статистическое оценивание распределения вероятностей /Г.М. Мания. Тбилиси: Изд- во Тбилис. гос. ун-та, 1974. — 237 с.

43. Маркович, Н. Непараметрическое оценивание плотности вероятности: восстановление распределений с тяжелыми хвостами / Н. Маркович // Междунар. конф. по проблемам управления: Избр. тр. Т 2. - М.: СИНТЕГ, 1999. - С. 66-67.

44. Медведев, A.B. Непараметрические оценки плотности вероятности и ее производных / A.B. Медведев // Автоматизация промышленного эксперимента. Фрунзе: Илим, 1973. - С. 22-31.

45. Медведев, A.B. Адаптация в условиях непараметрической неопределенности / A.B. Медведев // Адаптивные системы и их приложения. Новосибирск: Наука. Сиб. отд-ние, 1978. - С. 4-34.

46. Медведев, A.B. Непараметрические системы обучения и адаптации: Препринт ВЦ СО АН СССР / A.B. Медведев. Красноярск, 1981. - 72 с.

47. Медведев, A.B. Непараметрические системы адаптации / A.B. Медведев. — Новосибирск: Наука. Сиб. отд-ние, 1983. 174 с.

48. Медведев, A.B. О моделировании организационных процессов / A.B. Медведев // Вестник Сибир. аэрокосм. акад. имени академика М. Ф. Решетнева: Сб. науч. тр. / Под ред. Г. П. Белякова; CAA. Красноярск, 2000. - Вып. 1.-С. 173-191.

49. Надарая, Э.А. Об оценке регрессии / Э.А. Надарая // ТВиП. 1964. - Т. 9. -№1. - С. 157-159.

50. Надарая, Э.А. О непараметрических оценках плотности вероятности и регрессии / Э.А. Надарая // ТВиП. 1965. - Т. 10. - № 1.- С. 184-187.

51. Надарая, Э.А. Непараметрическое оценивание плотности вероятности и кривой регрессии / Э.А. Надарая. Тбилиси: Изд-во Томск, гос. ун-та, 1983. -193 с.

52. Надарая, Э.А. Замечания о непараметрических оценках плотности вероятности и кривой регрессии / Э.А. Надарая // ТВиП. 1970. - Т. 15. -№ 1.-С. 139-142.

53. Новак, С.Ю. О моде неизвестного вероятностного распределения / С.Ю. Новак // ТВиП. 1999. - Т 44. - № 1. - С. 119-123.

54. Новак, С.Ю. Обобщенная ядерная оценка плотности / С.Ю. Новак // ТВиП. 1999. Т 44. - № 3. - С. 634-645.

55. Пискунов, Н.С. Дифференциальное и интегральное исчисления: Учебник. Т. 2 / Н.С. Пискунов. М.: Наука, 1972. - 576 с.

56. Поллард, Дж. Справочник по вычислительным методам статистики / Дж. Поллард; Под ред. Е.М. Четыркина.- М.: Финансы и статистика, 1982.-344 с.

57. Пугачев, B.C. Теория вероятностей и математическая статистика / B.C. Пугачев. М.: Наука, 1979. - 590 с.

58. Райбман, Н.С. Что такое идентификация / Н.С. Райбман. М.: Наука, 1970. -117 с.

59. Райбман, Н.С. Адаптивные модели в системах управления / Н.С. Райбман, В.М. Чадеев. М.: Сов. радио, 1966. -160 с.

60. Рубан, А.И. Идентификация и чувствительность сложных систем / А.И. Рубан. Томск: Изд-во Томск, гос. ун-та, 1982.- 302 с.

61. Рубан, А.И. Методы анализа данных: Учеб. Пособие. В 2 ч. / А.И. Рубан; КГТУ. Красноярск, 1994. - 312 с.

62. Рубан, А.И. Методы оптимизации / А.И. Рубан; КГТУ. Красноярск, 2001. -527 с.

63. Рунион, Р. Справочник по непараметрической статистике / Р. Рунион М.: Финансы и статистика, 1982. - 198 с.

64. Сейдж, Э.П. Идентификация систем управления / Э.П. Сейдж, Д.Л. Мелса. М.: Наука, 1974. - 246 с.

65. Сергеев, B.JI. К оптимизации регрессионных оценок непараметрического типа при ограниченных выборках / B.JI. Сергеев. // Матем. статистика и ее приложения. Томск: Изд-во Томск, гос. ун-та, 1982. Вып. 8. - С. 123-148.

66. Смирнов, Н.В. О распределении w критерия Мизеса / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. - М.: Наука, 1970. - С. 60-78.

67. Смирнов, Н.В. Об уклонениях эмпирической кривой распределения / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. - С. 88-107.

68. Смирнов, Н.В. О приближении плотностей распределения случайных величин / Н.В. Смирнов // Теория вероятностей и математическая статистика: Избр. тр. М.: Наука, 1970. - С. 205-223.

69. Смирнов, Н.В. Курс теории вероятностей и математической статистики для технических приложений: Учеб. пособие / Н.В. Смирнов, И.В. Дунин-Барковский. М.: Наука, 1969. - 511 с.

70. Снедекор, Дж. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии / Дж. Снедекор. М.: Сельхозиздат, 1961. -503 с.

71. Соболь, ИМ. Метод Монте-Карло / И.М. Соболь. М.: Наука, 1985. - 40 с.

72. Советов, Б.Я. Моделирование систем / Б.Я. Советов, С.А. Яковлев. М.: Высш. шк., 1998. - 319 с.

73. Современные методы идентификации систем / Под ред. П. Эйкхоффа. М.: Высш. шк., 1977. - 288 с.

74. Справочник по прикладной статистике / Под ред. Э. Ллойда, У. Ледермана, С.А. Айвазяна и др. М.: Финансы и статистика, 1989. - Т. 1. - 510 е., Т. 2. -527 с.

75. Тарасенко, Ф.П. Непараметрическая статистика / Ф.П. Тарасенко Томск: Изд-во Томск, гос. ун-та, 1967. - 265 с.

76. Тьюки, Дж. Анализ результатов наблюдений / Дж. Тьюки. М.: Мир, 1981. -693 с.

77. Уилкс, С. Математическая статистика / С. Уилкс. М.: Наука, 1967.- 632 с.

78. Фишер, Ф. Проблема идентификации в эконометрии / Ф. Фишер. М.: Статистика, 1978. - 223 с.

79. Хальд, А. Математическая статистика с техническими приложениями / А. Хальд. М.: Иностр. лит., 1956. - 326 с.

80. Хан, Г. Статистические модели в инженерных задачах / Г. Хан, С. Шапиро. М.: Мир, 1969.-395 с.

81. Хардле, В. Прикладная непараметрическая регрессия / В. Хардле. М.: Мир, 1993.-349 с.

82. Хастингс, Н. Справочник по статистическим распределениям / Н. Хастингс, Дж. Пикок. М.: Статистика, 1980. - 95 с.

83. Цыпкин, Я.З. Основы информационной теории идентификации / Я.З. Цыпкин. М.: Наука, 1984.- 320 с.

84. Ченцов, Н.Н. Статистические решающие правила и оптимальные выводы / Н.Н. Ченцов. М.: Наука, 1972. - 520 с.

85. Эйкхофф, П. Основы идентификации систем управления / П. Эйкхофф. -М.: Мир, 1975.-683 с.

86. Aitchison, J. The Log-normal Distribution / J. Aitchison, J.A.C. Brown. -Cambridge University Press, Cambridge, 1957. 134 p.

87. Brewer Mark J. A. Bayesian model for local smoothing in kernel density estimation / Mark J. A. Brewer // Statistics and Computer. 2000. - Vol. 10. -№4.-P. 299-309.

88. Johnson, N.L. Distributions in Statistics / N.L. Johnson, S. Kotz // Discrete Distributions. Houghton Mifflin. - Boston, 1969. - Vol. 1. - P. 197-203.

89. Parzen, E. On the Estimation of Probability Density Function and the Mode / E. Parzen // Ann. Math. Statist., 1962. Vol. 33. - P. 1065.

90. Parzen, E. On Estimation of a Probability Density, Function and Mode / E. Parzen I I IEEE Transactions on Information Theory. 1982 Vol. Pam - 4. -№ 6. - P. 663-666.1. Список публикаций автора

91. Слонова, JI.A. К исследованию непараметрических вероятностных моделей / Е.В. Куприянова, Л.А. Слонова, В.М. Пысин // Вестник НИИ СУВПТ. / НИИ СУВПТ. Вып.4. - Красноярск, 2000. - С.53-79.

92. Слонова, JI.A. Об одном алгоритме построения непараметрических вероятностных моделей / JI.A. Слонова // 2-й сибир. конгресс женщин-математиков / Краснояр. гос. ун-т. Красноярск, 2002. - С. 133-138.

93. Слонова, JI.A. Об одном подходе к построению непараметрических вероятностных моделей / Л.А. Слонова // Труды 1-й Всерос. ФАМ'2002 конф. Ч. 2 / ИВМ СО РАН. Красноярск, 2002. - С. 251-258.

94. Слонова, JI.A. Об одном критерии при непараметрическом восстановлении неизвестных распределений / Л.А. Слонова // Труды межрегион, конф. «Математические модели природы и общества» / КГТЭИ. Красноярск, 2002.-С. 205-211.

95. Слонова, JI.A. Об одном подходе к нахождению моды плотности распределения / Л.А. Слонова // Труды межрегион, конф. «Математические модели природы и общества» / КГТЭИ. Красноярск, -С. 212-222.

96. Слонова, Л.А. К вопросу построения вероятностных моделей / Л. А. Слонова // Тез. докл. Междунар. науч. практич. конф. САКС-2002 / СибГАУ. - Красноярск, 2002. - С. 320-322.

97. Слонова, JJ.A. Об одном подходе к нахождению наиболее вероятного значения по наблюдениям / JI.A. Слонова // Труды 2-й Всерос. ФАМ'2003 конф. Ч. 2 / ИВМ СО РАН. Красноярск, 2003. - С. 195-199.

98. Слонова, JI.A. О различных подходах при моделировании экономических систем / JI.A. Слонова // Материалы 3-й межвуз. науч. конф. аспирантов «Актуальные проблемы современной науки и пути их решения» / КГТЭИ. Красноярск, 2003. - С. 47-50.

99. Слонова, JI.A. О стохастическом моделировании экономических систем /JI.A. Слонова // Проблемы экономики и управления-2003,- № 1 С. 17-20.

100. Slonova, LA. The identification of multipli connected systems under incomplete information / A.P. Krasnoshtanov, E.V. Kupriyanjva, M.A. Protsykova et al. // Тр. 4-го Междунар. симпозиума ИНТЕЛС'2000. M.: РУСАКИ, 2000. -С.99-101.

101. Slonova, L.A. Adaptive non-parametric models and solution adoption algorithms / M.G. Berezovsky, A.V. Kuchmasov, A.V. Medvedev et al. // Труды 3-й Междунар. конф. «Кибернетика и технологии двадцать первого века». / ВГТУ.- Воронеж, 2002. С.577-588.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.