Критерии согласия, основанные на характеризациях распределений, и их эффективность тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Рагозин Илья Андреевич
- Специальность ВАК РФ00.00.00
- Количество страниц 102
Оглавление диссертации кандидат наук Рагозин Илья Андреевич
1.1 Введение в теорию U-статистик
1.2 Предельное распределение U-статистик
1.3 Большие уклонения U-статистик
1.4 Бахадуровская эффективность
1.5 Вычисление информации Кульбака-Лейблера
1.5.1 Логистическое распределение
1.5.2 Экспоненциальное распределение
1.5.3 Распределение Парето I типа
1.5.4 Распределение Рэлея
2 Критерии согласия для логистического закона распределения
2.1 Интегральные статистики LUL
2.2 Статистики типа Колмогорова KUL
2.3 Интегральная статистика IUL
2.4 Статистики типа Колмогорова QUL
2.5 Локальная бахадуровская эффективность
2.6 Сравнение построенных статистик на основе статистического моделирования
2.6.1 Norm(0,1)
2.6.2 Логистическая альтернатива масштаба вида Logist(0,eö)
2.6.3 Тестирование на наборах реальных данных
3 Критерии согласия для экспоненциального закона распределения
3.1 Интегральная статистика IU^ и ее свойства
3.2 Статистика типа Колмогорова KU^ и ее свойства
3.3 Локальная бахадуровская эффективность статистик IU^ и KU^
3.4 Интегральная статистика L^
3.5 Статистика типа Колмогорова KL^
3.6 Локальная бахадуровская эффектиновсть
4 Критерии согласия для закона распределения Парето первого типа
4.1 Интегральная статистика IUP
4.2 Статистика типа Колмогорова KUP
4.3 Локальная бахадуровская эффективность
5 Критерии согласия для закона распределения Рэлея
5.1 Интегральная статистика
5.2 Интегральная статистика /Цр и локальная бахадуровская эффективность
5.2.1 Вычисление бахадуровской эффективности для интегральных статистик
5.3 Статистика типа Колмогорова Ки^ и КЦр
5.4 Статистика Ьк
5.5 Локальная бахадуровская эффективность
5.6 Вычисление мощностей на основе статистического моделирования
6 Заключение 50 Список литературы
ПРИЛОЖЕНИЕ
A. Логистическое распределение
B. Экспоненциальное распределение
C. Распределение Парето I типа
Б. Распределение Рэлея
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Асимптотическая эффективность критериев согласия, основанных на характеризационных свойствах распределений2011 год, кандидат физико-математических наук Волкова, Ксения Юрьевна
Асимптотические свойства критериев симметрии и согласия, основанных на характеризациях2004 год, кандидат физико-математических наук Литвинова, Виктория Викторовна
Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба2005 год, кандидат физико-математических наук Чирина, Анна Владимировна
Математические модели и методы статистического анализа случайных показателей, имеющих распределение, отличное от нормального2010 год, кандидат физико-математических наук Радионова, Марина Владимировна
Предельные теоремы и статистические процедуры для величин, связанных с рекордами и экстремальными порядковыми статистиками2014 год, кандидат наук Степанов, Алексей Васильевич
Введение диссертации (часть автореферата) на тему «Критерии согласия, основанные на характеризациях распределений, и их эффективность»
Введение
Проверка статистических гипотез является, наряду с теорией оценивания, одной из двух важнейших задач математической статистики. Классический раздел проверки гипотез, входящий в раздел непа-раметрческой статистики, это проверка согласия, где на основании выборки требуется проверить, принадлежит ли она определенному семейству вероятностных распределений. Для проверки непараметрических гипотез существует множество статистических критериев. Например, в известной библиографии [68] по непараметрической статистике насчитывается большее 3000 названий критериев для проверки непараметрических гипотез. Также о разнообразии непараметрических процедур можно судить по монографии [38] и трехтомнику [74]. Из современных источников на русском языке, посвященных данной тематике, можно упомянуть монографию 2006 года [81], в которой рассмотрено и подробно описано более 200 различных статистических критериев и монографию [86], посвященную асимптотическому исследованию непараметрических критериев. Классическими примерами являются знаменитый критерий х2 (хи-квадрат) и критерии, основанные на эмпирической функции распределения - критерии Колмогорова-Смирнова, односторонние статистики Смирнова, стандартный интегральный критерий и критерий Крамера-фон Мизеса-Смирнова ш2.
В последние годы растущую популярность приобретает проверка гипотез согласия, основанная на характеризации распределений, см. обзорную статью [61]. Там описано множество критериев экспоненциальности, нормальности и равномерности, основанных на характеризациях этих семейств распределений, причем многие из них удобны для использования на практике и имеют высокую асимптотическую эффективность. Причина этого, возможно, в скрытых свойствах распределений, выраженных именно в характеризационных терминах. Теория характеризаций вызывала интерес у многих математиков, таких как Д. Пойа, Ю. В. Линник, В. П. Скитович, Ж. Дармуа, А. М. Каган, С. Р. Рао, С. Н. Бернштейн, В. Б. Невзоров, М. М. Дезу, М. Ахсануллах и многих других. Также о развитии этой области можно судить по монографиям, например, [27], [42], [78].
Идея использовать характеризации для построения критериев согласия появилась в 50-е годы XX века и принадлежит Ю. В. Линнику [82,83], однако в тот момент не было механизмов и развитой теории для реализации этой идеи. Значительно позднее, с развитием теории и-статистик, построение критериев согласия на основе характеризаций стало возможным. Можно привести следующие работы, в которых применялась и использовалась в построении критериев согласия теория и -статистик, за авторством Барингауза и Хенце [19], [21], Никитина и Поникарова [58], Мульере и Никитина [57], Литвиновой и Никитина [84], [85], Никитина и Чириной [65,66], [87,88], Волковой и Никитина [63,64], [79] и других.
Настоящая работа посвящена критериям согласия, основанным на характеризациях распределений, и их эффективности. В некоторых случаях вместо характеризационного свойства использовалось специальное свойство, то есть соотношение может выполняться не только для конкретного семейства распределений. Важность построения новых критериев согласия обусловлена тем, что одной из фундаментальных проблем математической статистики является оправданный выбор кри-
терия из нескольких доступных. Характеристикой, на основе которой можно выполнить сравнение непараметрических критериев и выявить наиболее подходящей критерий в поставленной задаче, может служить асимптотическая эффективность или асимптотическая относительная эффективность, которая будет описана позднее. Более того, как отмечено в [80], понятие асимптотической эффективности критерия, различные вариации которого появились в конце 40-х - начале 50-х годов, является более сложным, чем асимптотическая эффективность оценок. Кроме того, необходимо отметить, что достаточно одного критерия, чтобы отвергнуть проверяемую гипотезу, а каждый новый критерий ей не противоречащий, лишь постепенно приближает к принятию ее справедливости. Теперь перейдем к описанию видов асимптотической эффективности.
Пусть {Тп} и {Уп} - две последовательности статистик, построенных по некоторой выборке Х1,..., Хп с распределением ,9 Е в С К и предназначенных для проверки освновной гипотезы И0, согласно которой 9 Е во, против альтернативы И^ 9 Е в1 = в \ во. Обозначим за Ыт(а, в, 9) минимальный необходимый объем выборки, чтобы последовательность статистик {Тп} достигала мощности в Е (0,1) при заданном уровне значимости а и при альтернативном значении параметра 9 Е в1. Для последовательности статистик {Уп} число Ыу (а, в, 9) определим аналогичным образом. Тогда относительной эффективностью последовательностей {Тп} по отношению к последовательности {Уп} называется величина
К сожалению, величины Ыт, Ыу не вычисляются в явном виде даже для простых последовательностей статистик. Поэтому принято рассматривать предельные значения в//т,у (а, в, 9) при 9 ^ дв0, при в ^ 1 или при а ^ 0, при этом оставляя фиксированными два оставшихся параметра. Соответствующие предельные значения принято называть асимптотической относительной эффективностью (АОЭ) по Питмену, по Ходжесу-Леману и по Бахадуру, соответственно. Такие пределы обусловлены тем, что с практической точки зрения наиболее интересны и популярны случаи близких альтернатив, высоких мощностей и малых уровней значимости. Однако существуют и другие принципиально отличающиеся подходы к вычислению АОЭ, подробно описанные в монографии [86], например, предложенные Г. Черновым [22] и В. Калленбергом [43], где при фиксированном 9 или в предельный переход выполняется по двум оставшимся параметрам, соответственно.
В этой работе в качестве метода асимптотического сравнения критериев выбрана эффективность по Бахадуру, так как среди рассмотренных статистик есть статистики колмогоровского типа, которые не являются асимптотически нормальными, из-за чего неприменим подход Питмена. Для вычисления эффективности по Ходжесу-Леману требуется вычислить асимптотику больших уклонений при нулевой гипотезе и при альтернативе, и если при нулевой гипотезе особых затруднений нет, то при альтернативе они есть. Вдобавок, как показано в [86], АОЭ по Ходжесу-Леману оказывается менее содержательным средством, чем бахадуровская АОЭ, так как не различает между собой двусторонние критерии и локально совпадает с АОЭ по Бахадуру в случае односторонних.
Теперь продемонстрируем общий подход построения критериев, основанных на характеризации или специальном свойстве. Рассмотрим для некоторого закона распределения следующую харак-
теризацию, предполагающую одинаковую распределенность статистик (Х\, ...,Х3) и дг(Х\, ...,Х-€). Пусть Х1,...,Хга независимые одинаково распределенные (н.о.р.) наблюдения с непрерывной функцией распределения (ф.р.) Г. Проверяем сложную основную гипотезу согласия Н0 : ^ € 5о, где Уо- некоторый известный класс распределений, против альтернативы Н1 : F € 5о. Построим две и-эмпирические ф.р., соответствующие левой и правой частям характеризации:
1
Ln(t)= (Л ^ 1 {gi(X4,...,Xia) <t},t е R,
^ ' 1<il <...<is<n
Rn(t)= (n) ^ l{gr(Xii,...,Xiv) <t},t е R.
^ ' 1<i1 <...<iv <n
По теореме Гливенко-Кантелли для U-эмпирических ф.р. при нулевой гипотезе [34] функции Ln(t) равномерно сходится к функции L(t) = P(g^(X1,..., Xs) < t) при больших n, аналогично функция Rn(t) равномерно сходится к функции R(t). Так как при нулевой гипотезе L(t) = R(t), то можно заключить, что при справедливости гипотезы H0
sup |Ln(t) — Rn(t)| — 0, n —У то, t
таким образом, значения тестовых статистик, основанные на такой разности при нулевой гипотезе, должны быть малы.
Для каждой из задач мы будем рассматривать следующие статистики. Первая - на основе харак-теризаций
In = J (Ln(t) — Rn(t))dFn(t),
R
где Fn(t) - обычная эмпирическая ф.р. Изучение простейших статистик такого вида уже сделано в [84]. Вторая - это статистика типа Колмогорова:
Kn = sup |Ln(t) — Rn(t)|. teR
Теперь рассмотрим критерии, построенные на основе специального свойства, которое в нашем случае можно сформулировать так:
X1, ...,Xs — н. о. р. случайные величины (с. в.) c ф. р. F, W = g1(X1, ...,Xs) ^ Fw(t) = F0(t), Vt е R,
где Fw- ф.р. статистики W, F, F0 - известные и определенные функции распределения. Определив аналогичным образом U-эмпирическую ф.р. Ln(t), будем исследовать следующие статистики:
In = /(Ln(t) — Fo(t))fw(t)dt и Kn = sup |Ln(t) — Fo(t)|, J teR
R
где fw(t) - вероятностный вес из того же класса, что и распределение случайных величин Xi. Помимо этого, для специального свойства были построены и исследованы статистики, основанные на
разности эмпирических преобразований Лапласа, с выполнением асимптотического сравнения, о чем подробнее будет рассказано позднее. Структура и объем диссертации.
Диссертация состоит из Введения, 5 глав, заключения, списка литературы и приложения. Общий объем диссертации - 101 страницы. Список литературы содержит 96 ссылок (включая 8 ссылок на статьи автора диссертации).
В первой главе введены необходимые вспомогательные сведения из теории и-статистик, теории Бахадура, основные определения, теоремы о логарифмической асимптотике больших уклонений, в том числе улучшенная формула для вычисления точного локального бахадуровского наклона, также представлены используемые альтернативы для каждого вида распределений, и вычислена информация Кульбака-Лейблера для этих альтернатив.
Во второй главе строятся и исследуются критерии согласия для логистического семейства распределений с произвольным параметром сдвига. Семейство логистических распределений, по-видимому, было введено Верхюльстом в середине 19-го века. Его применяют во многих областях, таких как экономика (например, логистическая регрессия), теория надежности, физические модели, нейронные сети, гидрология, общественное здравоохранение и, в последнее время, в финансах. Обычно оно появляется в качестве альтернативы нормальному распределению, поскольку оно также симметрично и имеет колоколоподобную форму, но более тяжелые хвосты. Значимость и важность логистического распределения подробно описаны в справочнике [18]. Тем не менее существует всего несколько критериев согласия, специально разработанных для этого семейства распределений. Среди редких тестов такого типа, мы можем упомянуть критерии, разработанные в [1], [10], [50], [71]. В статье [53] изучаются критерии согласия типа Колмогорова для логистического семейства распределений с произвольным параметром масштаба. Также можно отметить статью [72], где для логистического распределения строятся критерии согласия, основанные на характеризации, но там обсуждается проверка лишь простой гипотезы о стандартной логистичности. Однако критериев согласия, основанных на характеризациях, для проверки сложной гипотезы о принадлежности логистическому семейству распределений с произвольным параметром сдвига не существовало. Насколько известно автору, тесты, основанные на характеризации логистического семейства распределений с произвольном параметром сдвига, впервые были построены в этой работе (результаты опубликованы в статьях [89], [90]). Причина в том, что количество известных характеризаций для логистического семейства распределений удивительно мало по сравнению с экспоненциальным и нормальным семействами распределений. Это уже было отмечено Котцем в [46]. Тем не менее, такое положение дел сохраняется даже сейчас.
Известные характеризации логистического закона довольно немногочисленны. Представление о них дают статьи [28] и [33]. Похоже, одна из первых характеризаций логистического распределения, основанная на свойстве выборочной медианы со случайным лапласовским сдвигом, появилась в [29]. После долгой паузы появилась интересная статья Лин и Ху [33], содержащая ряд новых ха-рактеризаций стандартного логистического распределения. Они представили идею характеризации с
помощью случайного сдвига порядковых статистик. Позднее были опубликованы некоторые статьи, расширяющие и развивающие это направление исследований, см. например, [5] , [6], [32], [77].
Постановку задачи проверки нулевой гипотезы о принадлежности логистическому семейству с произвольным параметром сдвига можно сформулировать следующим образом.
Пусть Х1, ... , Хп - независимые одинаково распределенные наблюдения с функцией распределения (ф.р.) Г. Будем проверять сложную гипотезу согласия И0, согласно которой Г есть ф. р.
е±х+м тгп
логистического закона с параметром сдвига ^ с плотностью (1+е±х+М)2, х, ^ Е К против альтернативы И1, состоящей в том, что гипотеза И0 не выполняется.
Обозначим через Гп(£) обычную эмпирическую ф.р., а именно
п
ад) = п-1 ^ 1{Х <г},г е к.
г=1
Опишем альтернативы /г(х, 9), х Е К, г =1,..., 3, которые мы будем рассматривать против нулевой гипотезы И0.
1. Альтернатива масштаба с плотностью
р9+хев
/1(х,9)
(1 + exe* )2'
2. Альтернатива гиперболического косинуса с плотностью
f (x9) = Г(в + 2) e(x+f) .
J2(Z,U) Г2(f + 1)(1 + ex)û+2.
3. Синус-альтернатива c плотностью при малых 9
J3(x,9) = l(x) - 2п9 cos(2nL(x))l(x),
где L(x) = (1 + exp(-x))-1, l(x) = x E R. Все эти альтернативы при 9 = 0 превращаются в
логистическое распределение.
Мы построим критерии, основанные на следующих характеризациях:
1. Характеризация Ху и Лина [32].
В публикации тайваньских математиков Ху и Лина приведена новая характеризация логистического распределения, простейшим частным случаем которой (при n = 2 и k =1) является следующее утверждение, использующее "случайные экспоненциальные сдвиги".
Пусть X и Y - независимые одинаково распределенные случайные величины с непрерывной функцией распределения (ф.р.) F, а Z - независимая от X и Y случайная величина со стандартным экспоненциальным распределением. Тогда X и min(X, Y) + Z одинаково распределены тогда и только тогда, когда F является ф.р. логистического семейства со сдвигом с плотностью l(x + 9), 9 E R, где плотность l равна:
ex
l(x)= (1+ ex)f ,x E R-7
Следует отметить, что этому результату предшествовала работа [6], в которой была получена характеризация стандартного логистического распределения, т.е. при 9 = 0, причем при дополнительных условиях на ^. Более того, так как логистическое распределение является симметричным, то есть X = —X и ± шт(Х, У) = ^ тах(Х, У), то правую часть характеризации можно заменить на тах(Х, У) — Z без потери асимптотических свойств построенных статистик, основанных на этой характеризации.
Рассмотрим и-эмпирическую функцию распределения:
2г'
и,^) = (2) Е 1 {тт(Хг, X) < *}, * е К,
затем рассмотрим и-эмпирическую функцию распределения со случайными экспоненциальным сдвигом, соответствующую правой части уравнения в характеризации. Следующая и-эмпирическая функция распределения Ц+ соответствует положительному экспоненциальному сдвигу
те 1 те
и+(*) = [ и1>га(* + в)е—^ = гЛ ^ [ 1 |тах(Х;,Х^-) < * + в} е-^
^ ' 1<г<,<га 0
-1
' 1<г<,<»г
е-тах )—4)
Для проверки нулевой гипотезы Н0 будут предложены тестовые статистики, основанные на введенных выше характеризациях. Интегральная статистика
те
= I (*) — и+(*)) (*)
—те
и статистика типа Колмогорова
ки^ = 8ПР К(*) — и+(*)|.
2. Характеризация Ахсануллаха-Невзорова-Янева [5].
Эта характеризация найдена в [5] и сформулирована ниже. Похожий, но более сложный результат можно найти в [6].
Пусть X и У - независимые одинаково распределенные случайные величины с непрерывной функцией распределения ^, и пусть Z1, Z2 - случайные величины, независящие от X и У, со стандартным экспоненциальным законом распределения. Тогда следующие величины равнораспределены
тт^, У) + Z1 = тах^, У) — Z2,
что выполняется тогда и только тогда, когда f - плотность логистического семейства распределений с произвольным параметром сдвига и единичным параметром масштаба. Рассмотрим две и-эмпирические функции распределения:
ищ(*) = СП) Е 1 (тт^, X,-) < *} , * е К,
и2,п(1) = (Л Е 1 {тах(Х, X,) < 4} ,4 е К.
'и\ -
2] 1 {тах(Хг) <П ,4 е
4 ' 1<г<,<п
После этого рассмотрим две и-эмпирические функции распределения со случайными экспоненциальными сдвигами левой и правой частям уравнения в характеризации Ахсануллаха-Невзорова-Янева, полученные в результате соответствующей свертки с экспоненциальной случайной величиной. Следующая и-эмпирическая функция распределения и„+ соответствует положительному экспоненциальному сдвигу, в то время как и- соответствует отрицательному экспоненциальному сдвигу:
и+СО = [ и1,п(4 - = ^ Е Л {тт(Х*, X,) <4 - в} е-^
0 ^ ' 1<г<,<п 0
= (П)-1 Е (1 - е(т1П(ХгХ)-)) 1 (тт(Хг,Х,) <4}
1<г<,<п
-1 ( 2/ Е (1
1<г<,<п
П
_ ет1п(0,т1п(Х^,Х^)-4)
и
те 1 те
и-(г) = /и2.п(г + = - Е /1 {п^ад<( +
^ 4 7 1<г<,<п 0
-1
м Е
1<г<,<п
- тах (0,тах(Хг,Х^)-4)
Теперь введем две статистики, основанные на второй характеризации. Интегральная статистика:
те
= У (и+(4) - и-(4)) ^п(4)
-те
и статистика типа Колмогорова
дигаь = 8пр |и+ (4) - и-(4)|.
Отметим, что построенные статистики инвариантны относительно параметра сдвига. Для всех построенных статистик найдена асимптотика логарифмической функции вероятности больших уклонений. Кроме того, в случае интегральных статистик найдены предельные распределения, что невозможно сделать для статистик типа Колмогорова. Для каждого критерия вычислена локальная ба-хадуровская эффективность при введенных выше альтернативах. Кроме того, во второй главе выполнено моделирование построенных тестовых статистик и найдены их мощности на основе статистического моделирования для близких альтернативных распределений, также в этой главе предложенные критерии тестируются на выборке реальных данных. Выводы совпадают с полученными ранее другими авторами в статье [15], что подтверждает работоспособность критериев.
В третьей главе рассматриваются критерии согласия для экспоненциального семейства распределений. Экспоненциальное распределение - это одно из самых распространенных и популярных
распределений, используемых в моделировании реальных процессов, особенно часто применяемых в моделях, связанных с анализом выживаемости, в теории надежности, теории массового обслуживания. По этой причине были разработаны и изучены многочисленные тесты для проверки гипотезы о том, что наблюдаемые данные подчиняются экспоненциальному закону распределения. К ним относятся тесты, основанные на преобразованиях Лапласа [19], [35], [36], [54], на разности характеристических функций [26], [52], на среднем остаточном сроке службы [21], [39], на энтропии [20], [75] и на отношении правдоподобия [76]. Кроме того, существует множество свойств, характеризующих показательное распределение, представленных, например, в [7], [27], [42]. Множество критериев экс-поненциальности было разработано на основе некоторых из этих характеризаций; такие тесты выглядят привлекательно, так как они отражают некоторые скрытые свойства, связанные с данными характеризациями вероятностных распределений, и следовательно, могут быть эффективнее (или надежнее), чем другие тесты. Приведем несколько примеров работ, в которых были разработаны тесты экспоненциальности, основанные на характеризациях: в статьях [2], [8] и [11] строятся тесты на основе свойства отсутствия памяти экспоненциального распределения, в работе [41] тесты основаны на характеризации Арнольда-Вильясенора (УШазегюг), в статьях [63] и [73] рассмотрены новые тесты, основанные на характеризациях Россенберга и Ахсануллаха, работа [64] посвящена тестам, которые построены на основе специального свойства о распределении частного экспоненциально распределенных случайных величин. Также в работах [66], [65] изучаются бахадуровская эффективность и условия оптимальности в бахадуровском смысле критериев экспоненциальности, основанных на статистике Джини и тесте Лиллиефорса. Для дополнительных примеров критериев согласия, основанных на характеризациях, см., например, [9], [14], [36], [37], [54-56], [61] и [64].
В этой работе мы построим и изучим свойства новых тестов экспоненциальности, основанных на недавней характеризации Ахсануллаха-Аниса из работы [4] и на разности эмпирических преобразованный Лапласа для специального свойства из статьи [64].
Начнем с введения характеризации:
Пусть X1,X2,X - независимые одинаково распределенные случайные величины с непрерывной функцией распределения ^, такой что ^(0) = 0, ^(ж) > 0 Уж > 0. Предположим, что ^ бесконечно дифференцируема и пусть f (ж)- соответствующая плотность. Тогда величины max(X1,X2) и min(X1 ^2) + X одинаково распределены, тогда и только тогда, когда
^(ж) = 1 — е-Лх, ж > 0, Л > 0.
Отметим, что в этой характеризации использована идея случайных сдвигов, которая ранее появлялась в литературе по характеризациям и была развита, например, в работах [5], [32], и [69].
Теперь напомним специальное свойство из статьи [64]:
Пусть Х,У - независимые случайные величины, распределенные по экспоненциальному закону, тогда их частное имеет распределение ^гзЛ,ег(2>2)
X ж X, У - Ежр(Л), Q = — ^ ^о(ж) = ^йег(2 2)(ж) =-, ж > 0.
У 1 + ж
При помощи этого свойства, можно построить следующие интегральные статистики, основанные на разности соответствующих преобразований Лапласа для разности двух случайных величин и для распределения ^гзЛег(2)2)-
Тесты, основанные на этих свойствах, будут задействованы в следующей задаче. Пусть Х1,... , Хп независимые и одинаково распределенные случайные величины с неизвестной непрерывной функцией распределения ^. Обозначим за Ехр(А) экспоненциальное распределение с математическим ожиданием равным ^. Будет проверяться следующая сложная гипотеза согласия
Н0 : ^ - Ехр(А),
для некоторого неизвестного А > 0, против общих альтернатив.
Обозначим обычную эмпирическую функцию распределения через (¿), определяемую как
^(¿) = п-1 Е 1{Х <*}.
-1
г=1
В соответствии с характеризацией построим следующую и-эмпирическую функцию распределения для левой части:
(¿) = СЛ Е 1 {тах(Хг, X,-) < ¿} .
^ ' 1<г<,'<п
Теперь определим другую и-эмпирическую функцию распределения, которая соответствует правой части характеризации:
-1
п'
шип(¿) = (П) Е 1 {тЭД ,Х) + Хк < ¿}
Введем два вида тестовых статистик, а именно: интегральную статистику, определяемую формулой
/иЕ = (ьи„ (¿) - яи„ (¿)) (¿),
и статистику типа Колмогорова, определяемую как
КиЕ = 8ПР |ьи„(¿) - ди„(¿)|.
4
Теперь рассмотрим преобразование Лапласа для левой части специального свойства:
1
X,'
^(*)=Ы Е е х.
Вычислим преобразование Лапласа для плотности распределения ^гзЛег^г), соответствующее правой части специального свойства:
ЯШ) = /7—^ ■ =1 + ¿е4£г(-£),
J (1 + х)2
0
где Ег(-) - интегральная показательная функция, определяемая как Ег(*) = / ^ж.
—те
Введем следующие тестовые статистики, основанные на разности преобразований Лапласа: интегральную взвешенную статистику
те
¿Е(а) = J (¿¿(¿) — ДОД) е-'
0
и статистику типа Колмогорова
КЬЕ = вир —
4>0
Теперь мы опишем альтернативы /¿(ж, 9), ж > 0, г = 1,... , 6, которые мы будем рассматривать против нулевой гипотезы Н0.
1. Альтернатива Вейбулла с плотностью
/1(ж,9) = (1 + 9)жОе-, 9 > 0, ж > 0;
2. Альтернатива Макегама с плотностью
/2(ж, 9) = (1 + 9(1 — е-х))е(-х-0(е-х-1+х)), 9 > 0, ж > 0;
3. Альтернатива линейной интенсивности отказов с плотностью
Ох2
/з(ж, 9) = (1 + 9ж)е-х-^, 9 > 0, ж > 0;
4. Гамма-альтернатива с плотностью
О —г ж е-
/4(ж,9) = Г(9 + 1) ,9 > 0, ж > 0;
5. Альтернатива Верхюльста с плотностью
/5(ж, 9) = (1 + 9)е-Х(1 — е -х)0, 9 > 0, ж > 0;
6. Альтернатива экспоненциальной смеси с отрицательным весом с плотностью
/б(ж, 9) = (1 + 9)е-х — 9в е-вх, 9 е [0, тт^], в > 1, ж > 0.
р — 1
В четвертой главе рассматриваются критерии согласия для семейства распределений Парето первого типа с произвольным параметром формы. Классическое распределение Парето (или распределение Парето I типа Р(I)(1, Л)) имеет следующую функцию распределения С:
С(ж) = 1 — ж-Л, ж > 1, Л > 0.
В 2017 году Ахсануллах и Анис [4] доказали следующую характеризацию для экспоненциального закона распределения:
Пусть ХЬХ2,Х - независимые одинаково распределенные случайные величины с непрерывной функцией распределения Р, такой что Р(0) = 0, Р(х) > 0 для всех х > 0, бесконечно дифференцируема и f (х)-соответствующая плотность. Тогда шах(ХьХ2) и шт(ХьХ2) + Х одинаково распределены тогда и только тогда, когда
Теперь заметим, что если случайная величина X имеет экспоненциальное распределение с произвольным параметром А, то преобразованная случайная величина ехр(Х) имеет классическое распределение Парето (или распределение Парето I типа) с соответствующими параметрами (Р(I)(1,А)) [13]. Так как экспонента - монотонная функция, то утверждение, что шах(Х1, Х2) и ш1п(Х1, Х2) + X одинаково распределены эквивалентно следующему:
Обозначив за У = ехр(Х^), получим новую характеризацию для распределения Парето I типа: Пусть У1,У2,У - н.о.р.с.в. с непрерывной функцией распределения С, такой что С(1) = 0, С(х) > 0 для всех х > 1, бесконечно дифференцируема и д(х) - соответствующая плотность. шах(У1,У2) и ш1п(У1,У2) ■ У одинаково распределены тогда и только тогда, когда
Сформулируем теперь задачу проверки соответствия выборки распределению Парето I типа. Пусть У1,... , Уг - независимые одинаково распределенные наблюдения с функцией распределения С. Используя характеризацию, будем проверять сложную гипотезу согласия Н0, согласно которой С есть ф.р. закона распределения Парето I типа с произвольным параметром формы и единичным параметром масштаба, против некоторой альтернативы Н1, заключающейся в том, что гипотеза Н0 не выполняется.
Обозначим через Сп(¿) обычную эмпирическую ф.р., а именно
г=1
Рассмотрим следующую и-эмпирическую ф.р., отвечающую левой части выражения в характериза-ции:
Р(х) = 1 - е -Лх, х > 0, А > 0.
ехр(шт(ХьХ2) + Х) = ш1п(ехр(Х1),ехр(Х2)) ■ ехр(Х).
а
С(х) = 1 - х-Л, х > 1, А > 0.
п
С(¿) = п-1 1{у <*}.
1 ь
Построим и-эмпирическую ф.р. для правой части:
Критерии для проверки Н0 против альтернативы Н будем основывать на следующих статистиках:
те
/ЦТ = у (Шга(*) - дига(*)) (*), 1
КЦТ = 8ПР |Шга(*) - дига(*)|.
В качестве альтернатив будут рассмотрены следующие альтернативные функции распределения /¿(ж, 0), х > 1, г = 1,..., 6, которые будут рассмотрены в этой работе.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Некоторые задачи теории вероятностей и математической статистики, связанные с распределением Лапласа2010 год, кандидат физико-математических наук Лямин, Олег Олегович
Исследование методами компьютерного моделирования свойств оценок и статистик критериев согласия по группированным и цензурированным выборкам2003 год, кандидат технических наук Чимитова, Екатерина Владимировна
Исследование свойств и мощности критериев равномерности и показательности методами компьютерного моделирования2019 год, кандидат наук Блинов Павел Юрьевич
О мощности критерия знаков в случае распределения Лапласа2010 год, кандидат физико-математических наук Королев, Роман Анатольевич
Асимптотические свойства критериев согласия для проверки гипотез в схеме выбора без возвращения, основанных на заполнении ячеек в обобщенной схеме размещения2006 год, кандидат физико-математических наук Колодзей, Александр Владимирович
Список литературы диссертационного исследования кандидат наук Рагозин Илья Андреевич, 2024 год
Список литературы
[1] Aguirre N., Nikulin M., Chi-squared goodness-of-fit test for the family of logistic distributions. Kybernetika, 30(1994), pp. 214-222.
[2] Ahmad I., Alwasel I. A goodness-of-fit test for exponentiality based on the memoryless property. Journal of the Royal Statistical Society Series B. 1999;61(3):681-689.
[3] Ahsanullah M. On a characterization of the exponential distributon by spacings. Annals of the Institute of Statistical Mathematics Part A. 1978;30:163-166.
[4] Ahsanullah M., Anis M. Z., Some characterizations of exponential distribution. — Inter. J. Stat. Probab. 6(5) (2017), 132-139.
[5] Ahsanullah M., Nevzorov V.B., Yanev G.P., Characterizations of distributions via order statistics with random exponential shifts. J. Appl. Statist. Sci., 18(2010), pp. 297--305.
[6] Ahsanullah M., Onica C.,Yanev G. P. Characterizations of Logistic Distribution Through Order Statistics with Independent Exponential Shifts. Stochastics and Quality Control,27(2011), N 1, 8596.
[7] Ahsanullah M. Characterizations of Univariate Continuous Distributions. Atlantis Press; 2017.
[8] Alwasel I. On goodness of fit testing for exponentiality using the memoryless property. Journal of Nonparametric Statistics. 2001;13:569-581.
[9] Allison J. S., Santana L., Smit N., et al. An 'apples to apples' comparison of various tests for exponentiality. Computational Statistics. 2017;32(4):1241-1283.
[10] Aly E. E. A. A., Shayib M. A. On some goodness-of-fit tests for the normal, logistic and extreme-value distributions. Comm. Stat. Theor. Meth., 21(1992), pp. 1297-1308.
[11] Angus J. E. Goodness-of-fit tests for exponentiality based on a loss-of-memory type functional equation. Journal of Statistical Planning and Inference. 1982;6:241-251.
[12] Arnold B. C., Villasenor J. A. Exponential characterizations motivated by the structure of order statistics in samples of size two. Stat Probab Lett. 2013;83(2):596-601.
[13] Arnorld B. C. Pareto Distributions Second edition, CRC Press, Boca Raton (2014).
[14] Ascher S. A survey of tests for exponentiality. Communications in Statistics - Theory and Methods. 1990;19(5):1881-1825.
[15] Asgharzadeh A., Valiollahi R., Abdi M., Point and interval estimation for the logistic distribution based on record data. SORT-Stat. Oper. Res. Trans., 1(2016), pp. 89-112.
[16] Bahadur R. R. Some limit theorems in statistics. SIAM, Philadelphia (1971).
[17] Bahadur R. R. Stochastic comparison of tests. Ann. Math. Stat. 31(1960), 276-295.
[18] Balakrishnan N. Handbook of the logistic distribution. CRC Press, 1991.
[19] Baringhaus L., Henze N. A class of consistent tests for exponentiality based on the empirical Laplace transform. Annals of the Institute of Statistical Mathematics. 1991;43(3):551-564.
[20] Baratpour S., Habibi Rad A. Testing goodness-of-fit for exponential distribution based on cumulative residual entropy. Communications in Statistics - Theory and Methods. 2012;41(8):1387-1396.
[21] Baringhaus L., Henze N. Tests of fit for exponentiality based on a characterization via the mean residual life function. Statistical Papers. 2000;41:225-236.
[22] Chernooff H. A measure of asymptotic efficiency for tests of a hypothesis based on sums of observations. — Ann. Math. Statist., 1952, v. 23, p. 493-507.
[23] Cockeran M., Meintanis S. G., Allison J. S. Goodness-of-fit tests in the Cox proportional hazards model. Communications in Statistics - Simulation and Computation. 2019;:1-12.
[24] Cox D. R., Oakes D. Analysis of Survival Data. Chapman and Hall, London; 1984.
[25] Desu M. M., A characterization of the exponential distribution by order statistics. — Ann. Math. Statist. 42, No. 2 (1971), 837-838.
[26] Epps T. W., Pulley L. B. A test of exponentiality vs. monotone-hazard alternatives derived from the empirical characteristic function. Journal of the Royal Statistical Society Series B. 1986;48(2):206-213.
[27] Galambos J, Kotz S. Characterizations of Probability Distributions. Vol. 675. Springer, NY; 1978.
[28] Galambos, J. Characterizations. In: Balakrishnan N. Handbook of the logistic distribution. CRC Press, 1991, 169-188.
[29] E.O. George, G. S. Mudholkar,A characterization of the logistic distribution by a sample median. Ann. Inst. Statist. Math. 33(1981), pp. 125--129.
[30] I.S. Gradshteyn, I.M. Ryzhik, Table of Integrals, Series, and Products. A. Jeffrey and D.Zwillinger, eds., Academic Press, New York, 4th ed., 1994.
[31] Hoeffding W. A class of statistics with asymptotically normal distribution. Ann. Math. Statist.- 1948. V. 19.-P. 293-325.
[32] Chin-Yuan Hua, Gwo Dong Lin, Characterizations of the logistic and related distributions. Journ. of Mathem. Anal. and Appl, 463(2018), N 1, 79-92.
[33] G. D. Lin, C. Y. Hu, On characterizations of the logistic distribution., J. Stat. Plann. Infer., 138(2008), pp. 1147-1156.
[34] R. Helmers, P. Janssen, R. Serfling, Glivenko-Cantelli properties of some generalized empirical DF's
and strong convergence of generalized L-statistics. Probab. Theor. Relat. Fields, 79(1988), pp. 75-93.
[35] Henze N. A new flexible class of omnibus tests for exponentiality. Communications in Statistics -Theory and Methods. 1993;22:115-133.
[36] Henze N, Meintanis SG. Tests of fit for exponentiality based on the empirical Laplace transform. Statistics. 2002;36(2):147-161.
[37] Henze N, Meintanis SG. Recent and classical tests for exponentiality: a partial review with comparisons. Metrika. 2005;36:29-45.
[38] Hollander M., Wolfe D. Nonparametric statistical methods. - Wiley:1973.
[39] Jammalamadaka SR, Taufer E. Testing exponentiality by comparing the empirical distribution function of the normalized spacings with that of the original data. Journal of Nonparametric Statistics. 2003;15(6):719-729.
[40] Johnson, N. L., Kotz, S. and Balakrishnan, N. Continuous Univariate Distributions. Vol. 1, 2nd Edition, John Wiley & Sons Ltd., New York (1994).
[41] Jovanovic M., Milosevic B., Nikitin Y.Y., et al. Tests of exponentiality based on Arnold-Villasenor characterization and their efficiencies. Computational Statistics and Data Analysis. 2015;90:100-113.
[42] Kagan A. M., Linnik Y. V., Rao C. R. Characterization Problems in Mathematical Statistics. Wiley, New York, 1973.
[43] Kallenberg W. C. M. Intermediate efficiency, theory and examples. — Ann.Statist., 1983, v. 11, No 1, p. 170-182.
[44] Klein JP, Moeschberger ML. Survival analysis: techniques for censored and truncated data. Springer Science & Business Media; 2006.
[45] Korolyuk V. S., Borovskikh Yu. V., Theory of U-statistics. Kluwer, Dordrecht, 1994.
[46] Kotz S. Characterizations of statistical distributions: a supplement to recent surveys. Intern. Stat. Rev. 42(1974), pp.39--65.
[47] Lawless J. F. Statistical Models and Methods for Lifetime Data. John Wiley & Sons, Inc., Hoboken, New Jersey; 2003.
[48] Ley C., Paindaveine D. Le Cam optimal tests for symmetry against Ferreira and Steel's general skewed distributions. Journal of Nonparametric Statistics. - 2009. - V. 21. - N 8. - p. 943-967.
[49] Lilliefors H. On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown. J Amer Statist Assoc. 1969;64:387-389.
[50] Meintanis S. G. Goodness-of-fit tests for the logistic distribution based on empirical transforms.
Sankhya: The Indian J. of Stat., 66(2004), pp. 306-326.
[51] Meintanis S., Iliopoulos, G. Tests of fit for the Rayleigh distribution based on the empirical Laplace transform. Ann Inst Stat Math 55, 137-151 (2003). https://doi.org/10.1007/BF02530490
[52] Meintanis S. G., Swanepoel J. W. H., Allison J. S. The probability weighted characteristic function and goodness-of-fit testing. Journal of Statistical Planning and Inference. 2014;146:122-132.
[53] Milosevic B, Obradovic M., Two-dimensional Kolmogorov-type Goodness-of-fit Tests Based on Characterizations and their Asymptotic Efficiencies. J. Nonparam. Stat., 28(2):413-427, 2016.
[54] Milosevic B, Obradovic M. New class of exponentiality tests based on U-empirical Laplace transform. Stat Papers. 2016;57:977-990.
[55] Milosevic B. Asymptotic efficiency of new exponentiality tests based on a characterization. Metrika. 2016;79:221-236.
[56] Milosevic B, Obradovic M. Characterization based symmetry tests and their asymptotic efficiencies. Stat Prob Lett. 2016;119:155-162.
[57] Muliere P., Nikitin Ya., Yu. Scale-invariant test of normality based on Polya's characterization. Metron. V. 60 (1-2), pp. 21-33, 2002.
[58] Nikitin Ya. Yu., Ponikarov E. V. Rough large deviation asymptotics of Chernoff type for von Mises functionals and U-statistics. Proc. of St.Petersburg Math. Soc., 7(1999), 124-167. Engl. transl. in AMS Transl., ser.2, 203(2001), 107-146.
[59] Nikitin Ya. Yu., Peaucelle I. Efficiency and local optimality of distribution-free tests based on U- and V- statistics. Metron, LXII (2004), 185-200.
[60] Nikitin Ya. Yu. Large deviations of U-empirical Kolmogorov-Smirnov tests, and their efficiency. J. Nonpar. Stat., 22(2010), 649-668.
[61] Nikitin, Y. Y. Tests based on characterizations, and their efficiencies: a survey. Acta et Commentationes Universitatis Tartuensis de Mathematica, 21(2017), N 1, 3-24.
[62] Nikitin Ya. Asymptotic efficiency of nonparametric tests, Cambridge University Press, New York, 1995.
[63] Nikitin Y. Y., Volkova K. Y. Exponentiality tests based on Ahsanullah's characterization and their efficiency. Journ of Mathem Sciences. 2015;204(1):42-54.
[64] Nikitin Ya. Yu., Volkova K. Yu. Efficiency of Exponentiality Tests Based on a Special Property of Exponential Distribution. Math. Meth. Stat., 25(2016), pp. 54-66.
[65] Nikitin Y. Y., Tchirina A. V. Bahadur efficiency and local optimality of a test for the exponential distribution based on the Gini statistic. Statistical Methods & Applications. 1996;5(1):163-175.
[66] Nikitin Y. Y., Tchirina A. V. Lilliefors test for exponentiality: Large deviations, asymptotic efficiency, and conditions of local optimality. Mathematical Methods of Statistics. 2007;16(1):16-24.
[67] M. Obradovic, M. Jovanovic, B. Milosevic, Goodness-of-fit tests for Pareto distribution based on a characterization and their asymptotics. — J. Theor. Appl. Statist. 49, No. 5 (2015), 1026-1041.
[68] Savage I. R. Bibliography of nonparametric statistics. - Harvard University Press, 1962.
[69] Shah I. A., Khan A. H., Barakat H. M. Random translation, dilation and contraction of order statistics. Statistics & Probability Letters. 2014;92:209-214.
[70] Silverman B. W. Convergence of a class of empirical distribution functions of dependent random variables. Ann Probab. 1983;11(3):745-751.
[71] Stephens M. A. Tests of fit for the logistic distribution based on the empirical distribution function. Biometrika, 66(1979), N 3, 591-595.
[72] Volkova K.Yu. New tests for the logistic distribution based on the functionals of U-empirical process. Abstracts of 12th Intern. Vilnius Conf. on Prob. and Math. Stat., Vilnius, Vtex, 2018, p.297.
[73] Volkova KY. On asymptotic efficiency of exponentiality tests based on Rossberg's characterization. Journal of Mathematical Sciences. 2010;167(4):486-494.
[74] Walsh J. E. Handbook of nonparametric statistics. V. I-III, Princeton: Van Nostrand, 1962;1965;1968.
[75] Zardasht V, Parsi S, Mousazadeh M. On empirical cumulative residual entropy and a goodness-of-fit test for exponentiality. Statistical Papers. 2015;56(3):677-688.
[76] Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio. Journal of the Royal Statistical Society, Series B. 2002;64(2):281-294.
[77] V. O. Zykov, V. B. Nevzorov, Some characterizations of families of distributions, including logistic and exponential ones, by properties of order statistics, J. Math. Sci. 176(2011), pp. 203-206.
[78] Азларов Т. А., Володин Н. А. Характеризационные задачи, связанные с экспоненциальным распределением. Ташкент: Фан, 1982.
[79] Волкова К. Ю. Асимптотическая эффективность критериев согласия, основанных на характе-ризационных свойствах распределений. Кандидатская диссертация. СПбГУ. 2011
[80] Кендалл М., Стьюарт Дж. Статистические выводы и связи. М.: Наука, 1973.
[81] Кобзарь А. И. Прикладная математическая статистика. М. Физматлит, 2006.
[82] Линник Ю. В. Линейные статистики и нормальный закон распределения.// Докл. АН СССР, 1952, Т.83(3), С. 353-355.
[83] Линник Ю. В. Линейные формы и статистические критерии. I,II.// Украинский математический журнал, 1953, Т.5, №2, С.207-243; №3, С. 247-290.
[84] Литвинова В.В. Асимптотические свойства критериев симметрии и согласия, основанных на характеризациях. Кандидатская диссертация. СПбГУ. 2004
[85] Литвинова В. В., Никитин Я.Ю. Два семейства критериев нормальности, основанных на харак-теризации Пойа, и их асимптотическая эффективность. Зап. научн. семин. ПОМИ, Т. 328, С. 147-159, 2005.
[86] Никитин Я. Ю. Асимптотическая эффективность непараметрических статистических критериев. М.: Наука, 1995.
[87] Чирина А. В. Асимптотическая эффективность и локальная оптимальность по Бахадуру критерия экспоненциальности, основанного на статистике Морана. Зап. научн. семин. ПОМИ, Т.294, С. 245-259, 2002.
[88] Чирина А. В. Асимпототическая эффективность критериев экспоненциальности, свободных от параметра масштаба. Кандидатская диссертация. СПбГУ. 2005.
Публикации автора по теме диссертации.
[89] Никитин Я.Ю., Рагозин И.А. Критерии согласия, основанные на характеризации логистического распределения. Вестник СПбГУ. Математика. Механика. Астрономия, 2019, Т.6 (64), выпуск 2, C. 241-252.
[90] Y. Y. Nikitin, I. A. Ragozin, Goodness-of-Fit Tests Based on a Characterization of Logistic Distribution. Vestnik St. Petersburg Univ., Mathematics, 52(2019), pp. 169-177.
[91] Ya. Yu. Nikitin, I. A. Ragozin. Goodness-of-fit tests for the logistic location family. Journal of Applied Statistics, 2020, 47:13-15, 2610-2622,
DOI: 10.1080/02664763.2020.1761952
[92] J. S. Allison, Ya. Yu. Nikitin, I. A. Ragozin, L. Santana. New tests for exponentiality based on a characterization with random shift. Journal of Statistical Computation and Simulation, 2020, 90:15, 2840-2857, DOI: 10.1080/00949655.2020.1791865
[93] И. А. Рагозин. Новые критерии согласия для распределения Парето I типа, основанные на некоторой характеризации. Записки научных семинаров ПОМИ РАН, 2020, Т. 495, С. 237-249.
[94] И. А. Рагозин. Новые критерии согласия для семейства распределений Рэлея, основанные на некотором специальном свойстве и некоторой характеризации. Записки научных семинаров ПОМИ РАН, 2021, Т.505, С. 230-243.
[95] Ragozin I. A. New goodbess-of-fit tests for Pareto I type distribution, based on some characterization. Journal of Mathematical Sciences, 2022, Vol. 268, No. 5, P.684-692, https://doi.org/10.1007/s10958-022-06238-4
[96] Ragozin I. A. New goodness-of-fit tests for family of Rayleigh Distributions, based on a special property and a characterization. Journal of Mathematical Sciences, Vol. 281, No. 1, 2024. DOI 10.1007/s10958-024-07083-3
ПРИЛОЖЕНИЕ
В этой части диссертации представлены вычисления проекций и локальных бахадуровских наклонов, опущенные в основной части диссертации.
А. Логистическое распределение Интегральная статистика ¿иь
Эта статистика эквивалентна ¿и^-статистике степени 3 с центрированным ядром
Фь(х,у,г) = 1 - 1 (1 - в(т1п(х'у)-г)) 1 {ш1п(х,у) < г} -
-1 (1 - в(т1п(х>г)-у)) 1 {ш1п(х, г) < у} - -1 (1 - в(т1п(у'г)-х)) 1 {ш1п(у, г) < х} . 3 3
Найдем проекцию этого ядра:
Фь (*) = Е (Фь(Х,У,£ )|£ = *)
1 - 1 (1 - в(т1п(х>у)-г)) 1 {ш1п(Х,У) < - Е ^2 Для начала найдем распределение случайной величины ш1п(Х, У):
= Е ^ 1 - 1 (1 - в(т1п(х>у)-г)) 1 {ш1п(Х,У) < - Е ^2 (1 - в(т1п(х'г)-у)) 1 {ш1п(Х,*) < У.
1
Р {ш1п(Х, У) <в} = 1 - (1 - Р {X < в})2 = 1 -
(1 + в*)2'
Тогда плотность этой случайной величины имеет вид:
2е*
Р(в) =
(1 + в*)3'
а соответствующее математическое ожидание будет равно:
г
Е |(1 - е(тМ^)-г)) 1 {ш1п(Х,У) <*}} = I (1 - в(х-г))
-те
г г
[ 2ех _г Г 2в2х 1 _г в2г
— ~Лх — в —-— ах = 1 — —-— — в
(1 + вх)3 7 (1 + вх)3 (1 + вг)2 (вг + 1)2 -те -те
1 + вг в2г + вг вг
= 1 - _ _ .
(вг + 1)2 (1 + вг)2 1 + вг
Теперь рассмотрим второе математическое ожидание:
Е (1 - в(т1п(х'г)-у)) 1 {ш1п(Х, ¿) < У} = Р {ш1п(Х, ¿) < У} - Е (в(т1п(х'г)-у)) 1 {ш1п(Х, ¿) < У} . Вычислим первое слагаемое:
те те
р {шт(Х^ < У} = / Р {ш1п(Х,^) < у} = / (1 - 1 {у < ¿} (^У^)
-те -те
Г , , еУ 1 1 2 + 2е4 + е24
= 1 - ] 1 {у - =2 + 2(7П)2 = 2(е4 + 1)2 •
—те
Теперь вычислим второе слагаемое. Для вычисления этого математического ожидания рассмотрим 2 непересекающиеся области:
I. х < у > х, в этой области шт(х, *) = х, и аналогично
II. х ^ >
Тогда математическое ожидание вычисляется как двойной интеграл по объединению этих областей (1,11) по совместной плотности: р(х,у) = )2. Мы видим, что это математическое ожидание
будет равно:
4 те +те те
Е «в(тВД')—У)' 1 {П™ < У41 ^^ + / = ™ ++ 12(').
—те х 4 4
Вычислим первый двойной интеграл:
4 те 4 те
ех
= I / ех—Ур(х,у)^х = I I ех—| 2 ^ " 2 ¿у^х
(1 + ех)2 (1 + еУ)2
х
4 те 4
2х 2х
е2х [' 1 [ е2х / 1
¿у^х = —-— 1п(ех + 1) — х--- ) ¿х.
(1 + ех)2У (1 + ех)2 J (1 + ех)2 \ ' ех + 1
Подсчитаем отдельно каждое слагаемое:
4
. е2х 1п(ех + 1) , 1 1, 2, 4 ^ 1п(е4 + 1) 1
1 п ( „ х+2 ) ¿х = —т + 11п2(е4 + 1) + , , ) — 1,
—те 4
(1 + ех)2 1 + е4 2 к ' е4 + 1
хе2х 1
2 ] ¿х = е4) + — ^ * + + 1) 1п(е4 + ^
—те
У
где ¿¿2(у) = — / 1п(1х х) ¿х - известная специальная функция дилогарифм.
о
4
г е2х е24
3. —-— ¿х =
(1 + ех)3 2(е4 + 1)2
Приведя подобные члены, получим:
./ч г. , а 1, 2/ 4 / / 4 ^ е24 1п(е4 + 1) + е4(* — 1) /!(*) = — е4) + 11п2(е4 + 1) — (* + 1) Ь(е4 + 1) — ^ + ^ + -^-^ •
Теперь вычислим второй двойной интеграл:
+те те те те
12(*) = [ [ е4—Ур(х,уЫу^х = е4 / -—е—— ¿х / -—- = -—( 1п(1 + е4) — * — -—г | 2() У У у У (1 + ех)2 У (1 + еУ)2 (1 + е4) V ( ) (1 + е4)У
4 4 4 4
У
1 зв2г + 4вг
11 (*) + /2(4) = 1 1п2(вг + 1) - 41п(вг +1) - ^2(-вг) - 2(1 + .
Тогда
Е (1 - в(т1п(х'г)-у)) 1 {ш1п(Х, 4) < У} = Р {ш1п(Х, 4) < У} - Е (в(т1п(х>г)-У)) 1 {ш1п(Х, 4) < У} .
'2вг + 1 1 \ + ^(-вг) + 41п(вг + 1) - 2 1п2(вг + 1) ^ .
Теперь сложим все вместе и получим, что проекция ядра равна:
Ф(^) = 1 - - 3 (^ + ¿^2(-вг) + 41п(вг + 1) - 2 1п2(вг + 1)
2 Л - , *ч , „г , ^ 2,„г . ^ . 7вг + 1
-- Ьг2(-вг) + 41п(вг + 1) -- 1п2(вг + 1) +
3 V ^ ' к 2 к ' 4(вг + 1)) '
Теперь вычислим дисперсию проекции:
А2 = ЕФ2 (Х) =
те
4 Г / 1 7вх + 1 \ 2 вх
9/ (£г2(-вХ) + х ш(в' + 1)- 1 1П2((Х +1> + (ГТ^
—оо
4 ■ 0.00439
=-« 0.001899.
9
Статистика типа Колмогорова Киь
Эту статистику можно рассматривать как супремум по 4 модуля семейства и - статистик с ядрами
Фк(Х, У; 4) = (1 - в(т1п(х'у)-г))1{ш1п(Х, У) < 4} - 1 (1{Х <4} + 1{У < 4}). вычислим проекцию ядра: Фк(в, 4) = Е (Фк(Х, У; 4)|У = в) = Е {(1 - вт1п(х'в)-г)1{ш1п(Х, в) < 4}} - 1 (Р(Х < 4) + 1{в < 4}). Отдельно вычислим первое слагаемое:
Е {(1 - вт1п(х'*)-г)1{ш1п(Х, в) < 4}} ,
для этого рассмотрим два непересекающихся интервала:
I. х < в, т.е. ш1п(х, в) = х, и аналогично
II.x ^ в.
Тогда математическое ожидание вычисляется как интеграл по объединению этих интервалов (1,11) по логистической плотности
Е {(1 - вт1п(х'5)-г)1{ш1п(Х,в) < 4}} = /(в, 4) + //(в, 4),
где /(в,4),//(в,4) интегралы по первому и второму промежуткам соответственно. Имеем
г вх
/ (М) = у(1 - вх-г)1{х < 4} ах,
-те
представим этот интеграл как интеграл по всей прямой с домножением подынтегральной функции на соответствующий индикатор, тогда получим:
те
г вх
/(в, 4) = у (1 - вх-г)1{х < в}1{х < 4} вХ)2ах.
-те
Произведение индикаторов можно переписать в виде :
1{х < 4}1{х < в} = 1{х < ш1п(в,4)},
получим
тт(«,г) тт(«,г) тт(«,г)
/вЖ (' вХ [ (2х (1 - вх-г)^-^ах = —-т^гах - в-г —-т^гах
1 41 + вх )2 У (1 + вх)2 У (1 + вх)2
-те -те -те
вт1п(«,г) / 1
- в-г —---+ 1п(вт1п(8'г) + 1) - 1
^ШШ .«Г I 1 * '
1 + вт!п(«,г) \ вт1п(8,г) + 1
Теперь вычислим //(в,4):
в8 г Н в " ^ —
//(в, 4) = (1 - в8-г) 1{в < в 2 ах
(1 + вх)2 1 + в*
Таким образом, получим
Е {(1 - вт1п(х'8)-г)1{ш1п(Х,в) <4}} = /(в,4) + //(в,4)
^ - ^ +.п(вт-(х,') + 1) - 1) + - вХ-'»1 ^
1 + вт!п(х,г) I втт(х,г) + 1 I 1 + вх Тогда проекция будет равна:
Фк(х, 4) = /(х, 4) + //(х, 4) - 1 (Р(Х < 4) + 1{х < 4}) =
= вт!п(х'г) - в-г (_1_+ ^«(х,) + 1) - 1) + (1 - вх-г)1 {х<4} - 1 + 1{х < 4}) =
1 + вт^х.г) в ^вт1п(х,г) + 1+1п(в +1) 1 + вх 2^ + вг + 1{х < ^
_ вт1п(х'г) - в-г - в-г 1п(втш(х,г) + 1) + 1{х < 4}(1 - вх(1 + 2в-г)) в2г - 2вг - 2
1 + втт(х,г) ^ > 2(1 + вх) 2вг(1 + вг)
Теперь найдем функцию дисперсии ДК(*) := ЕхФК(X, *) рассматриваемого семейства ядер как функцию от Для удобства распишем подынтегральное выражение:
т2 , ^ (ет1п(х'4) — е-4)2 241 2. т1п(х4) ,, (1 — ех(1 + 2е—4))21{х < *} ФК(х, *) = ^-. ( т2 + е-241п2(ет1п(х'4) + 1) + --Ц---^+
ЛЧ ' (1 + ет1п(х,4))2 4 ' 4(1+ ех)2
(е24 — 2е4 — 2)2 е-41п(ет1п(х'4) + 1)(ет1п(х>4) — е-4) + 4е24(1 + е4)2 — 2 1 + ет1п(х,4) +
(ет1п(х,4) — е-4)(1 — ех(1 + 2е-4))1{х < *} е-41п(ет1п(х'4) + 1)(1 — ех(1 + 2е-4))1{х < *}
(1 + ет1п(х'4))(1 + ех) 1 + ех
( ет1п(х,4) — е-4 е-41п(ет1п(х,4) + 1) + 1{х<*}(1 — ех(1 + 2е-4)) \ V 1 + ет1п(х>4) е 1п(е +1)+ 2(1 + ех) )
е4(1 + е4) V 1 + ет1п(х,4) ' 2(1 + ех)
Сразу отметим, что интегралы, которые содержат шт(х,*), удобно разбить на два интеграла по соответствующим промежуткам х Е (—то,*) и х Е [*, то). Посчитаем каждое слагаемое отдельно:
те
( (ет1п(х,4)_е-'4)2 ^ с (ет1п(х,4)_е-4)2 ех
1 Е I -_— I = -_-__¿х =
• ^ (1 + етт^,4))2 / у (1 + ет1п(х>4))2 (1 + ех)2¿х
-те
4 те
= г (ех — е-4)2ех¿х + (е4 — е-44)2 Г ех ,х = У (1 + ех)4 ¿х + (1 + е4)2 У (1 + ех)2¿х
-те 4
4 4 4
/е3х г е2х г ех (е4 — е-4)2
(1 + ех)4 ¿х — 2е- У (1 + ех)4 ¿х + е-2 У (1 + ех)4¿х + (1 + е4)3
-те -те -те
е34 е4(е4 + 3) , -24 (1 1 \ (е4 — е-4)2 _ е34 — 3е4 + 3
+ е-24 - — „„ , ^ 0 +
3(1 + е4)3 3(1 + е4)3 V3 3(1 + е4)3/ (1 + е4)3 3е24(1 + е4) '
2. Ех{е-241п2(ет1п(х'4) + 1)}
х
^-24 ' ' 1п2(ех + 1) ¿х j + е-241п2(е4 + 1) ^ ¿х
I 1п2(е4 + 1) + 21п(е4 + 1) + 2 1п2(е4 + 1)\ = 2(е4 — 1п(е4 + 1)) е4 + 1 + 1 + е4 ) = е24(е4 + 1) '
4
3Е , (1 — ех(1 + 2е-4))21{Х<*П = / ех(1 — ех(1 + 2е-4))2 • 4(1 + ех )2 / У 4(1 + ех)4 х
-те
4 4
ех Г е2х Р е3х
^х — 2(1 + 2е-4) / — ■ —— ¿х + (1 + 2е-4)2 / . , . 4 ¿х
М ^ (1 + ех)4 У (1 + ех)4 ' У (1 + ех)4
те -те -те
^ е34 + 3е24 + 3е4 — 2е-4(2 + е4) е^М + е-24(е4 + 2)2 е34
^ 3(е4 + 1)3 4 6(е4 + 1)3 ' 3(е4 + 1)3
е24(е34 + 3е24 + 3е4) — е4(е4 + 2)е24(е4 + 3) + е34(е4 + 2)2 е34(е4 + 1)
12е24(е4 + 1)3 12е24(е4 + 1)3 12(е4 + 1)'
4
е
4. Останется таким же, так как не зависит от X, т.е (4е2< (1+^22 в-г 1п(в™п(х>г) + 1)(в™п(х>г) - в-г)
5. Ех 2
1 + вт1п(Х,г)
2в-г | } 1п(вх + 1)(вх - в-г) вх ах + 1п(вг + 1)(вг - в-г)
(1 + вх) (1 + вх)2 (1 + вг)2
\—оо
-г /3 4вг + (4вг + 2) 1п(вг + 1) + 3 -г / 1 21п(вг + 1) + 1\ 1п(вг + 1)(вг - в-г) 2в I т тт~1 : 7То в I т тт~1 : тто I +
6. Ех
4 4(вг + 1)2 \4 4(вг + 1)2 ) (1 + вг)2
3в2г - 2вг - 21п(вг + 1) 2в2г(1 + вг) . (вт1п(х'г) - в-г)(1 - вх(1 + 2в-г))1{Х < 4}
(1 + втЧх,г))(1 + вх) г г г
г вх(ех _ е-.),! _ ех'(1 + Зе-'))ах = г е'(ех - е-')ах _ (1 + ^ [ с^х^Ц-)ах =
(1+ вх)4 J (1+ вх)4 4 ' } (1+ вх)
-те
в2г - 6 г, вг(2вг - 3)
- (1 + 2в-г)- ;
7. Ех
6(вг + 1)2 ^ у 6(вг + 1)2 6(1 + вг)' в-г 1п(вт1п(х'г) + 1)(1 - вх(1 + 2в-г))1{Х < 4}
1 + вх
г г
в-г I ах - + / ¡Н)^ах
-те
-г , 1 21п(вг + 1) + 1 - в-г(вг + (3 - 4вг + (4вг + 2) 1п(вг + 1) + 3
4 4(вх + 1)2 4 \4 4(вг + 1)2
_ -г (в2г + 2вг - 21п(вг + 1) (вг + 2)(3в2г + 2вг - 2(2вг + 1)1п(вг + 1))) = в V 4(вг + 1)2 4вг(1 + вг)2 )
-2(вг + 1)(вг(вг + 2) - 2(вг + 1) 1п(вг + 1)) в2г + 2вг - 2(вг + 1) 1п(вг + 1)
4в2г(1 + вг)2 2в2г(1 + вг)
8. Так как
ЕФк (Х,4) = 0,
то
ы е^^х:!-- - с-' тсе-м + ч+1<х<'><1 - ^а+^п = ,
в™п(х>г) ^ у 2(1 + вх) / 2вг(1 + ег)
а тогда все выражение будет равно
(в2г - 2вг - 2)2 2в2г(1 + вг)2 .
Теперь соберем все вместе и получим:
^ т2 ^ N е3г - 3вг + 3 2(ег - 1п(вг + 1)) вг (в2г - 2вг - 2)2
АК(4) = ЕхФК(Х,4) = о 2г/3 , ^ + ( + + + ( )
3в2г(1 + вг) в2г(вг + 1) 12(вг + 1) 4в2г(1 + вг)2
3в2г - 2вг - 21п(вг + 1) ег в2г + 2вг - 2(ег + 1) 1п(вг + 1) (в2г - 2вг - 2)2
— - — - - — -
2е2г(1 + вг) 6(1 + вг) + 2в2г(1 + вг) 2е2г(1 + вг)2 _ в3г + 8в2г + 8вг - 4(е2г + 3вг + 2) 1п(вг + 1) = 4в2г (1 + ег)2 .
Теперь остается вычислить ее супремум. Для удобства обозначим в* за новую переменную y и вычислим супремум следующей функции при y > 0:
( y3 + 8y2 + 8y - 4(y + 1)(y + 2) ln(y + 1) g(y) 4y2 (y + 1)2 •
Для вычисления супремума использовался математический пакет Wolfram Mathematica увидим, что супремум этой функции достигается при y = 1.38468...,и равен 0.02322.... В терминах исходной функции супремум останется таким же и достигается в точке t = ln(y) = 0.32547. Итак,
ДК = sup ДК (t) = 0.02322...
teR
Теперь вычислим в соответствии с формулой (1.3) точные бахадуровские наклоны и локальные ба-хадуровские эффективности.
Альтернатива масштаба. Плотность имеет следующий вид:
Zi(M) =
gtf gxe0 gtf+xe0
(1 + exe" )2 (1 + exe0 )2' Найдем ее производную по в в точке в = 0:
, s _ ex(ex + x +1 - xex) fl (X 0) = (ex + 1)3 •
Используя формулу (1.3), получим следующее соотношение для локального бахадуровского наклона:
( 1 ln(eÉ+1)\2
S V - ) 2
ски,1(в) =--т"2-■ в ,
при помощи Wolfram Mathematica находим, что супремум достигается в точке t = 0.7713... и равен 0.01170____Таким образом, бахадуровский наклон равен
скид(в) - 0.5033... ■ в2, в ^ 0,
и, подставляя в формулу (1.1), получаем, что локальная бахадуровская эффективность равна
ff у екиМ 0.5033
e//KU'1 = Й 2^(в) ■ в2 = тш * 0.353.
Получившаяся эффективность существенно меньше эффективности интегральной статистики для той же альтернативы, что типично для статистик Колмогорова [62].
Альтернатива гиперболического косинуса. Плотность имеет следующий вид
/2(,в)-Г(в + 2) e(X+Ï)
Г2( 2 + 1)(1 + ex)*+2'
2
Теперь вычислим производную при в = 0 и получим:
ex(x + 2 - 2ln(1 + ex))
/2 (x, 0) =
2(1 + ex)2
64
При вычислении локального бахадуровского наклона используем формулу (1.3):
Sup (i Ьг2(-е') - ^+'"il+',) - mt)
n ia\ — t€R ___ д2
C/2,KU(0) --д2--0
Супремум квадрата достигается в точке t ~ 0.82979 и равен соответственно 0.03437822 — 0.001189.., Af — 0.02322... Таким образом, точный наклон будет равен: C/2,KU(0) ~ 0.0512 • 02 и, подставляя в формулу (1.1), получаем, что локальная бахадуровская эффективность:
eff — Иш cku,/2 (0) — 0.051^ 0 288 е//ku>/2 — 1то 2^2(0) • 02 — 0.1775 ~ 0.288.
Синус-альтернатива. По формуле (1.3), получим следующее соотношение для локального ба-хадуровского наклона:
sup z-1 ((1 - z)(Si(2n(1 - z)) - Si(2n)))2
c — f£M_ 02
cku,/S —-д2--0 ,
x
где Si(x) — / ^dt и за z обозначена величина L(x) — . При помощи пакета Wolfram Mathematica о
получаем, что супремум достигается в точке z ~ 0.324... и равен примерно 0.3669..., тогда бахаду-ровский наклон равен
"ки,/з (0) ~ 15.801... • 02,
и получаем, что по формуле (1.1) локальная бахадуровская эффективность равна:
ff у "к/ (0) 15.801...
e//KU'/3— Й0 "кадт — * °.80°.
Интегральная статистика /UL
Статистика /U^ асимптотически эквивалентна U-статистике степени 3 с центрированным ядром
ф(х y,z) — 3 (g(x y;z) + #(y,z;x) + z; y)),
где g(x,y; z) — e-max(°,max(x,y)-z) - (1 - emi"(°,mi"(x,y)-z)), x,y,z e R. Найдем проекцию этого ядра:
^(t) — E (Ф(Х, Y, Z)|Z — t) — E ( 1 g(X, Y; t) + 3g(X, t; Y)) .
Легко заметить, что в силу характеризации, имеем E(g(X, Y; t)) — 0, остается вычислить второе слагаемое.
E(g(X,t; Y)) — E (е-max(°,max(X,t)-Y)) - E ((1 - emi"|0,mi"|X,i)-Y))) — /1(t) - /2(t). Заметим, что
/2(t) — E ((1 - emi"(°,mi"(X,i)-Y))) — E (1 - emi"(X,t)-Y) 1{min(X,t) < Y}.
А такое математическое ожидание уже было вычислено для статистики в формуле (6), поэтому
перепишем его еще раз:
1 2е4 + 1
/2(*) = ¿Ы—е4) + * 1п(е4 + 1) — 11п2 (1 + е4) + —
2 1 + е4
где дилогарифм Эйлера Ы2 определяется формулой Ы2 (г) = — /0 1п(14 4) г € С. Вычислим теперь
04
слагаемое 11(*).
/1(4) = Е (е-тах(0>тах(х>4)-= р (тах(Х, *) < У) + Е (е-(тах(х>4)-< шах(Х,*)}) .
Для вычисления слагаемых в правой части рассмотрим две непересекающиеся области:
1. х < тах(х, *) = у <
2. х > тах(х, *) = х, у < х.
Тогда первое слагаемое найдем как двойной интеграл по по объединению этих областей по совместной плотности р(х,у) = (1+<;)2 (1+еУу)2:
4 те тете
Р (шах(Х, *) <У)= р(х,у)^у^х + р(х,у)^у^х
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.