Асимптотические свойства статистик, основанные на выборках случайного объема тема диссертации и автореферата по ВАК РФ 01.01.05, кандидат наук Галиева, Нургуль Кадыржановна

  • Галиева, Нургуль Кадыржановна
  • кандидат науккандидат наук
  • 2013, Москва
  • Специальность ВАК РФ01.01.05
  • Количество страниц 84
Галиева, Нургуль Кадыржановна. Асимптотические свойства статистик, основанные на выборках случайного объема: дис. кандидат наук: 01.01.05 - Теория вероятностей и математическая статистика. Москва. 2013. 84 с.

Оглавление диссертации кандидат наук Галиева, Нургуль Кадыржановна

Содержание

Введение

1 О скорости сходимости для функций распределения асимптотически нормальных статистик, основанных на выборках случайного объема

1.1 Предварительные результаты

1.2 Опенки скорости сходимости для функций распределения асимптотически нормальных статистик, основанных на выборках случайного объема

1.3 Распределение Стыодента и распределение Лапласа

2 Асимптотические разложения для функций распределения статистик, основанных на выборках случайного объема

2.1 Предварительные результаты

2.2 Асимптотические разложения

2.3 Применение к распределению Стыодента и распределению Лапласа

3 Оценки для функций концентрации статистик, основанных на выборках случайного объема

3.1 Функция концентрации

3.2 Конкретные статистики

3.3 Выборки случайного объема

3.4 Случай распределения Стыодента и распределения Лапласа

3.5 Об оценивании функций концентрации регулярных статистик, построенных по выборкам случайного объема

Заключение

Литература

Рекомендованный список диссертаций по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Асимптотические свойства статистик, основанные на выборках случайного объема»

Введение

В классических задачах математической статистики объем выборки, доступной исследователю, традиционно считается детерминированным и в асимптотических постановках играет роль (как правило, неограниченно возрастающего) известного параметра. В то же время на практике часто возникают ситуации, когда размер выборки не является заранее определенным и может рассматриваться как случайный. Эти ситуации, как правило, связаны с тем, что статистические данные накапливаются в течение фиксированного времени. Это имеет место, в частности, в страховании, когда в течение разных отчетных периодов одинаковой длины (скажем, месяцев) происходит разное число страховых событий (страховых выплат и/или заключений страховых контрактов), в медицине, когда число пациентов с тем или иным заболеванием варьируется от года к году, в технике, когда при испытании на надежность (скажем, при определении наработки на отказ) разных партий приборов (изделий), число отказавших приборов в разных партиях будет разным. В таких ситуациях число наблюдений, которые будут доступны исследователю, и заранее не известное, разумно считать случайной величиной. Другими словами, в таких ситуациях объем выборки является неизвестным параметром, а сам становится наблюдением, то есть статистикой. В силу указанных обстоятельств вполне естественным становится изучение асимптотического поведения распределений статистик достаточно общего вида, основанных на выборках случайного объема.

На естественность такого подхода, в частности, обратил внимание Б. В. Гнеденко в работе [2], в которой рассматривались асимптотические свойства распределений выборочных квантилей, построенных по выборкам случайного объема, и было продемонстрировано, что при замене неслучайного объема выборки случайной величиной асимптотические свойства статистик могут радикально измениться. К примеру, если объем выборки является геометрически распределенной случайной величиной, то вместо ожидаемого в соответствии с классической теорией нормального закона, в качестве асимптотического распределения выборочной медианы возникает распределение Стыодента с двумя степенями свободы, хвосты которого столь тяжелы, что у него отсутствуют моменты порядков, больших второго. «Тяжесть» же хвостов асимптотических распределений имеет критически важное значение, в частности, в задачах проверки гипотез.

Простейшей статистикой является сумма наблюдений. Для выборок случайного объ-

ема число слагаемых в таких суммах само становится случайным и такие суммы называются случайными. Асимптотическим свойствам распределений сумм случайного числа случайных величин посвящено много работ (см., например, [1], [2], [6], [7], [8], [12], [14]). Такого рода суммы находят широкое применение в страховании, экономике, биологии и т.п. (см., [2], [4], [8], [14]). В классической статистике суммирование наблюдений как правило возникает при определении выборочных средних. При статистическом анализе, основанном на моделях, в которых объем выборки считается неслучайным, асимптотическое поведение статистик типа сумм и статистик типа средних арифметических одинаково - эти статистики после нормировки, обязательной для получения нетривиальных предельных распределений, становятся неразличимыми. Однако, как уже говорилось, в реальной практике очень часто объем выборки сам является статистикой, и, как недавно показано, например, в работе [33], асимптотическое поведение статистик типа сумм и статистик типа средних арифметических при их неслучайной нормировке оказывается различным. Заметим, что, конечно же, формально допустима и случайная нормировка, но для построения разумных асимптотических аппроксимаций для распределений статистик (а именно это и является целыо асимптотической статистики), она неприменима. Именно использованием неслучайной нормировки и объясняется возникновение не «чистого» нормального закона, а смешанных нормальных предельных распределений у статистик типа сумм и типа средних арифметических. При этом различие этих предельных законов может дать дополнительную информацию о структуре исходных данных.

Более того, в математической статистике и ее приложениях часто встречаются статистики, которые не являются суммами наблюдений. Примерами являются ранговые статистики, [/-статистики, линейные комбинации порядковых статистик (¿-статистики) и т.п.

Диссертация посвещана исследованию асимптотических свойств статистик, основанных на выборках случайного объема. Рассмотрены оценки скорости сходимости и асимптотические разложения для функций распределения статистик. Рассмотрены асимптотические аппроксимации для функций концентраций таких статистик. В качестве конкретных примеров рассмотрены два частных случая: распределение Стыодента и Лапласа.

В работе приняты следующие обозначения: М - множество вещественных чисел, N -множество натуральных чисел, Ф(ж), у?(х) - соответственно функция распределения и плотность стандартного нормального закона.

Рассмотрим случайные величины N2,... и Х2,..., заданные на одном и том же вероятностном пространстве (П, Л, Р). В статистике случайные величины Х2, имеют смысл наблюдений, п - неслучайный объем выборки, а случайная величина - случайный объем выборки, зависящий от натурального параметра п € N. Например, если случайная величина 7УП имеет геометрическое распределение вида

1 / 1 \

Р(Мп = к) = -[1- -) п \ п/

то

ЕЛГ„. = п,

то есть среднее значение случайного объема выборки равно п.

Предположим, что при каждом ?г > 1 случайные величины 7УП принимают только натуральные значения (то есть 6 К) и независимы от последовательности случайных величин Х\,Х2, ■■■■ Пусть случайные величины Х\, Х2,... независимые и одинаково распределенные случайные величины, имеющие функцию распределения Р(х).

Пусть Тп = Тп(Хх,..., Хп) некоторая статистика, то есть действительная измеримая функция от наблюдений Х\, ...,Хи. Назовем Т„ асимптотически нормальной с параметрами (¿¿, 1/сг2), /х € Я, о > 0, если

Р (стл/гг (Тп - ц) < х) Ф(ж), п -> оо, (1)

где Ф(ж) - функция распределения стандартного нормального закона.

Примеры асимптотически нормальных статистик хорошо известны. Например, выборочное среднее (при условии существования дисперсии), оценки максимального правдоподобия (при соответствующих условиях регулярности), центральные порядковые статистики и т.п.

Для каждого п > 1 определим случайную величину полагая

Т„п(ш) = Тм^Х^ш), ...,Х„п(ы){ч>)), шеП. (2)

Таким образом, Тдгп - это статистика, построенная на основе статистики Тп по выборке слз'чайного объема Мп.

В первой главе получены оценки скорости сходимости функций распределения асимптотически нормальных статистик, построенных по выборкам случайного объема к предельному закону. Эти оценки непосредственно зависят от скорости сходимости функции

распределения случайного объема выборки и функции распределения статистики, основанной на неслучайной выборке. Подобного рода утверждения обычно называются теоремами переноса. Таким образом, в первой главе доказаны теоремы переноса, касающиеся оценок скорости сходимости.

В работах [1], [2] доказаны первая и вторая теорема переноса для частных случаев суммы независимых случайных величин и выборочной квантили.

Теорема 1([1], стр. 147). Пусть Хх, Х2,... - независимые одинаково распределенные случайные величины и £ N - последовательность случайных величин независящих от Хх, Х2,. .. Тогда, если существуют постоянные Ъп > 0, ап Е К такие, что

2. Р - <х^ Н(х). Я(0+) = 0, поо, где Ф(х), II (х)-функции распределения, то при п —> оо

Р I у ^ (Хг - ап) < х\ <?(ж), п оо

где функция распределения С (ж) определяется своей характеристической функцией

где ф(£) -характеристическая функция функции распределения

Теорема 2 ([1], стр. 148) Пусть Хх,Х2,... - независимые одинакова распределенные случайные величины и ДГП е N - последовательность случайных величии независящих от Хх,Х2,... и пусть Хуп - эмпирическая квантиль порядка 7 6 (0,1), построенная по неслучайной выборке Хх,Х2, ..Хп. Тогда, если существуют постоянные Ьп > 0. а„е! такие, что

и

п —> оо

и

2. Р ->• Н{х), Я(0+) =0, п^ оо,

где Ф(ж); Н(х) - функции распределения, то при п —>■ оо

Р - лг„ - ап) < х ) -» С(ж), п —> оо

'ть

где С(х) имеет вид масштабной смеси нормального закона со смешивающим распределением Н

роо

ОД - / Ф{Хл/у)<1Н(У). Jo

Для асимптотически нормальных статистик(см. (1)) в работе [3] доказана следующая обобщенная теорема переноса.

Теорема 3.([3]) Пусть {¿„}-некоторая неограниченно возрастающая последовательность положительных чисел. Предположим, что Кп —> оо по вероятности при п —» оо. Пусть статистика Тп = ТЦХх,..., Хп) асимптотически нормальна, то есть

Р ((Тл/п (Тп — р) < х) Ф(ж), п —^ оо.

Тогда для того, чтобы

Р (сг(ТМп - ц) < ж) п оо, 0 < йп | оо

необходимо и достаточно, чтобы суы,ествовала функция распределения Н(х) с Н(0+) = 0 такая, что

Р (Ып < йпх) ->• Н(х), п оо, х > 0, при этом функция распределения (7(ж) имеет вид

/■оо

ОД = / Ф(хл/у)сгя(у), х € Е Jo

то есть С (ж) - масштабная смесь нормального закона с смешиваючцим распределением Н.

Для дальнейшего нам будет более удобно заменить условие асимптотической нормальности статистики Тп(см.(1)) на более сильное условие, описывающее скорость функции распределения нормированной статистики Тп к нормальному закону. Пусть выполнено следующее

Условие 1. Существуют константы а > 0, С\ > 0 такие, что 8ир|Р(<7Л/гс(Тп-/х) <х) -Ф(х)| < п€М.

Сформулируем .условия, описывающие предельное поведение функции распределения нормированного случайного объема ЛГП.

Условие 2. Существуют константы ¡3 > О, С2 > 0и функция распределения Н(х) с Я(0+) = 0 такие, что

В главе 1 доказана следующая теорема

Теорема 4. Пусть статистика Тп = Тп(Хх, ...,Хп) удовлетворяет Условию 1, а случайный объем выборки Мп-Условию 2. Тогда справедливо неравенство

Анализируя доказательство Теоремы 4, несложно получить следующий общий результат.

Теорема 5. Пусть случайный элемент Хп, принимающий значения в произвольном измеримом пространстве, случайные величины заданы на одном вероятностном пространстве и независимы при каждом п € N. Предположим, что действительная статистика Тп = Тп{Хп) и случайные величины удовлетворяют следуючцим условиям,

1. Суи^ествуют константы а > 0, а > 0, ^ 6 К, С\ > 0 и последовательность О < с1п | оо, п —>• оотакие, что

2. Существуют константа С2 > 0 и последовательность 0 < 5п I 0, ?г —» оо и функция распределения Н(х)с Я(0+) = 0 такие, что

зир |Р (<г^(Т„„ -1м)<х)~ С(х)\ < С,ЕМ~а + 7г € N.

где функция распределения С(гг) имеет вид

Тогда справедливо неравенство

где функция распределения 0(х) имеет вид

лоо

ад - / ф{Хл/у)йН(у),хеЖ. J^)

'ОО

О

Приведем два примера применения Теоремы 4, в которых предельная функция распределения С (ж) является известным распределением.

Первый пример касается распределения Стьюдента, а второй- распределения Лапласа.

В работе [3] показано, что если случайный объем выборки Мп имеет отрицательно биномиальное распределение с параметрами р — 1/пиг > 0, то есть (при г = 1 имеем геометрическое распределение)

то для асимптотически нормальной статистики Тп справедливо предельное соотношение ([3], Следствие 2.1, стр. 426)

где Gf{x) - функция распределения распределения Стьюдента с параметром 7 = 2г, то есть имеющее плотность вида

где Г(-) - эйлерова гамма - функция, а 7 > 0 - параметр формы (если параметр 7 натурален, то он называется числом степеней свободы). В нашей ситуации он может быть произвольно мал, то есть мы имеем типичное тяжелохвостиое распределение. Если 7 = 2, то есть г = 1. то функция распределения. С2(ж) выражается в явном виде

В работе [10] получена оценка скорости сходимости случайного объема выборки в виде (0 < г < 1)

Р(ал/п (Тнп — /л) < х) —> С2г(ж у/г), п ^ оо

(3)

где

е~ГУ уГ-1 ^ 0)

Г

н'{х) = т1

при г = 1 правую часть этого неравенства можно заменить на 1/(п — 1).

Таким образом Нг(х)- функция распределения гамма-распределения с параметром г е (0,1] при этом

ЕАГ„ = т(п-1) + 1,

Нетрудно получить, что

ЕЛ::1 =

(5)

(6)

(п-1)(1

Пусть для функции распределения статистики Тп справедлива оценка скорости сходимости тира Берри-Эссеена, то есть

эир

X

(7)

р(ау/п{Тп-ц)<х^ -Ф(х)

то с учетом Теоремы 4 с а = 1/2,/3 = г/(г + 1), соотношений (З)-(б) в описываемой ситуации имеем оценку скорости сходимости

вир

Р (ауД {Т„п - ц) < х) -

= О

п

г/2

,г € (0,1),п € N.

(8)

Рассмотрим распределение Лапласа с функцией распределения Ае(х) и плотностью

1 г л/21x11 А0(х) = ^ехр|--в > 0, хеК.

В работе [9] была построена последовательность случайных величин Л7,, (а), зависящая от параметра я е N следующего вида. Пусть Уь У2, • • • - независимые одинаково распределенные случайные величины, имеющие непрерывную функцию распределения. Определим случайные величины

N(■/71) -- 1шп{ г > 1 • тах У3 < тах Ук}

т+1<к<тп+г

Хорошо известно, что так определенные случайные величины имеют распределение вида

р№> ^ Ч = ^тзт. * * 1. (9)

Пусть теперь Л^1^'), ... - независимые одинаково распределенные случайные

величины, имеющие распределение (5.19). Определим случайные величины

Nn(m) = max NU)(m),

1<7<™

тогда в работе [9] показано, что

lim pfMül < х) = g-m/^ ж>0) (10)

п—>оо \ П I

и для асимптотически нормальной статистики Тп справедливо соотношение

Р(<7^/n(TNri{m) - /i) < х) ->• Al/m(^), п —> ОО,

где Ai/m(.x) - функция распределения распределения Лапласа с параметром 7 = 1/т (см. также работу [10]).

В работе [11] была получена оценка скорости сходимости в соотношении (10) вида 'Nn(m) \ _/_ . С„

sup

х>0

(УШ < х) - е< ^ Ст > 0, n€N. (П)

\ 11 ) п

Поэтому, если функция распределения статистики удовлетворяет неравенству типа Берри-Эссеена(см.(7)), то с учетом неравенства (11) имеем

sup

P(V^ (7V„M - /х) < х) - A1/m(x)| = ^((EArV))172) + 0 • (12)

Рассматривая более подробно величину ЕАГП1 (ш). получаем

Г°° хп~2

E7Vn"1(m) <тп --r——dx.

Jo {т + x)n+1

Для вычисления данного интеграла используем формулу из [13] (формула 856.12, стр 184). В итоге получаем

EN-\m) < 0(п-г). С учетом этой формулы и (12) окончательно имеем

sup |р(сг^?г (TNn{m) - /i) < ж) - A1/m(x) =

Во второй главе получены асимптотические разложения для функций распределения статистик, построенных по выборкам случайного объема. Эти асимптотические разложения непосредственно зависят от асимптотического разложения функции распределения случайного объема выборки и асимптотического разложения функции распределения

статистики, основанной на неслучайной выборке. Подобного рода утверждения принято называть теоремами переноса. Таким образом, в данной главе доказаны теоремы переноса для асимптотических разложений статистик, построенных по выборкам случайного объема.

Сформулируем условие, определяющее асимптотические разложения для функций распределения статистики Тп при неслучайном объеме выборки.

Условие 3. Существуют константы I € 14, ц 6 К, а > 0, а > 1/2, 7 > 0, Сг > О, дифференцируемая функция распределения ^(х) и дифференцируемые ограниченные функции /^(х),] = 1такие, что

Следующее условие определяет асимптотического разложения функции распределения нормированного случайного индекса Ып.

Условие 4. Существуют константы т 6 М, /? > т/2, С% > 0, функция 0 < д(п) | оо,п —У оо, функция распределения Н(х),Н(0+) = 0 и функции ограниченной вариации кг(х),г = 1, ...,га такие, что

Во второй главе строится асимптотическое разложение для функции распределения нормированной статистики Тдгп. основанной на выборке случайного объема, получена аппроксимация вида

п е N.

P(cr^(n)(T;v„ - ¡l) < х) « Gn(x), П ОО,

(13)

где функция Сп(х) имеет вид (см. Условия 3, 4)

оо

Gn(x)= J F(xy^)dH(y)+ J2n~i/2 I FfaDdhiiy)

i= 1

+

1 /S(n)

1 /Я(п)

oo

3 = 1

V9(.n)

771.

OO

1/g(n)

В главе 2 доказана следующая теорема

Теорема 6. Пусть статистика Тп = Тп(Х±,..., Хп) удовлетворяет Условию 3, а случайный объем выборки Ип - Условию 4- Тогда существует константа > 0 такая, что справедливо неравенство

С -4- с. м

зир|Р(<75»(ТЛ,„ -ц)<х)- Сп(*)| < СхЕАГ* + пр2

где

оо I

Мя = 8ИР I |

м а.р. Сп(х) определено по формуле (14).

Приведем два примера применения Теоремы 6 с вполне конкретными предельными функциями распределения статистик, построенных по выборкам случайного объема. Мы рассмотрим асимптотические разложения для функция "распределения выборочных средних, построенных по выборкам случайного объема. Аналогичные результаты могут быть получены для статистик, допускающих асимптотические разложения типа Эджворта для функции распределения при неслучайном объеме выборки. Например, используя результаты работ [16]-[21], можно получить соответственно асимптотические разложения для функции распределения ранговых статистик, ¿-статистик и ¿/-статистик.

Пусть Х\,Х2,... - независимые одинаково распределенные случайные величины с ЕХ1 = уи, 0 < = Е|Х1|3+2<5 < оо, 6 е (0, п Е(Л\ - = ц3. Для натурального п обозначим

Тп = * + - + (15)

п

Предположим также, что случайная величина Х\ удовлетворяет условию Крамера (С)

Нтвир [Еехр-^Х!}! < 1, тогда с учетом Теоремы 6.3.2([22], стр. 207) получаем, что

вир

X

Р{аМТп -/*)<*)- Ф(х) - - х2)<р(х)

Ьу/п

с!

<

^(0,|), (16)

Таким образом, статистика (15) удовлетворяет Условию 3 с

F(x) = Ф(х), h(x) = ^(1 - х2)ф). (18)

Справедлива следующая лемма.

Лемма 1. Пусть I = I, 0 < д(п) t оо. F(x) = Ф(ж),

Тогда для величины Мп (см.Теорему5) справедливо неравенство

Мп^2 +

где

С = isuP{^(u)(«4 + 2и2 + 1)} = —

j о 3V27red

Рассмотрим пример применения Теоремы б в случае распределения Стыодента. В работе [3] показано, что если случайный объем выборки Nn имеет отрицательно биномиальное распределение с параметрами р — 1/п и г > 0, то есть

(при г = 1 имеем геометрическое распределение), то для асимптотически нормальной статистики Тп справедливо предельное соотношение ([3], Следствие 2.1, стр. 426)

P{cry/n(TNn — ц) < х) —У G2r(xy/r), п ^ оо, (19)

где Gf(x) - функция распределения Стыодента с параметром 7 = 2г, соответствующая плотности вида

, . Г(7 + 1/2) / ж2\-(7+1)/2

где Г(-) - эйлерова гамма-функция, а 7 > 0 - параметр формы (если параметр 7 натурален, то он называется числом степеней свободы). В нашей ситуации он может быть произвольно мал, то есть мы имеем типичное распределение с тяжелыми хвостами. Если 7 = 2, то есть г = 1, то функция распределения G2(x) выражается в явном виде

При г = 1/2 имеем распределение Коши.

В работе [23] (формула (6.112), стр. 233) приведена следующая оценка скорости сходимости случайного объема выборки в виде (г > 0)

вир

х^О

П

<—, г ^ 1, Сг> О, п е N. п

вир

х>0

Рх) - Нг{х) 7-6(0,1), Сг>0, пек,

\ сД„ / пг

а

где

Я,

X

е-туут~1йу, х ^ О

- функция гамма-распределения с параметром г > 0. При этом

ЕЛГ„ = г(п - 1) + 1.

Нетрудно получить, что

(21)

(22)

Е^"1 = 0(п~г), т> 0, г ф 1, п€М. Для случая г = 1, имеем

(23)

ЕЛГ^—'—Ь ёп, п>1. п — I

(24)

Таким образом, учитывая Теорему 6, формулы (16)-(18), соотношения (23), (24) и равенства(справедливые равномерно по х)

оо

I Ф{Ху/у)<Шг{у) = С2г(х) + 0 .

(г(п-1)+1)-!

оо

У = дг(х) +

(25)

(26)

(г(п-1)+1)-1

получаем следующую теорему.

Теорема 7. Пусть статистика Тп имеет вид (5.1), где Х1,Х2,... - независимые одинаково распределенные случайные величины с ЕХг = рь, 0 < 0X1 = а'2, Е|Хх|3+2г < оо, 5 € (0,1/2) и Е(Хх — ¿¿)3 - цз, причем случайная величина Хг удовлетворяет условию Крамера (С)

Нтвир |Еехр{г1Х"1}| < 1,

|£|—Юо

Предполооюим. что при некотором г > 0 случайная величина Агп имеет распределение вида

Тогда при г > 1/(1 + 28) для функции распределения нормированной статистики ТИп при п —» оо справедливо а. р. вида

цго3дг(х)

sup

Р (а^г(п-1) + ЦТМп -М)<х)~ G2t(x) - Г/ ^ , \ ' б \Jr[n — 1) + 1

°(nmm(l r(l/2+i»)' Г>1'

1 г л/2\х\ л

Лб(х) = öT2expl—er 9>0' хе

где функции G2r(x) и gr(x) определены в соотношениях (25) и (26).

Рассмотрим распределение Лапласа с функцией распределения Ав(х) и плотностью

л/2|:

И Y I К -

ву/2

В работе [9] была построена последовательность случайных величин Nn(s), зависящая от параметра s 6 N следующего вида. Пусть Yi, Y2,... - независимые одинаково распределенные случайные величины, имеющие непрерывную функцию распределения. Определим случайные величины

N(s) = min-fz > 1 : max У, < max УЛ.

1<j<s J S+l<k<S+l

Хорошо известно, что так определенные случайные величины имеют распределение вида

p(7V(5) -k) = ГПГЛ' k - 1 (27)

Пусть теперь N^(s), ... - независимые одинаково распределенные случайные

величины, имеющие распределение (27). Определим случайную величину

тогда, как показано в работе [9],

NJs) = max N^(s),

l<j<7l

Ит p (ЦШ <x)= е-Ф x > о (28)

n-»oo \ П J

и для асимптотически нормальной статистики Тп справедливо соотношение P(ay/n(TNrt{s) - ц) <х) —► Ai/a(x), п —» оо,

где A1/S(x) - функция распределения Лапласа с параметром в = 1/s(см.также работу [10]).

В работе [11] была получена следующая оценка скорости сходимости в соотношении (28):

svp\p(^^-<x)-e-a/x <—, Cs>0, neN. (29)

Х5>01 \ п / п

Таким образом, н;з соотношения (29) следует, что случайный индекс Nrl(s) удовлетворяет Условию 2 с

д{п) = п, Н(х) = e~s/l, т= 1, (30)

кг(х) = 0, C2 = Cs>0, 0 = 1. (31)

Рассмотрим величину E./V"1 (.s). Из определения случайных величин Nn(s) и равенства (27) имеем

к

/хп~1

(,s + x)n+ldX>

к-1

поэтому

оо

хп~2

ЕN (5) = 571 / 7-

п К ' У {з + х)^1 о

Используя формулу (см. [13] формула 856.12, стр. 184), получим

ЕЛГ-1(5) < ОК1). (32)

Таким образом, учитывая Теорему 6, , формулы (16) - (18), а также Лемму 1. соотношения (30), (31) и равенства (справедливые равномерно по х)

эо

I Ф(х^у)ае-'* = А!/,(*) +о (33)

71"1

ОО

I ЖX= Цх) + о(^), (34)

п-1

непосредственно получаем следующую теорему.

Теорема 8. Пусть статистика Тп имеет вид (15), где Х1,Х2,-.. - независимые одинаково распределенные случайные величины с ЕХх = /л, 0 < ОХ^ = ег-2, Е)^!3+2,5 < оо, 5 € (0,1/2) и Е(АГ1 — /х)3 = причем случайная величина Хг удовлетворяет условию Крамера (С)

Нтэир |Еехр{ггХ!}| < 1,

[г|->зо

Предположим, что при некотором в € N случайная величина N„(3) имеет распределение вида

Тогда для функции распределения нормированной статистики справедливо асимп-

тотическое разложение вида

sup

рКВДм.) - Р) < х) - А1/в(х) - = П оо,

1 \

где функции Ах/.,(ж) и ls(x) определены соответственно в соотношениях (33) и (34).

В третьей главе доказана общая теорема, позволяющая получать оценки сверху для функций концентрации статистик, основанных на выборках случайного объема из оценок для функций концентрации статистик, построенных по выборках неслучайного объема, а также приведены оценки функций концентрации регулярных статистик, построенных по выборкам случайного объема.

Как известно, функция концентрации - это одна из характеристик случайной величины. Функция концентрации широко используется для изучения предельных свойств сумм независимых случайных величин.

Функцией концентрации случайной величины Z называется функция вида ( см., например, [23], стр. 53)

Q(Z; А) = sup Р (х < Z < ж + Л), Л ^ 0. (35)

X

Очевидно функция концентрации Q(Z; А) неубывающая функция Л, удовлетворяющая неравенству

0 ^ Q(Z-X) <1,

для любого А ^ 0.

Из ее определения следует оценка

sup Р (Z =х) = Q(Z; 0) ^ Q(Z; А), Л ^ 0, (36)

X

позволяющая оценить максимальную вероятность отдельного значения случайной величины Z. Из определения (35) функций концентрации следует, что для любого числа а еШ и любого 6 > 0 справедливы тождества

Q(Z + а; А) = Q(Z- A), Q{bZ- А) = Q(Z~, Л/6). (37)

Применениям функций концентрации к проблемам слабой сходимости посвящены главы 3 п 4 книги [24]. Известны точные выражения для ф.к. через функцию распределения случайной величины если функция распределения Р{х) случайной величины 2 симметрична относительно точки абМи одновершинна, то соответствующая ей ф.к. Л) имеет вид ([24], стр 140)

А) = 2^(а + Л/2) - 1. (38)

Отмечена связь между оценками типа Берри - Эссеена для функции распределения статистик и оценками для функций концентрации.

Пусть для функции распределения нормированной статистики Тп = Тп(Хи ■ ■ ■ > Хп) справедлива оценка скорости сходимости к нормальному закону

sup

х

/ \ С

Р(ап'(Тп-ц) <х) - Ф(х) < —, neN, (39)

v / па

где С > 0, 5 ^ 0, сг > 0, а > 0 и р G 1 - некоторые числа. Тогда справедлива следующая лемма

Лемма 2. Пусть выполнено неравенство (39). Тогда для ф.к. статистики Тп выполнено неравенство

„/гп АС 4Xans

< <°+ -k)max (Ani< В главе 3 доказана следующая теорема.

Теорема 8. Пусть функция концентрации статистики Тп удовлетворяет неравенству

/ В \

Q(Tn- А) ^ Л maxi А, — ), neN \ ni J

где А

> 0, Б > 0, 7 > 0 - некоторые числа. Тогда для функции концентрации статистики Tjvn) построенной по выборке случайного объема Nn. справедливо неравенство

Q(TNn]X) < Л Е тах(А, ^ 2А тах(х, В Е

Приведем два примера применения Теоремы 8. Первый пример касается распределения Стьгодента, а второй - распределения Лапласа.

В работе [3] показано, что если случайный объем выборки _/Уп имеет отрицательно биномиальное распределение с параметрами р = 1/пиг > 0, то есть (при г = 1 имеем геометрическое распределение)

то для асимптотически нормальной статистики Тп справедливо предельное соотношение ([3] Следствие 2.1, стр. 426)

Р (ау/К {ТМп - //) < х) —> С

2г{х у/г), п —> оо, (40)

где 02г{х) - функция распределения распределения Стьюдента с параметром 7 = 2г, то есть имеющее плотность вида

, ч Г(7 + 1/2) / х-2\-(7+1)/2

где Г(-) - эйлерова гамма - функция, а 7 > 0 - параметр формы (если параметр 7 натурален, то он называется числом степеней свободы). В нашей ситуации он может быть произвольно мал, то есть мы имеем типичное тяжелохвостное распределение. Если 7 = 2,' то есть г = 1, то функция распределения С2(ж) выражается в явном виде

При г = 1/2 имеем распределение Коши.

В работе [13] получена оценка скорости сходимости случайного объема выборки в виде (0 < г < 1)

вир

х^О

р(тк < *) -

сг

- пг/(г+1)

, Сг >0, пе N.

(41).

где

Я.

г,—ГУ

ут ¿у, X ^ 0,

гг г

= Щ I

при г = 1 правую часть этого неравенства можно заменить на 1/(п — 1). Таким образом, Н,.(х) - функция распределения гамма - распределением с параметром г е (0,1] при этом

ЕЛГП = г(п - 1) + 1. 20

Нетрудно получить

Е N-1 =

п

(п - 1) (1 - г)

~ = °(П~Г)> 0 < г <1, п Е

N.

Если для функции распределения статистики Тп справедлива оценка скорости сходимости типа Берри - Эссеена, то есть

ьир

X

Р(а^(Тп-ц)<х) - Ф(х)| = (42)

■у/П'

то с учетом Теоремы 8са = 1/2.соотношений(40), (41), (22). (23), (42) в описываемой ситуации имеем оценку функции концентрации

В

пг

Если для функция концентрации статистики Тп справедливо неравенство,

Q(TNn,X) < Л max (А, г € (0,1), пе N. (43)

Q(Tn- А) < Л max (А, п е

N

то из Теоремы 8 непосредственно получаем неравенство

Q(TNn, А) < 2А max (a, г 6 (0,1), neN. (44)

Рассмотрим распределение Лапласа с функцией распределения А1(х) и плотностью

А7(ж) = —1= ехр{— ^^7 > 0, хеШ. 7\/2 V 7 >

В работе [9] была построена последовательность случайных величин Nn(m,), зависящая от параметра me N следующего вида. Пусть Yl,Y2,... - независимые одинаково распределенные случайные величины, имеющие непрерывную функцию распределения. Определим случайные величины

Похожие диссертационные работы по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Список литературы диссертационного исследования кандидат наук Галиева, Нургуль Кадыржановна, 2013 год

Литература

1. Гпедеико Б.В., Фахим X. Об одной теореме переноса // ДАН СССР, 1969. Т. 187. С. 15 - 17.

2. Гпедепко Б. В. Об оценке неизвестных параметров распределения при случайном числе независимых наблюдений // Труды Тбилисского Математического Института, 1989. Т. 92. С. 146 - 150.

3. Бенин? В.Е., Королев В.Ю. Об использовании распределения Стыодента в задачах теории вероятностей и математической статистики // Теория вероятностей и ее применения, 2004. Т. 49. Вып. 3. С. 417 - 435.

4. Гнедеико Б.В. Курс теории вероятностей. - М.: Наука, 1988. 446 с.

5. Ширяев А.Н. Вероятность. - М.: Наука, 1989. 638 с.

6. Круглое В.М.. Королев В.Ю. Предельные теоремы для случайных сумм. - Издательство МГУ, 1990. 263 с.

7. Gnedenko B.V., Korolev V.Yu. Random summation. Limit theorems and applications. - CRC Press, 1996. 267 p.

8. Bemng V.E.. Korolev V.Yu. Generalized Poisson models and their applications in insurance and finance. - VSP Press, 2002. 434 p.

9. Бенинг B.E.. Королев В.Ю. Некоторые статистические задачи, связанные с распределением Лапласа // Информатика и ее применения, 2008. Т. 2. Номер 2. С. 19 -34.

10. Бенинг В.Е., Королев В.Ю., У Да. Оценки скорости сходимости распределений некоторых статистик к распределению Стыодента / / Вестник Российского университета

дружбы народов, серия: Прикладная математика и информатика, 2004. Номер 1(12). С. 59 - 74.

11. Лямии О.О. О скорости сходимости распределений некоторых статистик к распределению Лапласа и Стыодента // Вестник Московского университета, серия 15, Вычислительная математика и кибернетика, 2011. Номер 1. С. 39 - 47.

12. Von Ghossy R, Rappl G. Some approximation methods for the distribution of random sums // Insurance: Mathematics and Economics, 1983. V.2. P. 251 - 270.

13. Двайт Г.Б. Таблицы интегралов и другие математические формулы. - М.: Наука, 1977. 224 с.

14. Королев В.Ю. Предельные распределения для случайно - индексированных последовательностей и их применения. - Диссертация на соискание ученой степени доктора ф из и ко - математических наук, М.: МГУ, 1993. 237 с.

15. Bilhngsley P. Probability and Measure. - John Wiley & Sons, 1995. 593 p.

16 Btckel P.G. Edgeworth expansions in nonparametric statistics // Ann. Statist., 1974. V.2. P. 1 - 21.

17. Alben W. Asymptotic expansions and the deficiency concept in statistics. -Mathematical Centre Tracts 58, 1974. 145 P.

18. Helmers R. Edgeworth expansions for linear combinations of order statistics. -Mathematical Centre Tracts 105, 1984. 137 P.

19. Albers W., Btckel P.G., Van Zwet W.R. Asymptotic expansions for the power of distribution free tests in the one - sample problem // Ann. Statist.. 1976. Y.4. P. 108 - 156.

20. Bickel P.G., Van Zwet W.R. Asymptotic expansions for the power of distribution free

tests in the two - sample problem // Ann. Statist., 1978. V.6. P. 947 - 1004.

21. Bentkus V.. Gotze F., Van Zwet W.R. An Edgcwortli expansions for symmetric statistics // Ann. Statist., 1997. V.25. P. 851 - 896.

22. Бенин?. B.E.. Королев В.Ю., Соколов И.А., Шоргин С.Я. Рандомизированные модели и методы теории надежности информационных и технических систем. - М.: Торус Пресс, 2007. 254 с.

23. Петров В.В. Суммы независимых случайных величин. - М.: Наука, 1972. 414 с.

24. Хенгартиер В., Теодореску Р. Функция концентрации. - М.: Наука, 1980. 172 с.

25. Alberink I.B. Berry - Esscen bounds for arbitrary statistics. - PrintPartners Ipskamp, Enschende, Ph.D. Thesis. 2000. 126 p.

26. Феллер В. Введение в теории вероятностей и ее приложения. - М.: Мир, 1984. т.2. 172 с.

27. Бенине В.Е., Галиева П.К. Оценки скорости сходимости для функций распределения асимптотически нормальных статистик, основанных на выборках случайного объема // Вестник Тверского государственного университета, 2012. Л1*0 11.Вып. 1. С. 20 -37.

28. Shevtsova I. On the absolute constants in the Berry - Essecn inequalities for indentically distributed summands // arXiv: 1111.6554vl. 28 November 2011.

29. Лукач E. Характеристические функции. - M.: Наука, 1979. 423 с.

30. Helmers R., Van Zwet W.R. The Berry - Essccn bound for U - statistics // Statistical Decision Theory and Related Topics 3. 1982. V.l. P. 497 - 512.

31. Круглое В.М. О принадлежности функций концентрации областям притяжения устойчивых законов // Теория вероятностей и ее применения. Т. 37. Вып. 3. С. 459 - 467.

32 Алекперов Ш. О. Круглое В.М. Сходимость сверток функций концентрации к вырожденному, нормальному и пуассоновскому законам / / Теория вероятностей и ее применения, 1994. Т. 39. Вып. 2. С. 248 - 271.

33. Королев В.Ю. О взаимосвязи обобщенного распределения Стыодента и дисперсионного гамма-распределения при статистическом анализе выборок случайного объема // Доклады РАН, 2012. Т. 445. Вып.

34. Климов Г.П.Теория вероятностей и математическая статистика. - М.: Изд-во Московского ун-та, 1983.

35. Гавриленко C.B., Зубов В.Г.,Королев В.Ю. Оценка скорости сходимости распределений регулярных статистик, построенных по выборкам случайного объема с отрицательным биномиальным распределением, к распределению Стыодента // Статистические методы оценивания и проверки гипотез. - Пермь: Изд-во Пермского гос. ун-та, 2006. С. 118 - 134.

35 Нефедова Ю.С. Оценки скорости сходимости в предельной теореме для отрицательных биномиальных случайных сумм // Статистические методы оценивания и проверки гипотез. - Пермь: Изд-во Пермского гос. ун-та. 2011. С. 46 - 61.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.