Некоторые вопросы уточнения предельных распределений статистик критериев нормального типа ω- и χ- для выборок умеренно большой длины тема диссертации и автореферата по ВАК РФ 01.01.05, кандидат физико-математических наук Миронова, Ирина Юрьевна

  • Миронова, Ирина Юрьевна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2003, Москва
  • Специальность ВАК РФ01.01.05
  • Количество страниц 90
Миронова, Ирина Юрьевна. Некоторые вопросы уточнения предельных распределений статистик критериев нормального типа ω- и χ- для выборок умеренно большой длины: дис. кандидат физико-математических наук: 01.01.05 - Теория вероятностей и математическая статистика. Москва. 2003. 90 с.

Оглавление диссертации кандидат физико-математических наук Миронова, Ирина Юрьевна

ВВЕДЕНИЕ.

ГЛАВА I. ВОПРОСЫ ПОСТРОЕНИЯ И АНАЛИЗА ЭМПИРИЧЕСКОГО ПРОЦЕССА ПО МНОГИМ ВЫБОРКАМ ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ О ТИПЕ РАСПРЕДЕЛЕНИЯ

§ 1. Введение.

§ 2. Построение эмпирического процесса для I -й выборки и анализ его корреляционной функции.

§ 3. Построение процесса по совокупности выборок X • > . >N.

ГЛАВА II. ЭМПИРИЧЕСКИЕ ПРОЦЕССЫ ДЛЯ НОРМАЛЬНО

РАСПРЕДЕЛЕННЫХ ВЫБОРОК.

§ 1. Корреляционные функции процесса для нормально распределена. ных выборок. Случай неизвестных yi ^ и известных

§ 2. Случай известных и неизвестных ^.

§ 3. Случай неизвестных ^

§ 4. Собственные числа и определители Фредгольма ядер эмпирического процесса в случае нормальных распределений.

ГЛАВА III. КРИТЕРИИ ТИПА ХИ-КВАДРАТ ДЛЯ ПРОВЕРКИ

ГИПОТЕЗЫ НОРМАЛЬНОСТИ ВЫБОРОК УМЕРЕННО БОЛЬШОЙ ДЛИНЫ С НЕИЗВЕСТНЫМИ ПАРАМЕТРАМИ.

§ 1. Введение. Постановка задачи.

§ 2. Асимптотическое распределение суммарного вектора частот

§ 3. Оценка параметров распределения вектора частот ^ для проверки гипотезы о нормальном типе распределения.

§ 4. Построение статистики типа хи-квадрат для умеренно больших выборок.

Рекомендованный список диссертаций по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Некоторые вопросы уточнения предельных распределений статистик критериев нормального типа ω- и χ- для выборок умеренно большой длины»

Постановка задачи.

В статистической теории и практике встречаются ситуации, когда необходимо проверить гипотезу о принадлежности функции распределения наблюдаемой совокупности случайных величин некоторому семейству распределений , где О - неизвестный параметр, вообще говоря, векторный.

Мы будем рассматривать ситуацию, когда совокупность наблюдаемых случайных величин, по которой следует построить критерий согласия и принадлежности этой совокупности случайных величин семейству распределений 6s), имеет следующий вид: это N выборок объемов n w соответственно, и каждая выборка в соответствии с проверяемой гипотезой И 0 принадлежит некоторому абсолютно непрерывному распределению , где параметр • неизвестен ( полностью или частично) и принадлежит некоторому открытому множеству 0 G R. . При этом, вообще говоря, для разных выборок параметры и 0 - различны.

В работе рассматривается для простоты случай, когда объемы всех выборок одинаковы и равны к,; и л- и^ . -. г - ^ . Элементы выборок будем считать независимыми в совокупности случайными величинами.

Отметим специфику рассматриваемой в дальнейшем задачи. В статистической практике в указанной ситуации экспериментатор часто имеет возможность получать достаточно большое число выборок, т.е. мы имеем право считать гУ достаточно большим ( bi ^о ). И в то же время он лишен возможности ползать выборки очень большого объема. Поэтому мы будем предполагать, что в наших условиях величина Vv является "умеренно большой". Это будет означать, что при анализе асимптотического поведения (при \л, ) рассматриваемых случайных величин мы должны оценивать или скорость сходимости приближения рассматриваемых распределений к предельному распределению, или же вводить те или иные уточнения асимптотических приближений.

Типичным примером возникновения большого числа выборок умеренно большого объема, является ситуация, когда экспериментатор работает в нестационарных условиях, и эти изменяющиеся условия влекут за собой изменения параметров распределения, которому подчинена выборка. Нестационарные условия не позволяют получать выборки достаточно большой длины, на которой можно гарантировать отсутствие изменений параметров. Эта ситуация часто имеет место в радиотехнике, когда инженер-исследователь работает с полезными сигналами на фоне помех в городских условиях. В теории выделения сигналов на фоне помех часто вводится предположение, что помехи имеют гауссовское распределение, параметры которого подвержены постоянным изменениям. Строго говоря, эти помехи далеко не всегда являются гауссовскими, и экспериментатору для математически строгой постановки эксперимента следует проводить предварительную проверку на "гауссовость" помех в данном конкретном случае и, тем самым, проверять справедливость выдвинутой математической модели в условиях проводимого эксперимента.

Сформулированная задача в такой общей постановке, когда практически нет никаких ограничений на тип распределения К'х; 0-^) кроме абсолютной непрерывности и на его параметры Q. ^-А,. > является весьма сложной. Поэтому по мере изложения мы будем налагать на p(icy в^ дополнительные ограничения. Все эти ограничения не будут выводить множество F за рамки нормальных функций распределения, которые будут нашим основным объектом рассмотрения. В последнем случае мы будем иметь дело с нормальным семейством распределений с параметрами сдвига и масштаба. - ^ с--W.

Таким образом, конечная задача состоит в том, чтобы по N выборкам объемом \п каждая (0,1) построить критерий согласия для проверки гипотезы Ц0 о том, что каждая о - я выборка (при любом i. ) представляет собой совокупность наблюдений случайной величины ^ ^ с функцией распределения РрСС'Ьс-р.^/^^) , для всех о , с различными и неизвестными (полностью или частично) математическими ожиданиями р^и дисперсиями ^. Мы рассматриваем три возможные ситуации: г

1) математические ожидания |ЧС неизвестны, дисперсии известны, ^-V.,, К/ ; v

2) математические ожидания у L известны, дисперсии неизвестны, ы ;

3) математические ожидания |ч t и дисперсии , неизвестны. Отметим, что для практических приложений особый интерес имеет именно 3-й случай.

Мы будем рассматривать критерии, основанные на эмпирическом процессе вида: Л где - эмпирическая функция распределения^ V7-некоторая оценка функции распределения, в качестве которой обычно берется ж.; 0 s) .В А качестве оценок О выбираем соответственно выборочные средние и дисперсии (когда эти параметры неизвестны). Отметим, что в этом случае ТЛ^СО имеет отличное от нуля математическое ожидание и некоторую функцию ковариаций . В традиционном случае одной выборки растущего объема К происходит предельный переход, при котором распределение этого процесса стремится к гауссовскому распределению (см.[1] ) и одновременно tllA^CC) VC^O^t4)-*^»;^4) - ковариационной функции предельного гауссовского процесса.

В работе рассматривается эмпирический процесс, построенный по совокупности заданных выборок, т.е. где - эмпирический процесс (0,2), построенный по L - й выборке 5

Для этого процесса предельный при N <=-о процесс является гауссовским J (t4) процессом за счет суммирования большого числа независимых случайных процессов "Ц^Д-Ь^ . Но при этом, при указанном выше выборе F (tx.4^ математическое ожидание процесса \А ^ (t4) не Л стремится к нулю. Поэтому, в качестве F мы выбираем несмещенную А оценку функции ГС'*;©4) . При таком выборе F (ос^ в силу общих свойств несмещенной оценки математическое ожидание процесса ^ (t^ тождественно равно нулю. Тогда lA^C*^ при Nи фиксированном к сходится к гауссовскому процессу с нулевым математическим ожиданием. При этом ковариационная функция предельного процесса остается равной К С-^/С) ,

ОТЛИЧНОЙ ОТ

Если к. фиксировано, то задача поиска распределения функционалов с ковариационной функцией ^.^-bt4) является сложной. Мы предполагаем, что kl является умеренно большим и это дает возможность считать, что наша ситуация близка к предельной, но не настолько, чтобы непосредственно использовать предельную функцию. Поэтому будем искать уточнения предельной аппроксимации для распределения статистик, построенных на таких функционалах, т.е. будем строить аппроксимацию для распределения, которая включала бы поправки к предельному при распределению.

В диссертационной работе вводятся и рассматриваются два критерия, точнее - модификации двух известных критериев - критерия Крамера-Мизеса-Смирнова со -г § "f 6t?> A-t и критерия Пирсона jC ? вводимые о специально для учета особенностей условий, при которых проводятся статистические испытания. Как известно, теория этих критериев разработана для широкого класса гипотез в последнем случае мы не будем требовать, чтобы число выборок к/ стремилось к бесконечности, т.е. число выборок может быть конечным и в том числе может быть равно единице.

В первой главе строится эмпирический процесс (t4) на основе выборки (0,1), распределение которого не зависит от неизвестных параметров распределений ? • - , Для этой цели сначала система выборок £ X —\ преобразуется в систему ^ ^ ^^ , распределение котрой не зависит от неизвестных параметров 6 ^ за счет потери свойства независимости случайных величин (с.в.) \ по второй координате (по строке). Затем строится процесс (А.^ для каждой строки по преобразованной выборке vuи затем уже суммарный процесс по всем выборкам.

Выводятся точные формулы для подсчета корелляционной функции процесса R Сь^О) через двумерные распределения Доказываются необходимые для дальнейшего анализа свойства функций \<(-ъ;С) для класса центрально-симметрических двумерных распределений. Во второй главе исследуются построенные в первой главе эмпирические процессы для нормально распределенных выборок при неизвестных параметрах распределений в трех указанных ранее случаях. Для анализа корреляционных функций процессов выводятся точные и асимптотические (при ул "^о ) формулы двумерных распределений которые необходимы будут и для построения и расчета критерия типа jC (в главе III). Выводятся соответствующие формулы для корреляционных функций - точные и асимптотические с учетом слагаемых разложения с точностью до О С • Влияние слагаемых разложения порядка иГ^ на изменение распределении критериев типа Со и <> составляет предмет дальнейшего исследования.

Далее находятся Эч - собственные значения линейного интегрального оператора с ядром корреляционного оператора) и определители ФредгольмаЗХз^ ядер КСъ^) с точностью до , т.е. с учетом слагаемых порядка 0(пAV) . Тем самым уточняется сходимость 2распределения типа и? при v\ с>о к некоторому невырожденному распределению, совпадающему с л ^ распределением случайных величин вида S и Of) Д-t

-о и ' где J СЧ^ - гауссовский процесс с корреляционной функцией КС^О) и - независимые нормально распределенные стандартные с.в.

В третьей главе для проверки нормальности системы тЧ \ • \ выборок применяется критерий типа хи-квадрат Пирсона. Этот метод, как известно, требует предварительной группировки данных. Для этой цели зададимся числом интервалов к и базовым вектором вероятностей р-С^,,. р,?0 1Н к , и разобьем действительную прямую на к. интервалов с граничными точками .0<ЪЛ<—+ .Точки находим последовательно из системы уравнений: где функция распределения стандартного нормального закона. Вектор частот . находим группировкой выборочных значений предварительно преобразованной выборки ^ по указанным интервалам. Тем самым частоты становятся случайными величинами, определяемыми числом значений первоначальной выборки, попавших в

-й интервал со случайными концами, которые зависят от оценок неизвестных параметров. Для суммарного вектора частот 3 , координатам которого соответствует сумма частот по столбцам строим статистику ^ - некоторую модификацию статистики хи-квадрат Пирсона. Доказывается, что статистика N при ^ - умеренно больших имеет распределение хи-квадрат с (к-V} степенями свободы. Как известно, скорость сходимости для обычной статистики хи-квадрат есть 0(ч/Л\ В нашем случае построенная статистика YhN имеет скорость сходимости ос^.

В работе выписывается конкретный вид измененной статистики для всех трех рассматриваемых случаев.

В заключение пользуюсь случаем выразить глубокую признательность своему научному руководителю Д.М.Чибисову за постановку задачи и большую помощь в работе.

Похожие диссертационные работы по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Список литературы диссертационного исследования кандидат физико-математических наук Миронова, Ирина Юрьевна, 2003 год

1. Уиттекер Э.Т., Ватсон Дж.Н. Курс современного анализа, т.1, ГИФМЛ., М, 1963.И. Чибисов Д.М. К исследованию асимптотической мощностикритериев согласия. Теория вероятн. и её примен., 1965, т. 10, К/зЗ, - с.460-478.

2. Darling D.A. The Cramer Smirnov test in the parametric case. -Ann. Math. Stat., 1955, v.26, - p. 1-20.

3. Stephens M. A. Asymptotic results for goodness of fit statistics with unknown parameters. Ann. Math. Stat., 1976, v.4,T/-2, p.357-369.

4. Sukhatme S. Fredholm determinant of a positive definite kernel of a special type and its application. Ann. Math. Stat., 1972, v.43,- p.1914-1926.

5. Anderson T.W., Darling D.A. Asymptotic theory of certain goodness--of- fit criteria based on stochastic, processes. Ann. Math. Stat., 1952, v.23, - p.193-212.

6. Kiefer J. К sample analogues of the Kolmogorov - Smirnov and Cramer - v.Mises tests. - Ann. Math.Stat., 1959, v.30, - p.420-447.

7. Kac M., Kiefer J., Wolfowitz J. On test of normality and other tests of goodness- of- fit based on distance methods. Ann. Math.Stat., 1955, - v.26, И 2,- p. 189-211.JL

8. Хмаладзе Э.В. Применение критериев типа со для проверки параметрических гипотез. Теория вероятн. и её примен., 1979, т.24, № 2, с.280-297.

9. Никулин М.С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба. Теория вероятн. и её примен., 1973, т.28, № 3, - с.583-592.

10. Roy A.R. On jC statistics wilht variable intervals. - Techn. Rep., Stanford Univ., Statist. Dept., 1956.

11. Джапаридзе К.О., Никулин М.С. Об одном видоизменении ф стандартной статистики Пирсона. Теория вероятн. и её примен.,1974, т. 19, /V4, с.886-888.

12. Чибисов Д.М. Некоторые критерии типа хи-квадрат для непрерывных распределений. Теория вероятн. и её примен., 1971, т. 16, № 1. - с.3-20.

13. Калинин В.М. Сходящиеся и асимптотические разложения для ф вероятностных распределений, 1967, т. 12, в. 1, с.24-38.

14. Медведева И.Ю. Проверка нормальности по большому числу выборок. В сб. Четвертая междун. Вильнюсская конф. по теор. вероятн. и мат. стат. Тезисы докладов, т.Н, Вильнюс: Ин-тматем. и киберн. АН Лит.ССР, 1985, с.160-161.

15. Миронова И.Ю. Критерий хи-квадрат для проверки нормальности многих выборок. "Вероятностные процессы и их приложения". Межвузовский сборник. М., 1985, с.55-62.

16. Миронова И.Ю. Уточнение критерия для проверки гипотезы о нормальном типе распределения. "Обозрение прикладной и промышленной математики", 2001, т.8, вып.2,-с.790-791.

17. Мартынов Г.В. Вычисление предельных распределений статистик критериев нормальности типа со . Теория вероятн. и её примен., 1973, T.XVIII, в.З, с.671-673.

18. Мартынов Г.В. Вычисление предельных распределений статистик критериев нормальности типа со" . Теория вероятн., и её примен., 1976, t.XXI, в. 1,- с.З-15.

19. Прохоров Ю.В. Сходимость случайных процессов и предельные теоремы вероятностей. Теория вероятн. и её примен., 1956, т.1, в.2., с.177-238.

20. Канделаки И.П., Сазонов В.В. К центральной предельной теореме для случайных элементов, принимающих значения из гильбертова пространства, Теория вероятн. и её примен., 1964, т.1Х, в.1, -с. 43-52.

21. Neuhaus, Asimptotic properties of the Cramer-von Mises statictic when parameters are estimated, Proc.Prague Symp.Asimpt.Stat., 1973, vol.2, Prague, Charles Univ., 1974,-p.257-297.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.