Исследование и разработка правил выбора методов анализа данных для интеллектуализированных систем прикладной статистики тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Лери, Марина Муксумовна

  • Лери, Марина Муксумовна
  • кандидат технических науккандидат технических наук
  • 2006, Петрозаводск
  • Специальность ВАК РФ05.13.18
  • Количество страниц 214
Лери, Марина Муксумовна. Исследование и разработка правил выбора методов анализа данных для интеллектуализированных систем прикладной статистики: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Петрозаводск. 2006. 214 с.

Оглавление диссертации кандидат технических наук Лери, Марина Муксумовна

Введение

1 Построение датчиков псевдослучайных чисел

1.1 Имитационное моделирование и датчики псевдослучайных чисел

1.2 Алгоритмы датчиков псевдослучайных чисел

1.3 Методика проведения экспериментов

1.4 Результаты и выводы

2 Исследование критериев согласия

2.1 Критерии согласия

2.2 Алгоритмы критериев согласия

2.3 Методика проведения экспериментов

2.4 Результаты и выводы

3 Исследование методов регрессионного анализа

3.1 Методы поиска наиболее информативного множества при знаков.

3.2 Задача А. Н. Колмогорова

3.3 Методика исследований.

3.4 Результаты исследований и выводы.

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование и разработка правил выбора методов анализа данных для интеллектуализированных систем прикладной статистики»

Использование методов прикладной статистики за последние десятилетия вышло на новый уровень и приобрело массовый характер. Быстрое развитие вычислительной техники, в частности, появление персональных компьютеров, способствовало внедрению этих методов во все сферы человеческой деятельности [2,12,32,41,43]. В связи с этим, все более широкое распространение получают программные средства, предназначенные для статистического анализа данных. Однако, проблема некорректного использования статистического программного обеспечения остается острой до сих пор [5,23,41,43,54], поскольку уровень статистического образования в нашей стране остается недостаточным [43], а наиболее известные зарубежные продукты ориентированы на подготовленного пользователя. Даже такие известные программные средства как Systat, Statgraphics и Statistica почти не содержат функций помощи пользователю при выборе метода анализа данных и обучения работе с существующими методами [6,23,51]. Положение часто усугубляется еще и недостаточным знанием английского языка многими отечественными пользователями, а также распространением неквалифицированных (с точки зрения математической статистики) переводов документации зарубежных пакетов. В связи со всем вышесказанным одним из направлений разработки отечественного статистического программного обеспечения остается работа над его интеллектуализацией [1,6,43], т.е. над созданием программных средств статистического анализа данных, предназначенных не только для решения задач методами прикладной статистики, но и содержащих развитые информационно-справочные и экспертные системы. Такие системы должны включать в себя сведения обо всех используемых в пакете понятиях и методах математической статистики и помогать пользователю при выборе метода решения задачи, режима работы соответствующей программы и при интерпретации полученных результатов. Понятно, что рекомендации, предлагаемые системой, должны быть обоснованы, однако современная математическая теория на многие возникающие здесь конкретные вопросы ответа не дает, поэтому для разработки экспертных правил необходимо проводить соответствующие исследования.

Автор диссертации является одним из разработчиков системы "Статистик-Консультант" [36,39,45,60]. Согласно классификации, использованной в [6], данный пакет прикладных программ относится к специализированным методо-ориентированным пакетам. Пакет написан с помощью языка программирования Си. Заметим, что "Статистик-Консультант" был исторически первым отечественным пакетом статистического анализа данных, созданным в среде Windows, и получил высокую оценку специалистов [6,43]. Создание этого пакета стало возможным благодаря финансовой и организационной поддержке известной петрозаводской фирмы "Тандем".

В пакете статистических программ "Статистик-Консультант" реализованы три основные группы методов статистической обработки данных:

• методы сжатия информации,

• методы классификации,

• методы исследования зависимостей.

Методы сжатия информации (или методы описательной статистики) в пакете "Статистик-Консультант" включают в себя:

- вычисление оценок (несмещенных и смещенных) основных характеристик случайных величин;

- оценку функции распределения случайной величины и ее параметров по имеющейся выборке;

- генерацию выборки по заданному закону распределения;

- вычисление значений функции распределения и обратной к ней.

Автором диссертации были разработаны алгоритмы и написана часть программ вычисления значений прямых и обратных функций распределения для 15-ти наиболее употребительных законов. Также, были написаны программы генерации псевдослучайных чисел, соответствующих 15-ти законам распределения и программы трех критериев согласия [24,25,39].

Из методов классификации в системе "Статистик-Консультант" реализованы основные виды факторного анализа.

Методы исследования зависимостей в системе "Статистик-Консультант" включают в себя:

- корреляционный анализ: оценки коэффициентов ковариации и корреляции; проверку гипотезы о равенстве нулю коэффициента корреляции случайных величин; для случая временных рядов - оценки значений автокорреляционной и взаимно-корреляционной функций и проверку гипотез о равенстве нулю коэффициентов автокорреляции или взаимной корреляции;

- регрессионный анализ: регрессию парную, полиномиальную, множественную, пошаговую, интерактивную, два типа метода ветвей и границ, двухступенчатую регрессию и нелинейную регрессию.

При реализации методов регрессионного анализа были использованы оригинальные результаты, полученные сотрудниками Карельского научного центра РАН [9-11,34,35,37].

Данные в системе "Статистик-Консультант" представляются, как и в большинстве статистических пакетов, в виде таблиц, причем возможен их обмен со стандартными системами обработки данных (Excel, dBase и др.), а также редактор таблиц предоставляет богатые средства аналитических преобразований столбцов переменных. Возможности наглядного представления данных включают в себя построение гистограмм, позволяющих наглядно представить особенности выборки и получить приближенное изображение функции распределения и ее плотности; двумерный графический анализ данных, позволяющий осуществлять построение корреляционного поля, а также накладывать на него графики уравнений регрессии и произвольно указываемой аналитической функции; трехмерный графический анализ данных, позволяющий осуществлять трехмерную аппроксимацию исходных экспериментальных данных.

Система "Статистик-Консультант" рассчитана на пользователей, не имеющих специальной статистической подготовки, и может найти применение в любой области деятельности, требующей статистической обработки данных (наука, образование, экономика, медицина, социология, сельское хозяйство, промышленное производство и т.д.). В состав системы "Статистик-Консультант" входят справочная и экспертная подсистемы. Информационно-справочная подсистема содержит сведения о реализованных методах прикладной статистики и о необходимых для их использования понятиях. Экспертная подсистема (во взаимодействии со справочной) способна в какой-то степени заменить квалифицированного специалиста и может помочь выбрать подходящий метод решения конкретной задачи, задать наилучшие для текущих исходных данных значения параметров, адекватно интерпретировать полученные результаты и осуществить проверку статистических гипотез. Ясно, что для того, чтобы экспертная система могла давать статистически корректные рекомендации, использования субъективного опыта и мнения экспертов недостаточно. Таким образом, в ходе создания экспертной системы пакета "Статистик-Консультант" возникли вполне определенные вопросы, связанные с выбором метода анализа данных среди нескольких альтернатив. Более глобально эту проблему можно обозначить как необходимость формирования подхода к созданию отечественных программных средств прикладной статистики, основанного на предварительных (предпроект-ных) исследованиях, направленных на снижение числа ошибок при работе недостаточно подготовленного пользователя.

Исследование методов анализа данных и сравнение получаемых с их помощью результатов аналитическим путем представляется весьма затруднительным, особенно вследствие того, что необходимо учитывать различные условия возникновения данных. По инициативе авторов пакета "Статистик-Консультант" на страницах журнала "Заводская лаборатория" была развернута дискуссия о выборе путей решения этой проблемы [29,37]. Опираясь на рекомендации А. И. Орлова [29] (см., также, [31]), основным методом исследования в диссертации был выбран метод статистических испытаний, также известный, как метод Монте-Карло. Необходимо отметить, что на современном этапе развития вычислительной техники и ее возможностей метод статистических испытаний, приобретает все большую популярность в качестве методики сравнения методов анализа данных (см., например, [47]).

Таким образом, целью диссертации является построение математических моделей и разработка рекомендаций, используемых при выборе методов анализа данных в интеллектуализированном программном обеспечении прикладной статистики.

Диссертация состоит из введения, трех глав, заключения, списка литературы и 5 приложений.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Лери, Марина Муксумовна

Заключение

Основные итоги диссертации состоят в следующем: Предложен общий подход к созданию интеллектуализированного статистического программного обеспечения. Этот подход заключается в проведении исследований, направленных на обеспечение достоверных выводов при использовании конкретных программ анализа данных. Поскольку во многих случаях математическая теория не дает исчерпывающих ответов на возникающие здесь вопросы, предложено проводить такие исследования экспериментально с использованием метода Монте-Карло. Полученные результаты позволяют формировать рекомендации пользователям при выборе метода статистического анализа. Такие рекомендации предназначены как для непосредственного применения, так и для включения их в базы знаний статистических экспертных систем.

Результаты, полученные в ходе этой работы включают в себя следующее:

1. Разработана система генераторов псевдослучайных чисел.

2. Разработаны и включены в статистический пакет "Статистик-Консультант" программы вычисления значений прямой и обратной функций наиболее употребительных законов распределения и программы проверки гипотез о соответствии выборки этим законам по трем критериям согласия.

3. Разработаны рекомендации пользователям по выбору критериев согласия при использовании статистического программного обеспечения и по определению некоторых условий проведения экспериментов при их планировании на основе построенных моделей зависимости мощностей рассмотренных критериев от уровня значимости, объема

4. Выявлены отличия методов поиска наиболее информативного множества признаков в линейном регрессионном анализе друг от друга по вероятности возникновения эффекта "вздувания" коэффициента детерминации в зависимости от числа регрессоров, включаемых в начальный набор и выбранных параметров методов, а также условия, при которых рекомендации по выбору методов ПНИМП не зависят от законов распределения регрессоров.

5. Построены модели взаимной зависимости числа регрессоров, включаемых в начальный набор регрессоров, параметров методов и числа случаев ошибочной работы методов.

6. Сформулированы рекомендации по выбору методов ПНИМП и их параметров, направленные на снижение вероятности возникновения эффекта "вздувания" коэффициента детерминации.

По мнению автора, предложенный подход может быть рекомендован к использованию создателями интеллектуализированного статистического программного обеспечения. Полученные в диссертации результаты охватывают только некоторые проблемы интеллектуализации, поэтому при развитии соответствующего программного обеспечения исследования необходимо продолжать. Заметим также, что предложенный подход является весьма трудоемким и представляется целесообразным разработать систему автоматизации проведения вычислительных экспериментов.

Список литературы диссертационного исследования кандидат технических наук Лери, Марина Муксумовна, 2006 год

1. Айвазян С. А. Интеллектуализированные инструментальные системы в статистике и их роль в построении проблемно-ориентированных систем поддержки принятия решений // Обозрение прикладной и промышленной математики, т. 4, № 2, 1997.

2. Айвазян С. А. Программное обеспечение персональных ЭВМ по статистическому анализу данных // Компьютер и экономика: экономические проблемы компьютеризации общества. — М.: Наука, 1991. — С. 91-107.

3. Айвазян С. А., Енюков И. С., Мешалкин JI. Д. Прикладная статистика. Т. 1: Основы моделирования и первичная обработка данных.

4. М.: Финансы и статистика, 1983. — 471 с.

5. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Т. 2: Исследование зависимостей. — М.: Финансы и статистика, 1985. 487 с.

6. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Т. 3: Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с.

7. Айвазян С. А., Степанов В. С. Инструменты статистического анализа данных. // Мир ПК, № 8, 1997. С. 32-41.

8. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. - 488 с.

9. Болыиев Л. Н., Смирнов Н. В. Таблицы математической статистики.- М.: Наука, 1965. 416 с.

10. Бондаренко В. М., Павлов Ю. J1. Система поиска регрессионных закономерностей "СПОР". — Петрозаводск: Карельский филиал АН СССР, 1991. 41 с.

11. Векслер J1. С. Статистический анализ на персональном компьютере // Мир ПК, № 2, 1992. С. 89-97.

12. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. — М.: Мир, 1980. — 610 с.

13. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Кн. 2. — М., 1987. 352 с.

14. Ермаков С. М. Метод Монте-Карло и смежные вопросы. — М.: Наука, 1975. 471 с.

15. Кельтон В., Лоу А. Имитационное моделирование. Классика CS. 3-е изд. — СПб.: Питер; Киев: Издат. группа BHV, 2004. — 847 с.

16. Кнут Д. Искусство программирования для ЭВМ. Т. 2: Получисленные алгоритмы. — М.: Мир, 1977. — 724 с.

17. Кнут Д. Искусство программирования для ЭВМ. Т. 3: Сортировка и поиск. М.: Мир, 1978. - 844 с.

18. Колчин В. Ф., Севастьянов Б. А., Чистяков В.П. Случайные размещения. М., 1976. - 224 с.

19. Королюк В. С., Портенко Н. И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. — М.: Наука, 1985. 640 с.

20. Кудлаев Э. М., Орлов А. И. Вероятностно-статистические методы исследования в работах А. Н. Колмогорова. // Заводская лаборатория, т. 69, № 5, 2003. С. 55-61.

21. Кулаичев А. П. Пакеты для анализа данных. // Мир ПК, № 1, 1995. С. 127-132.

22. Лери М. М. Эмпирическая оценка мощности критериев согласия для базы знаний экспертной системы // Труды Петр. ГУ, сер. "Прикладная математика и информатика", вып. 6, 1997. — С. 187-192.

23. Лери М. М., Павлов Ю. Л. Разработка экспертных правил выбора критерия согласия // Тез. докл. VI науч. конф. стран СНГ "Применение многомерного статистического анализа в экономике и оценке качества продукции", Москва, 1997. — С. 130-131.

24. Лери М. М. О выборе "наилучшей" регрессии // Труды Института ПМИ. Вып. 1. — Петрозаводск: Карельский научный центр РАН, 1999. С. 21-28.

25. Лери М. М. Об одной задаче А. Н. Колмогорова // Обозрение прикладной и промышленной математики, т. 7, вып. 1, 2000. — С. 190192.

26. Лери М. М. Об использовании методов регрессионного анализа // Тез. докл. Всероссийской научной школы "Математические методы в экологии", Петрозаводск, 2001. — С. 314-316.

27. Орлов А. И. Некоторые нерешенные вопросы в области математических методов исследования // Заводская лаборатория, т. 68, К2 3, 2002. С.52-56.

28. Орлов А. И. О развитии методологии статистических методов // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. — Пермь: Изд-во Пермского государственного университета, 2001. — С. 118-131.

29. Орлов А. И. Современная прикладная статистика // Заводская лаборатория, т. 64, № 3, 1998. С. 52-60.

30. Павлов Ю. JI. Прикладной статистике в Карельском НЦ РАН 25 лет // Тез. докл. юбилейной научной конф., Петрозаводск: Карельский научный центр РАН, 1996. - С. 253-254.

31. Павлов Ю. Л., Спектор Е. Н. Сравнение двух критериев отсечения в регрессионном методе ветвей и границ // Сборник трудов. Вып. 1. — Петрозаводск: Карельский научный центр РАН, 1994. — С. 25-30.

32. Павлов Ю. Л., Сысоева М. И. Алгоритм и программа критерия пустых ящиков // АСНИ регионального научного центра. — Петрозаводск: КФ АН СССР, 1984. С. 42-49.

33. Павлов Ю. JI., Хенинен А. Я. "Статистик-Консультант", или еще один довод в пользу неизбежного. // Мир ПК, № 5, 1994. — С. 92-94.

34. Павлов Ю. Л., Хенинен А. Я. Проблема усиления гипотез регрессионного анализа // Заводская лаборатория, т. 61, № 1, 1995. — С. 5355.

35. Петрович М. Л. Регрессионный анализ и его математическое обеспечение на ЕС ЭВМ. М., 1982. - 199 с.

36. Свидетельство об официальной регистрации программы для ЭВМ № 950298. М.: РосАПО, 1995.

37. Сильвестров Д. С. Программное обеспечение прикладной статистики. — М.: Финансы и статистика, 1988. — 240 с.

38. Тарасенко Ф. П. Непараметрическая статистика. — Томск, ТГУ, 1976. 292 с.

39. Тюрин Ю. Н., Макаров А. А. Статистический анализ данных на компьютере. / Под ред. В. Э. Фигурнова. — М.: ИНФРА-М, 1998. — 528 с.

40. Харин Ю. С., Малюгин В. И., Кирлица В. П., Лобач В. И., Хацке-вич Г. А. Основы имитационного и статистического моделирования. Минск: Дизайн ПРО, 1997. - 288 с.

41. Хенинен А. Я., Павлов Ю. Л. Статистик-Консультант. Версия 1.0. Руководство пользователя. — Петрозаводск, Тандем, 1993. — 140 с.

42. Шеннон Р. Имитационное моделирование систем искусство и наука. - М.: Мир, 1978.- 418 с.

43. Chistjakov S. P. On joint using of statistical tests // Proceedings of the Fifth International Petrozavodsk conference "Probability methods in discrete mathematics". VSP, Utrecht, 2001. - P. 159-162.

44. Csorgo M., Guttman I. On the empty cell test // Technometrics, v. 4, № 2, 1962. P. 235-247.

45. David F. N. Two combinatorical tests whether a sample has come from a given population // Biometrica, v. 37, 1950. — P. 97-110.

46. Gale W. A., Hand D. J., and Kelly A. E. Statistical applications of artificial intelligence, in Handbook of Statistics, v. 9(16), ed. C.R. Rao. Elsevier, 1993. P. 535-576.

47. Furnival G. M., Wilson R. W. M. Jr. Regressions by leaps and bounds // Technometrics, v. 16, 1974. P. 499-511.

48. Hahn G. J. More Intelligent Statistical Software and Statistical Expert Systems: Future Directions // The American Statistician, v. 39, № 1, 1985. P. 1-16.

49. Kitabatake S. A remark on a non-parametric test // Math.lap., v. 5, № 1, 1958. P. 45-49.

50. Lehmer D. H. Mathematical methods in large-scale computing units // Proc. 2nd Symposium on Large-Scale Digital Calculating Machines, Harvard University Press, 1951. — P. 141-146.

51. Leri M. M. On one problem of A. N. Kolmogorov // Proceedings of the Fifth International Petrozavodsk conference "Probabilistic methods in discrete mathematics". VSP, Utrecht, 2001. - P. 219-225.

52. Leri M. M. On some approaches to the development of intellectualized statistical software // Extended abstracts of Russian-Scandinavian Symposium "Probability Theory and Applied Probability". — Petrozavodsk: KarRC RAS, 2006. P. 35-37.

53. Leri M. M., Pavlov Y. L. On methods of searching for regression patterns // Proceedings of the Sixth International Conference "Computer Data Analysis and Modeling: Robustness and Computer Intensive Methods", v. 2, Minsk, 2001. P. 49-54.

54. Pavlov Y. L., Leri M. M., Spector E. N., Stafeev S. V., Heninen A. J. Some problems of intellectualization of statistical packages // Proceedings of the International Conference "Computer data analysis and modeling", v. 1, Minsk, 1995. P. 116-120.

55. Okamoto M. On a non-parametric test // Osaka I.Math., v. 4, 1952. — P. 47-85.

56. Используемые обозначения: д мощность критерия согласия; п - число элементов выборки; а - уровень значимости; обозначения параметров распределения F\ приведены в скобках, следом за названием закона.1. Fq равномерное

57. Fq равномерное; F\ - нормальное (т,а)11.1. Критерий х~квадрат (550 < п < 1000; -1000 < т ^ 1000; 1 < а < 500; 0.01 ^ а < 0.1):

58. Н = -0.7 0.0022п + 2.5а + 1.2 • 10"V - О.ООЗпа + 0.39Inn1. R2 = 0.9511.2. Критерий Колмогорова-Смирнова (22 ^ п ^ 1000; -1000 < т < 1000; 1 < а < 500; 0.01 ^ а < 0.1):

59. Н = -0.77 0.00831п + 4.2 ■ 10~6т + 2а + 3 • 10~6п2- 0.0023па + 0.2^п1. R2 = 0.9611.3. Критерий пустых ящиков (20 ^ n ^ 1000; -1000 < т ^ 1000; 1 500; 0.01 < 0.1):р, = -1 -0.000378п + 2.114а -0.002па + 0.333Inn1. R2 = 0.92

60. Fo нормальное; jF\ - равномерное (a, 6)21.1. Критерий х-квадрат (12 ^ n ^ 1000; -1000 1000; 0.01 ^ a ^ 0.1):

61. Fq логнормальное; F\ - нормальное (m, <r)32.1. Критерий х-квадрат (10 ^ n ^ 1000; 300 ^ m ^ 1000; 1 ^ a ^ 100; 0.01 < a ^ 0.1):fi = 0.16 + 0.0005n + 0.97a 3.4 • 10"7n2 + 6.9 • ЮЛт2- 3.5 • 106mo- + 0.0087(ia 0.047Inn + 0.001a-Inn

62. И = -0.1 + 0.0004т 2.7 • 10~7т2 - 2.89 • 10~6тсг+

63. О.ОИсго; + 2 • 10"бП(7 + 0.000432(7Inn1. R2 = 0.62

64. Критерий пустых ящиков (10 < п ^ 1000; 300 ^ т ^ 950; 1 < 100; 0.01 ^ а ^ 0.1):1 = -0.1 О.ОООЗп + а + 2 • 10~7п2 - 7.7 • 10~7Ш(7+0.0405 Inn + 0.0002cr Inn1. R2 = 0.61

65. Fq логнормальное; F\ - %-квадрат (/)

66. Критерий х-квадрат (10 ^ n ^ 1000; 1 < / < 33; 0.01 < а < 0.1):

67. Н = 0.2 + 0.001766п 0.01/ + 2а - 1 • 10"6п2+0.000123/2 0.002па - 0.000367/Vn1. R2 = 0.86

68. Критерий Колмогорова-Смирнова (30 < n ^ 1000; 2 < / < 5; 0.01 < а ^ 0.1):

69. Н = -0.4656 + 0.00197п + 0.2/ + 1.52а 1.4 • 10бп2+0.000175п/ + 0.1 Inn 0.056/Innй2 = 0.94

70. Критерий пустых ящиков (19 < п ^ 1000; 1 < / < 100; 0.01 < а < 0.1):

71. Н = -0.2 0.0002п + 0.001/ + 2а + 3 ■ 107п2 - 0.000017п/-- 0.01 fa + 0.06 Inn - 0.0005n In / + 0.0004пу/71. R2 = 0.87

72. Fq логнормальное; F\ - Стьюдента (/)

73. Все критерии (10 < n < 1000; 1 < / ^ 1000; 0.01 ^ a < 0.1): проверка невозможна, т.к. все элементы выборки должны быть > 0.

74. О.ООООЗ2/2 1.6 • 10~6n/i - 6.3 • 10~6n/2 - О.ООООЗ6/1/21. R2 = 0.5335.3. Критерий пустых ящиков (100 < п < 1000; 2 < Д < 100; 2 < Д < 100; 0.01 < а <0.1):1 = -0.19 а + 0.00003/1 + 3.1 • ЮЛгД + 0.00001п/2- O.OOOOI/1/2 + 0.11 Inn 0.00054/2^п1. Я2 = 0.72

75. Fq х-квадрат; Fi - логнормальное (m, a)

76. Критерий х-квадрат (74 ^ n < 1000; -4 < m ^ 4; 1 ^ a ^ 5; 0.01 < a < 0.1):fi = -0.3 + O.OOlln 0.01m + 0.177(7 + 0.5a + 0.019m2+0.396Inn 0.04(7Inn - 0.00315m2Inn - 0.08Vn1. R2 = 0.58

77. Критерий Колмогорова-Смирнова (10 ^ n ^ 1000; -4 ^ m ^ 4; 1 ^ a < 5; 0.01 ^ a ^ 0.1):

78. H = -0.5 + 0.0012П + 0.2(7 + 0.02m2 3 • 10~5nm+0.4Inn 0.04(7Inn - 0.003m2Inn - 0.085Vn2 = 0.53

79. Критерий пустых ящиков (41 ^ n ^ 1000; -7 ^ m ^ 7; 1 ^ a ^ 5; 0.01 ^ a ^ 0.1):

80. H = -0.7 + 0.047m 0.002m2 - 0.043(72 - 2 ■ 10~5nm+0.00087по-- O.Olmo-+ 0.198Inn + 0.2(7Inn 0.065crv/n1. R2 = 0.8

81. Fo х-квадрат; F\ - Стьюдента (/)се критерии (10 n ^ 1000; 1 ^ / ^ 1000; 0.01 ^ a < 0.1): проверка невозможна, т.к. все элементы выборки должны быть ^ 0.

82. F0 х-квадрат; Fi - Фишера (/ь/2)

83. Fq Стьюдента; - Фишера (Д, /2)

84. Критерий х-квадрат (20 < п < 1000; 2 < Д < 200; 2 < /2 < 200; 0.01 < а < 0.1):ju = 1 + O.OOl/i 4а - 2 • 10-6/i2 + 6.7 • l(T7n/i+0.004/ia 0.000233/i Inn + 0.968аInn - 0.112а^1. R2 = 0.36

85. Критерий Колмогорова-Смирнова (80 < n < 1000; 2 < Д < 200; 2 < /2 < 200; 0.01 < а < 0.1):л = 1 + 0.00077/i 2.3а - 1.3 ■ Ю-6/? + 4 • 10~7n/i+0.00266/ia 0.00015/i Ьп + 0.6аInn - O.lav^1. Я2 = 0.35

86. Критерий пустых ящиков (10 < п < 1000; 2 < Д < 200; 2 < Д < 200; 0.01 < а < 0.1):1. М = 1

87. Fo Стьюдента; i*i - бета (р, q)

88. Критерий х-квадрат (10 < п < 1000; 0.1 < р < 5; 0.1 < q < 5; 0.01 < а < 0.1):i = 1 + О.ООООЗЗп + 0.0064р + 0.0061g + 0.1478а- 0.0032рд 0.0175Inn - 20.88—п1. R2 = 0.28

89. Критерий Колмогорова-Смирнова (50 < п < 1000; 0.1 < р < 5; 0.1 5; 0.01 < а <0.1):м = 1

90. Критерий пустых ящиков (10 < п < 1000; 0.1 < р < 5; 0.1 < q < 5; 0.01 < а < 0.1):

91. F0 Фишера; F\ - равномерное (а, Ъ)

92. Все критерии (10 ^ n ^ 1000; -1000 1000;001 0.1): /х = 1

93. Fq Фишера; F\ - нормальное (га, а)

94. Все критерии (10 ^ п < 1000; 0 < т < 1000; 1 ^ о < 500; 0.01 ^ а < 0.1): ц = 1

95. Fq Фишера; F\ - логнормальное (га, а)

96. Все критерии (10 ^ п ^ 1000; -7 ^ т ^ 7; 1 ^ а < 5; 0.01 ^ а ^ 0.1): 11 = 1

97. F0 Фишера; F\ - х-квадрат (/)

98. Все критерии (10 ^ п ^ 1000; 1 < / < 1000; 0.01 ^ а < 0.1): ц = 1

99. F0 Фишера; F\ - Стьюдента (/)

100. Все критерии п = 10; / = 1,5; 0.01 ^ а ^ 0.1):7. Fq бета

101. Fq бета; F\ - нормальное (m, а)

102. Все критерии (10 < n < 1000; -1000 ^ m sC 1000; 1 ^ a ^ 1000; 0.01 ^ a ^ 0.1):проверка невозможна, т.к. все элементы выборки должны е 0,1.

103. Fo бета; F\ - %-квадрат (/)1. Все критерии:при п = 10; / = 1; 0.01 < а < 0.1: ц = 1 ф при 10 < п < 1000; 1 < / ^ 1000; 0.01 ^ а ^ 0.1: проверка невозможна,т.к. все элементы выборки должны е 0,1.

104. Fo бета; F\ - Стьюдента (/)

105. Все критерии (10 ^ п ^ 1000; 1 ^ / ^ 1000; 0.01 ^ а «$ 0.1): проверка невозможна, т.к. все элементы выборки должны G 0,1.

106. F0 бета; Fx - Фишера (/ь /2)1. Бее критерии:при п = 10; Д = 2; Д = 2,200; 0.01 < а < 0.1: д = 1 при 10 < п ^ 1000; 2 < Д < 200; 2 < Д < 200; 0.01 ^ а ^ 0.1: проверка невозможна, т.к. все элементы выборки должны £ 0,1.

107. Fq гамма; F\ - нормальное (m, сг)5ce критерии (10 ^ n ^ 1000; 1 < a < 500; 0.01 < a < 0.1): при -1000 < m < 0:проверка невозможна, т.к. все элементы выборки должны быть ^ 0; при 0 < т < 1000: /х = 1

108. Fq гамма; F\ - Стьюдента (/)

109. Все критерии (10 ^ n ^ 1000; 1000; 0.01 ^ а ^ 0.1):проверка невозможна, т.к. все элементы выборки должны быть ^ 0.

110. Fq гамма; F\ - Фишера (Д, /2)86.1. Критерий х-квадрат (100 < п < 500; 35 < Д < 100; 19 < Д < 83; 0.01 ^ а < 0.0787):ji = 0.7 0.0049п 0.013/2 - 1.6а - 8.5 • 10Лг2+0.00014/| + 2.8 ■ 10~6n/i + 0.0000126п/2 0.00256/2 Inп1. R2 = 0.94

111. И = -0.57 О.ОООЗп - 0.0034/ + 0.64а+31 • Ю-6/2 + 0.18Inn + 0.2In/ 0.00013/lnn1. R2 = 0.71

112. Fo экспоненциальное; Fi - Фишера (/i, /2)96.1. Критерий х~квадрат (10 ^ n ^ 1000; 2 < Д < 100; 23 < Д < 100; 0.01 < а < 0.099):ц = -0.22 О.ОООбп + O.Ol/i - 0.91а- 0.000124Д2 + 0.000032/1 + 6.4 ■ 10~6п/2+

113. O.OOOI/1/2 + 0.24Inп 0.0025/2Inn1. R2 = 0.8396.2. Критерий Колмогорова-Смирнова (10 ^ п ^ 1000; 5 < Д < 100; 26 ^ Д ^ 100; 0.01 < а ^ 0.099):= -0.8 0.0018n + O.Ol/i + 7.4 ■ 10~7п2- 0.00012/2 + 0.000044/2 + 7 ■ Ю~6п/2+

114. O.OOOI/1/2 + 0.4Inn 0.0028/2Inn1. Я2 = 0.8296.3. Критерий пустых ящиков (10 ^ п ^ 1000; 25 ^ Д < 97; 10 ^ Д ^ 89; 0.01 ^ а ^ 0.1):ц = -0.9 0.002п + 0.0098/1 + 8.7 ■ 10~V- O.OOOll/i2 + 0.00003/1 + 0.000096/1/2+

115. Inn + 0.00048/ilnn 0.002/2lnn

116. Fo Колмогорова; Fi - нормальное (т, сг)5се критерии (10 < п < 1000; 300 < т ^ 1000; 1 < <г < 500; 0.01 < a < 0.1): /х = 1

117. Inn + 0.0073m Inn + 0.007a2 Inn1. R2 = 0.76103.3. Критерий пустых ящиков (45 ^ п ^ 1000; 4.3; 0.01 ^ а < 0.1):

118. Н = -0.412 0.002п - 0.017т + 1.6 • ЮЛг2 - 0.005т2- 0.0243сг2 0.00031шт + 0.167Inn + 0.067<jlnn1. R2 = 0.56

119. Fq Колмогорова; F\ - %-квадрат (/)104.1. Критерий х~квадрат (10 ^ п < 1000; 1 ^ / ^ 5; 0.01 ^ а ^ 0.1):= 0.811 0.3/ - 0.0295/2 + О.ОООбп/ + 0.19/Inn - 0.05/v^1. R2 = 0.86104.2. Критерий Колмогорова-Смирнова (34 ^ п ^ 1000; 1 ^ / ^ 10;001 ^ а «С 0.1):

120. Fo Колмогорова; F\ - Стьюдента (/)

121. See критерии (10 ^ п ^ 1000; 1 < / ^ 1000; 0.01 < а «С 0.1): проверка невозможна, т.к. все элементы выборки должны быть ^ 0.106.1. Критерий х-квадрат (13 < п < 1000; 2 < /2 < 200; 2 < /2 < 200; 0.01 < а < 0.1):

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.