О применении критериев проверки однородности законов распределения | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 41. DOI: 10.17223/19988605/41/3

О применении критериев проверки однородности законов распределения

Проведен сравнительный анализ мощности критериев однородности законов распределения вероятностей (критериев Смирнова, Лемана-Розенблатта, Андерсона-Дарлинга). Построены модели предельных распределений статистик для ^-выборочного критерия Андерсона-Дарлинга. Даются рекомендации по применению критериев.

Application of criteria for testing homogeneity of distribution laws.pdf С необходимостью решения задач проверки гипотез о принадлежности двух (или более) выборок случайных величин одной и той же генеральной совокупности (проверки однородности) постоянно сталкиваются при анализе случайных ошибок средств измерений, при статистическом управлении качеством процессов. Такая задача естественно возникает при поверке средств измерений, когда пытаются убедиться в том, что закон распределения случайных ошибок измерений не претерпел существенных изменений по истечении некоторого интервала времени. При обработке результатов экспериментальных исследований такую задачу часто приходится решать технологам, медикам, биологам. Задача проверки однородности двух выборок формулируется следующим образом. Пусть имеются две упорядоченные по возрастанию выборки размером m и n: x1 < x2 < ... < Xm и У1 < У2 < ... < Уп . Для определенности обычно полагают, что m < п, но это совсем необязательно. Проверяется гипотеза о том, что две выборки извлечены из одной и той же генеральной совокупности, т.е. H0 : F(x) = G(x) при любом x. Как правило, на практике используется либо критерий Смирнова [1], либо критерий Лемана-Розенблатта [1-3]. В русскоязычной литературе практически не упоминается о применении критерия однородности Андерсона-Дарлинга [4] (Андерсона-Дарлинга-Петита) или, тем более, об использовании многовыборочного варианта этого критерия [5]. Настоящая статья является развитием работы [6], в которой были исследованы реальные свойства распределений статистик и мощности критериев Смирнова и Лемана-Розенблатта при ограниченных объемах выборок. В данном случае исследования дополнены анализом критериев Андерсона-Дарлинга и развитием его многовыборочного варианта. При проведении исследований использовалась методика компьютерного моделирования и исследования статистических закономерностей [7], хорошо зарекомендовавшая себя при сравнительном анализе критериев, ориентированных на проверку гипотез определённого вида [8-10]. 1. Критерий Смирнова Критерий однородности Смирнова предложен в работе [11]. Предполагается, что функции распределения F (x) и G( x) являются непрерывными. Статистика критерия Смирнова измеряет расстояние между эмпирическими функциями распределения, построенными по выборкам Dm,n = SUP |Gm (x) - Fn (x^ . x При практическом использовании критерия значение статистики Dm n рекомендуется вычислять в соответствии с соотношениями [1]: = max 1

Ключевые слова

критерии однородности, критерий Смирнова, критерий Лемана-Розенблатта, критерий Андерсона-Дарлинга, мощность критерия, homogeneity tests, Smirnov test, Lehmann-Rosenblatt test, Anderson-Darling test, power of test

Авторы

ФИООрганизацияДополнительноE-mail
Лемешко Борис ЮрьевичНовосибирский государственный технический университетпрофессор, доктор технических наук, главный научный сотрудник кафедры теоретической и прикладной информатики факультета прикладной математики и информатикиLemeshko@ami.nstu.ru
Лемешко Станислав БорисовичНовосибирский государственный технический университеткандидат технических наук, старший научный сотрудник кафедры теоретической и прикладной информатики факультета прикладной математики и информатикиskyer@mail.ru
Веретельникова Ирина ВикторовнаНовосибирский государственный технический университетаспирант кафедры теоретической и прикладной информатики факультета прикладной математики и информатикиira-veterok@mail.ru
Всего: 3

Ссылки

Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М. : Наука, 1983.
Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests // Ann. Math. Statist. 1951. V. 22, No. 1. P. 165-179.
Rosenblatt M. Limit theorems associated with variants of the von Mises statistic // Ann. Math. Statist. 1952. V. 23. P. 617-623.
Pettitt A.N. A two-sample Anderson-Darling rank statistic // Biometrika. 1976. V. 63, No. 1. P. 161-168.
Scholz F.W., Stephens M.A. K-Sample Anderson-Darling Tests // Journal of the American Statistical Association. 1987. V. 82, No. 399. P. 918-924.
Лемешко Б.Ю., Лемешко С.Б. О сходимости распределений статистик и мощности критериев однородности Смирнова и Лемана-Розенблатта // Измерительная техника. 2005. № 12. С. 9-14.
Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический анализ данных, моделирование и исследова ние вероятностных закономерностей. Компьютерный подход. Новосибирск : Изд-во НГТУ, 2011.
Лемешко Б.Ю. Непараметрические критерии согласия. Руководство по применению. М. : ИНФРА-М, 2014. DOI: 10.12737/11873.
Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона. Руководство по применению. М. : ИНФРА-М, 2015. DOI: 10.12737/6086.
Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона. Руководство по применению. М. : ИНФРА-М, 2015. DOI: 10.12737/11304.
Смирнов Н.В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках // Бюл. МГУ. Сер. А. 1939. Т. 2, № 2. С. 3-14.
Макаров А.А., Симонова Г.И. Исследование мощности двухвыборочного критерия Андерсена-Дарлинга в случае засорения одной из выборок // Статистические методы оценивания и проверки гипотез : межвуз. сб. науч. тр. № 20. Перм. ун-т. Пермь, 2007. C. 40-52.
Постовалов С. Н. Применение компьютерного моделирования для расширения прикладных возможностей классических методов проверки статистических гипотез : дис.. д-ра техн. наук. Новосибирск, 2013.
Kiefer J. K-Sample Analogues of the Kolmogorov-Smirnov and Cramer-v. Mises Tests // Annals of Mathematical Statistics. 1959. V. 30, No. 2. P. 420-447.
Лемешко Б.Ю. Критерии проверки гипотез об однородности. Руководство по применению. М. : ИНФРА-М, 2017.
Zhang J. Powerful goodness-of-fit and multi-sample tests : PhD Thesis. Toronto : York University, 2001. URL: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/NQ66371.pdf (дата обращения: 26.01.2016).
Zhang J. Powerful Two-Sample Tests Based on the Likelihood Ratio // Technometrics. 2006. V. 48, No. 1. P. 95-103.
 О применении критериев проверки однородности законов распределения | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 41. DOI: 10.17223/19988605/41/3

О применении критериев проверки однородности законов распределения | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 41. DOI: 10.17223/19988605/41/3