Исследование распределений статистик критерия обнаружения сдвига средних Кохрана
Исследованы распределения статистик критерия Кохрана при различных вероятностных законах. Показана устойчивость распределений статистик к нарушению предположений нормальности. Оценена мощность критерия относительно различных альтернатив.
The investigation of statistic distributions of the Cochran test for the means shift detection.pdf Одна из часто встречающихся проблем при анализе временных рядов в большом числе прикладных задач (в частности в рамках проблемы автоматизации технологического процесса предприятия) заключается в формулировке критерия, позволяющего адекватно отслеживать динамику среднего показателя данных. При этом речь идет как о выявлении трендов, так и об обнаружении скачков среднего в потоке непрерывно поступающих данных. На сегодняшний день известны критерии, предназначенные либо для проверки гипотез об отсутствии какого-либо тренда [1-3], либо для проверки равенства средних значений двух выборок [1, 4-5]. В данной статье приведены результаты исследования возможности применения критерия Кохрана в качестве универсального в ситуациях, когда возникает необходимость в проверке гипотез такого вида. В ходе решения основной задачи проводилось также исследование устойчивости критерия к нарушению предположения нормальности и определялся характер влияния ограниченности объема выборки на свойства критерия в ситуации и справедливой нулевой гипотезы и справедливой альтернативы. Сравнение мощности проводилось как с критерием проверки отсутствия тренда (критерий Аббе), так и с критерием проверки однородности средних (с F-критерием сравнения выборок по средним). В качестве аппарата исследования была выбрана методика компьютерного моделирования, детали которой описаны в [1. С. 487-595]. 1. Вид исследуемого критерия Подход, примененный Кохраном при разработке критерия, предложенного в статье [6], был использован автором данной работы при формулировании модифицированного критерия, который далее в работе обозначается как модифицированный или просто критерий Кохрана для обнаружения сдвига в средних. Рассматриваемый критерий предназначен для проверки гипотез вида H0 : E[х1 ] = E[x2] =... = E[xn], т.е. для проверки того, что все наблюдаемые, записанные в порядке их появления величины x1, x2,..., xn в выборке объема n имеют одинаковые математические ожидания. Конкурирующая гипотеза (альтернатива) заключается в изменении среднего статистического ряда скачком после первых щ наблюдений (щ + n2 = n). Подразумевается, что при использовании критерия проводится серия проверок нулевой гипотезы с разбиением исходной выборки на две с разным количеством наблюдений в каждой. Статистики критерия Кохрана (получаемые при различных подразбиениях) имеют вид K = «« _ (XL - XR )2 In' ^ * n 1 W \2 -7Z(xi - x) « - 1 i=1 _ 1 «1 _ 1 « _ 1 n xL = X Xi , XR = X Xi , X = X Xi • «1 i=1 «2 ,=n1 +1 « i=1 Распределение данной статистики аппроксимируется распределением Хи-квадрат с одной степенью свободы. То есть если K > %2а(1), то изменение среднего скачком после первых щ наблюдений признается значимым с достоверностью а, где %2а(1) - а -квантиль распределения %2(1) с f = 1 степенью свободы при выполнении предположения нормальности случайных величин X1, X2,...,Xn . 2. Результаты исследования критерия Кохрана при справедливости нулевой гипотезы Во всех приведенных ниже результатах численных экспериментов количество моделируемых значений статистик составляло N = 20 000 в выборке. О согласии эмпирической функции распределения с теоретическим распределением %2 при выполнении предположений нормальности можно судить по данным, представленным в табл. 1. В ней приведен усредненный достигнутый уровень значимости при проверке гипотезы о согласии по следующим критериям: отношения правдоподобия, Хи-квадрат Пирсона, Колмогорова, омега малое квадрат Мизеса, омега большое квадрат Мизеса. Из таблицы видно, что согласие эмпирического распределения статистики с распределением %2(1) начинается с n = 60, поскольку только с «1 =30, «2 = 30 достигнутый уровень значимости при проверке гипотезы о согласии превышает ошибку первого рода а = 0,05. Т а б л и ц а 1 Результаты проверки согласия эмпирического распределения статистики Кохрана (при xt ~ Norm) и распределения х2(1) Объем выборки = = n1 n «1 = 20, «2 = 20 n! = 25, n2 = 25 «1 = 30, «2 = 30 n! = 35, n2 = 35 «1 = 40, «2 = 40 «1 = 50, «2 = 50 Достигнутый уровень значимости 0 0,004 0,012 0,18 0,702 0,256 0,62 На самом деле не будет большой ошибки в статистических выводах при проверке гипотезы, если использовать распределение %2(1) уже с n = 30. Это видно из рис. 1: при любых а < 0,1 (т.е. в зоне принятия решения по принятию или отклонению нулевой гипотезы при использовании критерия Кохрана) расхождение эмпирического распределения и распределения х2(1) не превышает 0,005. Не было определено влияние способа разбиения на две подвыборки (равные или в различной степени неравные по объему) на распределение статистики критерия. В процессе исследования распределений статистик при справедливой проверяемой гипотезе, помимо случая принадлежности наблюдаемой выборки нормальному закону распределения, рассматривались ситуации принадлежности наблюдений множеству различных симметричных и несимметричных распределений. В частности, исследовались распределения статистики Кохрана в случае принадлежности наблюдений семейству с плотностью De(X) = f (X, X, 02,0j) = (х/ (02Г(1 / X))) exp j- (| X - 0 ((02 ) J и параметрами формы X = 0,2, 0,5, 1, 1,5, 2, 4, 8, 10. В частности, при X = 2 получаем нормальный закон распределения. На рис. 2 представлены полученные в результате моделирования распределения статистики (1) в случае принадлежности наблюдений законам распределения семейства De(X) при различных параметрах формы: вид закона De(X) менялся от близкого к распределению Коши до распределения, близкого к равномерному. Рис. 1. Распределение %2(1) и эмпирическое распределения статистики критерия Кохрана при нормальном законе распределения, n = 30 В случае принадлежности xt достаточно широкому кругу законов распределение статистики критерия Кохрана существенно не отличается от распределения, имеющего место в случае принадлежности наблюдений нормальному закону (см. рис. 2). Если закон, которому принадлежат наблюдаемые величины, симметричен и не имеет слишком тяжелых хвостов, то и увеличение и уменьшение эксцесса распределения наблюдений по сравнению с нормальным законом не приводит к значимому отклонению распределения статистики от «классического». Только при законе из семейства De(X) с X = 0,2 распределение статистики (1) действительно существенно отличается от «классического», соответствующего принадлежности наблюдений нормальному закону. На рис. 2 приведено распределение статистики (1) также и для случая принадлежности xl, x2,...,xn показательному (экспоненциальному) закону при n1 = n2 = 25. Видно, что даже при такой сильной асимметричности закона распределения наблюдаемых случайных величин распределение статистики (1) не становится отличным от %2(1). То же наблюдается в случае принадлежности наблюдений асимметричным законам - распределениям экстремальных значений (минимального или максимального). Очевидно, что асимметричность закона не оказывает практически никакого влияния на распределение статистики Кохрана. Поведение распределения статистики критерия Кохрана было также исследовано для случаев, когда наблюдаемый закон представляет собой симметричную смесь законов распределения. Например, когда закон распределения x1, x2,..., xn представляет собой смесь 2 нормальных законов вида f (x) = (0,5/e2V2^)exp{-(x-0! -k©2 //2e2j + (0,5/е2>/2я)exp{-(x-0! + k©2//2©2J. Построенные на основании результатов моделирования распределения статистики критерия Кохрана, соответствующие случаям принадлежности x1, x2,...,xn таким смесям со сдвигом компонент смеси ±1©2, ±2©2 и ±3е2 относительно 01, буквально накладываются одно на другое и на распределение статистики при нормальном законе. Отсюда можно сделать вывод, что критерий Кохрана не чувствителен к двумодальности закона распределения наблюдаемых величин при условии его симметричности и отсутствии тяжелых хвостов. Рис. 2. Распределения статистики критерия Кохрана при различных параметрах формы распределения семейства De(X) и при распределении наблюдений по показательному закону, n = 50 Также было исследовано влияние неоднородности в дисперсиях двух подвыборок (на которые мы разбиваем исходную выборку) на распределение статистики критерия Кохрана. Не было выявлено отклонений распределений статистики от распределения %2(1) даже при ситуации, когда одна дисперсия превышала другую в сотни раз, что говорит о несомненной устойчивости критерия к гетеро-скедастичности данных. 3. Исследование мощности критерия Кохрана при сравнении с классическими критериями однородности средних Если рассматривать ^ как среднее первых n1 наблюдений, а ц2 - как среднее последующих n2 наблюдений, то альтернативные гипотезы могут быть записаны в том же виде, как они формировались для классических критериев однородности средних двух выборок. Для исследуемого в работе критерия Кохрана мощность проанализирована относительно следующих альтернатив: Их: ц2 = + 0,1с, H2 : ц2 = + 0,2с, H3: ц2 + 0,5с, H4 : ц2 = + с, при одинаковых дисперсиях выборок и при распределении наблюдений по нормальному закону. Вычисленные на основании результатов моделирования оценки мощности критерия сравнения средних Кохрана представлены в табл. 2. По мощности критерий оказался эквивалентен параметрическому Р-критерию Фишера сравнения средних (мощность последнего бралась в соответствии с [1. С. 388-396]). Т а б л и ц а 2 Мощность критериев Кохрана и Фишера при справедливости различных альтернатив, а = 0,1 n1 = n2 Критерий H1 H2 H3 H4 20 Кохрана 0,12 0,17 0,47 0,93 Фишера 0,12 0,17 0,46 0,93 30 Кохрана 0,13 0,12 0,61 0,99 Фишера 0,13 0,2 0,61 0,99 50 Кохрана 0,15 0,26 0,8 1 Фишера 0,14 0,26 0,8 1 100 Кохрана 0,18 0,41 0,97 1 Фишера 0,18 0,41 0,96 1 4. Исследование мощности критерия Кохрана при наличии линейного и нелинейного тренда В дальнейшем в качестве конкурирующих гипотез рассматривались различные ситуации наличия тренда в последовательности данных, а именно: в случае линейного тренда моделировались случайные величины Ъ = bt + x, относительно которых проверялась гипотеза H0 . Наблюдения x1 представляли собой независимые случайные величины, распределённые по стандартному нормальному закону, t е[0...1]. Исследовалась мощность критерия относительно альтернатив с линейным трендом, задаваемым параметром b = 0,5; 1; 2; 3; 4. Соответствующие альтернативы обозначены в дальнейшем как H5, H6, H7, H8, H9. Чтобы иметь возможность сравнить значения мощностей различных критериев, технология моделирования ситуации линейного и нелинейного тренда использовалась такая же, как и в работе [1. С. 440447]. Из этой же работы брались и приводимые для сравнения значения мощности критерия Аббе. Значения мощности критерия Кохрана и критерия Аббе относительно альтернатив H5, H6, H7, H8, H9 с линейным трендом в зависимости от общего объема выборки наблюдений n при уровне значимости а = 0,1 приведены в табл. 3. Проведя сравнительный анализ с критерием Аббе, можно констатировать, что критерий Кохрана более эффективен, чем критерий Аббе. Поэтому применение его более предпочтительно. Т а б л и ц а 3 Мощность критериев Кохрана и Аббе при линейном тренде, а = 0,1 n Критерий H5 H6 H7 H8 H9 25 Кохрана 0,16 0,34 0,76 0,97 1,00 Аббе 0,125 0,206 0,514 0,840 0,978 50 Кохрана 0,23 0,54 0,96 1 1,0 Аббе 0,13 0,25 0,69 0,97 1,0 100 Кохрана 0,34 0,8 0,999 1,0 1,0 Аббе 0,14 0,31 0,89 0,999 1,0 Аналогичные исследования распределений статистики критерия Кохрана и его мощности были проведены относительно альтернатив с нелинейным трендом вида Ъ = b sin(2rct) + xt., Исследовалась мощность относительно альтернатив с нелинейным трендом, задаваемым параметром b = 0,1; 0,25; 0,5; 1; 1,5. Соответствующие альтернативы обозначены в дальнейшем как H10, Hn, H\2, Hi3, Hi4. Полученные значения мощностей критерия Кохрана относительно альтернатив H10, Hn, H12, H13, H14, в зависимости от объема выборки n при уровне значимости а = 0,1, а также приведенные для сравнения мощности критерия Аббе представлены в табл. 4. Исследована мощность критерия относительно альтернатив с трендом вида Ъ = bt + b sin(2rct) + xt. Были рассмотрены альтернативы H15, H16, H17, H18, H19, задаваемые параметром b = 0,25; 0,5; 1; 1,5; 2 соответственно. Полученные на основании результатов моделирования оценки мощности относительно альтернатив H15, H16, H17, H18, H19 со смешанным трендом в зависимости от объема выборки n при уровне значимости а = 0,1, а также приведенные для сравнения мощности критерия Аббе представлены в табл. 5. Т а б л и ц а 4 Мощность критериев Кохрана и Аббе при нелинейном тренде, а = 0,1 n Критерий H10 Hn H12 H13 H14 25 Кохрана 0,12 0,20 0,44 0,91 1,00 Аббе 0,103 0,135 0,249 0,676 0,953 50 Кохрана 0,14 0,3 0,71 0,996 0,998 Аббе 0,11 0,15 0,33 0,87 0,998 100 Кохрана 0,17 0,48 0,93 1,0 1,0 Аббе 0,11 0,17 0,45 0,98 1,0 Т а б л и ц а 5 Мощность критериев Кохрана и Аббе при смешанном тренде, а = 0,1 n Критерий H15 H16 H17 H18 H19 25 Кохрана 0,14 0,23 0,55 0,80 0,95 Аббе 0,117 0,172 0,415 0,734 0,937 50 Кохрана 0,18 0,37 0,82 0,98 1,00 Аббе 0,124 0,215 0,580 0,919 0,996 100 Кохрана 0,25 0,60 0,98 1,00 1,00 Аббе 0,133 0,266 0,790 0,989 1 По итогам данных табл. 3-5 можно заключить, что при рассмотренных альтернативах критерий Кохрана более эффективен, чем критерий Аббе. Однако до этого момента рассматривалась ситуация, когда выборка для критерия Кохрана разбивалась на равные (или почти равные для n = 25) подвыборки. Однако представим, что данный критерий применяется к некоторому «окну наблюдений», фиксированному по размеру, непрерывно смещающемуся за счет удаления более старых наблюдений (из начала последовательности) и добавления вновь поступающих наблюдений (в конец последовательности). В таких ситуациях обычно есть возможность рассматривать выборки довольно большого объема, скажем n = 100, но остро стоит вопрос о своевременном выявлении нарушений. Последнее в случае нашего критерия может быть обеспечено за счет разбиения выборки на существенно неравные части: чтобы первая часть, содержащая уже накопленную в предыдущие моменты времени информацию (в которой по результатам предыдущих тестов не было выявлено отклонений), содержала значительно больше наблюдений, чем вторая, представляющая вновь поступившие данные. Поэтому закономерно встает вопрос: насколько сильно неравномерность в разбиении выборки может сказаться на мощности? Для получения ответа было проведено исследование мощности (табл. 6) при различных пропорциях объемов первой и второй подвыборок для ряда альтернатив тренда рассмотренных выше типов. Конкретные альтернативы для рассмотрения выбирались из тех соображений, чтобы мощность критерия Кохрана при n1 = 50, «2 = 50 была достаточно высока, но не единична. Т а б л и ц а 6 Мощность критерия Кохрана при различных трендах и способах подразбиения на выборки, а = 0,1 Вид альтернативы n1 = 50, n2 = 50 n1 = 60, n2 = 40 n1 = 70, n2 = 30 n1 = 80, n2 = 20 n1 = 90, n2 = 10 H6, b = 1, линейный 0,8 0,78 0,73 0,62 0,42 H12, b = 0,5, синусоидальный 0,93 0,90 0,73 0,38 0,13 H16, b = 0,5, смешанный 0,60 0,52 0,31 0,12 0,10 Из вышесказанного можно сделать следующие выводы. Если мы имеем ситуацию линейного тренда, то мощность критерия Кохрана уменьшается более или менее равномерно. Достаточно резкий скачок вниз происходит только когда соотношение объемов подвыборок становится 9:1. И даже в этом случае мощность критерия Кохрана выше, чем мощность критерия Аббе для данной альтернативы. Это дает основание утверждать, что при наличии линейного тренда в данных критерий Кохрана будет выявлять его (линейный тренд) лучше, чем критерий Аббе при любом (в рамках рассмотренных пропорций) разбиении выборки на две части. Несколько иная ситуация при нелинейных трендах. При соотношении объемов подвыборок 4:1 критерий Кохрана начинает уступать по мощности критерию Аббе. И вообще при этой альтернативе мощность критерия Кохрана при увеличении отношения объемов подвыборок падает гораздо стремительнее, чем в случае с линейным трендом. Резкое падение начинается с момента, когда объем второй подвыборки составляет примерно треть от общего объема наблюдений. Для смешанного тренда ситуация такая же, как и для синусоидального тренда, даже более выраженная в очерченных тенденциях. Таким образом, на основании анализа, проведенного для ситуации с n = 100, можно заключить, что если мы хотим выявить тренд произвольного вида, то подразбиение на выборки для критерия Кохрана должно быть таким, чтобы объем меньшей из подвыборок был не менее трети от объема всей выборки. Иначе потери в мощности будут столь велики, что «скрадут» преимущества от «оперативности» реагирования на ситуацию. Заключение На основании проведенных исследований можно констатировать, что применение критерия Кохрана будет корректным и в тех случаях, когда мы имеем дело с законом, существенно отличающимся от нормального. Однако закон не должен иметь «тяжелых» хвостов. Закон может быть двумо-дальным, описываться симметричной смесью законов. Также не сказывается на распределении статистики и неоднородность по дисперсиям (даже весьма существенная) подвыборок наблюдений. В этом его преимущество по сравнению с F-критерием сравнения выборок по средним, с которым критерий Кохрана оказался практически идентичным по мощности. И в то же время критерий Кохрана оказался мощнее при рассмотрении альтернатив наличия тренда в данных, чем специализированный критерий выявления трендов - критерий Аббе (при условии, что объем меньшей подвыборки не составляет менее трети от общего объема наблюдений). Таким образом, критерий Кохрана показал себя как универсальный, мощный и устойчивый к нарушению исходных предположений инструмент по выявлению различных типов «неоднородности в средних» в последовательности данных и может быть рекомендован (особенно учитывая простоту вычисления его статистики) к широкому внедрению в практику статистического анализа данных.
Скачать электронную версию публикации
Загружен, раз: 319
Ключевые слова
power of tests, infringement of the normality and homosсedasticity, Cochran test for the means shift detection, мощность критериев, исследования в условиях нарушения предположений нормальности и гомоскедастичности, критерий Кохрана обнаружения сдвига среднихАвторы
ФИО | Организация | Дополнительно | |
Волкова Виктория Михайловна | Новосибирский государственный технический университет | кандидат технических наук, доцент кафедры программных систем и баз данных | vik-ky@yandex.ru |
Ссылки
Миттаг Х.-Й., Ринне Х. Статистические методы обеспечения качества. М. : Машиностроение, 1995. 600 с.
Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. М. : Финансы и статистика, 1983. 471 с.
Cochran W.G. Some methods for strengthening the common chi-square tests // Biometrics. 1954. No. 10. P. 417-451.
Strunov V.I. Applying the Abbe test to the independence of measurement series with distributions deviating from normal // Measurement Technique. 2008. V. 49, No. 8. P. 962-969.
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики : учеб. для вузов. М. : ЮНИТИ, 1998. 1022 с.
Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход. Новосибирск : Изд-во НГТУ, 2011. 888 с.
