Проводится сравнение характеристик F-критерия Фишера, Н-критерия Краскела - Уоллиса и L-критерия Пейджа в рамках различных супермоделей, описывающих отклонения от классической гауссовской модели дисперсионного анализа. Сравнение проводится как при конечных объемах выборки методом статистического моделирования, так и в асимптотике путем вычисления относительной эффективности Питмена.
COMPARISON OF THE PROPERTIES OF THE RANKANALOGUES F-TEST FISHER FOR DIFFERENT MODELS IN THE ANALYSIS OFVARIANCE .pdf Пусть объекты изучаемой совокупности (или популяции) W характеризуются некоторым результирующим показателем X. В соответствии с факторным признаком A, который может принимать k значений Ab...,Ak, вся совокупность W разбивается на k групп Wi,...,Wk (или k подпопуляций Wb...,Wk популяции W). Статистическими данными являются наблюденные реализации x11x^jxlkxnkkk выборок Xjj,...,X^ , XlkXtlkk из совокупностей W1v..,Wk c непрерывными распределениями изучаемого показателя X. Исходные данные кратко записываются в виде {Xj-}, j = 1,...,k, i = 1,...,rij, они получены в результате iij наблюдений за результирующим показателем X при каждом фиксированном j-м уровне Aj, j = 1,.. .,k, фактора A. Рассмотрим различные модели наблюдений.1. Гауссовская модельПредполагается, что исходные данные {Xj}, i = 1,. ■■,«/, j = 1,.--,k, представляют собой выборку, полученную в результате n независимых наблюдений над показателем X из k нормальных совокупностей W1v..,Wk со средними значениямиц1цk и с равными, но неизвестными дисперсиями с2 = с2, = = а2. = а2 . Этумодель наблюдений называют нормальной (или гауссовской) моделью 1 однофак-торного дисперсионного анализа с фиксированными эффектами. Для удобства дальнейших ссылок выделим в явном виде и пронумеруем все предположения этой модели наблюдений:xtj =Н/ +ztj , i = 1,...,nj , j = 1>->k, n = (n + + nk), (1)гдеа)uj = M(X | A = Aj), j = 1,k , постоянные величины,б)в,/- - независимые случайные величины,в)Sg - нормальные случайные величины, т.е. L(ztj) = N(0; а2),г)дисперсии совокупностей Wb...,Wk равны неизвестному параметру о2, то2 22 2есть с,= Со= - = а,, = а .В рамках этой модели требуется убедиться в том, что изменение фактора A не влияет на итоговый показатель X. На статистическом языке эта задача сводится к проверке статистической однородности наблюдаемых данных {X,-}, i = 1,...,iij ,j = 1,..., k, которая кратко записывается в виде проверки гипотез:H0 : Hi = ц2 = - = Hk = Н , H : не все цj равны , j = 1,...,k . (2) Эти гипотезы проверяются с помощью F-критерия Фишера (см., например, [1]), основанного на статистике F = S2. /SW , где SB и средние квадраты соответственно между и внутри групп W\,...,Wk, вычисляемые по формуламSB = SSB l(k -1) = -i- £ nj (X.j - X.. )2 ,k -i j=iS2 = SSr /(n-k) = -!- £ X (Xij -)2 . n - к j=i i=iСтатистика F = S2. / при гипотезе H0 имеет F-распределение Фишера с числами степеней свободы (к -1) и (n - k), то есть справедливо выражениеL{F = SB / | H„} = F(к -1, n - к). (3) Критическая область размера а находится справа от квантиля Fl-a (k -1, n - k) уровня (1 -а) для F-распределения с числами степеней свободы (к - 1) и (n - к).2. Непараметрическая модель с произвольными альтернативамиНа практике предположения нормальности наблюдений не всегда могут быть обоснованы. В таких случаях рассматривают более общие модели наблюдений и предполагают, что {Xj}, i = 1,...,nj , j = 1,...,k, являются независимыми случайными величинами, которые одинаково распределены лишь при фиксированном у-м уровне Aj , j = 1,...,k , фактора A, то есть XjXnjj является выборкой изусловной функции распределения Fj (x) = P{Xj < x | A = Aj}, j = 1,k, V/ ё (1,...,n7-). Отметим, что Fj(x) является произвольным непрерывным распределением, функциональный характер которого не конкретизируется и изучение влияния фактора A на итоговый показатель X в условиях этой непараметрической модели сводится к проверке гипотезH0 : F= F2 =... = Fk , H : HeeceFj равны , j = 1,...,k . (4)Эти гипотезы проверяются с помощью H-критерия Краскела - Уоллиса (см., например, [2, 3]), статистика которого вычисляется не по исходным наблюдениям {Xj}, а по их рангам {Rj} , i = 1,...,tj , j = 1,...,k, по формулеH =-^^т £ nj-(n +1)/2}2 , (5)где R.7- - средний ранг наблюденийу-й группы, j = 1,...,k . При больших объемах выборки H-критерий определяется асимптотической критической областью раз-мера а в виде неравенства H ^Xi-a (k -1), где Xi-a (k ~ 1) обозначает квантиль уровня (1 - а) для хи-квадрат распределения с числом степеней свободы k - 1.3. Непараметрическая модель с упорядоченными альтернативами сдвигаЧасто на практике уровни A\,...,Akфактора A отражают эффективность воздействия на показатель X в определенном направлении, например по мере увеличения интенсивности воздействия. В таких случаях рассматривают упорядоченные альтернативы. Предполагается, что XpXn:j - н.о.р. случайные величиныс произвольной непрерывной функцией распределения F(x-9j), j = 1,...,k, V/ ё (1,...,nj). Для изучения влияния фактора A на итоговый показатель X в условиях этой непараметрической модели проверяются гипотезыЯ0" : 0 =92 =... = Qk , Hl* : 9! < 92 \_а {(к2 - 1)(nk +1)/144n}1/2,где ^1-а = Ф-1 (1 - а) и Ф-1 обозначает квантильную функцию стандартного нормального распределения Ф(x).4. Рассматриваемые типы супермоделейПонятие «супермодель» (см., например, [4]) используют при изучении свойств робастности статистических процедур. Существуют различные подходы к заданию супермоделей. При изучении робастности процедур по распределению, один из вариантов задания супермодели состоит в конкретизации семейств распределений, включающих «идеальное» распределение, в которое мы верим и выбираем его в качестве основы, а также распределения, которыми могут характеризоваться наблюдения в условиях реального эксперимента. Мы рассмотрим два типа супермоделей, предложенных Тьюки [6].Первый тип содержит ^-аппроксимацию стандартных симметричных распределений и задается в виде семейства распределений путем конкретизации их квантильных функций, то есть в видеЗх (F) = {F: F-1 (и) =Х1 + [uh - (1 - Mf3 ]/Х2}, 0 < u < 1, (8)где Х\ характеризует параметр положения, Х2 является масштабным параметром и Х3 - параметром формы распределения. Подходы к определению этих параметров описаны в [7]. В семействе распределений Зх (F) мы выделим супермодель Зх (у2), которая описывает отклонения от нормального распределения по эксцессу у2 при следующих значениях эксцесса: 1,75, 3, 4, 5, 9. Отметим, что для нормального распределения эксцесс у2=3. Второе семейство 3Л (r) содержит ^-аппроксимацию распределений Стьюдента с числом степеней свободы r, принимающим следующие значения: 1, 5, 6, 7, 8, 9, 10, 25, 50, да. Отметим, что семейство распределений Стьюдента включает нормальное распределение (r-да) и распределение Коши (r=1). Это семейство является удобным для описания широкого класса распределений, упорядоченных по степени «тяжести их хвостов» (см., например, [4]).Второй тип супермоделей содержит гауссовские распределения с масштабным засорением и определяется в виде36>т (Ф) = {F: F6>1 (x) = (1 -б)Ф(х) + бФ(х/т)}, 0 1. (9)Отметим, что при s = 0, или при т = 1, имеем нормальное распределение Ф(x), x е R1.5. Сравнение критериев при конечных объемах выборкиВ рамках описанных типов супермоделей приведем результаты сравнения характеристик F-критерия Фишера, H-критерия Краскела - Уоллиса и L-критерия Пейджа. В качестве сравниваемых характеристик критериев используются их вероятности ошибок первого и второго рода. Изучение робастности F-критерия Фишера по уровню значимости при конечных объемах выборки проводится методом статистического моделирования, при этом исходные наблюдения {Xj} вычисляются по формулеXj =\ + -(1 -Uj]/Х2, i = 1,...,nj, j = 1,...,k, (10)где Ujj случайные величины с равномерным распределением в интервале [0,1]. Отметим, что ранговые статистики H- и L-критериев имеют дискретные распределения, поэтому при сравнении критериев, которое проводилось при фиксированном уровне значимости а = 0,05, использовались асимптотические непрерывные аппроксимации их распределений при нулевой гипотезе. При этом в процессе моделирования проверялось качество этих аппроксимаций при различных объемах выборки путем построения оценок уровней значимости критериев по числу опытов M= 10 000. Отметим, что при моделировании использовались равные объемы выборок в группах W\,...,Wk, то есть щ = n2 =...= nk= n. Мощности критериев сравнивались при альтернативах сдвига вида (6), при этом параметр положения Xi в (10) зависел от номера группы j и вычислялся по формуле ^i(j) = (j-1)А, j = 1,...,k, где А > 0 - заданный параметр, характеризующий сдвиг распределений по группам W1v..,Wfr Результаты моделирования в виде оценок уровней значимости а критериев (при А = 0) и оценок мощностей критериев W(A) при различных значениях параметра А, полученные по числу опытов M = 10 000, при числе групп k = 5, приведены в табл. 1 для F еЗЛ (у2) и в табл. 2 для F еЗЛ (r). Результаты эксперимента для F еЗЁТ (Ф) приведены в табл. 3.Анализируя данные этих таблиц, можно сделать следующие выводы.1..Эмпирический уровень значимости F-критерия обладает стабильностью при отклонениях от гауссовской модели по эксцессу в рамках супермодели Зх (у 2) (см. табл.1). Однако F-критерий не обладает свойством робастности по уровню значимости в рамках супермодели Зх (r). В частности, для распределений с «тяжелыми хвостами» (см. табл.2 при r = 1), вместо заданного уровня а = 0,005, эмпирический уровень значимости равен « 0,016 . При увеличении числа степеней свободы r «затянутость хвостов» распределений начинает приближаться к гаус-совской и эмпирические уровни начинают проявлять стабильность в окрестности заданного уровня.2..Асимптотическая аппроксимация точного распределения ранговой статистики H-критерия Краскела - Уоллиса при нулевой гипотезе с помощью выражения L(H | H0) = %2 (к -1), является неудовлетворительной при малых объемах выборки. См., например, табл. 2 при n = 5 и любом числе степеней свободы, начиная с r = 1 и до r - да. Вместо заданного уровня значимости а=0,005, эмпирический уровень значимости равен « 0,03 . При увеличении объемов выборки качество аппроксимации улучшается, и при n > 10 она уже является удовлетворительной для целей практики. Этот вывод сохраняется и для супермодели, описывающей отклонения от гауссовской модели по эксцессу, то есть для F еЗЛ (у2).3..Для рассмотренных в эксперименте альтернатив и для гауссовской модели наблюдений вида (1), F-критерий имеет незначительное преимущество в мощности перед H-критерием. Однако при отклонениях от гауссовской модели, то есть в рамках супермоделей 3Л (X2), 3Л (r) и 3ЁТ (Ф), ситуация меняется. Н-критерийимеет преимущество в мощности по сравнению с F-критерием, причем оно проявляется в большей степени при «утяжелении хвостов распределений» и при увеличении объемов выборки. Для рассмотренных в эксперименте упорядоченных альтернатив, L-критерий Пейджа, как и ожидалось, имеет существенно большую мощность по сравнению с F и Н-критериями. Причем качество нормальной аппроксимации распределения ранговой статистики L при нулевой гипотезе вполне удовлетворительное и для малых объемов выборки, начиная с n = 5.4..Проведенные эксперименты при числе групп k = 10, качественно не меняют эти выводы.Отметим, что рассмотренные в предыдущих экспериментах супермодели 3Л (X 2), 3Л (r) и 3ЁТ (Ф), были использованы, в частности, для изучения робастности по распределению уровня значимости F-критерия. Эти супермодели описывают различные варианты отклонения от предположения нормальности (1в) гауссовской модели (1). Изучим теперь робастность уровня значимости F-критерия при отклонениях от предположения (1г) о равенстве дисперсий в группах W\,...,Wi, оставив все остальные предположения гауссовской модели (1) верными. Для этого исходные наблюдения {Xy} будем вычислять по формуле (10), в которой Хх = 0, что обеспечивает справедливость предположения нулевой гипотезы (2), то есть H0 : ^1 = ц2 =... = \ik = \i. Далее, коэффициенты Х2 и Х3 соответственно будут равны Х2 = 0,1975 и Х3 = 0,1350 , что обеспечивает выполнение предположения нормальности модели (1). Затем для нарушения предположения (1г) о равенстве дисперсий в группах Wb...,Wfo сделаем масштабный параметр Х2зависящим от номера группы j, то есть Х2(j) = jX2 ,y'=1,...,k. В результате исходные наблюдения {Xy} вычисляются по формулеXy =К1 + [Ц>3 - (1 - Uj f3 ]/Х2 (j), i = 1,..., nj, j = 1,..., k . (11) Результаты эксперимента приведены в табл. 4.Таблица 4Из табл. 4 видно, что при невыполнении предположения (1г) о равенстве дисперсий в гауссовской модели вида (1) уровень значимости F-критерия превышает заданный уровень а = 0,05 больше, чем в два раза. Причем уровень значимости F-критерия значительно возрастает с увеличением количества уровней факторного признака А. Отметим, что условия рассматриваемого эксперимента для Н-критерия соответствуют альтернативе H\ , так как дисперсии распределений в группах разные и, следовательно, не все Fj, j = 1,...,k, равны. Приведенные данные для Н-критерия превышают заданный уровень значимости а = 0,05, что является проявлением свойства «несмещенности» Н-критерия, так как эти данные характеризуют его мощность при рассмотренных альтернативах.6. Асимптотическое сравнение критериевВ литературе разработаны различные подходы к асимптотическому сравнению критериев. Наиболее часто используют асимптотическую относительную эффективность Питмена (см. [2, 5]), которая вычисляется не для фиксированной альтернативы, а для последовательности контигуальных альтернатив, сходящихся к нулевой гипотезе при неограниченном увеличении объема выборки. Для многих непараметрических критериев получены общие выражения для эффективности Питмена по отношению к их «конкурентам» из нормальной теории. В частности, в [2] показано, что эффективность Питмена для Н-критерия Краскела - Уоллиса относительно F-критерия Фишера вычисляется по формуле2AREF (H: F) = Ист2,I f 2 (x)d= 12стуL0(12)где erf = D(X) и f (x) - плотность функции распределения F(x) наблюденийнад показателем X. Отметим, что формула (12) имеет достаточно общий характер. По формуле (12) вычисляется также асимптотическая относительная эффективность Питмена для критерия знаковых рангов Уилкоксона и t-критерия Стьюден-та в одновыборочном варианте и в двухвыборочном варианте для рангового критерия Уилкоксона и двухвыборочного t-критерия Стьюдента [5]. Это замечание распространяется на относительную эффективность Питмена многих непараметрических критериев по отношению к их «конкурентам» нормальной теории (см., например, [3]).Отметим, что плотность распределения вероятностей, выражаемая через кван-тильную функцию F-1 (u) = Х1 + [иХз - (1 - u)Хъ ] /Х2, 0 < u < 1, которая определяет элементы множества Зх (F) вида (8), записывается в виде(и)) = (и))' = [X3{uh-1 + (1 - u)h Х2 ]-1 , 0 < u < 1. (13)Далее, можно убедиться, что для F еЗЛ все центральные моменты\ik = M (X - a)k нечетного порядка равны нулю и, следовательно, коэффициентасимметрии yj = ц3 / ц^'2 = 0, а коэффициент эксцесса у2 =ц4 /ц2, вычисляется по формуле= ц£ = (1/(4^3 +1) - 4Б{ХЪ + 1,3^з +1)} Y 2 ^2 2[1 /(2Х3 +1) - Б( Х3 +1, Х3 +1)]2+3В(2^з + 1,2Хз +1) (14)2[1 /(2Х3 +1) - B(Х3 +1, Х3 +1)]2 'где B( x, y) обозначает бета-функцию. Кроме того, выражение для дисперсии имеет видcrf = 2[1/(2Х3 +1) - B(X3 +1, Х3 +1)]/ X2 .(15) С учетом формул (13) и (15), выражение (12) для F еЗЛ запишется в видеAREF (H : F) = 24 [11{2Х3 +1) - B(X3 +1, Х3 +1)]х1
Шуленин В.П. Введение в робастную статистику. Томск: Изд-во Том. ун-та, 1993.
Кендэлл М., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973.
Холлендер М., Вулф Д. Непараметрические методы статистики. М.: Финансы и статистика, 1983.
Хеттсманспергер Т. Статистические выводы, основанные на рангах. М.: Финансы и статистика, 1987.
Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ: Пер. с англ. М.: Мир, 1982.
Randles R.H., Wolf P.H. Introduction to the Theory of Nonparametric Statistics. N.Y.: Wiley, 1979.
Ramberg J.S. An approximation method for generation symmetric random variables // Commun. ACM. 1972. V. 15. P. 987 - 990.