Полупараметрические и полунепараметрические оценки доверительных интервалов для квантилей распределения физических величин
На основе взвешенного метода максимального правдоподобия синтезированы новые адаптивные робастные оценки (АО) и доверительные интервалы для квантиля распределения физических величин. Методом статистических испытаний найдены значения относительной эффективности АО с рядом классических и робастных оценок на классах локальных и глобальных супермоделей Тьюки. Показано, что адаптивные оценки и доверительные интервалы для квантиля распределения по эффективности значительно превосходят классические параметрические и непараметрические и робастные оценки.
Semi-parametric and semi-nonparametric estimations of the confidence intervals for quantiles of distributions of physica.pdf Введение В различных областях приложений статистических методов обработки физических величин [1-7] возникают задачи построения точечных и интервальных оценок для квантилей функции распределения случайных величин. Оценки и доверительные интервалы квантиля для параметрических и непараметрических задач давно привлекают внимание исследователей и широко применяются в практике [1-4]. Данная задача решена для некоторых классов параметрических распределений, а для непараметрического класса распределений построены непараметрические доверительные интервалы на основе порядковых статистик [1, 3, 4]. В настоящее время наиболее актуальны полупараметрические и полунепараметрические задачи, которые представляют значительный интерес для статистической обработки физических величин [1, 5-7]. В работе рассматриваются робастные адаптивные оценки и доверительные интервалы для квантиля на классах полупараметрических и полунепараметрических задач на основе взвешенного метода максимального правдоподобия [6, 8-13]. Численное моделирование показало, что адаптивные оценки, синтезированные с учетом априорной информации об исходном распределении по эффективности, значительно превосходят классические на классах полупараметрических и полунепараметрических задач. 1. Постановка задачи Пусть - случайная величина с функцией распределения (ф.р.) , где - класс распределений Тьюки ; - априорное распределение; и - распределение и доля выбросов; - соответствующие плотности распределений; - вектор неизвестных параметров распределения. Обозначим через единственный квантиль распределения уровня p (0 < p < 1), т.е. уравнение имеет единственное решение. Требуется по выборке объема N независимых и одинаково распределенных случайных величин (н.о.р.) из построить оценку и доверительный интервал для квантиля . Задачи и методы нахождения оптимальных оценок и доверительных интервалов определяются априорной информацией о виде ф.р. . Выделим основные задачи. 1. Параметрические задачи. Вид функции распределения определён с точностью до конечного числа неизвестных параметров , - параметрический класс функций распределения, при этом . 2. Непараметрические задачи. Вид функции распределения не известен, кроме некоторой общей информации типа непрерывности, симметричности,…, - непараметрический класс функций распределения, при этом . 3. Полупараметрические задачи. В этом случае функция распределения полупараметризирована на классе , если определена на параметрическом классе функций распределения, при этом предполагается, что информация о выбросах неизвестна , то есть , если - задачи классической робастной статистики [9, 11, 14]. 4. Полунепараметрические задачи. В этом случае функция распределения , при этом , - непараметрический класс функций распределения, при некоторой дополнительной информации о - задачи робастной непараметрической статистики [6, 11-13]. Отметим то обстоятельство, что в задачах 3 и 4 вопрос идет о квантиле априорного распределения на фоне выбросов в распределении , из которого и берется неоднородная выборка . Данный тип задач наиболее типичен и актуален при обработке результатов физических экспериментов [1, 5-7]. 2. Оценки и доверительные интервалы для квантилей В качестве состоятельной оценки квантиля функции распределения возьмем решение эмпирического уравнения , (1) где - состоятельная и несмещенная (асимптотически несмещенная) оценка . В дальнейшем ограничимся достаточно общим классом асимптотически нормальных оценок , т.е. предполагается, что случайная величина имеет асимптотически нормальное распределение с нулевым средним и дисперсией . (2) Для нахождения оценки обычно используются рекуррентные методы стохастической аппроксимации вида , (3) где должны удовлетворять следующим условиям: . Представим (1) в виде . (4) Теорема 1. Если и из (2) есть непрерывная функция , то , где . (5) Доказательство прямо следует из представления (4) и теорем непрерывности [10, 11]. Пусть (6) - состоятельная и непрерывная оценка дисперсии оценки квантиля , где - состоятельная оценка функции плотности распределения. Теорема 2. Если - непрерывная функция и - состоятельная и непрерывная оценка , то . (7) Доказательство следует из теоремы непрерывности [10, 11]. Теоремы (1), (2) позволяют записать асимптотические интервалы [3, 4, 10] для квантилей в виде , (8) где - квантиль уровня стандартного нормального распределения. Из (8) c учетом (6) получаем, что длина L доверительного интервала . (9) Пусть имеются две оценки и , тогда эффективность оценки доверительного интервала вида (9) на основе по отношению к оценке доверительного интервала вида (9) на основе можно определить в виде отношения , (10) где - длина доверительного интервала на j-й оценке функций распределения . Как следует из (8), (10), асимптотические доверительные интервалы для квантилей распределения полностью определяются через оценки функций распределения и оценки их дисперсий . Рассмотрим оценки функций распределения и доверительные интервалы для квантилей для разных уровней априорной неопределенности. 3. Полупараметрические доверительные интервалы для квантиля Полупараметрический класс задач определен на классе ф.р. , . Отметим главную неприятную особенность полупараметрических задач: в них требуется найти оценки и доверительные интервалы квантиля для априорного распределения на фоне неизвестных выбросов. Пусть - робастная для распределения на и состоятельная по распределению оценка параметра . Методом подстановки находим робастную оценку , а для квантиля - робастную оценку . Из выражения (8) с учетом (6) получаем асимптотические доверительные интервалы для квантиля вида (8). В данном алгоритме построения оценок и доверительных интервалов для квантиля наиболее узким местом является нахождение оценки дисперсии для робастной оценки . Действительно, выражение зависит от вида робастной оценки и супермодели . Робастная статистика предоставляет достаточно широкий набор робастных оценок параметров [9, 14] для различных супермоделей и критериев робастности и оптимальности, поэтому нахождение обычно представляет в математическом плане непростое исследование. Среди робастных оценок параметров на полупараметрических задачах высокую потенциальную эффективность имеют адаптивные оценки на основе взвешенного метода максимального правдоподобия (ВММП) [11, 12], которые относятся к классу устойчивых оценок [14]. Робастные оценки параметров на основе ВММП находятся из решения системы эмпирических оценочных уравнений [11, 12] ; (11) , (12) где - эмпирическая функция распределения (ЭФР); l - параметр радикальности оценки; определяется из условия несмещенности оценки по распределению : . (13) Отметим, что при получаем оценки максимального правдоподобия; при - робастные оценки максимальной устойчивости [14]. Физически роль параметра радикальности сводится к «мягкому» усечению как по удаленным выбросам, так и по виду априорной функции распределения . Варьируя параметром l, можно получать адаптивные робастные оценки (АОG) [11] с высокой потенциальной эффективностью [13]. Пусть - оценка на основе ВММП (11). При выполнении ряда условий можно доказать [11, 12], что 1) имеет асимптотическое k-нормальное распределение со средним и корреляционной матрицей : ; (14) . (15) 2) Оценка является асимптотически несмещенной и эффективной оценкой, если . Оптимальное значение параметра радикальности для адаптации оценки будем определять путем минимизации среднеквадратической ошибки оценки , где lopt - оптимальное значение параметра радикальности; - среднеквадратическая ошибка оценки. Определим робастную оценку ВММП для методом подстановки при . Теорема 3. Пусть - непрерывная функция по и имеет непрерывные и ограниченные производные по х до третьего порядка, , , тогда , где , (16) . Доказательство. Из условий теоремы следует, что имеет место представление , и доказательство следует из теоремы непрерывности [10, 11]. Непараметрическую оценку для дисперсии получаем, если в выражениях (14), (15) вместо подставить ЭФР . 4. Полупараметрические доверительные интервалы для квантиля обобщённо-нормального распределения 4.1. Полупараметрические доверительные интервалы с параметрической адаптацией Рассмотрим задачу нахождения полупараметрических оценок и доверительных интервалов для квантиля на априорном классе обобщённо-нормальных распределений с неизвестным параметром сдвига (глобальная супермодель) , (17) где - неизвестный сдвиг и известные параметры масштаба и формы . При изменении параметра формы получаем распределения с разной степенью «затянутости хвостов» распределения. Рассмотрим три распределения: - обобщенно-нормальное распределение четвертой степени (P4); - нормальное распределение (N); - распределение Лапласа (L). Супермодель Тьюки вида (18) позволяет исследовать оценки и доверительные интервалы на локальных и глобальных супермоделях с симметричными и асимметричными выбросами. Оценку параметра на основе ВММП находим из решения эмпирического уравнения (11) с оценочной функцией (12) вида (19) и с дисперсией оценки (15) . (20) Оценку для получаем, заменяя в (20) на ЭФР . Робастную адаптивную оценку для распределения Р4 (АОР4) на основе ВММП определяем при путем минимизации среднеквадратической ошибки оценки. Из теоремы 3 и выражений (16), (17), (20) находим дисперсию . (21) Выпишем уравнение для нахождения адаптивной оценки квантиля . (22) Из выражения (6) находим . (23) Доверительный интервал для квантиля находим из (8) с учетом (23). 4.2. Полупараметрические доверительные интервалы с непараметрической адаптацией Выше оценка и доверительный интервал квантиля из (8) с учетом (23) находились на основе робастной адаптивной оценки ВММП (АОР4) при . Для нахождения возможны два подхода: 1. Алгоритмы параметрической адаптации. Вычисляется теоретически из (20). Для этого в (20) подставляем выражения (17)-(19) и вычисляем все интегралы (теоретически или численно). Определяем оценку и численно находим . К сожалению, решение такой задачи усложняется в случае векторного параметра. Так как математические модели супермоделей во многом субъективны и меняются, то такие алгоритмы требуют серьёзного математического и программного обеспечения. 2. Алгоритмы непараметрической адаптации. Робастные оценки параметров на основе ВММП находим из решения системы эмпирических оценочных уравнений (11), (12). При фиксированном запускается бутстреп-процесс [15] и по бутстреп-выборкам определяются оценка квантиля , выборочная дисперсия и длина доверительного интервала . Варьируя , определяем или . При определяем бутстреп-оценку и доверительный интервал для квантиля и . При таком подходе все проблемы по нахождению и перекладываются на вычислительные системы. ПО для бутстреп-процедур распространено и широко используется, например, в системе R [15]. 5. Полунепараметрические доверительные интервалы для квантиля Рассмотрим полунепараметрический уровень априорной неопределенности. В этом случае функции распределения и относятся к непараметрическому классу функций распределения. Глобальная супермодель с локальными выбросами рассмотрена авторами в [11, 12]. Отметим, что речь идет о квантиле априорного распределения на фоне локальных выбросов в при условии, что , , и неоднородной выборке . Обозначим через робастную непараметрическую оценку . Для случая непараметрические оценки и доверительные интервалы для квантиля на порядковых статистиках широко известны [3, 4, 8]. Возникают вопросы об эффективности данных оценок для супермоделей вида . Для получения робастных непараметрических оценок квантиля необходимы . Оценки вида и плотности на основе ВММП рассматривались в [11], а находится из уравнения : , (24) , где , , , , , - нормальная ядерная функция. В данном случае получаем адаптивные оценки в виде взвешенного среднего полусумм Уолша. Для нахождения , и используются алгоритмы непараметрической адаптации, рассмотренные выше. 6. Численное моделирование Для исследования эффективности доверительных интервалов на адаптивных оценках ВММП методом статистических испытаний были проведены эксперименты на ЭВМ с имитацией различных локальных и глобальных супермоделей. Для этого был разработан специализированный программный комплекс, который позволил вычислить оценки и доверительные интервалы уровня для квантиля . Моделирование проводилось при объёме выборки N = 200, = 0.1, для квантиля , число повторных выборок M = 500. Исследовалось поведение полупараметрических и полунепараметрических доверительных интервалов квантиля на оценках ВММП с непараметрическими алгоритмами адаптации на классах локальных и глобальных супермоделей Тьюки (18) с симметричными выбросами (СВ): { }, асимметричными выбросами (АВ): { } на распределениях (17) с = 4 (Р4), = 2 (N), = 1 (L). Исследовались следующие оценки: параметрические оценки максимального правдоподобия (ОМП) при ; робастные оценки максимальной устойчивости (ОМУ); полупараметрические адаптивные оценки для распределений P4, N, L с локальной непараметрической адаптацией (АОР4), (АОN), (АОL); адаптивная непараметрическая оценка (АНО) ВММП для квантиля с нормальным ядром (24); непараметрическая оценка квантиля (НО) на ЭФР; непараметрическая оценка максимальной устойчивости (НОМУ) ВММП для квантиля с нормальным ядром (24). С помощью моделирования получены основные характеристики оценок - смещение, СКО, доверительные интервалы в зависимости от параметра радикальности l и поведение относительной эффективности оценок по критерию (10). В табл. 1 и 2 приведены примеры значения длины полупараметрических и полунепараметрических доверительных интервалов в зависимости от параметра радикальности . Таблица 1 Длина полупараметрических доверительных интервалов L в зависимости от параметра радикальности l на супермодели P4 l 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ОМП 0 0.0219 0.0186 0.0205 0.0193 0.0197 0.0196 0.0190 0.0191 0.0189 0.0208 0.0264 0.0219 АВ 4.0034 0.0142 0.0190 0.0189 0.0193 0.0177 0.0160 0.0183 0.0199 0.0225 0.0266 4.0034 СВ 0.6342 0.2506 0.1042 0.0716 0.0626 0.0571 0.0497 0.0447 0.0405 0.0415 0.0408 0.6342 Таблица 2 Длина полунепараметрических доверительных интервалов L в зависимости от параметра радикальности l на супермодели L l 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 НО 0 0.0739 0.0307 0.0371 0.0553 0.0736 0.0949 0.1117 0.1238 0.1358 0.1475 0.1568 0.0739 АВ 0.3071 0.2531 0.1722 0.1049 0.0591 0.0225 0.0455 0.0695 0.0886 0.1036 0.1204 0.3071 СВ 0.3854 0.2567 0.1658 0.1080 0.0595 0.0212 0.0500 0.0739 0.0909 0.1080 0.1208 0.3854 На классе полупараметрических задач исследовалось поведение относительной эффективности (10) доверительных интервалов квантиля параметрических оценок максимального правдоподобия (ОМП) (ОМП.:АОG) и робастных (ОМУ) (ОМУ:АОG) оценок по отношению к адаптивным полупараметрическим оценкам для распределения G (АОG) (табл. 3). Таблица 3 Эффективность , полупараметрических доверительных интервалов Распределение Р4 N L Эффективность , ОМП ОМУ ОМП ОМУ ОМП ОМУ = 0 0.84 0.70 0.93 0.51 0.83 0.63 АВ 0 0.53 0.20 1 0.05 1 СВ 0.06 0.99 0 0.79 0.05 0.96 На классе полунепараметрических задач исследовалось поведение относительной эффективности (10) доверительных интервалов квантиля непараметрических (НО) (НО:АОН) и робастных непараметрических (НОМУ) (НОМУ:АОН) оценок по отношению к адаптивной полунепараметрической оценке (АОН) (24) (табл. 4). Таблица 4 Эффективность и непараметрических доверительных интервалов Распределение Р4 N L Эффективность НО НОМУ НО НОМУ НО НОМУ = 0 1 0.18 1 0.12 0.42 0.20 АВ 0.17 0.19 0.43 0.30 0.07 0.19 СВ 0.42 0.24 0.12 0.46 0.05 0.17 Заключение В работе введены адаптивные оценки и доверительные интервалы для квантиля распределения физических величин на классах полупараметрических и полунепараметрических задач. По результатам численного моделирования и сравнения адаптивных оценок с типовыми по относительной эффективности на локальных и глобальных супермоделях Тьюки можно сделать следующие выводы: 1. На классе полупараметрических задач: 1. 1. Адаптивные оценки универсальны: при l = 0 получаем оценки максимального правдоподобия, а при l = 1 - оценки максимальной устойчивости. 1.2. При локальных асимметричных и симметричных выбросах оценки максимального правдоподобия при l = 0 для ряда ситуаций практически не работоспособны 1. 3. Оценки квантиля и доверительные интервалы на робастных оценках при l = 1 по отношению к локальным адаптивным оценкам на распределении G имеют низкую эффективность 0.5). 2. На классе полунепараметрических задач: 2. 1. Адаптивные оценки универсальны: при l = 0 получаем широко известную непараметрическую оценку на эмпирических или сглаженных эмпирических функциях распределения, а при l = 1 - новые непараметрические оценки максимальной устойчивости. 2. 2. При локальных асимметричных и симметричных выбросах непараметрические оценки для l = 0 для ряда ситуаций имеют катастрофически низкую асимптотическую эффективность 0.05). 2. 3. При локальных асимметричных и симметричных выбросах непараметрические оценки максимальной устойчивости для l = 1 имеют низкую асимптотическую эффективность 0.5).
Ключевые слова
adaptive estimations,
weighted maximum likelihood method,
robust estimations,
robust confidence intervals,
quantile estimations,
взвешенный метод максимального правдоподобия,
адаптивные оценки,
робастные доверительные интервалы,
робастные оценки,
оценки квантиляАвторы
Симахин Валерий Ананьевич | Курганский государственный университет | к.ф.-м.н., профессор | sva_full@mail.ru |
Черепанов Олег Сергеевич | Курганский государственный университет | к.ф.-м.н., доцент | ocherepanov@inbox.ru |
Всего: 2
Ссылки
Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. - Тольятти: Кассандра, 2013. - 314 с.
Шурыгин А.М. Прикладная статистика. Робастность. Оценивание. Прогноз. - М.: Финансы и статистика, 2000. - 223 с.
Симахин В.А., Черепанов О.С., Шаманаева Л.Г. // Изв. вузов. Физика. - 2017. - Т. 60. - № 7. - С. 26-32.
Симахин В.А. Робастные непараметрические оценки. - Germany: LAMBERT Academic Publishing, 2011. - 292 с.
Черепанов О.С. Робастные оценки параметров на основе взвешенного метода максимального правдоподобия: дис. … канд. физ.-мат. наук. -Томск: ТГУ, 2015.
Ивченко Г.И., Медведев Ю.И. Введение в математическую статистику. - М.: Изд-во ЛКИ, 2010. - 600 с.
Шуленин В.П. Робастные методы математической статистики. - Томск: Изд-во НТЛ, 2016. - 260 с.
Кошкин Г.М. // Изв. вузов. Физика. - 2014. - Т. 57. - № 5. - С. 96-103.
Симахин В.А., Черепанов О.С., Шаманаева Л.Г. // Изв. вузов. Физика. - 2015. - Т. 58. - № 12. - С. 176-181.
Syzrantsev V.N., Syzrantseva K.V., Ilinykh V.N., and Chernaya L.A. // Russ. Eng. Res. - 2016. - V. 36. - No. 1. - P. 20-24.
Федоров В.А. //Оптика атмосферы и океана. - 2003. - Т. 16. - № 2. - С.151-155.
Павлов И.В. Статистические методы оценки надежности сложных систем по результатам испытаний. - М.: Сов. радио, 1982. - 168 с.
Беляев Ю.К., Богатырев В.А., Болотин В.В. и др. Надежность технических систем: справочник / под ред. И.А. Ушакова. - М.: Радио и связь, 1985. - 608 с.
Физический эксперимент и моделирование в машиностроении / под ред. В.П. Тихомирова. - Орел: ОрелГТУ, 2009. - 452 с.
Сызранцев В.Н., Невелев Я.П., Голофаст С.Л. Расчет прочностной надежности изделий на основе методов непараметрической статистики. - Новосибирск: Наука, 2008. - 218 с.