В статье на примере теоремы Бернулли сформулированы требования к применению формальных результатов в частотной интерпретации теории вероятностей. Они включают определение теоретических величин, используемых в теореме на основе экспериментальных данных, и верификацию независимости данных. Показано, что эти требования более жесткие, по сравнению с требованиями в субъективистской интерпретации, поэтому критика в ней условий Колмогорова не является обоснованной.
Is Criticism of Kolmogorov's Conditions of Using Mathematics Sound?.pdf Первое издание известной книги Колмогорова вышло на немецком языке в 1933 г., а на русском она была опубликована в 1936 г., в ней впервые была предложена аксиоматика теории вероятностей, принятая впоследствии математическим сообществом в 1938 г. [1]. Эта небольшая по объему монография являлась разноплановой; так, в ней кроме собственно аксиоматики и изложения основных результатов теории вероятностей были сформулированы некоторые идеи, предполагающие философский анализ, а также относящиеся к применимости теории вероятностей. Во-первых, Колмогоров обосновал значимость понятия независимости в этой теории, при этом он считал, что невозможно в рамках математики описать положения дел, для которых адекватны модели независимых экспериментов, и считал, что эта проблема относится к философии естествознания [1]. Во-вторых, он описал требования к вероятностям в контексте их приложений следующим образом: «A. Можно практически быть уверенным, что если комплекс условий S будет повторен большое число раз n и если при этом через m обозначено число случаев, при которых событие A наступило, то отношение m/n будет мало отличаться от -P(A). B. Если -P(A) очень мало, то можно практически быть уверенным, что при однократной реализации условий S событие A не будет иметь места» [1. С. 13]. Почему в этой небольшой монографии, посвященной теоретической математике, были сформулированы требования к применению математики? Колмогоров дал ответ на этот вопрос в другой работе, он писал, что успехи в основаниях математики заслонили собой значимую и независимую проблему ее применимости [2]. Отметим, что в период времени, начиная с момента издания книги, посвященной аксиоматике, до признания последней, неизвестны какие-либо критические замечания, относящиеся к аксиоматизации теории вероятностей. Другая судьба у условий применения теории вероятностей по Колмогорову. Если аксиоматика Колмогорова общеизвестна, то его требования к применению теории вероятностей непопулярны, и они не обсуждались в современной литературе вплоть до появления публикаций Шейфера и Вовка [3, 4]. Так, в работе [3], посвященной истории создания аксиоматики, влиянию математических и философских идей на создание оснований теории вероятностей и на стиль изложения теории, также были проанализированы условия Колмогорова по применению теории вероятностей. Шейфер и Вовк описали рецепцию одного из требований Колмогорова известными математиками, его современниками: Борелем, Фреше, Леви и др. Шейфер и Вовк писали: «Борель, Фреше, Леви неоднократно подчеркивали, что требование A оказывается избыточным, так как оно выводимо на основании теоремы Бер-нулли, являясь заключением теоремы». Наша работа в основном посвящена исследованию убедительности критики условий Колмогорова в контексте частотной интерпретации, так как в контексте приложений он следовал Ми-зесу, основателю частотной интерпретации. Исследуемая в статье тематика связана с проблемой применимости математики и ее места в научном исследовании. Несмотря на значимость проблемы применимости математики и ее связь с не менее значимыми проблемами, такими как эффективность математики, понимание явлений природы на основе математики, им уделяется недостаточное внимание в литературе. Дело в том, что чистым математикам проблема приложений неинтересна, а философы, как правило, интересуются теориями, а не их применением. Как говорил известный специалист в области философии науки Кайберг, «только методологи и бизнесмены интересуются проблемой применимости математики» [5]. Уточним замечание Кайберга: проблемой применимости занимаются не только методологи, изучающие проблему применимости математики и ее место в научном исследовании, но и прикладные математики, участвующие в ответственных испытаниях, а также специалисты, принимающие решения на основе математики. Однако их публикации немногочисленны и разбросаны по специальным изданиям, поэтому проблема применимости оказывается актуальной. Так как критика требования Колмогорова основана на теореме Бернулли, поэтому в работе исследуются условия применимости теоремы. Для дальнейшего изложения имеет смысл напомнить эту теорему. Теорема Бернулли. Проводится n независимых испытаний события A, из них m экспериментов оказались успешными. Известно, что теоретическая вероятность появления события А в каждом эксперименте равняется p(A), а m/n - это частота события А, s - это точность вычислений. Тогда при бесконечном числе экспериментов выполняется следующее равенство: (1) Отметим, что значимость теоремы для развития теории вероятностей не вызывает сомнений. Так, например, известный математик Б.В. Гнеденко отмечал значимость исследования условий, при которых события происходят с единичной вероятностью. Современный математик Г. Шейфер писал, что теорема является мостом, связывающим азартные игры, основанные на ожидаемых выигрышах, с понятием вероятности [6]. В отличие от несомненной теоретической значимости теоремы ответ на вопрос о применимости теоремы не является в той же мере очевидным. Отметим, что историки математики показали, что свою теорему Я. Бернулли доказал еще в 1691 г., однако он не торопился с ее публикацией из-за недостаточного числа примеров, в которых используется теорема. Теорема Бернулли составляет четвертую часть его книги, которая была опубликована уже после смерти автора в 1713 г. [7]. Почему Борель, Гадамер, Фреше, Леви и др. критиковали Колмогорова? Несомненным поводом являлось замечание Колмогорова о том, что в контексте приложений он в целом следует Мизесу [1]. Как известно, Мизес был основателем частотной интерпретации теории и последовательным критиком субъективистской интерпретации теории вероятностей [8]. Факт критики Колмогорова вполне понятен, так как большинство его оппонентов были субъективистами. Почему критиковали именно требование A на основе теоремы Бернулли? Ответ на этот вопрос связан с особенностями субъективистской интерпретации. В ней исследуются сингулярные, субъективистские или, как еще говорят, индивидуальные вероятности. Так, Борель, Гадамер, Леви связывали развитие теории вероятностей с исследованиями субъективистских вероятностей. Однако они признавали, что в науке ценятся объективные результаты, но это не является проблемой, так как, по их мнению, применение теоремы Бернулли приводит к объективизации результатов. Рассмотрим аргументацию субъективистов с общематематических позиций. Как известно, формальные науки являются консервативными, это означает, что если рассуждения основаны на истинных посылках и осуществляются формально корректно, тогда и заключение будет истинным, однако формальные науки не обеспечивают выводимости утверждений о свойствах объектов, которых не было в посылках. Для того чтобы оценить убедительность аргументации субъективистов в контексте достижения ими объективистских результатов на основе теоремы Бернулли с точки зрения сторонников частотной интерпретации, мы сформулируем требования к получению убедительных результатов в частотной интерпретации. Известно, что частотная интерпретация является эмпирической, и в этой традиции применение математики не начинается с чистого листа. Так, согласно эмпирической концепции, применению математики предшествует убедительное экспериментальное определение некоторого свойства A изучаемого объекта X [9]. Далее, если объекты X и Y связаны посредством удачно подобранного математического оператора F, тогда в определенных случаях объект Y: Y = F(X) обладает тем же самым свойством A. Применительно к теореме Бернулли это означает, что если вероятность p(A) изучаемого события A получена на основе устойчивых частотных характеристик и поэтому является объективной, тогда и заключение теоремы, которое определяет вероятность близости частотных характеристик события A и его вероятности p(A), тоже имеет объективный характер. Таким образом, с точки зрения представителей частотной интерпретации, стратегия субъективистов, направленная на получение итоговых объективных вероятностей на основе применения теоремы, в которой теоретическая вероятность известна заранее или представляет собой степень уверенности, оказывается несостоятельной. Более того, возникает следующий вопрос: «А имели ли субъективисты право применять теорему с точки зрения частотного подхода?» Корректное применение формальных результатов в частотной интерпретации основано на учете базовых положений эмпиризма. В этой интерпретации имеет место доминирование эмпирических величин над теоретическими величинами, при этом последние априори не существуют. Теоретические величины существуют при определенных условиях, в частности, если соответствующие эмпирические величины демонстрируют специальные свойства, а именно, оказываются воспроизводимыми. Роль теоретических величин ограничена в качестве представительства эмпирических величин в формальных науках. Теперь перейдем к вопросу о формальных требованиях к применимости теоремы Бернулли в частотной интерпретации. Для того чтобы применить теорему, необходимо выполнение двух условий. Во-первых, определить теоретическую вероятность исследуемого события A, хотя в теореме она считается заданной, однако в эмпирической традиции теоретические величины неизвестны. Во-вторых, проверить, являются ли результаты наблюдений независимыми несмотря на то, что в теореме Бернулли они считаются независимыми, однако по отношению к конкретным данным это неизвестно, что предполагает формальную проверку их независимости. В математической статистике изучают теоретические методы оценивания неизвестной вероятности события на основе ее частотных характеристик. Для некоторых ситуаций адекватен экспериментальный подход, например для определения искомой вероятности применительно к случайным процессам с неизменяющимися вероятностями, в частности для оценивания вероятности на основе результатов испытаний, связанных с теоремой Бернулли. Эти результаты представляют реализацию события, происходящего с одной и той же постоянной вероятностью, поэтому естественно полагать, что при большом числе испытаний частотные характеристики этого события оказываются маловариабельными и близкими друг другу по величине. Тогда, взяв в качестве вероятности одну из частот, получим, что требование Колмогорова о близости вероятности события и его частотных характеристик выполняется геометрически. Теперь обратимся к верификации независимости результатов экспериментов, которая необходима для использования теоремы Бернулли. Однако сначала приведем необходимые определения, относящиеся к независимости. Определение независимости для двух событий. Два события A и B независимы, если условная вероятность события A при условии B равна безусловной вероятности события A: PA / B) = P(A). (2) Обычно утверждение (2) записывают следующим образом: P(A П B) = P(A) x P(B). (3) Отметим, что если формула (2) некорректна, когда P(B) = 0, то формула (3) свободна от этого недостатка. Для произвольного числа n событий Aj, A2, ..., An условие для их независимости имеет следующий вид [1]: PAiAiAa .Aim) = P(An) x PA) x PA) x ... x P(Aim); (4) m = 1, 2, ..., n; 1 < i\\ < i2 < i3 < ... < im < n. Отметим, что понятие независимости часто используется в теории вероятностей, так как ее применение чрезвычайно упрощает вычисления, однако формальную верификацию независимости сложно осуществить. Легко подсчитать, что для проверки независимости n событий общее число проверяемых комбинаций вероятностей равно 2n - n - 1, а чтобы их осуществить, необходимо знать 2n - 1 вероятностей. Так как в реальных приложениях чаще используется не теория вероятностей, а математическая статистика, поэтому уместно остановиться на исследовании независимости в рамках последней дисциплины. Как известно, в математической статистике нет унифицированного определения независимости, проверка независимости носит контекстуальный характер. Так, например, если исследуемые случайные величины имеют нормальное распределение, тогда подходит верификация независимости с помощью коэффициента корреляции. Если две случайные величины имеют произвольное общее известное распределение, тогда для проверки их независимости адекватен критерий Пирсона %2 [10]. На первый взгляд, он подходит и для верификации независимости результатов испытаний, относящихся к теореме Бернулли, так как вполне допустимо считать, что результаты бросания монеты, представляющие собой последовательность гербов и решек, имеют биномиальное распределение. Однако критерий Пирсона проверяет независимость для двух случайных величин, представленных двумя группами данных, в то время как результаты эксперимента, связанного с теоремой Бернулли, представляют собой одну последовательность гербов и решек и фактически относятся к одной случайной величине. Возникает вопрос: «Как правильно выбрать две группы данных?» На основе содержательного анализа это невозможно выполнить, и в то же время для такого рода ситуаций не разработаны и обоснованные стандартные формальные правила выделения подпоследовательностей, поэтому критерий Пирсона не подходит. Мы не будем сейчас останавливаться на применении нестандартных подходов проверки независимости, отметим, что совсем непросто осуществить верификацию независимости. В связи с трудностями верификации возникает естественный вопрос: «Почему не ограничиться содержательными, интуитивными подходами при принятии независимости?» Ответ был дан в интересной работе Эльясберга, в которой приведен пример, иллюстрирующий принципиальное различие между независимостью и минимальной связанностью [11]. Для дальнейшего изложения определим неформально несколько необходимых понятий, относящихся к математической статистике. Распределение случайной величины -это переменная, принимающая некоторые значения с определенными вероятностями. Коэффициент парной корреляции - это мера связи случайных величин. Дисперсия - это оценка вариабельности случайных величин. Пусть даны два множества случайных величин, мощность каждого равна тысяче, в первом множестве коэффициент парной корреляции равен 0,01, а во втором нулю, т.е. в последнем случайные величины независимы. Затем для каждого множества случайных величин вычисляется их сумма, и, наконец, для каждой полученной суммы вычисляется дисперсия. В результате оказывается, что дисперсия для суммы независимых величин на порядок меньше дисперсии слабозависимых величин [11], а если взять множества мощности 10 000, тогда дисперсии будут отличаться на два порядка. Данный пример наглядно объясняет, что использование множеств независимых случайных величин должно быть обосновано, особенно в случае их большой мощности. После анализа условий применения теоремы в частотной интерпретации и описания принципиальных трудностей, возникающих при верификации этих условий, возвращаемся к требованиям о применимости математики в субъективистской интерпретации. В ней существует единственное требование к применению, а именно, вероятности изучаемых событий должны соответствовать аксиоматике теории вероятностей, в то же время определение вероятностей и верификация независимости не являются обязательными, так как они считаются известными априори. Теперь у нас имеются основания для анализа критики условия Колмогорова субъективистами. Во-первых, на основе теоремы Бернулли, в контексте требований к применению математики в частотной интерпретации, субъективисты не только не могут получить гарантированные объективные результаты, но и даже просто приемлемые. Во-вторых, стиль применения теории вероятностей субъективистами, с точки зрения условий к применению математики в частотном подходе, не является легитимным. И более общий вывод: в целом критика субъективистами на основе применения теоремы Бернулли результатов, полученных в частотной интерпретации, оказывается несостоятельной. Итак, требование Колмогорова оказывается вне критики на основе применения субъективистской интерпретации. В связи с этим возникает естественный вопрос о корректности условия Колмогорова в рамках частотной интерпретации. Будем полагать, что на основе анализа проведенных экспериментов были определены частотные характеристики выпадения гербов, и они оказались устойчивыми, тем самым была определена теоретическая вероятность успеха, рассматриваемая в теореме. Кроме того, предположим, что на основе верификации было показано, что результаты экспериментов являются независимыми, и в этом случае применение теоремы оказывается легитимным. Тогда возникает вопрос: «Выводимо ли требование Колмогорова на основе обоснованного применения теоремы Бернулли?» Будем исходить из замечания Колмогорова о том, что в контексте приложений он в целом следует Мизесу [1]. Поэтому уместно напомнить определение теоретической вероятности у Мизеса. По Мизесу, теоретическая вероятность определяется как предел бесконечной сходящейся последовательности частот [8]. В реалистичном финитном варианте частотного подхода вероятность определяется на основе устойчивости частот, в этом случае вероятность - это центр сгущения частот, и близость вероятности и частот определяется геометрически, а не по вероятности. Отметим, что тогда требование Колмогорова оказывается следствием устойчивости частот, при этом устойчивость не следует ни из какой теоремы, а отражает характерную черту данных, относящихся к исследуемому феномену. Таким образом, условие Колмогорова является не заключением теоремы Бернулли, а предпосылкой применения теоремы в частотной интерпретации. Фактически мы получили, что требование Колмогорова не оказывается избыточным. Существуют ли теперь какие-либо основания полагать, что Колмогоров мог ошибиться? Так, Шейфер и Вовк писали, что Колмогоров мог ошибаться, так как он никогда не отвечал на критику оппонентов [4]. Мы считаем, что он не отвечал на критику по прагматическим соображениям. Кроме того, историки отмечали, что отчасти ссылка на Мизеса была вызвана соображениями политкорректности [3]. В связи с последним критическим аргументом приведем два соображения. Во-первых, если условие Колмогорова сформулировано подлинным сторонником интерпретации Мизеса, тогда для критики нет никаких оснований. Во-вторых, А.Н. Колмогоров оказывается вне критики в той степени, в которой он в период времени от написания своей книги до принятия аксиоматики являлся сторонником эмпирической теории вероятностей. Заключение В работе показана значимость исследований условий применимости математики не только для ее корректного использования, но и применительно к методологическим проблемам, связанным с определением места математики в ее приложениях. На примере теоремы Бернулли показано, что основные сложности ее корректного применения вызваны верификацией независимости данных, к которым предлагается применить теорему. По нашему мнению, представляет значимость разработка понятия независимости как на общенаучном, так и категориальном уровне. Отсутствие такого рода результатов, как справедливо отмечал Колмогоров, тормозит развитие математики, в частности теории вероятностей. Кроме того, бесспорно, что понятие независимости представляет интерес и для философии, в частности, в контексте исследований онтологии, проблемы свободы воли и др. В известной литературе эта тема практически не представлена за исключением некоторых работ Ю.В. Сачкова [12].
Колмогоров А.Н. Основные понятия теории вероятностей. М. : Наука, 1974. 120 с.
Колмогоров А.Н. Теория вероятностей // Математика, ее содержание, методы и значение. Т. 2. М. : Изд-во Академии наук СССР, 1956. 397 c.
Shafer G., Vovk V. The Sources of Kolmogorov's Grundbegriffe // Statistical Science. 2006. Vol. 21, № 1. P. 70-98. DOI 10.1214/088342305000000467
Shafer G., Vovk V. Probability and Finance It's Only a Game! New York : A Wiley-Interscience Publication, 2001. 414 p.
Кайберг Г. Вероятность и индуктивная логика. М. : Прогресс, 1978. 375 с.
Shafer G. The Significance of Jacob Bernoulli's Ars Conjectandi for the Philosophy of Probability Today // Journal of econometrics. 1996. Vol. 75, № 1. P. 15-32. DOI 10.1016/0304-4076(95)01766-6
Бернулли Я. О законе больших чисел. М. : Наука, 1986. 175 с.
Mises R. Mathematical theory of probability and statistics. New York : Academic Press, 1964. 694 p.
Алимов Ю.И. Альтернатива методу математической статистики. М. : Знание, 1980. 64 с.
Крамер Г. Математические методы статистики. М. : Мир, 1975. 648 с.
Эльясберг П.Е. Вычислительная информация. Сколько ее нужно? Как обрабатывать? М. : Наука, 1983. 208 с.
Сачков Ю.В. Вероятностная революция в науке (Вероятность, случайность, независимость, иерархия). М. : Научный мир, 1999. 144 с.