В работе рассматривается квантильная модель накопления для описанияколичественных закономерностей, присущих численностям населения территорий. Приводятся примеры применения этой модели при исследованиизакономерностей численностей населения по территориям США и Российской Федерации. Результаты исследований во многом подтверждают целесообразность применения логнормального закона при описании распределения численности населения.
Laws of populations formation on territories..pdf В рамках квантильной модели величины численности населения территорийформируются путём последовательного накопления под влиянием разнообразныхфакторов, которые и определяют их величину. Предполагается, что рассматриваемая вероятностно-статистическая модель формирования величины численности населения трактует итоговые их значения для каждой территории (регионы-----, области, районы, штаты) в отчётное время как величины, соответствующие квантилям xk , k =1,N, равноотстоящих уровней pk некоторой заданной функциираспределения F(x), xЎф R1 [1]. При этомF(xk ) = pk , k = 1, N , следовательно1 ( )xk F pk = − , k = 1, N .Для равноотстоящих уровней выполняется условие11pk pk N - − = , k = 1, N .Каждой территории соответствует единственная квантиль xk уровня pk , N - количество выделенных территорий.1. Логнормальная модельВведём следующие обозначения: j qk - численность населения k-й территории, сформированное в течение j-го периода, j Qk - величина населения k-й территории, сформированная к некоторому моменту или периоду j, то естьj 1 2 ... j Qk = qk - qk - - qk , k = 1, N . (1)При этом выполняются следующие неравенства: 1 2 ... j j j q > q > > qN , k = 1, N . (2)1 2 ... L Qk < Qk < < Qk , k = 1, N . (3)Закономерности формирования численности населения по территориям 81Рассмотрим модель накопления растущей системы видаj 1 j j ( j ), Qk Qk zk gk Qk - = - k = 1, N , (4)где j zk - независимые по j, неотрицательные, одинаково распределённые случайные величины, gk ( x) , k =1,N, - некоторые функции, которые будут выбиратьсясогласно определённому механизму накопления. Полагая, например, gk ( x) = Ґбx, Ґб > 0, x > 0, мы переходим к механизму накопления, характерному для законароста кристаллов. Другими словами, в данном случае предполагается, что численность населения определённой территории в каждом периоде пропорционально зависит от численности населения в предшествующем периоде.Заметим, что при x > 0 для сохранения приоритетов (2), (3), должны выполняться условияg1 ( x) > g2 ( x) > ... > gN ( x) и gk ( x) > 0 , k =1,N.При одинаковом механизме накопления в различных территориях функцииgk ( x) от номера k не зависят, поэтому можно положить в данном случаеgk ( x) = g ( x) , где g ( x) - монотонная возрастающая функция. При этом полагаем, что отношение приоритетности выполняется в среднем.Данная модель, как было показано в работе [2], тесно связана с законом Кептейна, имеющего плотность распределения( ) ( )( ) 2 ( )221 ( ) , , , exp ( )2 2 DG x a dG x K G x I x P VG dx ⎛ − ⎞Ґб Ґт = ⎜ − ⎟Ґт Ґр ςЎф ⎝ Ґт ⎠, (5)( )( )0xxG x du g u = Ўт . (6)Заметим, что если случайная величина х распределена по закону Кептейна с параметрами (Ґб,Ґт2 ) , то G(x) распределена по нормальному закону с теми же параметрами (Ґб,Ґт2 ) . В частном случае, при подстановке g(x) = Ґбx, Ґб > 0, x > 0, в формулу (6)0G(x) 1 ln x x ⎛ ⎞= ⎜ ⎟ Ґб ⎝ ⎠. (7)Подставляя выражение для G(x) в формулу (5), получим плотность распределения логнормального закона [2].Значит, в рамках исследуемой модели накопления (1) можно предположить, что величины сформированных численностей населения различных территорийраспределены приблизительно логнормально. Как известно, значения логнормально распределённой случайной величины формируется под воздействиембольшого числа независимых факторов, причём воздействие каждого факторамультипликативно по своему характеру [3]. Выберем класс сдвиг-масштабногосемейства, т.е.( , , ) 0 k k QF Q F ⎛ −Ґм ⎞ Ґм Ґт = ⎜ ⎟ ⎝ Ґт ⎠, 82 А.В. Талейкогде Ґм - параметр сдвига, σ - параметр масштаба. Пусть Qk , k =1,N, - численностьнаселения территории под номером k. Предположим, что величины Qk имеютлогнормальное распределение, при этом случайная величина G(Qk ) = ln(Qk ) имеет нормальную функцию распределения Ф(x) c некоторым средним Ґм и стандартным отклонением Ґт. Обозначим Q(k ) , k =1,N, упорядоченные по убыванию численности населения, т.е. Q(N) < Q(N−1) < ... < Q(1) . Тогда, опираясь на выводы, сделанные в работе [4], можно записать, что ln ( )1kkQ k N ⎛ − Ґм ⎞ҐХ⎜ ⎟ = - Ґе ⎝ Ґт ⎠ ; (8)1ln ( )k 1 k k k Q k e x e N = Ґм -ҐХ− ⎛⎜ ⎞⎟ - = Ґм - Ґт - ⎝ - ⎠, (9)где xk − квантили нормального распределения с нулевым математическим ожиданием и единичной дисперсией, Ґеk − ошибки наблюдений с нулевым средним и конечной дисперсией.2. Адекватность моделиПроверим, применима ли данная модель при исследовании распределениячисленности населения. Для этого построим для конкретных территорий диаграмму рассеяния и оценим сумму квадратов невязок. Отложим на оси абсциссквантили, а на оси ординат численности населения территорий. В результате получим диаграмму рассеяния N точек, которые мы аппроксимируем с помощьюметода наименьших квадратов прямой P(t) = Ґм - Ґтt . «Близость» расположенияточек к прямой линии характеризует сумма квадратов невязок. Таким образом, на графике будет представлена картина того, как прямая, заданная двумя параметрами, наилучшим образом (в смысле суммы квадратов невязок) аппроксимирует наблюдаемые значения. Очевидно, что чем ближе точки будут располагаться возлепрямой, тем ближе распределение величин численности населения к логнормальному закону распределения.Рассмотрим распределение численности населения Российской Федерации по территориям. Численность населения каждого из 85 субъектов будет соответствовать определённой ячейке накопления. В соответствии с моделью накопленияупорядочим численности населения за 2008 г. и построим диаграмму рассеяния[3]. На оси абсцисс отложим 85 известных значений квантилей стандартного нормального закона. Ось ординат будет соответствовать данным о логарифмах численности населения территорий.На рис. 1, в целом, отклонение наблюдаемых значений от теоретических невелико. Однако нижние 3 точки выбиваются из общей картины. Эти точки соответствуют следующим субъектам: Усть-Ордынскому Бурятскому АО, Чукотскому АО и Агинскому Бурятскому АО. Если включить перечисленные автономныеокруга в более крупные субъекты РФ, примыкающие к ним, то получим значительно меньшее отклонение (рис. 2).Закономерности формирования численности населения по территориям 83−4 −2 0 2 41012141618yiP t ( )xi, t −4 −2 0 2 41012141618xi, t yi P t ( )Рис. 1. Распределение численностинаселения РФ по 85 субъектамРис. 2. Распределение численностинаселения РФ по 82 субъектамДля вычисления суммы квадратов невязок используем формулу( )21ˆNi i i STD y y =ҐТ − , где yi - исходные наблюдения (т.е. значения численности населения), yˆi - теоретические значения [4]. В первом случае отклонение составило STD1 = 0,409, во втором - STD2 = 0,074. Таким образом, отклонение уменьшилось почти на порядок.3. Иллюстративные примерыРассмотрим другие примеры применения квантильной модели и логнормального закона. Используя данные 2002 г., исследуем распределение численности населения в Российской Федерации. В началедвухтысячных годов территория России была разделена на 7 федеральных округов: Центральный, Северо-Западный, Приволжский, Южный, Сибирский, Дальневосточный. В данном случае рассматривается каждый регион (округ) и субъекты, их составляющие (области, края, республики). На численность проживающих граждан влияют, в частности, исторические, социальноэкономические, демографические, природно-климатические факторы. В качестве«ячеек накопления» здесь будут выступатьсубъекты, и каждой ячейке будет соответствовать своя численность населения. На рис. 3 представлена картина распределениячисленности населения Российской Федерации в соответствии с разбиением территории на федеральные округа.−2 −1 0 1 215161718xi, t yi P t ( )Рис. 3. Распределения численности населения РФ в соответствии с разбиениемтерритории на 7 федеральных округов84 А.В. ТалейкоКак видно из рис. 3, точки располагаются в непосредственной близости прямой, и отклонение не является слишком заметным. Этот факт говорит о том, что, хотя разбиение территории и носит административный характер, однако, судя по всему, оно хорошо вписывается в рассматриваемую нами модель, то есть является вполне адекватным.Однако всё это были случаи, зафиксированные в одном временном интервале.Что же будет происходить, если рассмотреть процесс размещения населения в динамике- Возьмём случай распределения численности населения США по 49 штатам (исключив из рассмотрения Аляску, Гавайи в силу их специфического географического положения) в длительном отрезке времени, начиная с 1930 г. и до нашего времени. Построим диаграммы рассеяния для 1930, 1960 и 2005 гг. (рис. 4- 6). Стандартные отклонения будут следующими (представлены в хронологическом порядке) STD4 = 0,104, STD5 = 0,047, STD6 = 0,031.−3 −2 −1 0 1 2 3101214161812131415161718yiP(а,t)−3 −2 −1 0 1 2 3t, xi t, xi yi P(а,t)Рис. 4. Распределение численностинаселения США в 1930 г. по штатамРис. 5. Распределение численностинаселения США в 1960 г. по штатам12131415161718−3 −2 −1 0 1 2 3t, xi yi P(а,t)Рис. 6. Распределение численности населенияСША в 2005 г. по штатамЗакономерности формирования численности населения по территориям 85Таким образом, мы видим, что с течением времени стандартное отклоненийуменьшается. И, несмотря на то, что в отдельные годы могло наблюдаться небольшое увеличение значения невязок, в целом тенденция к уменьшению прослеживается отчётливо.Т а б л и ц а 1Изменение суммы квадратов невязок с течением времениГод Сумма квадратов невязок1930 0,1041940 0,1011950 0,0661960 0,0471970 0,0461980 0,0511990 0,0362000 0,032Т а б л и ц а 2Изменение рангов пяти крупнейших штатовШтат Ранг в 1930 г. Ранг в 1960 г. Ранг в 1990 г.New York 1 1 2Pennsylvania 2 3 5Illinois 3 4 6Ohio 4 5 7Texas 5 6 3Во всех штатах в течение всего анализируемого периода происходит увеличение численности населения, при этом если проранжировать штаты по убываниючисленности от 1 до 49, то с течением времени ранги большинства штатов будутменять свои значения (табл. 2), следовательно, изменение рангов обуславливаетсяразличной скоростью прироста населения. Поскольку сумма квадратов невязокимеет тенденцию к уменьшению своего значения, то можно предположить, что с течением времени вся совокупность населения, разбитая по отдельным территориям, становится, в некотором смысле, более «природной», в смысле более адекватного описания логнормальной моделью распределения численности населения.ЗаключениеПрименение квантильной модели и логнормального закона распределения для описания рассматриваемых процессов формирования численности населения(тесно связанных с миграционным движением населения) по территориям, как страны в целом, так и одного отдельно взятого субъекта, вполне целесообразно.С другой стороны, исследования показали, что в странах Европы, равно как и в других развитых странах, логнормальный закон описывает распределение численности населения лучше, чем в странах с ещё не устоявшейся рыночной экономикой или в странах с очевидным жёстким административным делением территорий. Вполне возможно, что с течением времени эти территориальные единицы(которые мы с полным правом можем назвать ячейками накопления) образуют86 А.В. Талейкодействительно природную совокупность, которая будет лучше описываться рассмотренной квантильной моделью.
Магнус Я.Р. Эконометрика. Начальный курс: Учебник. 4-е изд. М.: Дело, 2005. 400 с.
Федеральная служба государственной статистики [Электроный ресурс]. URL: http:/www.gks.ru/, свободный.
Айвазян С.А. Модель формирования распределения населения России по величине среднедушевого дохода // Экономика и математические методы. 1997. Т. 32. Вып. 4. С. 75 -88
Алексеев Ф.Н., Устинов Ю.К. Вероятностная теория формирования запасов полезных ископаемых // Непараметрические и робастные статистические методы в кибернетике и информатике / под ред. Ф.П. Тарасенко. Томск: Иркут. фил. ВМНИИПС и др., 1990. С. 32 − 42.
Дмитриев Ю.Г., Устинов -Ю.К. Математические модели растущих систем // Вычислительные технологии. 2007. Т. 12. С. 68 − 75.