Применение кластерного анализа для оценки температурно-влажностных условий в периодактивной вегетации на территории юга Западной Сибири и его связь с гидротермическим коэффициентом Т.Г. Селянинова | Вестн. Том. гос. ун-та. 2012. № 360.

Применение кластерного анализа для оценки температурно-влажностных условий в периодактивной вегетации на территории юга Западной Сибири и его связь с гидротермическим коэффициентом Т.Г. Селянинова

Для решения задач оценки территории была проведена автоматическая систематизация средних значений полей гидротермического коэффициента Селянинова с применением иерархического кластерного анализа. Проведена статистическая оценка полученных классов с применением критерия качества, которая в последующем была подтверждена физическим смыслом классификации.

Use of cluster analysis for assessing heat and moisture during active vegetationin south of Western Siberia and its relation to T.G. Selyaninov hydrothermal coefficient.pdf Научные подразделения Росгидромета считают,что продовольственная безопасность России в бли-жайшие десятилетия будет зависеть от темпов и на-правленности усиливающегося процесса глобальныхизменений климата. В данной связи действующая па-радигма постоянства климата стала явно нереали-стичной. Температурно-влажностный режим террито-рии юга Западной Сибири является неотъемлемойчастью общего климатического комплекса, анализкоторого представляется не только актуальным, но истратегически важными для аграрного комплексастраны. Для России оценка состояния климатическихресурсов была выполнена в ряде работ разными авто-рами с нескольких разных точек зрения [1. С. 247].Одним из основных выводов отдельных работ [2.С. 183] является заключение о том, что сельское хо-зяйство России имеет большие возможности для раз-вития благодаря корректному использованию своегобиоклиматического потенциала. Агроклиматическийпотенциал весьма полно учитывается в сельскохозяй-ственном производстве ведущих стран, однако длянашей страны представляет собой нереализованныйрезерв развития (по некоторым оценкам, до 30%).Данное исследование позволяет рассмотреть тема-тику районирования территории на более современномуровне, основа которой опирается на автоматическуюсистематизацию полученных данных и служит сле-дующим этапом развития методики оценки территории[3. С. 136].Климатическое районирование территории - оченьсложная и неоднозначная задача исследования, в кото-рую входит принцип определения и построения зонохвата. В условиях современного изменения климатааграрные предприятия Западной Сибири заинтересова-ны в поиске современной методики оценки агроклима-тических условий и решения проблем районирования, споследующим оптимизированием используемых аг-роклиматических ресурсов.Методика кластерного анализа активно разраба-тывается и используется для анализа данных ужедавно. Существует литература, описывающая раз-личные варианты методов кластерного анализа (на-пример, [4. С. 119]). Однако большие массивы дан-ных стало возможным обрабатывать и, следователь-но, получать статистически значимые результатытолько с появлением быстродействующих и совре-менных ЭВМ. Методика кластерного анализа позво-ляет выделить из множества объектов такие, которыеимели бы какие-либо близкие свойства, поэтому кла-стерный анализ носит также название классифика-ции. Для решения приведенных целей ставится зада-ча исследования температурно-влажностных условийтерритории с помощью кластерного анализа, кото-рый позволяет выполнить объективную системати-зацию.Кластерный анализ, а именно иерархическая клас-сификация, получил широкое применение в развитииавтоматических классификаций метеорологическихполей и синоптических процессов [5. С. 7]. Расчетнаячасть анализа уже не является трудоёмкой, потому какпроизводится в автоматическом режиме [7. C. 38]. Напервое место выходит проблема корректной интерпре-тации полученных результатов [6. C. 44].В данной работе классификации подверглись полясредних значений ГТК (гидротермический коэффици-ент Селянинова) над территорией юга Западной Си-бири как индикатор температурно-влажностного ре-жима и изменчивости климата. Была проведена стати-стическая оценка полученных классов с применениемкритерия качества, которая в последующем отвечалафизическому смыслу классификации ГТК, представ-ленного как критерий оценки температурно-влаж-ностных условий территории исследования в периодактивной вегетации.Исходные материалы. Для исследования быласформирована база данных компонентов индекса ГТК,а именно сумм активных температур и сумм атмосфер-ных осадков в фазу активной вегетации (Т ≥ 10°С) за51-летний период наблюдений (1960-2010 гг.). Полу-ченные компоненты были применены для расчета ин-декса ГТК с последующим осреднением по исследуе-мым станциям. Для устранения влияния пространст-венной неоднородности местоположения метеорологи-ческих станций проводилась пространственная интер-поляция рассчитанных средних годовых значений ве-личин на регулярной сетке 1.1° по алгоритму Край-гинга. Пространственные значения индекса ГТК под-верглись кластеризации с последующим получениемвариантов классификации. После завершения процедурклассификации была проведена статистическая оценказначимости полученных классов с использованием ме-ры качества классификации, которую принято называтькритерием качества. Критерием качества классов вданной работе выступала суммарная внутриклассоваядисперсия (F3).Расчет проводился по данным станций междуна-родного обмена (ВНИИГМИ-МЦД): Омск, Барабинск,Барнаул, Рубцовск, Красноярск, Минусинск, Томск,Колпашево, Тобольск, Екатеринбург, Курган, Ени-сейск, Тара, Петропавловск, Кустанай, Астана и Ир-тышск (рис. 1).Обзор территории исследования. Территория ис-следования представляется в виде сетки от центрально-го Предуралья до Енисея (50-60° с.ш. и 60-95° в.д.).Привлечение станций Урала и Казахстана использова-лись для улучшения точности результатов интерполя-ции, проводимой в данном исследовании (т.е. в качест-ве граничных условий).Географически данный регион, по большему счету,представляет собой юг Западной Сибири, который покраям граничит: на юге с Казахским мелкосопочником(200-500 м над ур. м.), на востоке и юго-востоке с Куз-нецким Алатау (1000-2000 м над ур. м.), а на западе сгорами Урала (500-1000 м над ур. м.). Юг ЗападнойСибири представляет собой плоскую равнину, котораяподнимается над уровнем моря всего на 50-250 м, нозначительно удалена от ближайшего океана - болеечем на полторы тысячи километров.Рис. 1. Исследуемая территория юга Западной Сибири и северо-востока КазахстанаМетодика кластерного анализа. В [8. С. 117]предложено использовать для кластеризации методакреции (bump hunting) и k-средних (k-mean). Инымисловами, проводится поиск такого разбиения на клас-сы, при котором дисперсия разбиения максимальна длязаданного числа классов. Излагать эти методы здесь неимеет смысла, потому как они имеют небольшие не-достатки, связанные с тем, что приходится задаватьчисло классов, а на данном этапе исследования мы незнаем точного числа выделяемых изначально классов.Кроме того, с помощью данных методов мы не можемполучить структурированные данные от более к менееобщим особенностям. Поэтому для анализа данныхбыл применен другой метод. Одним из наиболее гиб-ких и информативных методов кластеризации являетсяметод восходящей иерархической классификации. Под-робно иерархическая классификация излагается в [4.С. 77], ниже приводится краткое изложение модифици-рованного алгоритма, используемого в данной работе.Алгоритм строится из последовательных шагов:1. На начальном этапе в имеющейся пространствен-ной выборке, состоящей из полей средних значений ин-декса ГТК по исследуемым станциям, отождествим ка-ждую из них в отдельный класс. Такие классы, состоя-щие из единственного поля, называются начальными.Значения поля можно рассматривать как векторы в евк-лидовом пространстве. Общее число рассматриваемыхвекторов равно количеству полей в выборке N, т.е. ко-личеству рассматриваемых станций (17 станций).2. Для проведения классификации получим квад-ратную матрицу взаимных расстояний между всеминачальными классами с размерностью N . N. Это сде-лать легко, поскольку каждый начальный класс содер-жит единственный вектор. Существует несколько спо-собов получения расстояний между векторами в зави-симости от задач классификации и анализируемыхданных. Представляется естественным использованиеформулы евклидовой метрикиv w2 ,mij ik jkk id x x { vwгде dij - расстояние между i-м и j-м объектом; xik, xjk -значение k-й переменной у i-го и j-го объектов.3. Идея кластерного анализа заключается в после-довательном объединении близких по каким-либо при-знакам кластеров, при котором строится бинарное «пе-ревернутое дерево» иерархии классов. Критерием бли-зости классов в данной работе, как и в работе [6. C. 40],был использован метод Уорда (Ward's method), в неко-торых источниках он встречается под названием мето-да Варда. Из практического применения статистики(см., например, [4. С. 119]) известно, что сумма дис-персий зависимых случайных величин, под которыми внашем случае понимается евклидова метрика, необхо-димо на каждом шаге объединять такие два класса,которые дают наименьшее увеличение дисперсии раз-биения на каждом шаге. Данный метод предполагает,что на первом шаге каждый кластер состоит из одногообъекта, и первоначально объединяются два ближай-ших кластера. Для них определяются средние значениякаждого признака и рассчитывается сумма квадратовотклонений Vk:V x x { (2)где k - номер кластера; i - номер объекта; j - номер при-знака; р - количество признаков, характеризующих каж-дый объект; mk - количество объектов в k-м кластере.Таким образом, поля средних значений индексаГТК будут близки между собой и по структуре, по-скольку будут иметь большие значения пространствен-ной корреляции. В дальнейшем на каждом шаге работыалгоритма объединяются те объекты или кластеры,которые дают наименьшее приращение величины Vk.Метод Уорда приводит к образованию кластеров при-близительно равных размеров с минимальной внутри-классовой вариацией. В итоге все объекты оказываютсяобъединенными в один кластер.4. На данном этапе получаем информацию о количе-стве полей, попавших в каждый класс. Эту информациюнетрудно получить, используя спуск по полученномубинарному дереву (дендрограмме). Более того, прием-ники каждого класса позволяют получить информациюо том, какие именно поля составляют данный класс.Заслуживает внимания проблема интерпретация по-лученных результатов. Самый верхний класс, завер-шающий иерархию, будет идентичен среднему всейвыборки, что ясно из процедуры его получения.При спуске по ветвям дендрограммы будут выде-ляться все более тонкие и детальные структуры, свой-ственные климатическим особенностям.Однако начиная с некоторого уровня данные струк-туры уже не будут значимыми как физически, так истатистически.По дендрограмме визуально можно определить раз-ницу между уровнями объединения. Уровнем будемсчитать очередной шаг алгоритма, на котором проис-ходит объединение кластеров. Наибольшая разница пооси расстояний между соседними уровнями указываетна предпочтительное число классов (соответствующееуровню, от которого осуществляется переход к после-дующему). Этот подход возможно использовать в ус-ловиях данного исследования, потому как имеется не-большое количество объектов и выражается структураданных, но для корректности воспользуемся проверкойна качество.Результаты кластерного анализа. Напомним, чтоосновной задачей построения классификации являлосьопределение классов [9. С. 50]. В ходе визуальнойоценки было выяснено, что с помощью иерархическогокластерного анализа предпочтительней использоватьделение на три класса. Результаты деления на кластерыдля территории юга Западной Сибири представлены нарис. 2 в виде дендрограмм.Рис. 2. Дендрограммы иерархического кластерного анализа территории юга Западной Сибирина основе метода Уорда за период с 1960 по 2010 г.При анализе рис. 2 можно сказать, что у бинарногодерева классов выделяются три основные ветви. Ещена нижних ярусах они вобрали в себя значительнуючасть объектов. В первую группу попадают станции:Колпашево, Тобольск, Томск, Тара, Красноярск, Ени-сейск и Екатеринбург; во вторую - Петропавловск,Курган, Минусинск, Барнаул, Омск и Барабинск, а втретью - Рубцовск, Иртышск, Кустанай и Астана.Сравним полученную классификацию со среднимизначениями ГТК по станциям за период исследования,где за физический смысл обоснования используетсяшкала классификации уровней тепловлагообеспечен-ности по значениям ГТК. Результаты cравнения фор-мальной классификации и классификации уровнейтепловлагообеспеченности по значениям ГТК пред-ставлены в таблице.Рассматривая таблицу, можно сказать, что визуаль-но наблюдаетсятий - недостаточного. Представим полученные классыв пространстве и сравним их с распределением ГТК.Результаты формальной классификации представленына рис. 3.Сравнение классификации кластерного анализа (класс) и классификации уровней тепловлагообеспеченностипо средним значениям ГТК, приведенной для территории юга Западной СибириСтанции ГТКсред Класс Станции ГТКсред КлассБарабинск 1,01 2 Красноярск 1,53 1Барнаул 1,02 2 Тара 1,46 1Минусинск 1,22 2 Тобольск 1,57 1Омск 1,13 2 Томск 1,52 1Курган 1,04 2 Астана 0,71 3Петропавловск 1,04 2 Иртышск 0,72 3Екатеринбург 1,63 1 Кустанай 0,84 3Енисейск 1,51 1Колпашево 1,82 1 Рубцовск 0,83 3абРис. 3. Результаты формальной классификации (1960-2010 гг.): а - пространственное изменение индекса ГТКпо территории юга Западной Сибири; б - пространственное распределение классовпо территории юга Западной СибириПри анализе рис. 3 можно сказать, что на террито-рии исследования прослеживается зональное распреде-ление индекса ГТК (см. рис. 3, а). В среднем за периодисследования наибольшие значения индекса ГТК при-ходятся на районы ст. Екатеринбург, Тобольск, Колпа-шево, Томск, Красноярск и Енисейск (1,4-1,8). Наи-меньшие значения ГТК (слабой засушливости) за веге-тационный период приходятся на районы ст. Астана иИртышск (< 0,75) Наиболее благоприятные условияприходятся на районы ст. Курган, Омск, Барабинск,Барнаул и Минусинск (1-1,4).Из рис. 3, б видно, что в пространстве классы полу-чили широтное распределение без каких либо «остро-вов», данная картина соответствует распределениюиндекса ГТК по территории.При рассмотрении рис. 3, а можно сказать, что в со-временных климатических условиях на территории югаЗападной Сибири за период исследования пространст-венное распределение ГТК отражает увеличение кон-тинентальности и засушливости с северо-востока наюго-запад. В целом за период активной вегетации не-достаток увлажнения (ГТК < 1) отмечается южнее«пояса» Барнаул - Барабинск - Курган.Нормальное увлажнение (1,0 < ГТК ≤ 1,4) на терри-тории исследования реже всего отмечается на юго-западе. По мере продвижения на северо-восток условияоптимального тепловлагообеспечения занимают терри-торию в виде «пояса» Минусинск - Барнаул - Омск -Курган. Условия переувлажнения (ГТК < 1,4) наблюда-ются на севере и северо-востоке юга Западной Сибири.Засушливые условия (ГТК < 0,8) отмечаются на юго-западе территории (Рубцовск - Иртышск - Костанай).Этот район считается самым засушливым на территорииюга Западной Сибири, где на фоне высоких температурколичество осадков незначительно.В целом для исследуемой территории Западной Си-бири среднее значение индекса ГТК равно 1,2. Это го-ворит о том, что большая часть территории юга Запад-ной Сибири находится в оптимально благоприятныхусловиях за время активной вегетации.В результате проведенных исследований с помо-щью иерархического кластерного (формального) ана-лиза объективным способом удалось получить научнообоснованную классификацию, хорошо согласую-щуюся с уже известной, физически обоснованнойшкалой классификации ГТК. Кроме того, представ-ленный метод кластерного анализа позволил намсэкономить время расчета и сжать информацию, чтоявляется важным фактором в условиях использованиябольших массивов данных. Кластерный анализ такжеподтверждает то, что шкала классификации ГТК потепловлагообеспеченности имеет статистическуюзначимость и может применятся для объективногорайонирования территории.Важность учета погодно-климатических факторовв сельскохозяйственном производстве однозначна иона еще больше возрастает из-за сокращения числазернопроизводящих экономических районов в Россиив целом и на юге Западной Сибири в частности. Посравнению с СССР продовольственная безопасностьстраны снизилась в два раза [10. С. 161]. В этом от-ношении высокая степень зависимости урожая от по-годно-климатических условий свойственна как зерно-вым, так и техническим и овощным культурам, сено-косным травам.При рассмотрении большинства сценариев измене-ния климата отмечается продолжение потепления (от4°С на конец столетия при жестком сценарии А2, до1,8°С в щадящем сценарии В1). В тех же моделях не-определенность поведения осадков существенно боль-ше, но большинство сценариев дает увеличение осад-ков жидкой фазы для умеренных широт, что можетнеоднозначно отразиться на температурно-влажност-ном режиме в этих широтах. Комплексный показательГТК возможно самостоятельно использовать для моде-лирования аномалий индекса в будущем, используя,соответственно, надежную метеорологическую инфор-мацию. В целом по результатам прогностических оце-нок изменения ГТК можно предположить, что границыагроклиматических поясов, выделяемых по совокупно-сти тепла и влаги, будут претерпевать незначительныеизменения. Вероятнее, что наиболее комфортными вотношении колебаний ГТК будут северные территорииисследования с оптимальными и избыточными усло-виями тепловлагообеспечения. При этом на территори-ях с недостаточными и засушливыми значениями ГТКвозрастет опасность повторяемости засух различныхинтенсивностей.Как это отразится на условиях произрастания сель-скохозяйственных культур, сказать трудно. Условияпроизрастания культур изменяются и методы агротех-ники интенсивно развиваются. Сложившаяся зона рис-кованного земледелия, очевидно, расширится к северу.Если судить только по ГТК, то площади комфортногопроизрастания теплолюбивых культур также расширят-ся на север. Таким образом, в условиях сохранения со-временных тенденций изменения климата юг ЗападнойСибири в ближайшие 100-200 лет имеет все предпосыл-ки к повышению агроклиматического потенциала засчет северных и восточных территорий.

Ключевые слова

тепловлагообеспеченность территории, кластерный анализ, heat and moisture, territory, cluster analysis

Авторы

ФИООрганизацияДополнительноE-mail
Поляков Денис ВикторовичНациональный исследовательский Томский государственный университет; ФГБУ «Томский центр по гидрометеорологии и мониторингу окружающей среды»магистр геолого-географического факультета; синоптик 1-й категории группы метеорологических прогнозовdenissinoptik1988@mail.ru
Кужевская Ирина ВалерьевнаНациональный исследовательский Томский государственный университетдоцент, кандидат географических наук, доцент кафедры метеорологии и климатологии геолого-географического факультетаmeteo@ggf.tsu.ru; ivk@ggf.tsu.ru
Всего: 2

Ссылки

Гордеев А.В. и др. Биоклиматический потенциал России: теория и практика. М. : Товарищество научных изданий КМК, 2006. 508 с.
Гридасов В.Ф. Оценка влагообеспеченности сельского хозяйства с помощью агрогидрологических свойств почв // Труды ВНИИСХМ. 2006. № 35. С. 178-184.
Зоидзе Е.К., Хомякова Т.В. Оценка засушливых явлений в Российской Федерации // Труды ВНИИСХМ. 1993. № 33. С. 133-144.
Жамбю М. Иерархический кластерный анализ и соответствия. М. : Финансы и статистика, 1988. 344 с.
Груза Г.В. О типизации форм циркуляции в умеренных широтах Северного полушария по положению осевой изогипсы ВФЗ на поверхности 500 гПа // Метеорология и гидрология. 1996. № 2. С. 5-12.
Эзау И.Н. Кластерный анализ данных наблюдений и результатов численных экспериментов с моделью ОЦА // Метеорология и гидрология. 1995. № 12. С. 40-53.
Золотокрылин А.Н., Коняев К.В., Эзау И.Н. Сравнение синоптической и формальной классификаций крупномасштабной циркуляции атмосферы Северного полушария // Метеорология и гидрология. 1988. № 12. С. 34-44.
Гмурман В.Е. Теория вероятностей и математическая статистика. М. : Высшая школа, 1977. 479 с.
Зоидзе Е.К. Основы оперативной системы оценки развития засух и опыт ее экспериментальной эксплуатации // Труды ВНИИСХМ. 2002. № 34. С. 48-66.
Кислов А.В. и др. Прогноз климатической ресурсообеспеченности Восточно-Европейской равнины в условиях потепления XXI века. М. : МАКС Пресс, 2008. 292 с.
 Применение кластерного анализа для оценки температурно-влажностных условий в периодактивной вегетации на территории юга Западной Сибири и его связь с гидротермическим коэффициентом Т.Г. Селянинова | Вестн. Том. гос. ун-та. 2012. № 360.

Применение кластерного анализа для оценки температурно-влажностных условий в периодактивной вегетации на территории юга Западной Сибири и его связь с гидротермическим коэффициентом Т.Г. Селянинова | Вестн. Том. гос. ун-та. 2012. № 360.

Полнотекстовая версия