КЛАСТЕРИЗАЦИЯ КЛАССИЧЕСКИХ УНИВЕРСИТЕТОВ НА ОСНОВЕ ВСТУПИТЕЛЬНЫХ ИСПЫТАНИЙ
Проведен многомерный статистический анализ качества набора абитуриентов в российские классические университеты на основе результатов вступительных испытаний 2010 года. Составляющими статистического метода исследования являются корреляционный, факторный, кластерный и дискриминантный анализы. Построена 12 кластерная высококачественная модель классических университетов. Приведены рекомендации по совершенствованию процедуры проведения и содержания вступительных испытаний
CLUSTERIZATION OF CLASSICAL UNIVERSITIESON THE BASIS OF ENTRANCE TESTING.pdf На фоне всестороннего анализа современного состояния и проблем российского высшего образования [1] особенно активно обсуждается одна из новаций в реформировании образования в России - введение ЕГЭ в систему аттестации школьных знаний и применения его как вступительного испытания для высшей школы. Результаты ЕГЭ рассматриваются как критерий оценки качества работы средней школы и качества набора абитуриентов в высшую школу[2-7] с привлечением иногда в качестве обоснования методов математической статистики [1, 8-9]. В рамках сложившихся отношений делаются попытки изменения механизма перераспределения средств в государственном секторе образования. Предполагается, что при реорганизации сети вузов следствием этого шага станет зависимость финансирования вуза от его востребованности у абитуриентов и от качества сформированного вузом контингента студентов на основе рейтинга вузов РФ по среднему баллу ЕГЭ (mЕГЭ). Такой рейтинг [10] показывает, с какими знаниями абитуриенты 2010 года поступили на бюджетные места в 455 государственных вузах страны. В частности, рейтинг качества приема в классические университеты (КУ) возглавляет Московский госуниверситет (МГУ) со средним баллом ЕГЭ 81,6 по 100-балльной шкале, а на втором месте - Санкт-Петербургский госуниверситет (СПГУ) с 76,3 балла. Среди 79 классических университетов отметился Новосибирский госуниверситет (НГУ), ставший третьим в этой категории (73,3). В десятку здесь вошел и Омский госуниверситет (ОГУ), занявший восьмую строчку (68,1), а у Томского госуниверситета (ТГУ) 16-е место (66,5).По результатам рейтинга качества приема в КУ всего 6 КУ смогли набрать себе отличников, то есть тех, у кого средний результат ЕГЭ оказался выше 70 баллов, 66 КУ смогли обеспечить себя хорошистами (55 - 70 баллов по ЕГЭ), а 7 КУ были готовы принять всех, кто принес менее 55 баллов, то есть самых что ни на есть глубоких троечников, часть из которых с трудом проползла минимальный порог. Визуально наблюдаемое распределение (гистограмма) mЕГЭ (рис.1) близко к теоретическому распределению по нормальному закону. Проверка нормальности распределения mЕГЭ с помощью χ2-критерия Пирсона дает незначимое (уровень значимости р > 0,10) отличие от нормального закона с выборочной средней 62,19 балла по 100-балльной шкале и выборочным стандартным отклонением у = 5,64.В данной работе на основании базы данных рейтинга качества приема в КУ [10] проведена их кластеризация по совокупности показателей вступительных испытаний (ПВИ) 2010 года, включающих кроме mЕГЭ также долевое количество абитуриентов (в % от общего количества бюджетных мест), принятых по конкурсу баллов ЕГЭ (NЕГЭ), по целевому набору (NЦ), по олимпиадам (NО) и по льготам (NЛЬГ). Заметим, что подсистема долевых показателей является избыточной, так как NЕГЭ + NЦ + NО + NЛЬГ =100 (в %). Диаграммы рассеяния с гистограммами КУ для ПВИ 2010 года приведены на рис.1. Можно обратить внимание на взаимосвязь долевых показателей NЕГЭ и NЦ (с увеличением NЕГЭ падает NЦ) и непопулярность олимпиадной формы вступительных испытаний (малость NО).1Рис. 1. Матричные диаграммы рассеяния с гистограммами КУ для ПВИ 2010 годаВ силу разнородности ПВИ они были стандартизированы, так что каждый показатель имеет среднее , равное 0, и стандартное отклонение , равное 1. При стандартизации все значения выбранных переменных заменяются на стандартные значения, которые вычисляются какстандартное значение = (исходное значение - среднее)/стандартное отклонение.Диаграмма рассеяния с гистограммами mЕГЭ по 100-балльной и стандартизированной шкалам приведена на рис. 2.Кроме вышеперечисленных КУ, на рис. 2 указаны в качестве примеров согласно рейтингу также Российский университет дружбы народов (РУДН), Нижегородский (НГГУ), Алтайский (АГУ), Поморский (ПГУ), Тульский (ТулГУ), Ленинградский (ЛГУ), Хакасский (ХГУ), Камчатский (КГУ), Тихоокеанский (ТихГУ), Тывинский (ТывГУ), Чеченский (ЧечГУ), Читинский (ЧГУ) и Братский (БГУ) госуниверситеты.1Рис. 2. Диаграмма рассеяния с гистограммами mЕГЭ по 100-балльной и стандартизированной шкалам Для выбранных в качестве примеров КУ значения ПВИ по 100-балльной и стандартизированной шкалам приведены в табл. 1. Таблица 1. ПВИ некоторых КУ по 100-балльной и стандартизированной шкаламРейтинг КУ (место)КУПВИ по 100-бал. шкалеПВИ по стандарт. шкалеmЕГЭNЕГЭNЦNОNЛЬГmЕГЭNЕГЭNЦNОNЛЬГ1МГУ81,675,80186,23,44-0,85-1,033,85-0,192СПГУ76,365,41,327,26,12,50-1,96-0,856,02-0,213НГУ73,369,80,42,827,11,97-1,49-0,970,254,106РУДН70,283,807,391,420,00-1,031,320,3810ОГУ68,180,68,61,59,21,05-0,340,17-0,050,4212НГГУ67,374,27,910,77,30,91-1,020,072,120,0316ТГУ66,583,57,82,760,76-0,030,060,23-0,2333АГУ63,163,522,17,470,16-2,172,061,34-0,0338ПГУ62,21000000,001,74-1,03-0,41-1,4647ТулГУ60,570,417,457,2-0,30-1,431,400,770,0152ЛГУ606928,302,7-0,39-1,582,92-0,41-0,9160ХГУ58,763,317,20,219,3-0,62-2,191,37-0,362,5064КГУ57,9784,813,14,2-0,76-0,62-0,362,69-0,6073ТывГУ54,767,15,1027,8-1,33-1,78-0,32-0,414,2476ЧечГУ52,55837,804,2-1,72-2,764,25-0,41-0,6078ЧГУ51,3100000-1,931,74-1,03-0,41-1,4679БГУ47,588,17,104,8-2,600,46-0,04-0,41-0,48Составляющими статистического метода исследования являются корреляционный, факторный, кластерный и дискриминантный анализы. Статистический анализ проводился в системе Statistica [11].Статистический анализ КУ начнем с проверки ПВИ на корреляционную зависимость. Матрицы коэффициентов парных корреляций ПВИ приведены в табл. 2 (Пирсона r - в право-верхнем треугольнике над диагональю и Спирмена R - в лево-нижнем треугольнике под диагональю). Жирным шрифтом выделены высокозначимые (уровень значимости р < 0,001) корреляции. На рис. 3 изображена дендрограмма (древовидная диаграмма, или иерархическое дерево) корреляционной матрицы ПВИ, полученная в результате древовидной кластеризации. Таблица 2. Матрица коэффициентов парных корреляций Пирсона r и ранговых корреляций Спирмена R ПВИ ПВИ mЕГЭ NЕГЭ NЦ NО NЛЬГ mЕГЭ 1,00 -0,12 -0,19 0,53 0,05 r NЕГЭ -0,11 1,00 -0,73 -0,38 -0,52 NЦ -0,10 -0,69 1,00 -0,08 0,01 NО 0,57 -0,32 0,01 1,00 -0,02 NЛЬГ 0,07 -0,52 0,11 0,05 1,00 R Рис.3. Вертикальная дендрограмма корреляционной матрицы ПВИМетод древовидной кластеризации позволяет проводить обнаружение кластеров или однородных в некотором смысле групп показателей. Этот анализ содержит процедуры иерархической кластеризации с самыми разнообразными мерами близости и правилами объединения кластеров. Одной из мер близости является корреляционное расстояние, вычисляемое по формуле 1 - r, где r - коэффициент корреляции Пирсона. Этот тип расстояния отличается от всех других типов расстояний, поскольку он использует методы корреляционного анализа для оценки расстояний между кластерами. На первом шаге, когда каждый объект (показатель) представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, то необходимо правило объединения для двух кластеров, в качестве которого использован метод Уорда (Варда), отличающийся от всех других методов тем, что он использует методы дисперсионного анализа для оценки расстояний между кластерами. На рис.3 посредством корреляционного расстояния, вычисляемого по формуле 1 - r, изображены значимая положительная корреляционная зависимость между mЕГЭ и NО и сильная отрицательная корреляционная зависимость между NЕГЭ и NЦ (показатель NбЛЬГ не учитывался в силу избыточности подсистемы долевых показателей).Диаграмма рассеяния и прямая регрессии с 95% доверительным интервалом для наиболее сильной отрицательной корреляционной зависимости NЕГЭ и NЦ изображена на рис.4. Менее сильной отрицательной корреляционной зависимостью связаны NЕГЭ и NЛЬГ. Следует отметить высоко значимую положительную корреляционную зависимость mЕГЭ и NО (рис.5). Рис. 4. Диаграмма рассеяния корреляционной зависимости NЕГЭ и NЦ Рис. 5. Диаграмма рассеяния корреляционной зависимости mЕГЭ и NОНаличие корреляционной зависимости ПВИ предполагает использование факторного анализа. Главными целями факторного анализа являются сокращение числа показателей (редукция данных) и определение структуры взаимосвязей между показателями, т.е. классификация показателей. Если определить новый показатель (фактор) на основе регрессии, то он будет включать в себя наиболее существенные черты исходных показателей, и его использование (замена нескольких старых коррелированных показателей одним новым) приведет к сокращению числа показателей. Если пример с двумя переменными распространить на большее число переменных, то вычисления становятся сложнее, однако основной принцип представления двух или более зависимых переменных одним фактором остается в силе. Геометрически такое представление подобно вращению, максимизирующему дисперсию (варимакс) исходного пространства показателей. Например, на диаграмме рассеяния можно рассматривать линию регрессии как ось X, повернув ее так, что она совпадает с прямой регрессии. После того, как первый фактор выделен, то есть первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, факторы последовательно выделяются один за другим. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга, то есть некоррелированными или ортогональными. Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости. Факторный анализ как метод классификации основан на оценках корреляций (факторных нагрузок) между исходными показателями и факторами (или "новыми" показателями) в рамках выбранной факторной модели и позволяет узнать значимость факторов. Факторные нагрузки можно изобразить в виде диаграммы рассеяния , на которой каждый исходный показатель представлен точкой в координатах факторные нагрузки. Можно повернуть оси в любом направлении без изменения относительного положения точек; однако действительные координаты точек, то есть факторные нагрузки, должны, без сомнения, меняться. Одним из типичных методов вращения является варимакс, описанный выше. Целью вращения является получение простой интерпретации факторов, которые ясно отмечены высокими нагрузками для некоторых показателей и низкими - для других (рис. 5), что и позволяет провести классификацию показателей. С помощью факторного анализа построена 4 факторная модель ПВИ ГУ 2010 года (табл. 3). В табл. 3 жирным шрифтом выделены наиболее значимые (основные) повернутые факторные нагрузки (частные коэффициенты корреляции) показателей на факторы, что позволяет по совокупности этих показателей интерпретировать соответствующие факторы, приписывая им наиболее существенные черты значимых показателей. В нижней строке приведены доли объясненной данным фактором дисперсии исходных показателей, иными словами, весовые коэффициенты факторов. Накопленная дисперсия первыми 2 факторами ≈ 90%. Диаграмма рассеяния ПВИ в координатах факторные нагрузки изображена на рис. 6. Таблица 3. Матрица факторной структуры ПВИ ГУ 2010 года ПВИ Ф1 Ф2 Ф3 Ф4 mЕГЭ 0,074 0,526 -0,816 -0,227 NЕГЭ 0,596 -0,218 0,126 -0,762 NЦ -0,866 -0,199 -0,123 -0,442 NО -0,111 0,920 0,371 0,067 Доля фактора 0,507 0,387 0,098 0,008 1 Рис. 6. Диаграмма рассеяния ПВИ в координатах факторные нагрузкиСогласно табл. 3 и рис. 6 высокие факторные нагрузки ПВИ распределились по факторам, имеющим наибольшие веса, следующим образом:Фактор_1 (Ф1) - наиболее весомый (0,507), характеризуется NЕГЭ и NЦ, связанных отрицательной корреляционной связью (чем больше NЕГЭ, тем меньше NЦ). Таким образом, положительная часть Ф1 интерпретируется как NЕГЭ (чем правее по оси Ф1 (рис. 6), тем больше NЕГЭ), а отрицательная - как NЦ (чем левее по оси Ф1, тем больше NЦ).Фактор_2 (Ф2) - менее весомый (0,387), характеризуется mЕГЭ и NО, связанных положительной корреляционной связью (чем выше mЕГЭ, тем больше NО). Таким образом, фактор Ф2 интерпретируется как суммарное значение mЕГЭ + NО (чем выше по оси Ф2 (рис. 6), тем больше суммарное значение mЕГЭ + NО, а чем ниже по оси Ф2, тем меньше суммарное значение mЕГЭ + NО).Далее проведем кластеризацию КУ в построенном 2-мерном факторном пространстве {Ф1, Ф2} ПВИ.Кластерный анализ позволяет проводить обнаружение кластеров или однородных в некотором смысле групп не только ПВИ, но и КУ. В этом случае из разных мер близости наиболее уместным, реализованным в пакете Statistica, является евклидово расстояние. Оно попросту является геометрическим расстоянием в многомерном пространстве. Таким образом, на первом шаге, когда каждый объект (КУ) представляет собой отдельный кластер, расстояния между этими объектами определяются евклидовым расстоянием. На стадии, когда связываются вместе несколько кластеров из все менее и менее сходных объектов (КУ), следует определить расстояния между кластерами. Среди правил объединения двух кластеров возможно применение метода Уорда, уже рассмотренного выше. Выполним сначала для КУ в факторном пространстве {Ф1, Ф2} процедуру объединения (древовидную кластеризацию). Метод древовидной кластеризации последовательно свяжет вместе КУ с возрастающими различиями или расстояниями в координатах Ф1и Ф2. Наиболее важным результатом, получаемым в результате древовидной кластеризации КУ, является иерархическое дерево (рис. 7).Древовидная диаграмма начинается слева с каждого КУ в своем собственном кластере. При движении вправо КУ, которые теснее соприкасаются друг с другом в координатах Ф1 и Ф2 объединяются и формируют кластеры. Каждый узел диаграммы, приведенной на рис. 7, представляет объединение двух или более кластеров, положение узлов на горизонтальной оси определяет расстояние, на котором были объединены соответствующие кластеры.1Рис.7. Горизонтальная дендрограмма КУ в факторном пространстве {Ф1, Ф2}В зависимости от выбора расстояния объединения можно получить соответствующее число кластеров. Так, например, уровню расстояния объединения, равного 6 (средняя пунктирная вертикальная прямая), соответствует 12 кластеров (К1 - К12), уровню расстояния объединения, равного 20 (правая крупная пунктирная вертикальная прямая), - 6 кластеров (К1+К2+К3, К4+К6, К8+К5+К7, К11+К12 и К9+К10), а уровню расстояния объединения, равного 4 (левая мелкая пунктирная вертикальная прямая), - 16 кластеров, когда кластеры К1 и К12 распадаются на одиночные КУ, в то время как кластеры К6 и К8 - на пары более мелких. Таким образом, выбор значения связующего расстояния позволяет проводить кластеризацию на любом уровне, то есть строить кластерную модель с любым наперед заданным числом кластеров.Наряду с методом древовидной кластеризации применяется также метод K-средних, проводящий классификацию объектов (КУ) по заданному количеству кластеров. Предлагается 12-кластерная высококачественная модель КУ, согласно λ-критерию Уилкса высоко значимо (на уровне значимости р < 0,00005) различающая 12 кластеров КУ по совокупности Ф1 и Ф2. Алгоритм метода K-средних перемещает объекты в разные кластеры с целью минимизации изменчивости внутри кластеров и максимизации изменчивости между кластерами. После получения результатов классификации рассчитываются средние значения показателей по каждому кластеру (табл. 4) для оценивания значимости их различий между собой. Таблица 4. Матрица факторных средних по Ф1-2 и стандартизированных средних по ПВИ для каждого кластера 12-кластерной модели КУ, а также N - число КУ в кластереКЛАСТЕРФ1Ф2mЕГЭNЕГЭNЦNОNК1-0,29713,0722,970-1,408-0,9374,9372К2-1,2975,2600,073-0,820-0,1422,4062К31,8873,1111,437-0,232-0,9230,8514К42,6210,2120,7920,922-0,681-0,2468К5-0,7140,9470,883-0,2720,2800,1534К63,160-1,014-0,5231,184-0,937-0,37314К70,993-1,727-1,1990,445-0,327-0,4098К80,034-0,6810,025-0,0510,022-0,32420К9-2,479-1,067-0,284-0,5750,902-0,3119К10-4,433-0,783-0,419-1,5091,354-0,0894К11-7,6092,2920,516-2,2372,3831,1052К12-10,039-2,400-1,052-2,1673,583-0,4092В идеале должны получиться сильно различающиеся средние для большинства, если не для всех признаков, используемых в анализе. Значения F-статистики, полученные для каждого ПВИ, являются другим индикатором того, насколько хорошо проведена классификация. В рассматриваемом случае (табл. 5) F-критерий показывает, что для каждого ПВИ, а также Ф1 и Ф2 различие между средними баллами по кластерам высоко значимо (значимо на уровне p < 0,00005). Таблица 5. Результаты дисперсионного анализаМежду SSссВнутри SSссFpmЕГЭ59,19818,827027,510,0000NбЕГЭ61,32816,687032,160,0000NбЦ68,4389,577062,560,0000NбО67,20810,817054,400,0000С вычислительной точки зрения можно рассматривать этот метод как дисперсионный анализ наоборот в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом К- средних программа перемещает объекты (т.е. КУ) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат в соответствии с критерием дисперсионного анализа.Согласно апостериорному критерию наименьших значений разности (НЗР) можно выделить для каждого фактора однородные группы кластеров, расположенные в порядке убывания факторных средних:Ф1: {К6}, { К4, К3}, {К7 }, {К8, К1}, {К5, К2}, {К9}, {К10}, {К11}, { К12};Ф2 : {К1}, {К2}, {К3, К11}, {К5, К4}, {К8, К10, К6, К9}, { К7, К12};Аналогично, согласно критерию НЗР можно выделить для каждого ПВИ однородные группы кластеров, расположенные в порядке убывания стандартизированных средних mЕГЭ, NО , NЕГЭ и возрастания NЦ: mЕГЭ : {К1}, {К3}, {К5, К4, К11}, {К2, К8}, {К9, К10, К6}, {К12, К7};NО : {К1}, {К2}, {К11, К3}, {К5, К10}, {К4, К9, К8, К6, К12, К7};NЕГЭ : {К6, К4}, {К7}, {К8, К3, К5}, {К9, К2}, {К1, К10}, {К12, К11};NЦ : {К6, К1, К3}, {К4}, {К7}, {К2, К8}, {К5}, {К9}, {К10}, {К11}, {К12};Графики факторных (по Ф1 и Ф2) и стандартизированных (по ПВИ) средних для каждого кластера 12-кластерной модели КУ приведены на рис. 8 и 9 соответственно. Рис. 8. Графики факторных средних для каждого кластера Рис. 9. Графики стандартизированных средних для каждого кластераГрафики факторных средних для каждого кластера (рис. 8) иначе можно представить факторной диаграммой рассеяния средних для кластеров КУ в координатах Ф1 и Ф2 (рис. 10) в виде образной формы птицы потенциального классического университетского образования, обладающей наглядной симметрией двух крыльев (целевой вдоль Ф1 и олимпиадной вдоль Ф2): К12 и К1, К11 и К2, К10 и К3, К9 и К4, К7 и К6. Причем первые четыре симметричные пары кластеров имеют попарно одинаковое число КУ (рис. 7, табл. 4). Рис. 10. Факторная диаграмма рассеяния средних кластеров КУ Факторная диаграмма рассеяния КУ в лицах изображена на рис. 11.Рис. 11. Факторная диаграмма рассеяния КУВыбранные в качестве примеров КУ на рис. 11 в координатах факторные нагрузки Ф1 и Ф2 приведены в табл. 6.Таблица 6. ПВИ некоторых КУ в координатах факторные нагрузкиКУФакторыКластерФ1Ф2МГУ0,9211,111СПГУ-1,5115,041НГУ1,242,243РУДН2,154,123ОГУ-0,410,655НГГУ-1,655,242ТГУ-0,061,075АГУ-6,992,6011ПГУ3,99-0,676ТулГУ-4,761,1610ЛГУ-7,88-1,7612ХГУ-5,02-1,5210КГУ-0,945,282ТывГУ-1,03-1,838ЧечГУ-12,20-3,0412ЧГУ3,53-2,146БГУ0,03-2,867 Проведенная классификация КУ действует лучшим образом для выборки, по которой она была проведена (апостериорная классификация), чем для свежей выборки (априорная классификация). При этом для каждого КУ вычисляются апостериорные вероятности отнесения его к разным кластерам, что вызывает особый интерес в случае приграничных КУ. Апостериорные вероятности КУ определяются посредством расстояний Махаланобиса каждого КУ от центров различных кластеров (средние для каждого кластера в координатах факторные нагрузки приведены в табл. 4 и изображены на рис. 10). Расстояние Махаланобиса является мерой расстояния между двумя точками в пространстве, определяемом двумя или более коррелированными переменными, и определяется аналогично евклидовому расстоянию для некоррелированных переменных. Однако в отличие от евклидового расстояния расстояние Махаланобиса учитывает корреляции между переменными в модели. Вообще говоря, чем дальше наблюдение (КУ) расположено от центра группы (кластера), тем менее вероятно, что наблюдение принадлежит к этой группе. Каждый КУ приписывают кластеру, к которому он ближе, т.е. когда расстояние Махаланобиса до него минимально, и для которого он имеет наивысшую апостериорную вероятность классификации. Так, например, ТГУ с вероятностью 0,75 относится к К5 и с вероятностью 0,25 относится к К8, а ТывГУ с вероятностью 0,81 относится к К8, с вероятностью 0,15 - к К9 и с вероятностью 0,04 - к К7.Результаты кластерного анализа КУ по совокупности показателей (табл. 4, рис. 8-11) позволяют провести качественную классификацию КУ в номинальной шкале измерений (табл. 7), полагая в качестве уровня средний - стандартизированный интервал (-0,5; +0,5) для ПВИ. Аномально высокие значения (> +2,5) определяют уровень ЛИДЕР, а аномально низкие значения (< -2,0) определяют уровень аутсайдер. Промежуточные значения между средними и аномальными определяют уровень выше среднего и ниже среднего соответственно. Уровни для факторных показателей определятся вследствие их интерпретации с помощью ПВИ (табл. 3). Таблица 7. Качественная классификация КУ по показателямКластерХарактеристика уровня кластера на фоне среднего по показателюКУФ1NЕГЭNЦФ2mЕГЭNОК1СреднийНиже среднегоНиже среднегоСУПЕР ЛИДЕРЛИДЕРЛИДЕРМГУ, СПГУК2Ниже реднегоНиже среднегоСреднийЛИДЕРСреднийВыше среднегоНГГУ, КГУК3Выше среднегоСреднийНиже среднегоВыше среднегоВыше среднегоВыше среднегоРУДН, НГУ, …К4Выше среднегоВыше среднегоНиже среднегоСреднийВыше среднегоСредний…К5СреднийСреднийСреднийВыше среднегоВыше среднегоСреднийОГУ, ТГУ, …К6Выше среднегоВыше среднегоНиже среднегоСреднийСреднийСреднийПГУ, ЧГУ, …К7СреднийСреднийСреднийНиже среднегоНиже среднегоСреднийБГУ, …К8СреднийСреднийСреднийСреднийСреднийСреднийТывГУ, …К9Ниже среднегоСреднийВыше среднегоСреднийСреднийСреднийК10Аут- сайдерНиже среднегоВыше среднегоСреднийСреднийСреднийТулГУ, ХГУ, …К11Аут- сайдерНиже среднегоВыше среднегоВыше среднегоСреднийВыше среднегоАГУ, …К12Аут- сайдерАут- сайдерЛИДЕРАут- сайдерНиже среднегоСреднийЛГУ, ЧечГУЗаметим, что по неучтенному показателю NЛЬГ лидерами являются НГУ (27,1%) и ТывГУ (27,8%), уровень выше среднего имеют ХГУ (19,3%) и Брянский госуниверситет (20%).В целом же по совокупности показателей основная масса КУ сгруппирована в кластерах К4, К6 -9, охватывающих 59 КУ из 79 (≈75%), составляет бескрылую птицу потенциального классического университетского образования.Возвращаясь к рейтингу качества приема в классические университеты на основе среднего балла ЕГЭ, изобразим результаты кластеризации КУ в 2 мерном факторном пространстве в виде графика зависимости mЕГЭ от Ф1 и Ф2 (рис. 12)Рис. 12. График зависимости mЕГЭ от Ф1 и Ф2По-видимому, с рассмотрением результатов ЕГЭ как критерия оценки качества работы средней школы произошло вмешательство в процесс обучения [1]. Новая система измерения знаний привела к изменению способа преподавания в средней школе, сориентировала учителя на натаскивание ученика, приближая методику преподавания к репетиторской в ущерб обучающей и развивающей функциям. Особенно заметны эти процессы в выпускных классах. Уходит обучение как развитие ученика, как способ формирования в нем системного мышления, предполагающего наличие таких умений, как анализ, систематизация, обобщение, производство нового знания. Системное мышление формируется не посредством заучивания правильных ответов на тесты, а в процессе творческого освоения методов науки, изучения ее истории, логики, места в системе человеческих знаний. В работе [12] отмечены задачи по совершенствованию процедуры и содержания ЕГЭ: - совершенствование нормативного правового регулирования проведения ЕГЭ; - совершенствование организационно-технологического обеспечения; - доработка процедуры регистрации и сертификации Федеральной базы свидетельств о результатах ЕГЭ; - совершенствование содержания КИМ ЕГЭ в плане усиления практико-ориентированной и компетентностно-ориентированной составляющих экзамена; - совершенствование содержания КИМ ЕГЭ в плане максимального снижения влияния на результат такого субъективного фактора, как позиция проверяемого и проверяющего; - формирование системы подготовки контрольных измерительных материалов; - совершенствование технологии проведения ЕГЭ, апробация других технологий; - создание распределенной информационной системы; - обеспечение информационной безопасности; - подготовка кадров; - материально-техническое обеспечение; - мониторинг эксперимента; - проведение научно-исследовательских работи др. На основании многолетних исследований (1995 - 2010 гг.) [13] на предмет подтверждения результатов вступительных испытаний с результатами входного контроля знаний школьной математики студентов первого курса ТПУ однозначно проявилось лучшее подтверждение результатов ЕГЭ. Кроме того, средний балл ЕГЭ в настоящее время признан в качестве официального критерия определения рейтинга вуза [10].Если на сегодняшний день ЕГЭ по математике имеет наибольшее подтверждение входного контроля математических знаний студентов, то, на наш взгляд, просматриваются следующие пути совершенствования процедуры проведения экзамена и содержания билетов (содержание билетов, вообще говоря, и определяет методику преподавания математики в школе), а именно:1.Убрать из билетов задачи по высшей математике (давать определение производной без введения понятия предела - это беспредел в математике. Здесь хорошо бы смотрелся рисунок: тонкий слой - школьная математика и над этим фундаментом покосившееся здание вузовской математики; и второй рисунок - весь материал школьной математики - это фундамент крепкого здания вузовской математики).2. Из п.1 вытекает п.2: проблема учебников по школьной математике. Надо иметь учебники с разным теоретическим уровнем изложения математики: для классов с углубленным изучением математики; непрофильных классов; техникумов и колледжей. О проблемах вузовских учебников по математике хорошо сказано в статье И.П. Костенко [14].3. Ручной проверке подлежат задачи не только типа С, но и типа В. Многие школьники не могут правильно оформить решение задач - нет пояснительного текста к решению задач, то есть нет ссылок на используемые теоремы и формулы. К тому же голый ответ легче организовать.4. Ввести в каждый билет по ЕГЭ по одному теоретическому вопросу. Во многих случаях легче запомнить вывод формулы, чем саму формулу. К тому же доказательство теорем и вывод формул приучают школьников логически мыслить;5. Под каждой задачей должны быть проставлены баллы (сумма баллов должна быть равна ста баллам).6. Шкала должна быть линейной: 0-49 баллов - неудовлетворительно,50-69 баллов - удовлетворительно; 70-89 баллов - хорошо; 90-100 баллов - отлично (в советское время оценка удовлетворительно ставилась за 2/3 правильно решенных задач).Образцы билетов по ЕГЭ не должны тиражироваться, привязка должна быть только к темам или группам тем (в настоящее время достаточно прорешать образцы билетов, чтобы решить задачи любого билета, за исключением задач типа С).7. Данные меры позволят переломить ситуацию в целом, показать, что подготовленный школьник в состоянии самостоятельно решить задачи билета и получить достойный балл (надо исключить надежду на обходные пути сдачи экзамена по ЕГЭ).ВЫВОДЫ1. На основании корреляционного анализа ПВИ выявлены высоко значимые наиболее сильная отрицательная корреляционная зависимость между NЕГЭ и NЦ, менее сильная отрицательная корреляционная зависимость между NЕГЭ и NЛЬГ, а также положительная корреляционная зависимость между mЕГЭ и NО.2. С помощью факторного анализа построена 2 факторная модель ПВИ КУ 2010 года, объясняющая изменчивость ПВИ на ≈ 90%.3. В рамках кластерного анализа в 2 мерном факторном пространстве {Ф1, Ф2} построена кластерная модель КУ, позволяющая проводить кластеризацию на любом уровне, то есть строить кластерную модель с любым наперед заданным числом кластеров. Подробно рассмотрена 12-кластерная высококачественная модель классических университетов. Для каждого показателя выделены группы однородных кластеров. Результаты кластеризации КУ представлены в виде образной формы птицы потенциального классического университетского образования, обладающей наглядной симметрией двух крыльев (целевой вдоль Ф1 и олимпиадной вдоль Ф2): К12 и К1, К11 и К2, К10 и К3, К9 и К4, К7 и К6. Причем первые четыре симметричные пары кластеров имеют попарно одинаковое число КУ.4. Приведены рекомендации по совершенствованию процедуры проведения и содержания вступительных испытаний.
Скачать электронную версию публикации
Загружен, раз: 656
Ключевые слова
Multidimensional statistic analysis, entrance testing, Многомерный статистический анализ, вступительные испытанияАвторы
ФИО | Организация | Дополнительно | |
Ссылки
1. Сальников Н., Бурухин С. Реформирование высшей школы: актуальное состояние и проблемы // Высшее образование в России. - 2008. - № .8 - С. 3-13
2. Грязев М.В., Хадарцев А.А., Хрупачёв А.Г., Туляков С.П. Методика интегральной оценки знаний абитуриентов // Высшее образование в России. - 2010. - № 6. - С. 28-32
3. Гулидов И.Н., Шатун А.Н. ЕГЭ: проблемы и решения // Высшее образование сегодня. - 2007. - № 1. - С. 32-33.
4. Гоник И. Л., Москвичев С.М., Иванов Ю.В., Гурулев Д.Н. Различные формы сдачи вступительных испытаний как элемент формирования контингента абитуриентов. // Известия Волгоградского государственного технического университета. - 2009. - Т. 10, № 6. - С. 2
5. Бримова А.К. ЕГЭ как современная форма проверки знаний. // Успехи современного естествознания. - 2008. - № 6. - С. 108-109
6. Данилов Д.А. ЕГЭ как критерий качества образования // Наука и образование. - 2008. - № 1. - С. 75-76.
7. Радомская М.В., Лызь Н.А. Результат ЕГЭ как показатель качества общего образования // Известия Таганрогского государственного радиотехнического университета. - 2006. - Т. 56, № 1. - С. 39-40.
8. Поландов Ю.Х., Колпакова С.В., Фесенко Н.Н. К обоснованию применения результатов ЕГЭ в качестве оценок знаний абитуриентов // Ученые записки Орловского государственного университета. - 2008. - № 3. - С. 216-219
9. Лапотникова И.Н. Методы математической статистики для оценки результатов ЕГЭ. //Ярославский педагогический вестник. - 2008 - № 1 - С. 17-23.
10. Рейтинг вузов РФ по среднему баллу ЕГЭ 2010 года // РИА Новости. - URL: <http://www.hse.ru/org/hse/ex/>.
11. Халафян А.А. Statistica 6. Статистический анализ данных. - М.: ООО Бином-Пресс, 2008. - 512с.

КЛАСТЕРИЗАЦИЯ КЛАССИЧЕСКИХ УНИВЕРСИТЕТОВ НА ОСНОВЕ ВСТУПИТЕЛЬНЫХ ИСПЫТАНИЙ | Открытое и дистанционное образование. 2011. № 3 (43).
Скачать полнотекстовую версию
Загружен, раз: 2422