Проведен многомерный статистический анализ показателей качества набора (ПКН) абитуриентов по разным направлениям подготовки (НП) в российский втуз на основе результатов вступительных испытаний 2013 г. Составляющими статистического метода исследования являются корреляционный, факторный, кластерный и дисперсионный анализы. На примере Томского политехнического университета (ТПУ) построена 4-факторная модель ПКН, объясняющая общую изменчивость ПКН четырьмя факторами на 96,3 %. В рамках построенного факторного пространства ПКН предложена 8-кластерная модель технических НП в ТПУ, позволяющая выделять группы НП, однородных по совокупности факторных показателей. Результаты проведенного статистического анализа могут быть учтены при принятии управленческих решений по распределению контрольных цифр приема студентов по направлениям подготовки, а также при формировании выравнивающих и адаптационных курсов обучения студентов вузов.
Clusterization of directions of training at russian technical college in factorial space of entrance examenations.pdf Среди проблем реформирования современного российского высшего образования [1-3], в частности отечественного инженерного образования в условиях перехода к инновационной модели экономического развития [4-8], особенно активно обсуждается проблема повышения качества образования и оценки эффективности реформирования высшего образования в Российской Федерации. Одним из основных показателей оценки эффективности образовательной деятельности вузов является входной показатель качества набора (ПКН) - средний балл ЕГЭ поступивших в вуз [2, 9-10]. Соответствующие рейтинги эффективности деятельности вузов используются для принятия управленческих решений по распределению контрольных цифр приема студентов по направлениям подготовки [11-12] и как показатели популярности у абитуриентов как учебного заведения в целом, так и отдельных направлений подготовки [13-14]. Многообразие и разнородность системы показателей эффективности образовательной деятельности вузов предполагает использование методов многомерного статистического анализа. Например: анализ показателей конкурентоспособности российских вузов с применением метода главных компонент [15], кластерный анализ вузов при оценке качества услуг высшего профессионального образования. [16], кластерный анализ регионов при оценке обеспеченности вузами [17], факторный анализ ПКН в вузы с последующим кластерным анализом самих вузов [18]. В связи с этим представляет интерес проведение комплексного многомерного статистического анализа ПКН абитуриентов по разным направлениям подготовки. В данной работе, аналогично [18], на основе результатов факторного анализа ПКН 2013 г. проведен кластерный анализ разных направлений подготовки (НП) российского втуза на примере Томского политехнического университета (ТПУ) [19]. В качестве ПКН были использованы следующие 3 группы входных индикаторов. Во-первых, рейтинговые индексы ЕГЭ ТПУ по НП среди других вузов: где ЕГЭ - средний балл зачисленных по результатам ЕГЭ 2013 г. (в расчете на один предмет) по НП, в том числе ЕГЭк - средний балл ЕГЭ зачисленных по конкурсу [20]. Во-вторых, показатели набора абитуриентов в ТПУ по НП [21]: план приема (ПП) на бюджетные места, конкурс (Кон), проходной балл (ПБ), общая сумма баллов абитуриента (ОБ), баллы по математике (МБ), численность зачисленных на каждое НП (NНП). В-третьих, показатели входного тестирования по математике (ВТ) и численность участвовавших во ВТ по НП (NВТ). В силу разнородности показатели были стандартизированы. Статистический анализ проводился в системе Statistica [22]. Заметим, что согласно теории измерительных шкал балльная шкала относится к типу порядковой, в которой оперирование средним баллом для сравнения является некорректным. Однако полностью игнорировать средние арифметические нецелесообразно из-за их распространенности [9]. Диаграммы рассеяния с гистограммами [22] основных 25 НП для наиболее характерных ПКН приведены на рис. 1. На рис. 1 использованы по умолчанию типичные для данного вида графики обозначения координатных осей [22]. Согласно рис. 1 основные НП имеют мультимодальное распределение РНП, в основном малочисленны (ПП < 40 у половины НП), характеризуются низким конкурсом (Кон < 2 у половины НП), визуально наблюдаемое распределение (гистограмма) МБ наиболее близко к теоретическому распределению по нормальному закону, что подтверждается c2-критерием Пирсона (на уровне значимости р > 0,10), а наиболее сильно корреляционно связаны МБ и ВТ, имеющие высокий коэффициент корреляции (параметрический Пирсона r = 0,812 и ранговый Спирмена R = 0,822, различающиеся высоко незначимо на уровне значимости р » 0,92). Последнее обстоятельство (незначимое различие r и R) обосновывает применение параметрических параметров и критериев там, где не используются ранговые (непараметрические). На рис. 2 изображена дендрограмма (древовидная диаграмма, или иерархическое дерево) корреляционной матрицы ПКН, полученная в результате древовидной кластеризации. В качестве меры близости ПВИ использовано корреляционное расстояние 1 - r, где r - коэффициент корреляции Пирсона, а в качестве правила объединения для двух кластеров использован метод Уорда (Варда), отличающийся от всех других методов тем, что он использует методы дисперсионного анализа для оценки расстояний между кластерами [22]. Согласно рис. 2 на корреляционной основе можно выделить 4 группы ПКН: {РНП, РНПк}, {Кон}, {МБ, ОБ, ВТ, ПБ}, {ПП, NНП, NВТ}. Наличие корреляционной зависимости ПКН допускает использование факторного анализа. Главными целями факторного анализа являются сокращение числа исходных показателей (редукция данных) и определение структуры взаимо-связей между показателями, т.е. классификация показателей [22]. Факторный анализ как метод классификации основан на оценках корреляций (факторных нагрузок) между исходными показателями и факторами (или «новыми» показателями) в рамках выбранной факторной модели и позволяет узнать значимость факторов. С помощью факторного анализа построена 4-факторная модель ПКН НП 2013 г. (табл. 1). В табл. 1 жирным шрифтом выделены наиболее значимые (основные) повернутые факторные нагрузки (частные коэффициенты корреляции) показателей на факторы, что позволяет по совокупности этих показателей интерпретировать соответствующие факторы, приписывая им наиболее существенные черты значимых показателей. В нижней строке приведены доли объясненной данным фактором дисперсии исходных показателей, иными словами, весовые коэффициенты факторов. Накопленная дисперсия первыми 3 факторами » 87,4 %, а 4 - 96,3 %. Таблица 1 Матрица факторной структуры ПКН НП 2013 г. ПКН Ф1 Ф2 Ф3 Ф4 РНП 0,122 0,180 0,966 0,123 РНПк 0,190 0,148 0,954 0,167 ВТ 0,905 -0,075 0,087 -0,096 Nвт 0,015 0,983 0,168 0,041 ПП 0,028 0,988 0,037 -0,086 Кон -0,010 -0,013 0,194 0,970 ПБ 0,705 0,027 0,427 0,527 ОБ 0,944 0,010 0,122 0,181 МБ 0,950 0,111 0,116 -0,114 NНП 0,013 0,983 0,164 0,044 Доля фактора 0,316 0,298 0,216 0,133 Согласно табл. 1 и рис. 2 высокие факторные нагрузки ПКН распределились по стандартизированным факторам, имеющим наибольшие веса, следующим образом: Ф1 - наиболее весомый (0,316), связан положительной корреляцией с МБ, ОБ, ВТ, ПБ и характеризует вузовское качество, т.е. качество приема в ТПУ по НП. Ф2 - менее весомый (0,298), связан положительной корреляцией с ПП, NНП, NВТ и характеризует количество приема в ТПУ по НП. Ф3 - еще менее весомый (0,216), связан положительной корреляцией с РНП, РНПк и характеризует федеральное качество, т.е. качество рейтинга ТПУ по данному НП среди других вузов. Ф4 - наименее весомый (0,133), связан положительной корреляцией с Кон и характеризует конкурс приема в ТПУ по НП. В построенном 4-мерном стандартизированном факторном пространстве {Ф1, Ф2, Ф3, Ф4} ПКН проведена кластеризация НП [22]. В этом случае из разных мер близости наиболее уместным, реализованным в пакете Statistica, выбрано расстояние Чебышева. На стадии, когда связываются вместе несколько кластеров из все менее и менее сходных объектов (НП), следует выбрать в качестве правила объединения двух кластеров, например метод Уорда (Варда), уже рассмотренный выше. Выполним для НП в факторном пространстве {Ф1, Ф2, Ф3, Ф4} древовидную кластеризацию (рис. 3). В зависимости от выбора расстояния объединения можно получить соответствующее число кластеров. Так, например, уровню расстояния объединения, равного 2 (пунктирная вертикальная прямая), соответствуют 8 кластеров (К1-К8). Предлагаемая 8-кластерная высококачественная модель НП согласно l-критерию Уилкса высоко значимо (на уровне значимости р < 0,00005) различает 8 кластеров НП по совокупности Ф1, Ф2, Ф3, Ф4. Далее можно оценить качество проведенной классификации для каждого фактора. В рассматриваемом случае параметрический F-критерий показывает высоко значимое (на уровне p < 0,0005) различие по совокупности кластеров для каждого фактора. Если учесть порядковый характер балльной шкалы измерения успеваемости абитуриентов, то результаты параметрического дисперсионного анализа качества классификации НП необходимо подтвердить результатами непараметрического (рангового) дисперсионного анализа. Ранговый критерий Краскела-Уоллиса смягчает эти различия по совокупности кластеров для фактора Ф1 до сильно значимого (на уровне p » 0,004), для фактора Ф3 - до статистически значимого (на уровне p» 0,013) и для факторов Ф2 и Ф4 - до слабо значимого (на уровне 0,05 < p < 0,10). После получения результатов классификации рассчитываются средние значения кластеров по каждому показателю, что допускает очень компактную наглядную интерпретацию (рис. 4). Согласно апостериорному критерию наименьших значений разности (НЗР) можно выделить для каждого фактора однородные группы кластеров, расположенные в порядке убывания факторных средних: Ф1: {К1, К2, К4, К5, К3}, { К2, К4, К5, К3, К7, К6}, { К5, К3, К7, К6, К8}; Ф2 : {К4}, {К3, К5, К7}, {К7, К2, К6, К8, К1}; Ф3 : {К3}, {К1, К6, К5, К4}, {К4, К8}, {К2, К7}; Ф4 : {К8}, {К3}, {К4, К2, К1, К7, К5, К6}. Ранговый критерий Краскела-Уоллиса смягчает эти различия в случае Ф2, Ф3 и Ф4 за счет аномального положения монокластеров следующим образом: Ф1: {К1, К2, К4, К5, К3}, { К2, К4, К5, К3, К7, К6}, { К5, К3, К7, К6, К8}; Ф2 : {К4, К3, К5, К7}, {К7, К2, К6, К8, К1}; Ф3 : {К3, К1, К6, К5, К4, К8}, {К4, К8, К2, К7}; Ф4 : {К8, К3, К4, К2, К1}, {К4, К2, К1, К7, К5, К6}. На основании рис. 4 в факторном пространстве {Ф1, Ф2, Ф3, Ф4} можно провести качественную классификацию НП в номинальной шкале измерений (табл. 2), полагая в качестве уровня «Средний» - стандартизированный интервал (-0,25; +0,25) для факторных показателей, «Средний+» - стандартизированный интервал (+0,25; +0,6), «Средний-» - стандартизированный интервал (-0,6; -0,25). Аномально высокие значения (> +1,4) определяют уровень «Лидер», а аномально низкие значения (< -1,4) определяют уровень «Аутсайдер». Промежуточные значения между средними и аномальными определяют уровень «Выше среднего» и «Ниже среднего» соответственно. Согласно табл. 2 среди 25 основных НП ТПУ 2013 г. выделены прежде всего 3 монокластера, характеризующиеся аномально высокими значениями по отдельным факторным ПКН: К4 (140400* - Электроэнергетика и электротехника) - лидер по количеству приема при среднем уровне качества, К8 (022000 - Экология и природопользование) - лидер по конкурсу приема при малочисленном наборе слабого качества, К3 (131000 - Нефтегазовое дело) - лидер федерального качества и по конкурсу приема и при наборе 3 групп (ПП=75) среднего вузовского качества. Еще 2 кластера К2 и К7 (наполовину с химическим уклоном) характеризуются аномально низким федеральным качеством при малочисленном наборе средне-слабого вузовского качества и конкурсу приема. К многочисленному по набору К4 близок К5 (140100* - Теплоэнергетика и теплотехника и 140800* - Ядерные физика и технологии) с родственными НП. Оставшиеся К6 и К1, объединяющие по 7 НП, различаются в основном вузовским качеством (ниже среднего у К6 и выше среднего у К1) при среднем уровне остальных факторных ПКН. Результаты проведенного статистического анализа могут быть учтены при принятии управленческих решений в рамках проходящей реформы высшего образования, например при принятии решения по распределению контрольных цифр приема студентов по направлениям подготовки, а также при корректировке направлений деятельности для обеспечения качественного набора абитуриентов и формировании выравнивающих и адаптационных курсов обучения студентов [19]. Выводы 1. Согласно рис. 2 на корреляционной основе можно выделить 4 группы ПКН: {РНП, РНПк}, {Кон}, {МБ, ОБ, ВТ, ПБ}, {ПП, NНП, NВТ}. 2. С помощью факторного анализа построена 4-факторная модель ПКН НП 2013 г., объясняющая изменчивость ПКН на » 96,3 %. 3. В рамках кластерного анализа в 4-мерном факторном пространстве ПКН построена кластерная модель НП, позволяющая проводить кластеризацию на любом уровне, т.е. строить кластерную модель с любым наперед заданным числом кластеров. Подробно рассмотрена 8-кластерная высококачественная модель НП ТПУ 2013 г. Для каждого показателя выделены группы однородных кластеров. 4. Проведенные исследования могут быть учтены при принятии решения по распределению контрольных цифр приема студентов по направлениям подготовки, а также при корректировке направлений деятельности для обеспечения качественного набора абитуриентов и формировании выравнивающих и адаптационных курсов обучения студентов [19]. ер НП (специальности) Уровень кластера по факторам Ф1 Ф2 Ф3 Ф4 К5 140100* - Теплоэнергетика и теплотехника 140800* - Ядерные физика и технологии Средн. Выше средн. Средн.+ Средн.- К7 240100* - Химическая технология 150100* - Материаловедение Ниже средн. Средн.+ Аутсайдер Средн.- К4 140400* - Электроэнергетика и электротехника Средн.+ Лидер Средн. Средн. К8 022000 - Экология и природопользование Ниже средн. Средн.- Ниже средн. Лидер К6 130101 - Прикладная геология 140600 - Высокотехнологические установки 141100* - Энергетическое машиностроение 150700 - Машиностроение 200100* - Приборостроение 200400* -Оптотехника 201000* - Биотехнические системы и технологии Ниже средн. Средн.- Средн.+ Средн.- К2 240501* - Химическая технология материалов 240700* - Биотехнология 010400 - Прикладная математика и информатика 241000* - Энерго- и ресурсосберегающие процессы в химической технологии Средн. Средн.- Аутсайдер Средн. К3 131000 - Нефтегазовое дело Средн. Выше средн. Лидер Лидер К1 220700* - Автоматизация технологических процессов 230400* - Иформационные системы и технологии 140801* - Электроника и автоматика физических установок 141403* - Атомные станции 210100* - Электроника и наноэлектроника 221000* - Мехатроника и робототехника 230100* - Информатика и вычислительная техника Выше средн. Средн.- Средн.+ Средн.
Качество приема в вузы - 2013 [Электронный ресурс]. - Режим доступа: http:// http://www.hse.ru/ege/second_section2013 (дата обращения: 12.01.15).
Конкурс 2013 года [Электронный ресурс]. - Режим доступа: http://abiturient.tpu.ru/navigation/how/konkursyi-proshlyix-let/ (дата обращения: 12.01.15).
Халафян А.А. Statistica 6. Статистический анализ данных. - М.: ООО «Бином-Пресс», 2008. - 512 с.
Арефьев В.П. Кластеризация классических университетов на основе вступительных испытаний / В.П. Арефьев, А.А. Михальчук, Д.В.Болтовский, А.В. Петиченко // Открытое и дистанционное образование. - 2011. - № 3. - C. 20-31.
Образование в ТПУ: итоги 2012/13 учебного года / И.А. Абрашкина [и др.]; Национальный исследовательский Томский политехн. ун-т (ТПУ). - Томск: Изд-во ТПУ, 2013. - 318 с.
Вихарева О.Н., Сокольник И.В. Оценка качества услуг высшего профессионального образования: кластерный подход // Теория и практика общественного развития. - 2013. - № 5. - С. 249-252.
Яковлев В.Б. Применение кластерного анализа в региональной статистике российского образования // Вест. Московского городского пед. ун-та. Сер.: Информатика и информатизация образования. - 2014. - № 2 (28). - С. 65-70.
Корф В.П. Оценка конкурентоспособности ведущих российских университетов с использованием метода главных компонент // Бизнес-информатика. - 2014. - № 2 (28). - С. 63-71.
Ефимова И.Н., Маковейчук А.В. Анализ влияния роли рейтинговых позиций вуза на мотивацию абитуриентов при выборе места обучения: прикладной аспект // Вест. Пермского ун-та. Философия. Психология. Социология. - 2014. - № 1 (17). - С. 173-181.
Гавриленко А.В., Гавриленко Е.В., Наривончик С.Н. Современные тенденции приема абитуриентов в региональные технические вузы на примере Тверского государственного технического университета // Вест. Тверского гос. техн. ун-та. Сер.: Науки об обществе и гуманитарные науки. - 2014. - № 1. - С. 22-27.
Пыхтин А.И., Емельянов И.П. Концепция организации приема в вузы на основе проведения единого Всероссийского конкурса по направлениям подготовки и специальностям // Изв. Юго-Западного гос. ун-та. - 2013. - № 2 (47). - С. 086-088.
Федулин А.А., Минаев В.А. Распределение контрольных цифр приема студентов в контексте эффективности деятельности вузов // Высшее образование сегодня. - 2014. - № 2. - С. 25-28.
Показатели мониторинга деятельности федеральных государственных высших учебных заведений и их филиалов (24 декабря 2012 г.) [Электронный ресурс]. - Режим доступа: http://минобрнауки РФ/новости/2932 (дата обращения: 12.10.13).
Голованов П.А., Тупоносова Е.П. Анализ российского рейтинга вуза по среднему баллу ЕГЭ // Вест. Самарского гос. техн. ун-та. Сер.: Экономические науки. - 2014. - № 2 (12). - С. 80-85.
Подлесный С.А., Масальский Г.Б. Пути повышения качества подготовки инженеров в контексте мировых и отечественных тенденций // Журнал Сибирского федерального ун-та. Сер.: Техника и технологии. - 2014. - Т. 7, № 2. - С. 235-247.
Шаховская Л.С. Актуальные проблемы подготовки инженерных кадров в вузах: региональный аспект / Л.С. Шаховская, В.А. Пономарев, Е.Г. Гущина и др. // Изв. Волгоградского гос. техн. ун-та. - 2014. - Т. 18, № 4 (131). - С. 6-12.
Воронина Л.Н., Кеммет Е.В. Инженерное образование сегодня и завтра: социологический анализ // Вест. Сургутского гос. пед. ун-та. - 2014. - № 2 (29). - С. 106-112.
Симоньянц Р.П. Проблемы инженерного образования и их решение с участием промышленности // Наука и образование: электронное научно-техническое издание. - 2014. - № 3. - С. 394-419.
Акатьев В.А., Волкова Л.В. Инженерное образование в постиндустриальной России // Современные проблемы науки и образования. - 2014. - № 5. - С. 40.
Баронин С.А., Сюзев К.С. Основные проблемные ситуации высшего образования // Высшее образование в России. - 2013. - № 1. - С. 110-115.
Воронова Т.Г. Модернизация системы высшего образования: мониторинг эффективности вузов / Т.Г. Воронова, Д.Г. Матишов, В.Н. Попов, А.Е. Хинштейн // Вест. Воронежского гос. ун-та. Сер.: Проблемы высшего образования. - 2013. - № 2. - С. 16-20.
Вахитов Д.Р., Ковалькова Е.Ю., Нуртдинов Р.М. Проблемные аспекты реформирования высшего образования в Российской Федерации // Вест. Казанского техн. ун-та. - 2013. - Т. 16, № 2. - С. 270-275.