Эволюция маркемной лексики на основе исследования маркем в хронологических срезах | Язык и культура. 2018. № 42. DOI: 10.17223/19996195/42/2

Эволюция маркемной лексики на основе исследования маркем в хронологических срезах

Рассматривается маркемный состав английских текстов второй половины XVII в. Актуальность обсуждаемой проблемы объясняется необходимостью решения задачи объективации и формализации содержательного анализа текста. До сих пор не выработаны четкие параметры, позволяющие, с одной стороны, объективировать характеристику стиля автора, а с другой - проследить взаимосвязь разных авторов и исследовать формирование языка литературы. Применение математических методов в лингвистических исследованиях позволяет выделить закономерности, которым подчиняются все тексты на естественных языках. Универсальные законы Дж. Ципфа, описывающие статистическую структуру текста на естественном языке, позволяют выделить из частотного словаря какого-либо текста или совокупности текстов слова, имеющие ключевое значение. Использование квантитативных методов для анализа литературных произведений дает возможность не только выявить закономерности в частотности употребления тех или иных слов, но и решить ряд других важных задач лингвистического исследования. В статье предлагается использование метода маркемного анализа как одного из способов формализации содержательного анализа текста. Он дает возможность получить полную картину маркемного состава языка литературных произведений любого хронологического среза или исторического периода, позволяя, при этом, исследовать тексты практически любого объема. Кроме того, метод маркемного анализа дает возможность исследовать специфику маркем отдельных авторов или групп авторов, влияние социокультурных процессов на динамику маркем, изучать эволюцию маркемной лексики на основе исследования маркем в нескольких хронологических срезах, а также посредством выделения общих маркем и определения на их основе коэффициента корреляции авторов устанавливать взаимосвязи различных авторов и, таким образом, обнаруживать преемственность в литературе. В основе метода лежат базовые понятия «маркема» и «индекс текстуальной маркированности» (ИнТеМ). ИнТеМ выражает зависимость между длиной словоформы и частотой ее употребления. Разность, полученная в результате вычитания веса словоформы по длине из ее веса по частоте, представляет собой авторскую составляющую, указывающую на степень весомости отдельной словоформы для конкретного текста. Обработка текстов производится созданным в Воронежском государственном университете программным комплексом тематического анализа лексики «ProTemAl-Engl». С целью определения взаимосвязи английских писателей второй половиныXVП в. в созданных ими произведениях выявляется и анализируется маркемная лексика. Маркемами признаются наиболее значимые для автора текста словоформы. Это - имена существительные, как наименее маркированная часть речи, обозначающие важнейшие категории культуры, описываю- щие внутренний мир человека, а также межличностные и социальные взаимоотношения, базовые понятия и т.д. Потенциальная маркема проходит специальную систему фильтров: грамматический, грамматико-семантический, тематико-семантический, стилистический, диалогический и классификаторный. Указанная система фильтров позволяет исключить попадание в число маркемонимов и одушевленных существительных, кроме словоформы человек; стилистически окрашенных слов; названий месяцев и дней недели; названий артефактов, если они не обрели коннотативных или символических значений; лексем, связанных с определенным жанром; обращений и слов-классификаторов. Зависимость величины ИнТеМа от веса словоформы по частоте ограничивает возможность его применения при проведении сопоставительного мар-кемного анализа, что обусловлено различным количеством как созданных отдельными авторами произведений, так и их доступностью в электронном виде. В этом случае целесообразно использовать Нормированный ИнТеМ, определяемый как отношение ИнТеМа маркемы автора к суммарному ИнТеМу всех его маркем, а его значение всегда находится в интервале 0-1. Анализ маркемного состава языка исследуемых литературных произведений предполагает выделение доминантной и вице-доминантной маркем хронологического среза, семантическую характеристику срезовых маркем. Выделение срезовых маркем дает возможность установить общие закономерности, существующие в литературе исследуемого хронологического среза. Параметром, определяющим попадание авторских маркем в число срезовых маркем, служит величина суммарного нормированного интегрального веса, вычисляемого как произведение суммарного нормированного ИнТеМа на количество авторов, употребивших данную маркему. Первые 50 маркем сводного маркемного списка, ранжированного в порядке убывания суммарного нормированного интегрального веса, являются маркемами среза. Вычисление коэффициента корреляции в каждой паре авторов среза, базирующееся на значении суммарного нормированного индекса текстуальной маркированности их общих маркем, позволило установить близость авторов относительно друг друга. На основе максимального значения коэффициента корреляции определена сила максимальной векторной связи авторов и предложен способ визуализации основных векторных связей и их силы для авторов среза, что позволяет установить степень маркемной близости авторов. Исходя из количества связей максимальной силы и их направленности, выделены два центра аттракции - большой и малый, а также исследовано их количественное и содержательное маркемное наполнение. Результатом исследования стало проведение стратификации авторов среза, в результате которой установлен статус каждого автора: типичный представитель среза - нуклеар, нетипичный для среза - маргинал, занимающий промежуточное положение - медиар.

Evolution of markemic lexis on the basis of markem research in chronological slices.pdf Введение По мнению историков английской литературы, развитие английской литературы XVII в. приходится на 1620-1690 гг. Последнее десятилетие XVII в. знаменует начало нового периода истории английской литературы, положившего начало становлению просветительских тенденций. Спецификой развития английской литературы XVII в. в целом и его второй половины в частности является тесная связь с общественными процессами данного периода. Исторические события этой революционной эпохи обусловили эволюцию и этапы развития английской литературы. На 60-80-е гг. XVII в. приходится период развития противоречий и борьбы направлений в литературе. Начало ему положила реставрация династии в 1660 г., обусловившая концентрацию при дворе Карла II значительного круга литераторов, подверженных влиянию французского классицизма. Широкое распространение в это время получила теория государства Гоббса, изложенная им в 1651 г. Происходит осмысление результатов революционных и послереволюционных событий, нашедшее воплощение в трех поэмах Мильтона, две из которых, «Возвращенный рай» и «Самсон-борец», являются образцом классицистической поэтики. В это же время в английской литературе с новой силой возродились барочные тенденции, особенно заметные в творчестве Драйдена. Они явили собой отражение атмосферы неуверенности и ощущения близости надвигающейся катастрофы, сохранявшиеся в английском обществе в период Реставрации. В то же время именно Драйден первым из английских писателей XVII в. высоко поднял национальную английскую традицию и обратил внимание на возможности, которые открывала поэтика классицизма. При этом классицизм Драйдена больше походил на развитие эстетических идей, высказанных Беном Джонсоном в начале века. Поворот английской драматургии в сторону классицизма заметен и в произведениях Т. Отвея и У. Уичерли [1]. Одним из первых против безнравственности английского общества эпохи Реставрации выступил Бэньян, обратившийся в своих произведениях к поиску истинного пути духовного формирования идеального человека, основой которого он считал самосовершенствование. В его творчестве прослеживаются одновременно черты барочного и реалистического направлений. В это время происходили становление и развитие нового этапа истории английской комедии - комедии Реставрации - яркими представителями которой являются Драйден, Уичерли и Этеридж [2]. Наряду с драматургией большой вклад в развитие английской литературы вносит художественная проза в лице Афры Бен, Дж. Мэкензи. Большое значение во второй половине XVII в. приобрели мемуары, представленные именами С. Пеписа и Дж. Ивлина. В этих условиях борьбы направлений шла подготовка новой литературной эпохи. Таким образом, вторая половина XVII в. является переломным моментом в истории английской литературы. Историография вопроса и методология Использование аналитических методов, основанных на применении математического аппарата в лингвистических исследованиях, имеет свою историю, началом которой принято считать 50-е гг. XX в., хотя уже в 1851 г. английский логик Август де Морган впервые предложил использовать математический аппарат для решения задачи установления авторства литературных текстов [3]. В лингвистике появление квантитативных методов связывают, прежде всего, с возникновением направления структурной лингвистики, т.е. началом XX в. Однако длительное время среди ученых, занимавшихся вопросами применения математических методов в лингвистических исследованиях, не существовало единства взглядов на цели и задачи математического направления в лингвистике. Так, немецкий ученый Э. Форстеманн [4], русские математики В.Я. Буняковский [5] и А.А. Марков [6, 7], английский статистик Джордж Юл [8] рассматривали языковые элементы как наиболее подходящий иллюстративный материал для квантитативных методов. При этом значимость результатов такого исследования для лингвистов находилась вне сферы их внимания. А. Росс [9] рассматривал теорию вероятностей и математическую статистику в качестве математической модели для проверки и подтверждения тех лингвистических выводов, которые допускают числовую трактовку [10]. Выделению закономерностей, которым подчиняются все тексты на естественных языках, посвящены работы ряда отечественных и зарубежных ученых. Эти исследования, в частности, выявили необходимость формализации статистических закономерностей языка, что нашло свое отражение в трудах Ж. Эсту [11], Э. Кондона [12], В. Болдрини [13], Дж. Ципфа [14, 15], Б.Н. Головина [16] и др. Именно Дж. Ципф вывел два универсальных закона, описывающих статистическую структуру любого текста на естественном языке. Согласно этим законам, произведение вероятности обнаружения некоторого слова в тексте на ранг его частоты - константа, сохраняющая свое значение для всех текстов на данном языке, а частота и количество слов, входящих в текст с данной частотой, связаны между собой. Эти закономерности позволяют выделить из частотного словаря какого-либо текста или совокупности текстов слова, имеющие ключевое значение. Также свой вклад в развитие количественных методов внесли американцы К. Шэннон и У. Уивер [17], применившие понятия теории информации для лингвистического описания, Г. Хердан, изучавший квантитативную лингвистику [18], отечественный филолог и автор трудов по математической лингвистике Р.Г. Пиотровский [19, 20], немецкий математик В. Фукс [21] и др. Первоначально количественные методы интенсивно применялись при составлении частотных словарей, но еще в начале 40-х гг. прошлого столетия был предложен ряд приемов количественной оценки содержания текста (методы контент-анализа), оказавшиеся, к сожалению, малоэффективными ввиду необходимости наличия однородного языкового материала значительного объема [22]. Большой вклад в развитие квантитативной лингвистики внесла Жозефина Майлз, осуществив анализ лексического состава английских поэтических произведений XVI-XX вв. Использование для этой цели квантитативных методов позволило выявить закономерности в частотности употребления тех или иных слов. В частности, ею были отмечены такие особенности английских лексем, как преобладание в базовой лексике всех периодов односложных слов и переход слов из состава дополнительной лексики предшествующего хронологического периода в состав основной лексики последующего периода. При этом было установлено, что лексемы, принадлежащие к основной лексике, более стабильны на протяжении нескольких веков, нежели принадлежащие дополнительной лексике, что и позволяет обеспечивать преемственность языка поэзии [23]. Таким образом, полученные Жозефиной Майлз данные, а также используемые в работе методы анализа материала и способы представления результатов исследования заложили основы для проведения подобных исследований. В настоящее время лингвисты проявляют интерес к квантитативному исследованию языка английской поэзии [24]. В своих работах А.Б. Борунов [25, 26] исследует авторский корпус американского прозаика Рэгу Н. Митры. Сопоставительное исследование на материале английской поэзии и прозы, охватывающее творчество 14 авторов, принадлежащих XIV-XX вв., осуществили Л.Г. Кишинская и С.В. Ки-шинский [27]. Актуальность нашей работы определяется отсутствием квантитативных исследований языка английской прозы, позволяющих детально изучить литературные связи авторов-современников на лексическом уровне. Метод формализованного изучения текстов - маркемный анализ - предложил А.А. Кретов. Применение метода маркемного анализа [28, 29] дает возможность получить полную картину маркемного состава языка английской прозы любого хронологического среза или исторического периода, позволяя, при этом, исследовать тексты практически любого объема: как правило, нижней границей пригодного для маркемного анализа текста являются 70 тыс. словоформ. Основу данного метода исследования составляют понятия «мар-кема» и «индекс текстуальной маркированности» (ИнТеМ). Выделение маркем в текстах автора осуществляется на основе вычисления ИнТе-Ма и ранжирования словоформ в порядке его убывания. Обработка собранных в единый файл английских текстов производится с использованием программного комплекса тематического анализа лексики «ProTemAL-Engl» (автор - А. С. Гусельникова, научный руководитель - др техн. наук И.Е. Воронина, научный консультант - д-р филол. наук А.А. Кретов). Для проведения маркемного анализа в тексте выделяются 50 мар-кем - прошедшие через все фильтры словоформы (имена существительные) с максимальным положительным значением ИнТеМа, представляющим собой разность между весом слова по частоте и длине. Полученные списки словоформ проходят специальную систему фильтров, подвергаются контекстной проверке значений многозначных слов и исключению грамматической омонимии, в результате чего составляются индивидуальные маркемные списки авторов (подробно об используемой системе фильтров см.: [30]). Поскольку величина ИнТеМа зависит от длины текста, его использование в качестве инструмента сопоставительного маркемного анализа, а также установления динамики маркем возможно при исследовании текстов одинаковой длины, что по ряду объективных причин не всегда возможно. К числу таких причин можно отнести различное количество созданных каждым автором произведений и их доступность в электронном виде. В этом случае корректно провести маркемный анализ позволяет применение Нормированного ИнТеМа (НормИнТеМа), определяемого как отношение ИнТеМа маркемы автора к СумИнТеМу всех его маркем. Таким образом, НормИнТеМ вычисляется по формуле: НормИнтем = ИнТеМ :СумИнТеМ, а его значение всегда находится в интервале 0-1. Разнообразие литературных направлений второй половины XVII в. оказало влияние на формирование маркемных систем авторов среза. Выделение срезовых макем (СМ) позволяет установить общие закономерности, существующие в литературе исследуемого хронологического среза. Определение СМ осуществляется на основе сводного маркемного списка, составленного из маркемных списков авторов среза и ранжированного в порядке убывания суммарного нормированного интегрального веса (СумНормИнВес) его маркем. Величина СумНормИнВеса определяется произведением СумНормИнТема на количество авторов, употребивших данную маркему. Первые 50 маркем ранжированного по убыванию СумНормИнВеса сводного списка являются маркемами среза. Исследование Цель данной работы - выявление маркемной лексики английской прозы второй половины XVII в. Задача исследования - выделить СМ в прозаических текстах второй половины XVII в. (далее - срез 17-2) и определить стратификацию авторов среза. Объектом исследования являются доступные в электронном виде произведения 16 писателей: Джона Бэньяна (John Bunyan - Bun), Афры Бен (Afra Behn - Bn), Ричарда Брэтуэйта (Richard Brathwaite - Br), Томаса Гоббса (Thomas Hobbes - Hb), Джона Драйдена (John Dryden - Dr), Джона Ивлина (John Evelyn - Ev), Абрахама Каули (Abraham Cowley -Cl), Джона Локка (John Locke - Lck), Джона Мильтона (John Milton -М1), Джорджа Мэкензи (Sir George Mackenzie - Мск), Томаса Отвея (Thomas Otway - О^, Сэмюэла Пеписа (Samuel Pepys - Ps), Уильяма Сейлза (William Sales - Sl), Уильяма Уичерли (William Wycherley -Wch), Ричарда Хэда (Richard Head - Hd), Джорджа Этериджа (George Etherege - Eth) (в скобках указаны оригинальные имена авторов и принятые в работе сокращенные обозначения авторов). Общее количество исследованных в этом хронологическом срезе словоформ - 8 620 801. Отнесение исследуемых текстов ко второй половине ХУ11 в. в известной степени условно, поскольку некоторые текстов отдельных авторов формально принадлежат как первой, так и второй половине XVII в. В срезе 17-2 отсутствует общая для всех исследуемых авторов маркема. Доминантная маркема satisfaction 'удовлетворение'(15; 7,718; первая цифра - количество авторов, употребивших маркему, вторая -ее СумНормИнВес) не отмечена в маркемном списке Д. Мильтона. Ви-це-доминантная маркема understanding 'осмысление' (13; 6,494) отсутствует в маркемных списках Дж. Мэкензи, У. Сейлза и Дж. Этериджа. Распределение НормИнТеМа доминантной и вице-доминантной мар-кем в срезе 17-2 представлено на гистограмме (рис. 1). нормишем о о о о о о о о о о о о о о O-^hJCO-fc-UlO^J I ГП : - Л : _ ■ : Ё I I - - : : Бэн Бн Бр Гб Др Ив Кл Лк Мк Мл О т Пс Сз Уч Хд Эт ■ satisfaction о.о2 о.о4 ооо2 ооо2 ооо3 о.ое о.о 1 о.о: ооо3 о ооо 4 о.о4 ооо4 ооо5 ооо4 ооо4 □ understanding о.оз ооо3 ооо3 ооо3 ооо3 оо о.о 5 оо о ооо 3 ооо 4 о.о4 о о.об ооо4 о Рис. 1. Распределение НормИнТеМа маркем satisfaction / understanding во второй половине XVII в. Высокий СумНормИнТеМ understanding обусловлен ее доминированием у А. Каули и Д. Локка. У Р. Брэтуэйта, С. Пеписа, У. Уичер-ли, Р. Хэда - это вице-доминантная маркема. Ранг understanding в мар-кемных списках других авторов находится в пределах 3-8. При этом ранг доминантной СМ satisfaction в авторских маркемных списках находится, в основном, в пределах 3-4 (А. Бен, Дж. Мэкензи, Т. Отвей, С. Пепис, У. Сейлз, У. Уичерли, Р. Хэд). В качестве доминантной она выделена только в списке Д. Ивлина. Достаточно высокий ранг маркемы отмечен в списках Д. Драйдена - 6, Д. Локка - 10, Д. Бэньяна - 13. И только у Т. Гоббса, Р. Брэтуэйта ранг satisfaction находится в третьем десятке, у А. Каули - в четвертом десятке. Минимальный ранг - 47 - satisfaction занимает в маркемном списке Дж. Этериджа. Высокое значение СумНор-мИнТеМа understanding в срезе 17-2, очевидно, связано с особенностями рационализма эстетики Ренессанса, барокко и классицизма. Для эпохи Возрождения характерны представления о гармонии разума и чувства, в то время как для представителей барокко разум - это сила, дающая возможность противостоять хаосу жизни, а для классицизма характерно противопоставление рационального эмоциональному [31]. Поэтому вполне закономерно выделение в качестве доминантной маркемы «эмоциональной» satisfaction, а в качестве вице-доминантной - «ментальной» understanding. В целом в маркемной лексике второй половины XVII в. высока доля «ментальных» и «эмоциональных» маркем - 22. Однако в числе СМ наблюдается незначительное преобладание «эмоциональных» маркем -12. Тем не менее распространенность общих «ментальных» маркем в списках большинства авторов среза выше. Помимо вице-доминантной маркемы среза understanding в маркемных списках большинства авторов встречаются conscience 'совесть' (14; 4,581), confidence 'вера, доверие' (11; 2,152), consideration 'размышление' (11; 4,840), expectation 'ожидание' (11; 3,110), pleasure 'желание, воля' (11; 1,942), remembrance 'память, воспоминание' (10; 2,169), imagination 'воображение' (9; 1,377), observation 'наблюдение' (8; 1,272). И только contemplation 'раздумье' (6; 0,997) встречается менее чем у половины авторов среза. Среди «эмоциональных» маркем, вошедших в маркемные списки не менее восьми авторов среза, наряду с satisfaction, выделим entertainment 'развлечение' (12; 3,870), happiness 'счастье, радость' (11; 2,386), pleasure 'удовольствие' (11; 1,942), acknowledgement 'признательность' (8; 0,727). Остальные маркемы - indifference 'равнодушие' (6; 0,589), repentance 'сожаление' (6; 0,608), admiration 'восторг' (5; 0,524), disappointment 'разочарование' (5; 0,864), displeasure 'недовольство' (5; 0,438), indignation 'негодование' (5; 0,360), astonishment 'удивление' (4; 0,369) - характеризуют творчество около трети авторов среза. Среди «эмоциональных» маркем пять - indifference, repentance, disappointment, displeasure, indignation - имеют отрицательную окраску. Максимальное число отрицательных маркем в авторских списках СМ - 3 -выделено у Д. Бэньяна, А. Бен, С. Пеписа. Общей для них является disappointment. Indignation объединяет Д. Бэньяна и А. Бен и при этом имеет равный НормИнТеМ - 0,014. Общей для А. Бен и С. Пеписа является indifference. Пара displeasure - indignation выделена у двух авторов - Д. Мильтона и У. Сейлза. По две отрицательных маркеме в разной комбинации выделены у Д. Драйдена - indifference, displeasure, у Д. Ивлина - repentance, displeasure, Дж. Мэкензи - indifference, disappointment, у Дж. Этери-джа - repentance, indignation. По одной отрицательной маркеме выделено в текстах Р. Брэтуэйта, Д. Локка - indifference - и Т. Гоббса, Т. Отвея, Р. Хэда - repentance, a также У. Уичерли - disappointment. И только в текстах А. Каули отрицательные «эмоциональные» маркемы отсутствуют. Наиболее полно «эмоциональные» маркемы представлены у С. Пеписа -9, а также у А. Бен и У. Сейлза - 8. Таким образом, срез в целом характеризуется преобладанием положительных эмоциональных состояний, вызывающих восторг, изумление, удовлетворение, удовольствие, радость и чувство признательности. Значимыми для трети и более авторов оказываются и маркемы, характеризующие личностные качества человека - resolution 'решительность' (9; 1,371), covetousness 'алчность' (7; 1,104), greatness 'величие, мощь' (7; 0,817), dissimulation 'лицемерие' (6; 0,938), righteousness 'праведность' (6; 1,304), jealousy 'ревность' (5; 0,461). Несколько меньше представлена маркема self-preservation 'самосохранение' (4; 0,514). В той или иной степени эти маркемы присутствуют в текстах всех авторов среза. Максимально маркемы этой категории выделены у Р. Брэтуэйта - 5. В текстах А. Бен, Д. Драйдена, Р. Хэда обнаружено четыре маркемы, а у Т. Гоббса, А. Каули, Дж. Мэкензи, Т. Отвея, У. Уичерли и Дж. Этериджа -три. У остальных авторов отмечены одна (Д. Ивлин, Д. Локк, С. Пепис) или две (Д. Бэньян, Д. Мильтон, У. Сейлз) маркемы. Широко представлена в числе СМ группа маркем, выражающих межличностные отношения, - friendship 'дружба' (11; 3,056), assistance 'помощь' (9; 1,516), contradiction 'противоречие, конфликт' (7; 1,123), reconciliation 'примирение' (7; 1,340), encouragement 'ободрение' (6; 1,113), affection 'привязанность' (5; 0,531), commendation 'одобрение' (5; 0,531), forgiveness 'прощение' (5; 0,510). Они характерны для всех авторов, но максимальное представление получили в маркемном списке Д. Драйдена - 7. В текстах этого автора отсутствует только affection. Следующими по количеству маркем идут Р. Хэд - 6, А. Бен - 5, Д. Бэньян, Д. Ивлин, Дж. Мэкензи, У. Сейлз - 4, Т. Отвей, С. Пепис, Дж. Этеридж - 3. Меньше всего этихмаркем у Р. Брэтуэйта, Т. Гоббса, А. Каули, Д. Локка, Д. Мильтона, У. Уичерли - 2. Высокочастотной оказалась одна маркема, выражающая морально-нравственные ценности - innocence 'невинность, целомудрие' (8; 1,072). Важной она является для А. Бен, Д. Драйдена, А. Каули, Дж. Мэкензи, Д. Мильтона, Т. Отвея, У. Сейлза и У. Уичерли. Кроме того, важными для большинства представителей среза маркемами являются маркемы, выражающие фундаментальные понятия, связанные, в основном, с категорией бытийных отношений - opportunity 'благоприятная возможность, шанс' (14; 5,619), experience '(жизненный) опыт' (13; 2,813), knowledge 'знание, знания' (11; 2,132), punishment 'наказание' (11; 2,079), destruction 'разрушение' (10; 2,841), advantage 'преимущество' (9 1,310), difficult(y/ies) 'трудность, трудности' (9; 1,755), necessity 'необходимость' (9; 1,211), perfection 'безукоризненность' (9; 1,261), occasion 'удобный случай, возможность' (8; 0,891). Более чем у трети авторов среза выделены misfortune 'беда, несчастье' (7; 0,851), creature 'человек, создание' (6; 0,440), providence 'провидение, Бог' (6; 0,671). Опираясь на количество всех общих маркем (ОМ) в каждой паре авторов, можно установить типичность авторов относительно друг друга. С этой целью был вычислен коэффициент корреляции (КК) авторов среза. Величина КК равна произведению СумНормИнТеМов ОМ двух авторов. В табл. 1 представлены значения КК в каждой паре авторов, округленные до сотых. Мы использовали КК в качестве единицы измерения силы связи между авторами. Установив в каждой горизонтальной строке максимальное значение КК, мы, тем самым, определили силу максимальной векторной связи авторов. Учет только связей максимальной силы для каждой пары авторов позволил построить граф, отражающий основные векторные связи и их силу для авторов среза 17-2 (рис. 2). Для удобства представления и восприятия информации значения КК на графе представлены в процентном формате и округлены до целых. Т а б л и ц а 1 Значение коэффициента корреляции в парах авторов в срезе 17-2 Авторы Bun Bn Br Hb Dr Ev Cl Lck Mck Ml Ot Ps Sl Wch Hd Eth Bun 0,13 0,08 0,14 0,18 0,10 0,12 0,05 0,04 0,06 0,04 0,07 0,08 0,09 0,16 0,10 Bn 0,13 0,14 0,07 0,34 0,22 0,21 0,13 0,25 0,08 0,28 0,26 0,27 0,30 0,42 0,12 Br 0,08 0,14 0,06 0,16 0,10 0,19 0,08 0,07 0,04 0,06 0,16 0,13 0,11 0,19 0,10 Hb 0,14 0,07 0,06 0,21 0,04 0,06 0,07 0,01 0,05 0,03 0,05 0,06 0,04 0,13 0,02 Dr 0,18 0,34 0,16 0,21 0,22 0,27 0,22 0,15 0,09 0,20 0,24 0,25 0,19 0,41 0,11 Ev 0,10 0,22 0,10 0,04 0,22 0,11 0,08 0,20 0,11 0,18 0,26 0,27 0,13 0,23 0,16 Cl 0,12 0,21 0,19 0,06 0,27 0,11 0,14 0,14 0,07 0,15 0,12 0,13 0,21 0,27 0,08 Lck 0,05 0,13 0,08 0,07 0,22 0,08 0,14 0,07 0,04 0,03 0,16 0,08 0,07 0,21 0,02 Mck 0,04 0,25 0,07 0,01 0,15 0,20 0,14 0,07 0,04 0,10 0,17 0,18 0,13 0,18 0,12 М1 0,06 0,08 0,04 0,05 0,09 0,11 0,07 0,04 0,04 0,08 0,04 0,10 0,06 0,09 0,09 Ot 0,04 0,28 0,06 0,03 0,20 0,18 0,15 0,03 0,10 0,08 0,10 0,16 0,19 0,19 0,24 Ps 0,07 0,26 0,16 0,05 0,24 0,26 0,12 0,16 0,17 0,04 0,10 0,15 0,20 0,26 0,09 Sl 0,08 0,27 0,13 0,06 0,25 0,27 0,13 0,08 0,18 0,10 0,16 0,15 0,10 0,25 0,10 Wch 0,09 0,30 0,11 0,04 0,19 0,13 0,21 0,07 0,13 0,06 0,19 0,20 0,10 0,27 0,18 Hd 0,16 0,42 0,19 0,13 0,41 0,23 0,27 0,21 0,18 0,09 0,19 0,26 0,25 0,27 0,17 Eth 0,10 0,12 0,10 0,02 0,11 0,16 0,08 0,02 0,12 0,09 0,24 0,09 0,10 0,18 0,17 саяфйю щ офЗТР^" Рис. 2. Предпочтительные связи английских писателей второй половины XVII в. (по данным КК) Всего на графе 16 связей. Одновременный учет количества и векторной ориентированности связей позволил выделить два центра аттракции: большой и малый. Центром аттракции мы называем объединение авторов, имеющих взаимонаправленные связи. В структуру графа также входят авторы, имеющие разнонаправленные связи -Д. Драйден, Т. Отвей, У. Сейлз. Эти авторы образуют центры-посредники (ЦП). Поскольку все ЦП имеют непосредственную связь с ЦА, мы назвали их центрами-посредниками первой степени (ЦП-1). Периферию графа составляют терминальные (конечные) авторы -Т. Гоббс, Д. Локк, Д. Бэньян, Дж. Этеридж, Дж. Мильтон. Их характеризует наличие только одного вида связи - центробежной. Под центробежной связью мы понимаем связь максимальной силы, которая направлена от данного автора к ближайшему для него по КК автору. Большой центр аттракции (БЦА) - Хэд - Брэтуэйт - Каули -Пепис - Драйден - Бен - Уичерли - Мэкензи - Отвей. Все авторы БЦА группируются возле двух связующих фигур Р. Хэда и А. Бен, имеющих двустороннюю связь одинаковой силы. Группу авторов, имеющих центробежную связь с Р. Хэдом, образуют С. Пепис, А. Каули, Р. Брэтуэйт и Д. Драйден. Группу А. Бен составляют У. Уичерли, Дж. Мэкензи, Т. Отвей. В состав БЦА входят два ЦП-1, связующими фигурами которых являются Д. Драйден и Т. Отвей. ЦП-1 Д. Драйдена характеризует наличие трех центробежных связей - Т. Гоббса, Д. Локка и Д. Бэньяна, а ЦП-1 Т. Отвея - центробежная связь Дж. Этериджа. С учетом векторной направленности связи получаем две цепочки: Гоббс - Локк - Бэнь-ян - Драйден - Хэд, замыкающуюся на Р. Хэде, и Этеридж - Отвей -Бен, замыкающуюся на А. Бен. Сила связи Р. Хэда с Д. Драйденом и А. Бен отличается незначительно - 42 и 43. Максимальная для среза сила двусторонней связи - 43 - характеризует пару Хэд - Бен. При этом наличие взаимонаправленной связи Хэд - Бен при отсутствии связей максимальной силы между авторами, группирующимися возле Р. Хэда и А. Бен, позволяет рассматривать Р. Хэда и А. Бен еще как и авторов, образующих два ЦП: ЦП Хэда и ЦП Бен. Суммарная мощность БЦА с учетом силы максимальной связи составляет 461. Рассматривая количественное и содержательное маркемное наполнение центра относительно Р. Хэда, отметим, что больше всего ОМ с ним имеет А. Бен - 30, из них СМ - 27. Далее следуют Д. Драйден - 29 (СМ -27), С. Пепис - 23 (СМ - 19), А. Каули - 22 СМ, Р. Брэтуэйт - 20 (СМ -18). Общими для всех авторов являются семь маркем - «ментальные» confidence, conscience, consideration, understanding; «эмоциональные» entertainment, satisfaction; «фундаментальная» opportunity. Следующая группа из восьми маркем объединяет три группы авторов: Хэд - Бен - Брэтуэйт - Драйден - Пепис; Хэд - Брэтуэйт -Драйден - Каули - Пепис; Хэд - Бен - Брэтуэйт - Драйден - Каули. Больше всего общих маркем - 4 - представлено в группе Хэд - Брэту-эйт - Драйден - Каули - Пепис. Это - «ментальная» CM observation и «фундаментальные» CM knowledge, experience, necessity. «Эмоциональная» маркема acknowledgement и выражающая межличностные отношения маркема friendship объединяют авторов группы Хэд - Бен -Брэтуэйт - Драйден - Пепис, а «ментальная» remembrance и «эмоциональная» happiness - Хэд - Бен - Брэтуэйт - Драйден - Каули. Самая многочисленная группа маркем - 12 - выделена в группах из четырех авторов. Общими для группы Хэд - Бен - Драйден - Пепис являются «фундаментальные» advantage, difficult(y/ies), «ментальная» expectation и «межличностная» assistance. Вторая по количеству ОМ группа Хэд - Бен - Драйден - Каули объединена «ментальной» imagination, «межличностной» encouragement и «фундаментальной» punishment. Маркемы, характеризующие личностные качества человека, cov-etousness и resolution, объединяют Хэда с Бен, Брэтуэйтом, Драйденом и Каули, причем обе маркемы характеризуют группу Хэд - Брэтуэйт -Драйден. У Бен выделена только resolution, а у Каули - covetousness. Еще три общие СМ характеризуют связь Хэда с Каули - Бен -misfortune, Каули - Брэтуэйт - contemplation, Каули - Драйден - destruction. По две маркемы связывают Хэда с Бен - Драйденом - complaisance 'почтительность, услужливость' (ОМ), contradiction (CM), Бен - Пеписом - melancholy 'уныние, тоска' (ОМ), occasion (CM). Общими только для отдельных пар авторов являются, главным образом, маркемы, не вошедшие в число СМ, - inconstancy 'непостоянство' (Хэд - Бен); concupiscence 'вожделение', impression 'впечатление' (Хэд - Брэтуэйт); commiseration 'сочувствие, сострадание', СМ self-preservation (Хэд - Драйден); convenience 'удобство, комфорт', kindness 'привязанность, нежность' (Хэд - Пепис). Таким образом, содержательный состав маркем, обеспечивающих основные маркемные связи авторов большого центра аттракции, составили 11 «фундаментальных», 9 «ментальных», 7 «эмоциональных», 6 маркем «личностных» и 5 «межличностных» маркем. Малый (изолированный) центр аттракции (МЦА) представляют Ивлин - Мильтон - Сейлз. Связующей фигурой центра является Д. Ивлин. Он же является ключевой фигурой ЦП-1, опосредующего связь Д. Мильтона с У. Сейлзом. Суммарная мощность этого центра аттракции - 67. По количеству связей центральной фигурой выступает Р. Хэд -шесть непосредственных связей общей мощностью 203 (при определении количества связей учитывается их направленность, поэтому двусторонняя связь считается как две связи). На втором месте А. Бен: пять связей общей мощностью 172. На третьем месте - Д. Драйден с четырьмя связями общей мощностью 103. Следует отметить, что все три автора объединены связями максимальной силы, образуя системообразующую триаду среза - с Хэдом в качестве центральной фигуры. По суммарному значению максимальной силы связи рейтинг авторов первой половины XVII в. выглядит следующим образом (табл. 2). Мы сопоставили корреляцию рейтинга авторов, основанного на значениях максимальной силы, со стратификацией авторов, составленной на основе СумНормИнТеМа только общих СМ, представленной на рис. 3. Критерием определения принадлежности автора к одному из классов является значение разности суммы НормИнТеМов СМ каждого автора и среднего значения суммы НормИнТеМов СМ всех авторов среза. Типичными представителями своего среза - нуклеарами - являются Р. Хэд, Д. Драйден, А. Бен. Список авторов полностью совпадает со списком, выделенным в рейтинге, с той разницей, что Драйден и Бен поменялись местами. Это обусловлено тем, что данные рейтинга опираются только на величины максимальной силы и не учитывают другие связи между авторами среза и вектор их направления. Нетипичными для среза - маргиналами - определяются Д. Бэньян, Д. Локк, Т. Гоббс, Д. Мильтон. Отличие от рейтинга касается места в нем Р. Брэтуэйта -14. Однако, делая поправку на то, что данные рейтинга показывают лишь основные связи авторов, это отличие можно считать несущественным. Промежуточное положение занимают медиары - Д. Ивлин, С. Пепис, У. Сейлз, У. Уичерли, А. Каули, Т. Отвей, Дж. Мэкензи, Дж. Этеридж, Р. Брэтуэйт. В рейтинге они также занимают промежуточное положение. В целом при учете количества и вектора связей авторов, а также их отношения к центрам аттракции, наблюдается полное совпадение графических и аналитических данных. Т а б л и ц а 3 Рейтинг авторов первой половины XVII в. по суммарной силе связи № Автор Количество связей Сила связи 1 Хэд 6 203 2 Бен 5 172 3 Драйден 4 103 4 Ивлин 3 67 5 Сейлз 2 56 6 Отвей 2 54 7 Уичерли 1 31 8 Каули 1 28 9 Пепис 1 27 10 Мэкензи 1 26 11 Этеридж 1 25 12 Локк 1 22 13 Гоббс 1 21 14 Брэтуэйт 1 20 15 Бэньян 1 18 16 Мильтон 1 11 0,1 0,08 0,06 0,04 -0,06 -0,08 -0,1 Рис. 3. Стратификация английских авторов второй половины XVII в. относительно среднего значения Заключение Проведенное маркемное исследование текстов английских авторов второй половины XVII в. позволило установить: 1. Доминантой данного хронологического среза является маркема satisfaction, вице-доминантой - маркема understanding. 2. В срезе отсутствуют общие для всех авторов маркемы. 3. Срез характеризуется незначительным преобладанием «эмоциональных» маркем над «ментальными». В маркемных списках авторов «ментальные» маркемы представлены шире. 4. В срезе высока доля маркем, характеризующих личностные качества человека, межличностные отношения и фундаментальные понятия. 5. В срезе 17-2 выделяются два центра аттракции. Связующими фигурами большого центра аттракции являются Р. Хэд и А. Бен, малого - Д. Ивлин и У. Сейлз. 6. Структуру большого центра аттракции образуют четыре центра-посредника - ЦП Хэда, ЦП Бен, ЦП Драйдена, ЦП Отвея. ЦП Хэда и ЦП Бен являются центрами-посредниками относительно друг друга вследствие наличия взаимонаправленной связи Р. Хэда и А. Бен и отсутствия маркемных связей максимальной силы между авторами, группирующимися около каждого из них. 7. В составе малого центра аттракции выделен один центр-посредник - ЦП Ивлина - опосредующий связь Д. Мильтона и У. Сейлза. 8. В результате стратификация авторов среза установлен статус каждого автора: нуклеары - Р. Хэд, Д. Драйден, А. Бен; медиары -Д. Ивлин, С. Пепис, У. Сейлз, У. Уичерли, А. Каули, Т. Отвей, Дж. Мэкензи, Дж. Этеридж, Р. Брэтуэйт; маргиналы - Д. Бэньян, Д. Локк, Т. Гоббс, Д. Мильтон. Источники I. http://www.gutenberg.org/ 2. https://quod.lib.umich.edu/e/eebo/ 3. https://archive.org/ 4. http://oll.libertyfund.org/

Ключевые слова

English literature, quantitative linguistics, authors' markemesimilarity visualization, centre of attraction, correlation coefficient, index of textual markedness, markeme, английская литература, квантитативная лингвистика, визуализация маркемной близости авторов, центр аттракции, коэффициент корреляции, индекс текстуальной маркированности, маркема

Авторы

ФИООрганизацияДополнительноE-mail
Кретов Алексей АлександровичВоронежский государственный университет доктор филологических наук, профессор, заведующий кафедрой теоретической и прикладной лингвистики, директор Научно-методического центра компьютерной лингвистикиtipl@rgph.vsu.ru
Комарова Эмилия ПавловнаВоронежский государственный технический университет доктор педагогических наук, профессор кафедры иностранных языков и технологии переводаvivtkmk@mail.ru
Артемова Ольга ГригорьевнаВоронежский государственный технический университет кандидат филологических наук, доцент кафедры иностранных языков и технологии переводаolgaartemova65@yandex.ru
Всего: 3

Ссылки

История зарубежной литературы ХУП века : учеб. / под общ. рук. З.И. Плавскина. URL: https://www.libfox.ru/367790-zahariy-plavskin-istoriya-zarubezhnoy-literatury-xvii-veka.html
Фаустов А.А., Кретов А.А. Понятие маркемы и предварительные итоги маркемного анализа русской литературы // Вестник Воронежского государственного университета. Сер. Лингвистика и межкультурная коммуникация. 2017. № 4. С. 16-31.
Кретов А.А Понятие маркемы: методика выявления и практика использования // Универсалии русской литературы. Воронеж, 2010. С. 138-153.
Гусельникова А. С., Воронина И.Е., Кретов А А Выделение тематически маркированной лексики в текстах на естественных языках // Материалы XV Международной научно-методической конференции «Информатика: проблемы, методология, технологии», 12-13 февраля 2015 г. Воронеж, 2015. Т. 3. С. 245-250.
Кишинская Л.Г., Кишинский С.В. Выявление опережающей роли поэтической речи в развитии языка с помощью корреляционного анализа // Ученые записки Тартуского государственного университета. Лингвостатистика и квантитативные закономерности текста. Труды по лингвистике. 1980. Т. VI. С. 47-58.
Борунов А. Б. Квантитативное исследование англоязычного авторского корпуса Рэгу H. Митры // Litera. 2017. № 1. С. 76-87. URL: http://e-notabene.ru/fil/ article_20090.html
Борунов А.Б. Параметрическая стратификация лексики авторского англоязычного корпуса (на материале авторского корпуса американского писателя Рэгу Н. Митры) // Филологические науки. Вопросы теории и практики. 2016. № 12 (66) : в 4 ч. Ч. 1. С. 65-68.
Марусенко М.А Атрибуция анонимных и псевдонимных текстов методами прикладной лингвистики // Прикладное языкознание. СПб., 1996.
Слугина О.В. Лингвокогнитивные основы поэтической квантитативности: на материале английского языка : дис.. канд. филол. наук. Саранск, 2009. 200 с.
Miles J. The continuity of poetic language; the primary language of poetry, 1540's-1940's. NY : Octagon Books, 1965.
Fucks W. Mathematische Analyse von Sprachelementen, Sprachstil und Sprachen. Koln und Oplade, 1955. 110 p.
Пиотровский Р.Г. Математическая лингвистика : учеб. пособие М. : Высш. шк., 1977. 383 с.
Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л. : Наука, 1979. 111 с.
Herdan G. Language as Choice and Chance. Noordhoff : Groningen, 1956. 356 p.
Головин Б.Н. Язык и статистика. М. : Просвещение, 1971. 192 с.
Shannon C., Weaver W. The Mathematical Theory of Communication. Univ of Illinois Press, 1949. 117 p.
Zipf G.K. The Psycho-Biology of Language an introduction to dynamic philology. Cambridge : Mass. MITPress, 1965. 336 p.
Zipf G.K. Human Behavior and the Principle of Least Effort. Cambridge : Addison-Wesley Press, 1949. 533 p.
Boldrini V. Le statichelettararie e ifonemielementarinellapoesia. Milano, 1948.
Estoup J. Gammestenographique. Paris, 1916.
Condon E. V. Statistics of Vocabulary // Science. 1928. Vol. 67. Р. 1733.
Верхозин С. С. О статусе количественных методов в лингвистике // Вестник Иркутского государственного лингвистического университета. 2013. Вып. № 3 (24). С. 145-150.
Ross A Philological Probability Problems //Statist. Soc. Ser. B. 1950. Vol. XII. P. 19-59.
Yule Udny G. A Statistical Study of Vocabulary. Cambridge, 1944. Vol. IX. 306 p.
Марков А А Пример статистического исследования над текстом «Евгения Онегина», иллюстрирующий связь испытаний в цепь // Известия Императорской академии наук. Сер. VI. 1913. Т. 7, № 3. С. 153-162. URL: http://www.mathnet.ru/php/archive.phtml? jrnid=im&option_lang=rus&paperid=6612&wshow=paper
Марков А.А. Исследования замечательного случая зависимых испытаний // Известия Императорской академии наук. Сер. VI. 1907. Т. 1, № 3. С. 60-80. URL: http://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=im&paperid=7832&optio n_lang=rus
Буняковский В.Я. Основания математической теории вероятности. М. : Книга по Требованию, 2017. 502 с. URL: https://www.bookvoed.ru/files/3515/36/75/0.pdf
Forstemann E. Commentary on the Maya manuscript in the royal public library of Dres den. Published by the Museum, 1906. 266 р. URL: http://нэб.рф/search/ ?f_field[authorbook]=f/authorbook/Forstemann+E.
Ерофеева Н.Е. Зарубежная литература XVII век : учеб. для пед. вузов. URL: http://17v-euro-lit.niv.ru/17v-euro-lit/erofeeva-uchebnik/index.htm
Сидоров Ю.В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров : дис.. канд. техн. наук. Петрозаводск, 2002. 127 с.
Бердников Г.П. (гл. ред.) История всемирной литературы : в 9 т. М. : Наука, 1989. Т. 4. URL: http://litlife. club/br/?b=204319&p= 101
 Эволюция маркемной лексики на основе исследования маркем в хронологических срезах | Язык и культура. 2018. № 42. DOI:  10.17223/19996195/42/2

Эволюция маркемной лексики на основе исследования маркем в хронологических срезах | Язык и культура. 2018. № 42. DOI: 10.17223/19996195/42/2