Данное исследование является одним из этапов масштабного изучения маркемного состава языка британской художественной прозы XVH-XX вв. Маркемные связи, устанавливаемые между прозаическими текстами британских писателей второй половины ХХ в. (срез 20-2), позволяют выяснить степень общности маркемной лексики исследуемых авторов. Маркемные связи выявляются между текстами всех авторов, но в зависимости от силы возникающих между текстами, а следовательно, и между авторами маркемных связей и числа исследуемых авторов, различают предпочтительные маркемные связи, или связи 1-го уровня, и связи 2-го, 3-го и т.д. (по числу авторов среза) уровней. На данном этапе цель исследования - установление и содержательное изучение предпочтительных маркемных связей, возникающих между авторами среза 20-2. В соответствии с поставленной целью решаются следующие задачи: 1) выявление связующих маркем, обеспечивающих образование предпочтительных маркемных связей между авторами среза 20-2; 2) визуализация предпочтительных маркемных связей авторов среза 20-2; 3) содержательное исследование предпочтительных маркемных связей, сложившихся в срезе 20-2 центров аттракции, и определение их внутренней и внешней специфики. Актуальность обсуждаемой проблемы объясняется поиском способов формализации содержательного анализа текста. Исследование маркемных связей представляет собой один из способов формализованного содержательного анализа текста. Решение поставленных задач основано на применении метода маркемного анализа, предложенного А. А. Кретовым. Метод маркемного анализа основывается на извлечении из собранных в единый файл текстов автора ключевых слов -маркем. Маркему характеризует аномальность частоты распределения в тексте, определяемая величиной Индекса ее Текстуальной Маркированности (ИнТеМа). Формула, используемая для вычисления ИнТеМа, выражает существующую функциональную зависимость между весом словоформы по частоте (переменный параметр) и ее весом по длине (постоянный параметр). Меру существенности словоформы для каждого конкретного текста определяет положительное значение ИнТеМа. В качестве маркем рассматривается имя существительное как наименее маркированная и ориентированная на внеязыковую действительность часть речи. Все потенциальные маркемы проходят специальную систему фильтров - грамматико-семантический, тематико-семантический, стилистический, диалогический, классификаторный, позволяющие отделить то, что рассказывается, от того, ради чего рассказывается. В результате выделяется список из 50 самых важных для автора текста словоформ -маркем, ранжированных в порядке убывания ИнТеМа. Поскольку величина ИнТеМа зависит от количества словоформ в тексте конкретного автора, обеспечить сопоставимость маркем в списках разных авторов позволяет Нормирование ИнТеМов маркем каждого автора, осуществляемое путем деления ИнТеМа каждой маркемы автора на Суммарный ИнТеМ (СумИнТеМ) всех его маркем, в результате чего их значения всегда находятся в интервале 0-1. Маркемные связи между авторами обеспечивают связующие маркемы - общие маркемы каждой пары авторов среза 20-2. Количественной мерой силы маркемной связи, характеризующей степень общности маркемной лексики двух авторов, является Индекс Маркемной Близости (ИМаБ) авторов. Максимальная величина ИМаБа свидетельствует об образовании предпочтительной маркемной связи между авторами и определяет силу их маркемной связи. Максимальный ИМаБ может характеризовать только одного или сразу двух авторов пары. Следовательно, возникающие между авторами связи являются нагруженными векторными, т. е. ориентированными и обладающими собственным весом связями. Если величина ИМаБа максимальна только для одного автора пары, между авторами устанавливается однонаправленная связь максимальной силы (от данного автора ко второму автору пары). Если максимальный ИМаБ характеризует сразу двух авторов пары, между ними образуется обоюдная, или взаимонаправленная, предпочтительная маркем-ная связь. Авторы, между которыми образуется обоюдная связь, представляют Центр Аттракции (ЦА), возле которого группируются другие авторы, соединенные однонаправленной связью. Таким образом, ЦА образуют два автора, являющиеся его связующими фигурами и образующие относительно друг друга Центр-посредник нулевой степени (ЦП-0). Каждый ЦП-0 объединяет авторов непосредственно или опосредованно связанных однонаправленной связью со своим ЦП-0. Непосредственная связь возникает тогда, когда между автором и ЦП-0 существует однонаправленная связь типа автор^ЦП-0. Опосредованная связь возникает при наличии цепочки автор1^автор2^ЦП-0. В этом случае ближайший к ЦП-0 автор (здесь - автор2) образует центр-посредник первой степени. При удлинении цепочки связанных друг с другом однонаправленной связью авторов каждый последующий автор образует центр-посредник следующей (по возрастанию) степени - второй, третьей и т. д. При наличии опосредованной маркемной связи связующими являются только те маркемы, которые являются общими для каждого автора цепочки, соединенной однонаправленными связями. Применяемый в этом случае принцип «наследования связей и их весов» позволяет установить общую величину связующей силы каждой маркемы в хронологическом срезе. При визуализации полученных данных было установлено, что в срезе 20-2 выделяются два графа: ЦА-1 Силлитоу - Пратчетт и ЦА-2 Мёрдок - Голдинг. Были установлены маркемы, относящиеся к связующему ядру и периферии среза 20-2, и его совокупная маркемная мощность. Анализ связующих маркем каждого центра аттракции позволил установить внутреннюю и внешнюю специфику каждого из них. Также были выделены маркемы, обеспечивающие связь двух центров аттракции в срезе 20-2.
Linking Markemes in Enflish Prose of the Latter Half of the Twentieth Century.pdf Введение В настоящее время применение количественных методов - одно из условий, обеспечивающих достоверность результатов лингвистического исследования. Рассматривая квантитативные методы как meaning in numbers (смысл в цифрах), Золтан Дерньеи справедливо полагает, что количественное выражение качественных характеристик объекта способно не только характеризовать сам объект, но и его взаимосвязи [1]. Как отмечает Н.В. Малышева, «привлечение методов измерения и подсчета языковых реализаций позволяет существенно модифицировать представление о языковой системе и возможностях ее функционирования» [2]. А это, в свою очередь, дает возможность организовать и обобщить полученные эмпирическим путем данные, выявить взаимосвязанные закономерности, по которым функционирует язык, сформулировать законы его функционирования и, в конечном счете, построить общую теорию. Квантитативные методы хорошо зарекомендовали себя как метод сбора и обработки данных, поскольку позволяют выделить, отобрать и осуществить обработку параметров, которые подлежат измерению, а затем исследовать их статистическими методами с точки зрения обозримых закономерностей. Точность измерений и однозначность результатов, по мнению А.В. Кащеевой, позволяют с большей долей вероятности подтверждать или опровергать выдвигаемые гипотезы [3]. Маркемология - направление лингвистических исследований, предложенное и развиваемое А.А. Кретовым [4, 5], позволяет формализовать и объективировать содержательный анализ литературного текста. Маркемологические исследования основываются на методе компьютерного выделения ключевых слов - маркем. Метод маркемного анализа применяется для исследования творчества отдельных авторов; составления общесрезовых (односрезовых) или общеинтервальных (многосрезовых) маркемных списков; описания специфики маркем отдельных авторов или групп авторов; изучения эволюции маркемной лексики на основе исследования динамики маркем в нескольких хронологических срезах; влияния социокультурных процессов на динамику маркем [6-9]. Маркемологические исследования также позволяют посредством выделения общих маркем и определения на их основе Индекса Маркемной Близости (ИМаБ) авторов устанавливать взаимосвязи различных авторов и таким образом обнаруживать преемственность в литературе [10, 11]. Материал и методы В предлагаемой статье объектом исследования являются доступные в электронном виде произведения 16 писателей второй половины XX - начала XXI в.: Питера Акройда (Peter Ackroyd - Ack), Кингсли Эмиса (Kingsley Amis - Ams), Джеймса Балларда (J.G. Ballard - Bld), Клайва Баркера (Clive Barker - Brk), Энтони Бёрджесса (Anthony Burgess - Bur), Лоренса Даррелла (Lawrence Durrell - Drl), Джона Фаулза (John Fowles - Fls), Уильяма Голдинга (William Golding- Gol), Грэма Грина (Graham Greene - Grn), Джека Хиггинса (псевдоним британского романиста Гарри Паттерсона) (Jack Higgins - Hig), Дорис Лессинг (Doris Lessing - Les), Айрис Мёрдок (Iris Murdoch - Mur), Патрика О'Брайана (Patrick O'Brian - OBr), Терри Пратчетта (Terry Pratchett - Prt), Алана Силлитоу (Alan Sillitoe - Sil), Чарльза Перси Сноу (C.P. Snow - Snw). В скобках указаны оригинальные имена авторов и их сокращенные обозначения, принятые в работе. Тексты для исследования выбраны из коллекции Проекта «Гутенберг» (http://www.gutenberg.org/). Суммарный размер обследованных текстов - 23 999 195 словоформ. Предметом исследования выступают маркемные связи художественных текстов британских прозаиков второй половины XX века (далее - «срез 20-2»). Маркемный анализ языка литературных произведений предполагает выделение из всего перечня употребленных словоформ маркем и вычисление индекса их текстуальной маркированности (ИнТеМ). Используемая для вычисления ИнТеМа словоформы формула ИнТеМ = Ч-вес - Д-вес, где Ч-вес - вес словоформы по частоте, а Д-вес - вес словоформы по длине, выражает функциональную зависимость, обусловливающую величину ИнТеМа величиной Ч-веса, поскольку Д-вес конкретной словоформы в каждом тексте, определяемый длиной слова в буквах, является неизменным для всех словоформ данной длины этого текста. Поскольку ИнТеМ - величина переменная, его значение зависит от количества вхождений словоформы в текст. Чем выше частота распределения словоформы в тексте, тем выше ее ИнТеМ. На превышение порога нормальной частоты распределения отдельной словоформы указывают положительные значения ИнТеМа. Поэтому для лингвистики величина ИнТеМа - это степень текстовой весомости отдельной словоформы для конкретного текста [13]. Вычисление ИнТеМа английских словоформ с последующим их ранжированием по величине ИнТеМа производится с использованием программного комплекса тематического анализа лексики ProTemAL-Engl (автор - А.С. Гусельникова, научный руководитель - д-р техн. наук. И.Е. Воронина, научный консультант - д-р филол. наук А.А. Кретов) посредством обработки текстов данного автора, собранных в единый файл. Положительная величина ИнТеМа - это обязательный, но не единственный критерий для выделения словоформы в категорию мар-кем. Маркема - это одно из множества ключевых авторских слов, позволяющее приблизиться к пониманию цели создания текста. Поэтому в качестве источника маркем рассматривается наименее маркированная и ориентированная на внеязыковую действительность часть речи - имя существительное. Для приобретения статуса маркемы имена существительные проходят систему специальных фильтров - грамматико-семантический, тематико-семантический, стилистический, диалогический, классификаторный (подробно об используемых фильтрах см. [14]). Считается целесообразным выделение 50 маркем для одного автора. Таким образом, маркема - это одна из 50 прошедших все фильтры словоформ, ранжированных по убыванию ИнТеМа. Значения параметров Ч-веса и Д-веса отдельной словоформы, обусловливающие величину ИнТеМа, зависят от количества словоформ в конкретном тексте. Так, например, количество словоформ в тексте Фаул-за 32 934, а в тексте Эмиса - 30 196. Для словоформы текста Фаулза, имеющей частоту употребления 1, а длину 19 букв, Ч-вес равен 0,4115, Д-вес - 0,3945. Соответственно, ИнТеМ такой словоформы в тексте Фа-улза составляет 0,4115 - 0,3945 = 0,077. В тексте Эмиса Ч-вес словоформы, имеющей такие же параметры, составляет 0,4494, а ее Д-вес - 0,3605, следовательно, величина ИнТеМа будет равна 0,4494 - 0,3605 = 0,0889. Пренебречь разницей в длине исследуемых авторских текстов и привести значения ИнТеМа к сопоставимому виду позволяет Нормирование ИнТеМов маркем каждого автора. Нормирование ИнТеМа производится путем деления ИнТеМа каждой маркемы автора на Суммарный Ин-ТеМ (СумИнТеМ) всех его маркем. В этом случае значение Нормированного ИнТеМа (НормИнТеМа) всегда располагается в интервале 0-1, что позволяет обеспечить сопоставимость весов маркем всех исследуемых авторов. Установление предпочтительных маркемных связей между британскими прозаиками второй половины XX в. основывается на выделении и исследовании связующих маркем. В качестве связующих рассматриваются маркемы, обеспечивающие маркемную связь двух и более авторов при сравнении «каждый с каждым». При выделении связующих маркем учитываются только общие маркемы для каждой пары авторов среза. Источником извлечения общих маркем служат авторские маркемные списки. Далее для общих маркем каждой пары авторов вычисляется Индекс Маркемной Близости (ИМаБ), являющийся количественной характеристикой общности маркемной лексики двух авторов. Вычисление ИМаБа производится по формуле ИМаБ = СумНормИнТеМОМ1 х СумНормИнТеМОМ2, где ИМаБ - индекс маркемной близости, СумНормИнТеМОМ1 и СумНормИнТеМОМ2 - СумНормИнТеМ общих маркем в паре. Диапазон значений индекса маркемной близости - от 0 до 1. Например, СумНормИнТеМ ОМ Акройда в паре Акройд - Эмис равен 0,4286, СумНормИнТеМ соответствующих ОМ Эмиса - 0,4647, следовательно, ИМаБ = 0,4286 х 0,4647 = 0,1992. Значение ИМаБа 0,199 находим на пересечении строки «Ack» (Акройд) со столбцом 1 «Ams» (Эмис) в табл. 1, где представлены значения ИМаБа для каждой пары авторов, округленные до тысячных. Маркемы той пары авторов, в которой ИМаБ является максимальным для одного или двух авторов пары, являются связующими данных авторов маркемами. Величина ИМаБа характеризует силу мар-кемной связи двух авторов. В том случае, когда величина ИМаБа максимальна для одного автора пары, мы получаем направленную, или ориентированную, связь максимальной силы. Если максимальное значение ИМаБа для Автора 1 (Силлитоу -«Sil») находится на пересечении с Автором 2 (Пратчетт - «Prt»), а максимальное значение ИМаБа Автора 2 находится на пересечении с Автором 1, связь между Авторами 1 и 2 называется взаимонаправленной связью. Т а б л и ц а 1 Значение индекса маркемной близости авторов в срезе 20-2, промилле Author Ack Ams Bld Brk Bur Drl Fls Gol Grn Hig Les Mur OBr Prt Sil Snw Ack 199 120 181 187 176 177 271 172 146 229 167 213 255 307 114 Ams 199 181 235 312 305 207 373 334 280 212 282 399 328 419 350 Bld 120 181 192 087 108 148 117 168 279 214 162 125 255 245 114 Brk 181 235 192 196 190 186 330 258 249 156 297 204 269 289 180 Bur 187 312 087 196 158 179 303 279 208 185 221 216 312 356 220 Drl 176 305 108 190 158 232 285 191 118 123 316 190 225 239 216 Fls 177 207 148 186 179 232 231 117 147 187 240 216 242 270 179 Gol 271 373 117 330 303 285 231 300 275 242 426 372 423 403 331 Grn 172 334 168 258 279 191 117 300 341 206 235 242 318 356 266 Hig 146 280 279 249 208 118 147 275 341 291 239 232 338 307 227 Les 229 212 214 156 185 123 187 242 206 291 151 204 299 340 111 Mur 167 282 162 297 221 316 240 426 235 239 151 276 285 325 254 OBr 213 399 125 204 216 190 216 372 242 232 204 276 337 425 243 Prt 255 328 255 269 312 225 242 423 318 338 299 285 337 534 246 Sil 307 419 245 289 356 239 270 403 356 307 340 325 425 534 310 Snw 114 350 114 180 220 216 179 331 266 227 111 254 243 246 310 Поскольку в данном исследовании мы используем ИМаБ в качестве единицы измерения силы связи между авторами, то, установив в каждой горизонтальной строке максимальное значение ИМаБа, мы, тем самым, определяем силу максимальной векторной связи авторов. Так, например, приняв за отправную точку Акройда (строка «Ack»), мы обнаруживаем, что для него максимальный ИМаБ (свидетельствующий о максимальной близости маркемных составов двух авторов) - 0,307 представлен в столбце «Sil» (Силлитоу). Следовательно, Акройд указывает на Силлитоу. Так мы получаем ориентированный граф: от Акройда к Силлитоу. Аналогичные данные извлекаются из всех строк. Исследование Принимая во внимание только связи максимальной силы для каждой пары авторов, можно построить граф, отражающий основные векторные связи и их силу для авторов среза 20-2 (рис. 1). С этой целью для каждого автора определялся ближайший к нему по ИМаБу автор, и все дальнейшее исследование строилось на анализе только тех маркем, которые связывают авторов среза в такие пары (рис. 1). Рис. 1. Граф предпочтительных связей авторов среза 20-2 Выделение связей максимальной силы позволяет провести анализ связующей силы маркем относительно Центров Аттракции (ЦА), представляющих собой объединение авторов, имеющих обоюдные, т.е. взаимонаправленные, связи. Таким образом, в срезе 20-2 выделяются два ЦА: ЦА-1 Силлитоу - Пратчетт и ЦА-2 Мёрдок - Голдинг. Это позволяет выделить маркемы, обеспечивающие связь каждого автора со связующей фигурой центра, и установить величину связующей силы каждой маркемы данного хронологического среза. Анализ графа показывает наличие авторов, имеющих две однонаправленные связи: одну входящую и одну исходящую связи - Хиггинс, Грин, Эмис. Авторы, имеющие такие связи, образуют Центры-Посредники (ЦП). В нашем случае два ЦП непосредственно связаны с ЦА, поэтому они называются центрами-посредниками 1-й степени (ЦП-1) - ЦП-1 Грин и ЦП-1 Эмис. Связь ЦП, образуемого Хиггинсом, с ЦА осуществляется через ЦП-1 Грин, поэтому ЦП Хиггинс называется центром-посредником 2-й степени - ЦП-2. На периферии графа находятся авторы, не имеющие непосредственных маркемных связей с ключевыми фигурами центра аттракции, - Баллард, Сноу. Эти авторы именуются терминальными (максимально удаленными от ЦА). Анализ связующих маркем предполагает выделение ядерных и периферийных маркем внутри ЦА и установление мощности его мар-кемных связей. При проведении анализа мы опираемся на значение суммарного веса маркемной связи пар авторов (СумСВес) для выделения ядерных и периферийных маркем, а также на интегральный связующий вес (ИнС-Вес) маркем ключевых фигур центра аттракции для определения его мощности. ИнСВес вычисляется по формуле ИнСВес = СумСВес х Qm, где СумСВес - суммарный вес маркемных связей, а Qm - количество связей, обеспечиваемых данной маркемой. Величина суммарного связующего веса маркемы численно равна величине СумНормИнТеМа маркемы в обслуживаемых ею связях. При проведении анализа учитывается принцип «наследования» связей и их весов. Наследование связей происходит через ЦП и заключается в учете связующего веса маркем, общих для терминальных авторов и авторов, объединенных в ЦА. Например, attention - связующая маркема пар Баллард - Хиггинс и Хиггинс Грин, но при этом она также является связующей для пары Грин - Силлитоу. Поэтому мы рассматриваем attention как проходящую через ЦП-1 Хиггинс маркему, имеющую 3 связи. Следовательно, при входе в ЦА, представленный связующей фигурой центра Силлитоу, Силлитоу связующий вес маркемы attention равен сумме ее связующего веса у Балларда (0,02193), Хиггин-са (0,01542) и Грина (0,0158): СумСВес = 0,02193 + 0,01542 + 0,0158 = 0,05314 (в скобках указан вес исходящей от каждого автора маркемы). Соответственно, ИнСВес attention при ее входе в ЦА составляет 0,05314 х 3 = 0,15942. Аналогичным образом вычисляются СумСВес и ИнСВес всех проходящих через ЦП-1 маркем. На первом этапе исследования установим ядерные и периферийные маркемы, обеспечивающие связь максимальной силы в парах авторов среза 20-2, а затем определим маркемную мощность центра аттракции. Всех авторов среза соединяют 16 векторных связей максимальной силы, включающих 12 однонаправленных и четыре взаимонаправленные связи. Эти связи обеспечивают 78 маркем с общим числом употреблений - 437. Среднее число маркем на одну связь (28) не выделено ни для одной пары авторов. Количество маркем выше среднего демонстрируют следующие связи: Эмис - Силлитоу (29), Мёрдок - Голдинг (30), О'Брайан - Силлитоу (30). Максимальное число маркем - 33 - образует взаимонаправленную связь Пратчетт - Силлитоу. Минимальное количество маркем (22) характеризует связь Фаулз -Силлитоу, за которой (в порядке возрастания) следуют девять связей: Лес-синг - Силлитоу (23 маркемы), Баллард - Хиггинс (24), Хиггинс - Грин (25), Акройд - Силлитоу (25), Грин - Силлитоу (26), Сноу - Эмис (26), Бёрджесс - Силлитоу (27), Даррелл - Мёрдок (27), Баркер - Голдинг (27). Полный список маркем, ранжированный по количеству связей, обслуживаемых каждой маркемой, представлен в табл. 2. На рис. 2 и табл. 2 наглядно представлено распределении маркем в зависимости от количества обслуживаемых связей. Т а б л и ц а 2 Распределение маркем по количеству обслуживаемых ими связей Маркема КС Маркема КС Маркема КС DISAPPOINTMENT 16 DIRECTION 7 UNCERTAINTY 2 EXPERIENCE 16 ENTERTAINMENT 7 ACCIDENT 1 RESPONSIBILITY 16 BUSINESS 6 ACCOMPLISHMENT 1 RELATIONSHIP 15 CIVILI(S/Z)ATION 6 BEWILDERMENT 1 UNDERSTANDING 15 DISSATISFACTION 6 COMPREHENSION 1 CONSCIOUSNESS 14 IMPORTANCE 6 CONFRONTATION 1 POSSIBILITY 14 ATMOSPHERE 5 DEVELOPMENT 1 DIFFICULT(Y/IES) 13 INCOMPREHENSION 4 DISADVANTAGE 1 EMBARRASSMENT 13 INDEPENDENCE 4 EMERGENCY 1 OPPORTUNITY 13 PERSONALITY 4 EXASPERATION 1 SATISFACTION 13 RECOGNITION 4 FRIENDLINESS 1 IMAGINATION 12 SELF-SATISFACTION 4 FRIENDSHIP 1 INTELLIGENCE 12 ASTONISHMENT 3 HAPPINESS 1 MISUNDERSTANDING 12 EXISTENCE 3 HESITATION 1 SIGNIFICANCE 12 INCONVENIENCE 3 INQUISITIVENESS 1 ATTENTION 11 RECOLLECTION 3 INTEREST 1 CONCENTRATION 11 SELF-PRESERVATION 3 MIDNIGHT 1 CONSIDERATION 11 UNCONSCIOUSNESS 3 MISREPRESENTATION 1 EXCITEMENT 11 ACKNOWLEDGEMENT 2 MOVEMENT 1 DETERMINATION 10 APPRECIATION 2 PLEASURE 1 IMPRESSION 10 CHEERFULNESS 2 REFLECTION 1 INDIFFERENCE 10 CONTEMPLATION 2 SELF-INDULGENCE 1 ENCOURAGEMENT 9 DARKNESS 2 SENTIMENTALITY 1 CONFIDENCE 8 IMPOSSIBILITY 2 SPECULATION 1 DESTRUCTION 8 SOPHISTICATION 2 SURPRISE 1 KNOWLEDGE 8 SUPERSTITION 2 SURVEILLANCE 1 Примечание. Здесь и в табл. 3-5, 8 КС - количество связей. Приведенный список включает 78 маркем сводного маркемного списка, состоящего из маркемных списков всех авторов среза 20-2. С учетом их повторяемости у разных авторов общее количество маркем сводного списка равно 256. В нашем списке присутствуют только те из них, которые встречаются в списках как минимум двух авторов и вместе с другими общими для этих авторов маркемами показывают максимальный для пары ИМаБ. Учет количественных связей каждой маркемы позволяет произвести их предварительное ранжирование. Среднее значение числа связей 5,6 позволяет установить шесть связей в качестве нижней границы количества для ядерных связей, что составляет 80,3% от суммы всех выявленных связей. Все ядерные связи обеспечивают 32 маркемы. Малое ядро со средним значением числа ядерных связей 10,97 составляют, соответственно, 19 маркем, обслуживающих 11 и более связей. Число связей 18 16 14 12 10 8 6 4 2 0 Рис. 2. Распределение маркем по количеству обслуживаемых связей В исследуемых связях прослеживаются три сквозные (т.е. представленные во всех связях) маркемы. Максимальное количество связей - 16 -отмечено у маркем disappointment, experience, responsibility. За ними в порядке убывания числа связей следуют relationship, understanding - 15, consciousness, possibility - 14, difficult(y/ies), embarrassment, opportunity, satisfaction - 13, imagination, intelligence, misunderstanding, significance - 12, attention, concentration, consideration, excitement - 11, determination, impression, indifference - 10, encouragement - 9, confidence, destruction, knowledge -8, direction, entertainment - 7, business, civili(s/z)ation, dissatisfaction, importance - 6. Остальные 46 маркем являются периферийными и участвуют в создании 1-5 связей. Среднее значение числа этих связей 1,87 позволяет отнести 21 маркему, образующую 2-5 связей, к малой периферии, а 25 маркем, образующих по одной связи, - к большой периферии. Таким образом, малую периферию составляют atmosphere - 5, incomprehension, independence, personality, recognition, self-satisfaction - 4, astonishment, existence, inconvenience, recollection, self-preservation, unconsciousness - 3; acknowledgement, appreciation, cheerfulness, contemplation, darkness, impossibility, sophistication, superstition, uncertainty - 2; большую - accident, accomplishment, bewilderment, comprehension, confrontation, development disadvantage, emergency, exasperation, friendliness, friendship, happiness, hesitation, inquisi-tiveness, interest, midnight, misrepresentation, movement, pleasure, reflection, self-indulgence, sentimentality, speculation, surprise, surveillance - 1. Таблица 3 Данные о распределении ядерных и периферийных маркем с учетом ИнСВеса КС Маркема ИнСВес КС Маркема ИнСВес КС Маркема ИнСВес 16 RESPONSIBILITY 10,3809 6 CIVILI(S/Z)ATION 0,9951 2 APPRECIATION 0,0554 16 DISAPPOINTMENT 8,0536 8 KNOWLEDGE 0,9081 1 CONFRONTATION 0,0505 15 UNDERSTANDING 6,9975 7 DIRECTION 0,7756 1 INQUISITIVENESS 0,0339 14 CONSCIOUSNESS 5,9347 6 DISSATISFACTION 0,7227 1 SURVEILLANCE 0,0319 15 RELATIONSHIP 5,5939 6 IMPORTANCE 0,6271 1 COMPREHENSION 0,0317 16 EXPERIENCE 4,8699 6 BUSINESS 0,5072 1 BEWILDERMENT 0,0221 12 MISUNDERSTANDING 4,5975 5 ATMOSPHERE 0,4479 1 SPECULATION 0,0200 13 EMBARRASSMENT 4,4409 4 SELF-SATISFACTION 0,4158 1 SELF-INDULGENCE 0,0189 13 SATISFACTION 4,1892 4 INCOMPREHENSION 0,3594 1 ACCIDENT 0,0178 14 POSSIBILITY 4,0365 4 INDEPENDENCE 0,3395 1 EXASPERATION 0,0175 13 OPPORTUNITY 3,4004 4 RECOGNITION 0,2726 1 DEVELOPMENT 0,0173 11 CONSIDERATION 3,1352 3 ASTONISHMENT 0,2710 1 INTEREST 0,0164 13 DIFFICULT(Y/IES) 3,0801 3 UNCONSCIOUSNESS 0,2626 1 PLEASURE 0,0163 11 CONCENTRATION 3,0373 4 PERSONALITY 0,2592 1 EMERGENCY 0,0161 12 IMAGINATION 2,9863 3 SELF-PRESERVATION 0,2012 1 MISREPRESENTATION 0,0159 12 INTELLIGENCE 2,9717 3 RECOLLECTION 0,1701 1 HESITATION 0,0159 12 SIGNIFICANCE 2,7310 3 INCONVENIENCE 0,1496 1 FRIENDLINESS 0,0158 10 DETERMINATION 2,5447 2 IMPOSSIBILITY 0,0998 1 HAPPINESS 0,0152 10 INDIFFERENCE 2,0905 3 EXISTENCE 0,0998 1 DISADVANTAGE 0,0147 11 EXCITEMENT 1,9976 2 ACKNOWLEDGEMENT 0,0979 1 SENTIMENTALITY 0,0147 11 ATTENTION 1,8616 2 CONTEMPLATION 0,0829 1 FRIENDSHIP 0,0144 10 IMPRESSION 1,6471 2 UNCERTAINTY 0,0785 1 REFLECTION 0,0139 9 ENCOURAGEMENT 1,3691 2 DARKNESS 0,0780 1 ACCOMPLISHMENT 0,0138 8 DESTRUCTION 1,2151 2 CHEERFULNESS 0,0654 1 MOVEMENT 0,0127 7 ENTERTAINMENT 1,1014 2 SOPHISTICATION 0,0615 1 SURPRISE 0,0107 8 CONFIDENCE 1,0184 2 SUPERSTITION 0,0578 1 MIDNIGHT 0,0077 |\\J СП 00 о о RESPONSIBILITY DISAPPOINTMENT UNDERSTANDING CONSCIOUSNESS RELATIONSHIP EXPERIENCE MISUNDERSTANDING EMBARRASSMENT SATISFACTION POSSIBILITY OPPORTUNITY CONSIDERATION DIFFICULTfY/IES) CONCENTRATION IMAGINATION INTELLIGENCE SIGNIFICANCE DETERMINATION INDIFFERENCE EXCITEMENT ATTENTION IMPRESSION ENCOURAGEMENT DESTRUCTION ENTERTAINMENT CONFIDENCE CIVILI(S/Z)ATION KNOWLEDGE DIRECTION DISSATISFACTION IMPORTANCE BUSINESS ATMOSPHERE SELF-SATISFACTION INCOMPREHENSION INDEPENDENCE RECOGNITION ASTONISHMENT UNCONSCIOUSNESS PERSONALITY SELF-PRESERVATION RECOLLECTION INCONVENIENCE IMPOSSIBILITY EXISTENCE ACKNOWLEDGEMENT CONTEMPLATION UNCERTAINTY DARKNESS CHEERFULNESS SOPHISTICATION SUPERSTITION APPRECIATION CONFRONTATION INQUISITIVENESS SURVEILLANCE COMPREHENSION BEWILDERMENT SPECULATION SELF-INDULGENCE ACCIDENT EXASPERATION DEVELOPMENT INTEREST PLEASURE EMERGENCY MISREPRESENTATION HESITATION FRIENDLINESS HAPPINESS DISADVANTAGE SENTIMENTALITY FRIENDSHIP REFLECTION ACCOMPLISHMENT MOVEMENT SURPRISE MIDNIGHT к тз и о ё о й п - » я К Я п >73 К О го (D о £ « о ш п Ранжирование маркем по ИнСВесу дает возможность уточнить состав ядерных и периферийных маркем. За границу ядра и периферии принимается среднее арифметическое значение ИнСВеса. Аналогичное вычисление среднего арифметического значения ИнСВеса отдельно ядерных и периферийных маркем позволяет произвести выделение малого и большого ядра среди ядерных маркем, а также малой и большой периферии среди периферийных маркем. В табл. 3 представлены данные, использованные для наглядного представления распределения ядерных и периферийных маркем с учетом ИнСВеса (см. рис. 3). С учетом средневзвешенного ИнСВеса - 1,34 - границей ядра является encouragement. Из ядра, выделенного по количеству связей максимальной силы, в состав маркем малой периферии ушли business, civili(s/z)ation, confidence, destruction, direction, dissatisfaction, entertainment, importance, knowledge. При этом значительно уменьшился количественный состав малого ядра - 10: responsibility, disappointment, understanding, consciousness, relationship, experience, misunderstanding, embarrassment, satisfaction, possibility. Таким образом, число ядерных маркем составило 23, периферийных - 55. Для определения маркемной мощности ЦА-1 и ЦА-2 измерим силу маркемных связей всех ЦП-1 и двух ЦА. Маркемную мощность центра аттракции составляют сумма маркемных связей Силлитоу, Пратчетта, Мёрдок, Голдинга. Учитывая принцип «наследования» связей, маркемная связь, направленная от ЦП-1 к одной из связующих фигур ЦА, равна сумме маркемных связей каждого ЦП-1. Таким образом, общее количество маркемных связей - 16, из них у Силлитоу - 11, Пратчетта - 1, Мёрдок - 2, Голдинга - 2. Следовательно, совокупная мощность двух центров аттракции, определяемая величиной ИнСВеса маркем, составляет 104,2. Содержательное исследование двусторонних маркемных связей ключевых фигур центров аттракции позволяет выделить связующие их маркемы и определить маркемную специфику каждого центра аттракции. С этой целью проведен маркемный анализ маркемных связей ЦА, ЦП-1 и ЦП-2 - Силлитоу, Пратчетта, Мёрдок, Голдинга, Хиггинса, Грина, Эмиса. Центр аттракции объединяет авторов, группирующихся около двух ключевых фигур центра и не имеющих между собой маркемных связей максимальной силы. Наличие взаимонаправленной связи Силли-тоу - Пратчетт и Мёрдок - Голдинг дает основание считать их относительно друг друга центрами-посредниками нулевой степени (ЦП-0Сил, ЦП-0Пр, ЦП-0Мрд, ЦП-0Глд). Это делает целесообразным исследование и сопоставление маркемной специфики каждого ЦП-0. Поскольку каждый ЦП-1 опосредует собственную связь и связь терминальных авторов с ключевой фигурой своего ЦА, в качестве связующих этих авторов маркем мы, реализуя принцип наследования маркем и их весов, рассматриваем проходящие через ЦП-1 и исходящие из него маркемы, обозначив их условно маркемами Хаггарда, Моэма, Оруэлла. Первый ЦА объединяет писателей, которые группируются около двух ключевых фигур центра - Силлитоу и Пратчетта - и не имеют между собой маркемных связей максимальной силы - Балларда, Хиг-гинса, Грина, О'Брайана, Бёрджесса, Сноу, Эмиса, Фаулза, Лессинг, Акройда. Пару Грин - Силлитоу характеризуют 26 маркем, из которых проходящих, связывающих Балларда и Хиггинса с Силлитоу - 20, исходящих - шесть маркем. Также к Силитоу направлены маркемные связи Эмиса. В качестве связующих маркем были выделены 21 проходящая, обеспечивающая опосредованную связь Сноу - Силлитоу, и восемь исходящих маркем. К Силлитоу также направлены маркемные связи О'Брайана (30), Бёрджесса (27), Акройда (25), Лессинг (23), Фаулза (22) (в скобках указано количество общих маркем каждого автора в паре с Силлитоу). Количество исходящих маркем Силлитоу, обеспечивающих непосредственную связь Силлитоу - Пратчетт, составляет 33 маркемы. Связующие маркемы Силлитоу, ранжированные по ИнСВесу, представлены на рис. 4. Полный список связующих маркем Силлитоу с указанием числа связей и ИнСВеса маркем представлен в табл. 4. На основе средневзвешенного значения ИнСВеса проведена стратификация маркем. Общее количество связующих маркем Силлитоу -33. Среди них 11 маркем, или 33,3%, принадлежат ядру, 22 маркемы, или 66,7%, - периферии. Малое ядро составили три маркемы: responsibility, disappointment, understanding. Большое ядро образовали relationship, consciousness, experience, opportunity, possibility, misunderstanding, embarrassment, satisfaction. Следовательно, среди ядерных маркем 27,3% составили маркемы малого ядра, 72,7% - маркемы большого ядра. Ядерные маркемы обслуживают 8-11 связей. Следует пояснить, что при определении количества связей учитывались и опосредованные связи Силлитоу с терминальными авторами, поэтому максимальное число маркемных связей, обслуживаемых одной маркемой равно 11. Малую периферию образуют 11 маркем - consideration (7), difficulties) (8), intelligence (8), attention (9), excitement (8), impression (8), imagination (7), determination (6), concentration (6), significance (6), civili(s/z)ation (5) (в скобках указано количество обслуживаемых связей). Большую периферию также составили 11 маркем - entertainment (5), knowledge (6), direction (5), destruction (4), business (5), atmosphere (4), inconvenience (2), recollection (2), personality (2), existence (2). Исключительную связь Силлитоу - Пратчетт обеспечивает маркема uncertainty. Таким образом, периферийные маркемы распредилились поровну: 50% периферийных маркем составили малую периферию, 50% - большую. ЦП-0 Силлитоу 6 5 4 о ->-OHzZi ^Zzi^MOf^^ZZOO □ Lu^^iuz^Ij^LiJi-^ □ zz
Dornyei Z. Research Methods in Applied Linguistics. OUP, 2007.
Малышева Н.В. Квантитативная лингвистика в современной научной парадигме // Концепт. 2014. Т. 20. С. 546-550. URL: http://e-koncept.ru/2014/54373.htm (время обращения: 29.03.2019).
Кащеева А. В. Квантитативные и качественные методы исследования в прикладной лингвистике // Социально-экономические явления и процессы. 2013. № 3 (049). С. 155-162.
Кретов А.А. Метод формального выделения тематически нейтральной лексики (на примере старославянских текстов) // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2007. № 1. С. 81-90.
Кретов A.A Понятие маркемы: методика выявления и практика использования // Универсалии русской литературы. Воронеж, 2010. С. 138-153.
Кашкина А. В. Наиболее употребительные маркемы и их закономерности // Мир лингвистики и коммуникации. 2013. Т. 1, № 33. С. 94-101.
Артемова О.Г., Комарова Э.П., Кретов А. А Эволюция маркемной лексики на осно ве исследования маркем в хронологических срезах // Язык и культура. 2018а. № 42. С. 19-38.
Кретов А.А Динамика маркем в русской литературе XVIII - начала XX веков как отражение социокультурных процессов // Политическая лингвистика. 2010. № 3 (33). С. 141-150.
Кретов А.А Индекс приятия мира: новая информация о русских писателях XVIII- XX вв. // Универсалии русской литературы: сб. науч. тр. Воронеж, 2010. Вып. 4. С. 114-125.
Артемова О.Г. Формализация и визуализация маркемных отношений в английской художественной прозе первой половины XX века // Материалы XIX международной научно-методической конференции «Информатика: проблемы, методология, технологии». Воронеж, 2019. С. 1590-1596.
Артемова О.Г., Комарова Э.П., Кретов А. А. Связующие маркемы в британской прозе второй половины XIX века // Язык и культура. 2018б. № 43. C. 6-32.
Артемова О.Г., Кретов А.А Исследование связующих маркем в британской прозе второй половины XVII века // Мир лингвистики и коммуникации: электронный научный журнал. 2018. № 53. С. 70-88.
Ефимова М.А., Воронина И.Е., Кретов А.А. Выделение тематически маркированной лексики в англоязычных текстах // Материалы XIII международной научно-методической конференции «Информатика: проблемы, методология, технологии». Воронеж, 2013. С. 461-464.
Фаустов А.А., Кретов А.А Понятие маркемы и предварительные итоги маркемно-го анализа русской литературы // Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2017. № 4. С. 16-31.