Экспрессивность как маркер гендерных различий компьютерной коммуникации (к проблеме автоматической гендерной атрибуции текста) | Вестн. Том. гос. ун-та. 2018. № 433. DOI: 10.17223/15617793/433/5

Экспрессивность как маркер гендерных различий компьютерной коммуникации (к проблеме автоматической гендерной атрибуции текста)

Приведены результаты исследования гендерных различий в текстах компьютерно опосредствованной коммуникации с использованием лингвистических и статистических методов анализа. В качестве маркеров гендерных различий изучаются лексемы, выражающие различные виды семантики экспрессивности: единицы, содержащие 1) компоненты рациональной и эмоциональной оценки; 2) компоненты интенсивности проявления признака; 3) морфемные маркеры эмоционально-экспрессивной окрашенности, единицы; 4) графическое маркирование выражения эмоционального отношения. При наличии сочетания маркеров экспрессивности, лексема включается не в одну группу.

Expressiveness as a marker of gender differences in computer communication (the problem of automatic gender attribution .pdf Введение Гендерная лингвистика - направление, интенсивно развивающееся в настоящее время в российской лингвистике, включающее широкий спектр частных проблем. Наиболее противопоставленными, на наш взгляд, аспектами анализа общей проблемы проявления гендерных различий в языке являются исследования способов маркирования гендерных различий в структурах языка и различий в структуре коммуникативной деятельности, как следствие, в текстах, порождаемых мужчинами и женщинами. В первом направлении, прежде всего, обособляются изучение грамматического маркирования гендерных различий, например обсуждаются вопросы своеобразия категории рода в структурах разных языков (см., например, [1-4]), и выявление маркирования гендерных стереотипов в лексике, фразеологии различных языков [57]. В совокупности исследований речевой деятельности в гендерном аспекте противопоставляется изучение особенностей речи (текста), стратегий и тактик их развертывания, своеобразие использования единиц различных уровней языковой системы в текстах, порождаемых мужчинами и женщинами [8-10], и особенности восприятия и ассоциирования мужчинами и женщинами языковых единиц и текстов разного типа [11-14]. Очевидно, что при решении данных проблем лингвист неизбежно вступает в проблемное поле ряда смежных гуманитарных наук - социологии, культурологии, психологии, когнитивистики. К настоящему времени в исследованиях особенностей речевой коммуникации и порождаемых в данных процессах текстов получены заслуживающие внимание данные о типах различий, противопоставляющих речь мужчин и женщин: различия касаются характера использования языковых единиц разных языковых уровней [8-10, 15-17], что, как правило, связывается авторами проведенных ранее исследований с различным самопозиционированием мужчин и женщин в коммуникации, реже - с когнитивными особенностями мужчин и женщин. При исследовании особенностей текстов, порождаемых мужчинами и женщинами, в качестве яркого отличительного свойства определяется их повышенная экспрессивность, проявляющаяся в различии использования языковых разнуровневых средств выражения экспрессивности. Вместе с тем уже на ранних этапах развития ген-дерной лингвистики было отмечено, что гендерное речевое позиционирование не может осуществляться изолированно, вне других социальных ролей, репрезентируемых в тех или иных речевых практиках [18]. Различие гендерных ролей может актуализироваться или подавляться в сочетании с другими социальными ролевыми позициями говорящих, отражающимися в менах коммуникативных ролей. Вследствие этого проблема гендерно обусловленных различий в коммуникации не может решаться вне проблемы дискур-сивно и жанрово обусловленных вариаций коммуникативной деятельности. В настоящее время в русистике исследования ген-дерно маркированных различий в коммуникации ведутся на материале различных дискурсов: художественного, рекламного, публицистического, политического [19-22]. Активно вовлекаются в аналитические работы этой направленности и различные жанры компьютерно опосредствованной коммуникации [17, 23], что мотивировано не только потребностью в разрешении ранее обозначенной научно значимой теоретической проблемы, но и наличием определенного прагматического социального заказа, потребностью в определении авторства текста, автор которого намеренно скрывается, в том числе и в криминалистической практике [24, 25]. В данном и других случаях решения практически ориентированных задач в последнее время необычайно остро актуализируется задача автоматической ген-дерной атрибуции текстов (см., например, [26, 27], а также обзор в [28]). Необходимо отметить, что во всех случаях при сравнении мужских и женских текстов речь идет о преобладании единиц определенного типа в тексте, а не абсолютном отсутствии / наличии единиц какого-либо конкретного типа. Вследствие этого возникает проблема доказательности выводов о преобладании единиц какого-либо типа, использование которых противопоставляет речь мужчин и женщин. Это актуализирует проблему использования методов статистического анализа как способа проверки релевантности выводов, сделанных с использованием лингвистических методов анализа. Достоверность выводов о характере использования каких-либо единиц в речи в качестве маркеров типологических различий в настоящее время проверяется в системах автоматической обработки текстов, в методах проверки лингвистических гипотез с опорой на статистические методы анализа, методы математического моделирования. Все сказанное ранее определяет, на наш взгляд, актуальность обращения к выявлению маркеров ген-дерных различий в социально актуальных современных дискурсах и определение степени надежности использования определенного типа маркеров в системах автоматической обработки текстов. Постановка задачи, материал и методы В статье с опорой на выработанные в гендерной лингвистике данные о повышенной экспрессивности женской речи, о наличии различий в характере эмоциональности мужчин и женщин, обнаруживаемых в коммуникации, мы анализируем различные типы экспрессивных единиц в качестве маркеров различий мужской и женской коммуникации, сравнивая силу маркирующих различий эмоциональности как прагматической и семантической категории. Основная задача, результаты разрешения которой представлены в статье, - определение диагностирующей силы лексических маркеров эмоциональности и экспрессивности текста в системе автоматической гендерной атрибуции текста. Данная задача решается на материале текстов компьютерной коммуникации, текстов персональных страниц социальной сети «ВКонтакте». Выбор материала исследования мотивируется следующим. Как было отмечено ранее, в настоящее время в виртуальной коммуникации Интернета содержатся электронные аналоги практически всех типов текстов «реальной коммуникации», и в то же время Интернет - это пространство формирования новых дискурсивных и жанровых форм общения, в наиболее непосредственной форме сочетающих черты первичных форм устной речи - личностное обыденное общение, протекающие в онлайн форме, и черты, характерные для письменной речи, к чему следует отнести, прежде всего, ее фактуру - систему письменных, визуально воспринимаемых знаков [29-31]. К таким жанровым формам следует, на наш взгляд, отнести тексты персональных страниц социальной сети «ВКонтакте», которые интерпретируются нами как принадлежащие к сфере естественной письменной речи в концепции Н.Б. Лебедевой [30], как одна из жанровых форм личностно-ориентированных бытовых дискурсов в противопоставлении институциональным и личностно-ориентированным бытийным [32]. К характерным чертам личностно-ориентированных бытовых дискурсов, значимым при анализе текстов персональных страниц «ВКон-такте», относим то, что в них, с одной стороны, «говорящий выступает как личность во всем богатстве своего внутреннего мира», с другой стороны, «этот тип дискурса характеризуется спонтанностью, сильной ситуативной зависимостью, ярко выраженной субъективностью» [32. С. 5-6]. Социальная сеть «ВКонтакте» исследователями в жанровом аспекте интерпретируется как гипержанр, персональная страница - как наджанровое макрообразование, включающая жанры «анкета», «статус», «записи на стене», «личные сообщения», «обсуждения», «комментарии» [33. С. 24], «типичными стилевыми чертами» которых «являются эмоциональность, субъективность и имитация разговорной спонтанности при помощи экспрессивно-окрашенной лексики, разговорного синтаксиса, звукового письма, эмотиконов и экспрессивной пунктуации» [Там же. С. 23]. Важно, что тексты данных жанровых форм порождаются спонтанно, в естественных условиях. В представляемом исследовании тексты были отобраны для анализа после порождения речи, протекающей в естественных условиях1. Конкретным материалом исследования послужили 19 диалогов компьютерной коммуникации, корпус текстов был собран в рамках учебной практики студентов отделения фундаментальной и прикладной лингвистики филологического факультета Томского государственного университета. Объем каждого диалога составил 150-200 Кб, 4 000 слов. В целом объем проанализированных текстов составляет 120 страниц, 80 300 слов. Метод При решении поставленной задачи мы опирались на сочетание лингвистического и математического анализа текста. На первом этапе после предварительной технической обработки текстов применялись собственно лингвистические методы контекстуального анализа лексических единиц, в результате выявлен состав маркеров экспрессивности и эмоциональности текстов. На втором этапе с помощью приемов статистического анализа была проведена количественная квалификация использования выявленных маркеров в мужских и женских текстах и выявлена степень статистической достоверности (значимости) выявленных количественных различий в использовании данных маркеров, на этой основе была дана оценка диагностирующей силы классов и отдельных единиц при маркировании гендерной специфики. Охарактеризуем более подробно применение методов и их результаты. Перед началом анализа исходный материал - диалоги - были разделены на мужские и женские реплики. Все тексты были нормализованы: лексические единицы были приведены к одному стилю, устранены неинформативные формальные признаки (знаки пунктуации, ссылки и т. п.) и произведена лемматиза-ция (приведение единиц к начальным формам - леммам). Нормализация и лемматизация осуществлялись при помощи языка программирования R (пакет «Quanteda») и интегрированным в него стеммером -«Mystem». В результате текст был преобразован в список лексических единиц, возведённых к начальным формам. Из данного списка были выделены единицы, которые, по гипотезе авторов исследования, могут являться маркерами гендерных различий. Как было отмечено, на этом этапе был проведен лингвистический анализ текста для определения признаков семантики и прагматических функций лексических единиц, на основе наличия которых лексемы определяются как потенциальные маркеры гендерных различий коммуникации. При решении данной задачи, основываясь на предшествующих гендерных исследованиях, в качестве маркеров гендерных различий были избраны лексические показатели эмоциональности и экспрессивности. Мы определяем экспрессивность как прагматическую характеристику речи. В современной российской лингвистике утвердилось мнение о сложности категории экспрессивности, множественности средств ее языкового разнуровнево-го выражения (ср., определение данного понятия в одном из наиболее авторитетных источников: совокупность семантико-стилистических признаков единицы языка, которые обеспечивают ее способность выступать в коммуникативном акте как средство субъективного выражения отношения говорящего к содержанию или адресату речи [34. С. 591]). В данной работе мы анализировали собственно лексические, лексико-деривационные и графические маркеры экспрессивности. Исследователи, работающие в сфере анализа лексической экспрессивности, определяют экспрессивную лексическую единицу как «слово, которое характеризует лицо или действие с качественной или количественной стороны, но в аспекте такого качества или количества, которое переходит в новое качество: хлобыстнуть - не просто выпить, а выпить быстро, мгновенно, может быть с жадностью, без остатка» [35. С. 41] и выделяют в качестве основных элементов экспрессивности образность, интенсивность, эмоциональность и оценочность, стилевую маркированность. Понимая, что экспрессивность коммуникации есть результирующие взаимодействия языковых единиц разных уровней, формирующие разные компоненты коннотативного слоя текста, мы в данной работе ограничились выявлением диагностирующей силы в выражении гендерных различий четырех групп единиц, выражающих значение интенсивности и оценочности. Группы выделяются по характеру прагматического компонента и по способам их маркирования в тексте. Прагматические компоненты семантики характеризуются как максимально контекстно зависимая величина, поэтому формирование групп маркеров проходило в два этапа. На первом группы выделялись по наличию маркирующего семантического и / или формально-семантического признака. 1. По наличию формально-семантического признака была выделена группа диминутивов - лексем, содержащих морфемные маркеры деривационных диминутивных суффиксов -очк(а), -еньк(а), -ик, -ок, -к(а), -еньк(ий), - -енок, -еныш и др.., например погодка, тетрадка, телефончик, пяточек, шапочка, ягодка и т. д. Прагматическая направленность дими-нутивов - выражение синкретичного единства смыслов эмоциональной и рациональной оценки с весьма широким спектром варьирования, от уменьшительно-ласкательного до уничижительного и пренебрежительного с доминированием положительного ядра и эмоциональности (см., например, [12]). Далее данный класс единиц мы называем «лексемы-диминутивы». 2. Вторую группу составили единицы, содержащие компоненты рациональной и эмоциональной оценки, при этом при формировании группы мы на данном этапе не противопоставляли единицы с положительной и отрицательной оценочностью, например бесполезный, большой, бяка, гадость, дельный, дерьмовый, красавец, околоумный, опупенный, славный, урод, фигня и под. Так как при выделении группы в качестве инварианта был избран компонент лексической семантики, в ее состав вошли единицы разных частей речи: например классно, круто, кошмар, мощный и т. д. При формировании единиц данной группы мы в случаях неоднозначности смыслов основывались на данных толковых словарей2 и, при необходимости, возвращались к тексту для определения контекстуального значения. Эту группу называем «оценочные лексемы». 3. Третью группу маркеров составили слова, содержащие в структуре экспрессивного макрокомпонента компонент «интенсивность», т.е. актуализирующие в семантике смысл «очень, в большой степени» как актуальный коммуникативный компонент, например грандиозный, бестолочь, офигенный, адский, бредятина, крутатецкий, опупенный. Данная актуализация может быть реализована как узуальный компонент семантики, не маркированный формально (единица с таким смыслом всегда является синонимом нейтрального в данном отношении элемента) либо маркированный морфологически (жердина, большуший), графически (большооооой), морфологически и графически (жердииииина, большууууущий) [36]. Эта группа далее обозначается «лексемы-интенсивы». 4. Четвертую группу составили единицы, содержащие графическое маркирование выражения эмоционального отношения - повторение графем, например этоооо, хааааа, фууу, ужааас, ураа и т.д. Данную группу обозначаем как лексемы с графическими маркерами. Как можно видеть, данные группы единиц выделяются нами на основании не взаимоисключающих признаков, т. е. одна лексическая единица может входить в более чем одну группу: оценочных лексем, лексем интенсивов, лексем с графическими маркерами. При необходимости подсчета всего состава маркеров, повторяющиеся лексемы устранялись. Объединение четырех групп маркеров обозначаем «маркеры экспрессивности». На основе лингвистического анализа были составлены словари для проведения статистического анализа и автоматического анализа текстов. На втором этапе анализа применялись методы статистического анализа и машинного обучения. Основные задачи, решаемые на данном этапе: 1) составление матрицы частот по выбранным признакам; выявление статистически значимых различий в использовании мужчинами и женщинами единиц выделенных четырех групп лексики (групп маркеров); 2) проведение машинного обучения, т. е. создание системы автоматического, машинного распределения текстов на мужские и женские на основании выявленных статистических различий в использовании лексических маркеров рассматриваемых классов. Для подсчета частот лексических маркеров по выбранным признакам и их объединения в группы для последующего определения степени статистической значимости выявленных количественных различий в использовании данных маркеров применялась формула веса tf-idf. Суть ее заключается в подсчете веса некоторого слова пропорционально количеству употреблений этого слова в группе текстов и обратно пропорциональному частоте употребления слова в других. Например, если слово молодец чаще встречается в женских текстах, а реже в мужских, тогда вес этого слова в женских текстах будет стремиться к 1, а в мужских к 0. Итогом работы алгоритма стала частотная матрица (tf-idf) суммы относительных величин использования лексических единиц мужчинами и женщинами, которые были сгруппированы нами по вышеуказанным признакам. Результаты данного анализа представлены в таблице. Таблица 1 Фрагмент ма трицы сумм весов гр; маркеров экспрессивности текста Текст Лексемы-интенсивы Оценочные лексемы Лексемы-диминутивы Лексемы с графическими маркерами dlg1_f.txt 42,77 165,76 31,95 319,89 dlg2 f.txt 0,00 0,84 1,08 3,32 dlg4 f.txt 0,78 6,84 0,60 2,54 dlg3 f.txt 2,84 40,28 6,95 23,91 dlg5 f.txt 56,42 273,64 48,84 58,48 dlg6 f.txt 1,56 23,37 3,24 7,47 dlg7 f.txt 8,62 44,15 10,67 20,49 dlg8 f.txt 7,25 21,31 15,59 28,64 dlg9 f.txt 16,43 57,61 10,84 18,95 dlg10 f.txt 0,00 10,70 0,00 2,89 dlg11 f.txt 7,54 45,32 7,18 64,76 dlg12 f.txt 0,60 4,51 0,00 1,86 dlg12 m.txt 54,93 208,20 41,18 219,61 dlg1 m.txt 0,00 3,27 0,00 2,16 dlg2 m.txt 0,00 5,44 0,00 0,00 dlg3 m.txt 14,16 54,36 5,22 32,11 dlg4 m.txt 51,53 195,96 36,74 51,31 dlg5 m.txt 6,11 23,49 2,51 15,60 dlg6 m.txt 12,52 56,20 10,67 15,06 dlg7 m.txt 7,68 19,74 12,65 29,04 dlg8 m1.txt 10,88 63,89 9,29 12,02 dlg9 m.txt 5,24 16,56 4,02 3,06 dlg10 m2.txt 11,26 85,47 28,31 12,20 dlg11 m2.txt 0,48 4,77 0,00 3,92 Данная матрица является исходным материалом для дальнейшего анализа текстов с применением других формально-количественных методов. На следующем этапе была подсчитана сумма весов лексических единиц всех групп мужских и женских реплик. Отметим, что при этом мы объединили единицы всех четырех групп маркеров, удалив повторяющиеся лексемы, т. е. лексемы, имеющие более чем один компонент. Например, текстовая единица ужаааас, входящая в три класса слов с семантикой оценочности, интенсивности, которые содержали графические маркеры интенсивности, в данном подсчете учитывалась один раз. Сумма весов лексических единиц оставила 1 529,3 в женских репликах, а в мужских - 458,8. Результат анализа представлен в диаграмме на рис. 1. Рис. 1. Соотношение сумм весов экспрессивных единиц в мужских и женских репликах Как видно из данных диаграммы, мужская и женская речь отличается в количестве используемых экспрессивных единиц, женские реплики содержат больше экспрессивных и эмоциональных лексических единиц (сегмент f на диаграмме), чем мужские (сегмент m). Однако проверка статистической значимости данных различий показала, что выявленный результат не является значимым: анализ на основании критерия Манна - Уитни выявляет уровень значимости p = 0,72 (p > 0,05), что свидетельствует о случайном характере выявленного распределения. На следующем этапе исследования были подсчитаны в мужских и женских репликах суммы весов лексических единиц выделенных групп, выявлено преобладание маркеров экспрессивности в женских репликах (наблюдается в трех группах: лексемы-интенсивы, лексемы-диминутивы, оценочные лексемы и отсутствует в группе лексем с графическими маркерами экспрессивности). Однако проверка статистической значимости выявленных количественных различий показала, что только относительно группы единиц-диминутивов уровень значимости составил p = 0,04 (p > 0,05). В использовании остальных групп лексических единиц в репликах мужчин и женщин статистическая значимость не была выявлена (p > 0,05), а следовательно, все различия случайны. Так как полученный уровень значимости для лек-сем-диминутивов близок к пороговому уровню значимости 0,05, мы провели дополнительный статистический анализ сравнения дисперсий критерием Фридмана. Цель дисперсионного анализа заключалась в проверке гипотезы о равенстве средних значений использования экспрессивов в зависимости от ген-дерной принадлежности участника коммуникации. Дисперсия характеризует разброс значений относительных частот использования анализируемых групп лексических единиц в текстах, противопоставленных по гендерной принадлежности автора. Результат анализа показан на рис. 2: как можно видеть, дисперсия различает группы лексем, но не различает гендерно противопоставленные тексты (уровень значимости составил 0,88, т.е. значительно больше 0,05). Рис. 2. Дисперсии относительных частот использования групп экспрессивных единиц Полученные данные явились основанием предположения, что подобный результат вызван различиями внтуригрупповых диссперсий: вероятно, частоты использования экспрессивных единиц могут отличатся в каждом диалоге. Чтобы проверить данное утверждение, мы провели дисперсионный анализ одной из групп лексем - лексем с графическими маркерами. Результат анализа представлен на рис. 3. Как видно из рис. 3, во-первых, для дисперсий характерен большой размах, во-вторых, в то время как дисперсии по всем лексемам словаря с графическими маркерами отличаются, медианы единиц данного словаря почти равны как для мужчин, так и для женщин. Результат анализа дисперсий по каждому из текстов позволяет сделать предположение о том, что различия в использовании экспрессивов определяются не только гендерной принадлежностью авторов, но и другими признаками коммуникациии. Такое предположение коррелирует с идеями гендерной лингвистики о том, что гендер как социокультурная характеристика коммуникантов не может не вступать во взаи-модейстивие с другими социально значимыми ролями коммуникантов [18], а также с классическими положениями теории дискурса о множественности факторов дискурсообразования (см., например, [39. С. 205-210]). 1 3 5 8 Ю 1? 14 16 1в 20 77 7* Twi 006 0.05 ow 003 0,02 0,01 ООО ■0 01 = : 3\ Г tofl V Пол ж Рис. 3. Дисперсии относительных частот использования лексем с графическими маркерами экспрессивности Для проверки этой гипотезы мы провели кластерный анализ «Уорда» [40. С. 298]. Под «кластерами» понимаются однородные (схожие) подгруппы, в которых дисперсия минимизирована внутри групп и максимизирована между группами. На вход подавалась матрица экспрессивных лексических единиц с относительными величинами без маркирования класса, результате тексты распределились на два основных кластера. В первом кластере (dlgO f1, dlgO m2, dlg2 f2, dlg2 ml) наблюдается превалирование экспрессивных лексических единиц в сравнении со вторым. Что касается второго кластера, то он противопоставляется первому кластеру (за счет максимизирования дисперсии между группами) и одновременно распадается на два подкласса, имеющие менее значительные различия в характере использования экспрессивных единиц (рис. 4). Рис. 4. Кластерная дендрограмма распределения текстов компьютерной коммуникации по признаку использования экспрессивных лексем Как было отмечено, в первом кластере (dlgOfl, dlgO m2, dlg2 f2, dlg2 ml) наблюдается преобладание экспрессивных лексических единиц всех четырех классов в сравнении со вторым. Дискурсивный анализ текстов, вошедших в первый класс, выявил, что тексты первого кластера противопоставляются второму по двум дискурсивным признакам - тема коммуникации и личностные отношения коммуникантов. Реплики, вошедшие в первый кластер, принадлежат мужчинам и женщинам, имеющим длительный опыт личного общения, темой коммуникации являются по преимуществу межличностные эмоционально наполненные отношения. Так, в диалоге dlgO участники коммуникации (fl и m2), судя по репликам, знают друг друга продолжительное время, имеют общие интересы в спорте и учебе, они обсуждают личные отношения, отношения общих друзей, рассуждают о жизни, совместном времяпровождении, например, Ж: Напьешься поди, а мне тебя домой тащить?, М: «Красава))). )))». Или реплики из dlg 2: 1) М: «Идешь завтра гулять?». Ж: «Ааа, блин я завтра только в часов в 7 освобожусь». 2) М: «Скучаю По тебе Скорее бы завтра услышать твой голос»; Ж: «Нуу) Я тоже скучаю по тебе»). Объединяющей характеристикой диалогов второго кластера является тема деловых отношений, учебы, не исключающая выражения эмоционального отношения к данным темам, например, типичный диалог: dlg 1: Ж: «Какими способами? Или как учится?) Аааа, английский и испанский;)»; М: «Ого) Испанский охренеть) А почему Испанский?)». Или dlg 4: Ж: «А ты не мог бы сфотать свою тетрадь тему и прислать через вк?»; М: «прости я тогда не писал мы с сашкой сидели»). Таким образом, сочетание методов лингвистического и статистического анализа позволило нам сделать вывод о том, что различия в использовании экспрессивных единиц в текстах компьютерной коммуникации, противопоставленных по признаку гендерной принадлежности авторов, отмечаются, но не являются статистически значимыми, т. е. признак гендерного противопоставления не обнаруживается как устойчивый и во-производимый. Применение кластерного анализа позволило выявить взаимодействие гендерного признака авторов коммуникации с другими социально значимыми параметрами компьютерной коммуникации - темой текста, ролевыми и социальными позициями коммуникантов в диалоге, которые оказываются более значимыми факторами, определяющими характер использования экспрессивных единиц. ПРИМЕЧАНИЯ 1 Извлечение диалогов из социальных сетей осуществлялось с согласия их авторов, которые, в соответствии с нормами регламента Этического комитета междисциплинарных исследований ТГУ (http://lab.tsu.ru/cognitivestudies/node/14) и в соответствии с Федеральным законом № 152 РФ «О персональных данных», были проинформированы о целях проводимого исследования и о гарантиях анонимности предоставленных персональных данных, после чего были заполнены «Формы информированного согласия», в структуру которых были включены метаданные участников диалогов: пол, возраст, социальный статус. 2 Дискурсивно-жанровая специфика анализируемых текстов обусловила наличие значительного количества просторечной, сленговой, в том числе ненормативной лексики. Для уточнения значения данных единиц наряду со словарем литературного языка [37] мы использовали словарь Т.Г. Никитиной [38]. 3 В таблице приняты следующие обозначения: dlg-диалог, цифрами обозначается номер текста, f.txt и m.txt - маркеры гендерной атрибуции авторов текстов. Например, dlg0 - первый диалог, dlg0_f - женские реплики из первого диалога; dlg0_m - мужские реплики первого диалога.

Ключевые слова

statistical analysis, text emotionality, expressiveness, gender attribution of text, computer communication, статистический анализ, эмоциональность текста, экспрессивность, гендерная атрибуция текста, компьютерная коммуникация

Авторы

ФИООрганизацияДополнительноE-mail
Резанова Зоя ИвановнаТомский государственный университет; Томский политехнический университетд-р филол. наук, зав. кафедрой общего, славяно-русского языкознания и классической филологии; профессор кафедры русского языка как иностранногоresso@rambler.ru; resso@mail.tsu.ru
Степаненко Андрей АлександровичТомский государственный университетаспирант кафедры общего, славяно-русского языкознания и классической филологии, мл. науч. сотр. лаборатории лингвистической антропологииstepanenkone@mail.ru
Всего: 2

Ссылки

Никитина Т.Г. Так говорит молодежь. Словарь молодежного сленга. СПб., 1998. 592 с.
Макаров М.Л. Основы теории дискурса. М. : Гнозис, 2003. 280 с.
Deza M. Encyclopedia of Distances / Deza M., Deza E. // Springer Dordrecht Heidelberg. London; New York, 2009. 722 p.
Большой академический словарь русского языка / гл. ред. К.С. Горбачевич, А.С. Герд. М., СПб. : Наука, 2004. 571 с.
Бельская Е.В. Интенсивность как категория лексикологии (на материале говоров Среднего Приобья). автореф. дис.. канд. филол. наук. Томск, 2002. 20 с.
Лукьянова Н.А. Экспрессивная лексика разговорного употребления: проблемы семантики. Новосибирск : Наука, Сиб. отд-ние, 1986. 230 с.
Лингвистический энциклопедический словарь. М. : Сов. энциклопедия, 1990. 685 с.
Алтухова Т.В. Социальная компьютерная сеть «ВКонтакте»: жанровая характеристика // Вестник Кемеровского государственного университета. 2012. № 4 (52), Т. 3. Филология. С. 21-25
Карасик В.И. О типах дискурса // Языковая личность: институциональный и персональный дискурс : сб. науч. тр. Волгоград : Перемена, 2000. С. 5-20.
Картины русского мира: современный медиадискурс. Томск, 2011.
Алтухова Т.В., Лебедева Н.Б. Виртуальное общение: новый этап развития письменоой коммуникации // Вестник Кемеровского государственного университета. 2012. № 1 (49). С. 105-111.
Вавилова Е.Н. Жанровая квалификация виртуального дискурса телеконференций Фидонет : автореф. дис.. канд. филол. наук. Томск, 2001.
Резанова З.И., Романов А.С., Мещеряков Р.В. Задачи авторской атрибуции текстов в аспекте гендерной принадлежности (к проблеме междисциплинарного взаимодействия лингвистики и информатики) // Вестник Томского государственного университета. 2013. № 370. С. 24-28.
Степаненко А. А. Гендерная атрибуция текстов компьютерной коммуникации: статистический анализ использования местоимений // Вестник Томского государственного университета. 2017. № 415. C. 17-25.
Романов А.С., Мещеряков Р.В. Определение пола автора короткого электронного сообщения // Диалог. 2011. С. 620-626.
Ощепкова Е.С. Выявление идентификационных признаков мужской и женской письменной речи при искажении текстов // Теорiя та практика експертизи i кримшашстики. Харюв : Право, 2002. Вип. 2. 221-226
Вул С.М., Горошко Е.И. Судебно-автороведческая классификационная диагностика: установление половой принадлежности автора документа // Современные достижения науки и техники в борьбе с преступностью : матер. науч.-практ. конф. Минск, 1992. С. 139-141.
Захарова Т.Н. Семиотические средства выражения гендера в тексте на электронном носителе: на материале немецких чатов : автореф. дис. канд. филол. наук. М. : Моск. гос. лингвист. ун-т, 2006.
Верзун А.Б. Гендерная агональность политического дискурса : автореф. дис.. канд. филол. наук. Волгоград, 2005.
Спирюшкина Е.В. Проявление гендерного фактора в немецком языке : На материале публицистики : автореф. дис.. канд. филол. наук. Н. Новгород, 2006.
Витлицкая Е. В. Лингвистическая репрезентация гендерных стереотипов в рекламе: на материале англоязычных и русскоязычных текстов : автореф. дис. канд. филол. наук. Волгоград, 2005.
Кирилина А.В. Гендер: лингвистические аспекты. М. : Ин-т социологии РАН, 1999. 189 с.
Балакина Л.В. Проявление гендерного фактора в художественном тексте : автореф. дис.. канд. филол. наук. Орел, 2005.
Антинескул О. Л. Гендер как параметр текстообразования : автореф. дис. канд. филол. наук. Пермь, 2000. 19 с.
Васильева А.В. Коммуникативно-прагматические аспекты проявления экспрессивности в мужских и женских коротких электронных сообщениях // Вестник науки Сибири. 2014. № 4 (14). C. 190-195
Котов А.Е. Гендерное своеобразие функционирования дискурсивных элементов в английском и русском языках: экспериментально-сопоставительное исследование на материале разностилевых устных текстов : автореф. дис. канд. филол. наук. Пятигорск, 2003.
Горошко Е.И. Особенности восприятия и порождения текста, обусловленные половой принадлженстью индивида // Язык: Антропоцентризм и прагматика. Москва ; Кривой Рог, 1995. С. 82-91.
Васильева А. В. Особенности когнитивной обработки диминутива мужчинами и женщинами: экспериментальное исследование // Наука. Технологии. Инновации : сб. науч. тр. в 9 ч. / под ред. ст. преп. О.Е. Цыганковой. Новосибирск : Изд-во НГТУ, 2015. Ч. 8. С. 121-123.
Резанова З.И., Некрасова Е.Д. Семантика диминутивных суффиксов в восприятии носителей русского языка: влияние контекстных и социальных факторов // Вестник Томского государственного университета. 2017. № 421. С. 12-21.
Горошко Е.И. Особенности мужских и женских ассоциаций // Пол и его маркировка в речевой деятельности / под ред. Е.Н. Шовгеля. Кривой Рог : МИЦ ЧЯКП, 1996. С. 65-88.
Земская Е.А., Китайгородская М.А., Розанова Н.Н. Особенности мужской и женской речи // Русский язык и его функционирование. М. : Наука, 1993. С. 90-136.
Вернер Ф. Речевое поведение женщин и мужчин // Языкознание. РЖ ИНИОН РАН. 1984. Сер. 6. С. 116-135.
Базылев В.Н., Сорокин Ю.А. Феминолект и маскулинолект: модусы существования // Пол и его маркировка в речевой деятельности / под ред. Е.Н. Шовгеля. Кривой Рог : МИЦ ЧЯКЦ, 1996. С. 4-18.
Каменева В.А. Гендерно обусловленные стереотипы в публицистическом дискурсе: на материале американской прессы : автореф. дис.канд. филол. наук. Кемерово, 2005.
Соловьева Н.С. Динамика гендерных стереотипов в английской и русской языковых картинах мира: на материале фразеологии : автореф. дис.. канд. филол. наук. Волгоград, 2008.
Кирилина А.В. Гендерные стереотипы, общение и пол говорящего // Женщина в российском обществе. М., 1999. № 2. С. 27-45.
Landor R. Grammatical Categories and Cognition across Five Languages: The Case of Grammatical Gender and its Potential Effects on the Con ceptualisation of Objects: Thesis (PhD Doctorate). Griffith University, Brisbane, 2014. 310 p.
Резанова З.И., Некрасова Е.Д. Влияние грамматической категории рода на бимодальное восприятие имен существительных болгарского языка // Русин. 2015. № 3 (41). С. 241-255.
Boroditsky L., Schmidt L. A., Phillips W. Sex, syntax, and semantics // Language in mind: Advances in the study of language and thought. 2003. P. 61-79.
Kurinski E., Jambor E., Sera M.D. Spanish grammatical gender: Its effects on categorization in native Hungarian speakers // International Journal of Bilingualism. 2016. Vol. 20, № 1. С. 76-93.
 Экспрессивность как маркер гендерных различий компьютерной коммуникации (к проблеме автоматической гендерной атрибуции текста) | Вестн. Том. гос. ун-та. 2018. № 433. DOI: 10.17223/15617793/433/5

Экспрессивность как маркер гендерных различий компьютерной коммуникации (к проблеме автоматической гендерной атрибуции текста) | Вестн. Том. гос. ун-та. 2018. № 433. DOI: 10.17223/15617793/433/5