Эмоционально нейтральные интернет-тексты: в поисках специфики | Вестник Томского государственного университета. 2020. № 458. DOI: 10.17223/15617793/458/3

Эмоционально нейтральные интернет-тексты: в поисках специфики

Рассматривается специфика эмоционально нейтральных интернет-текстов. По результатам анализа двух подкорпусов - вики-текстов и текстов из паблика «Подслушано» в ВКонтакте, размеченных асессорами как нейтральные, делается вывод о том, что в интернет-коммуникации категория эмоциональной нейтральности представляет собой континуум, верхнюю границу которого очерчивают информационно-справочные тексты, а нижнюю - тексты жанра «интернет-откровение». Однако и для тех, и для других существует ряд общих вербальных «маркеров нейтральности».

The Specificity of Emotionally Neutral Internet Texts.pdf 1. Введение Современная коммуникация в интернете характеризуется в исследовательской литературе как дискурсивное пространство новой чувствительности [1], которая призвана освободить человека цифровой эры от переживаний, связанных с насилием и эксплуатацией, вернув ему интерес к собственным инстинктивным экзистенциальным ощущениям [2. P. 54]. Однако слоган «ты то, чем ты делишься» [3. С. 46], став основой идеологии новых медиа, породил волну так называемого киберэксбиционизма [4], в том числе и эмоционального. Гипертрофированная резкость оценок и откровенность эмоций, став непременной характеристикой интернет-коммуникации, спровоцировали желание социальных стейкхолдеров параметризировать чувства и эмоции в интернете в целях их последующего мониторинга. Возникла исследовательская парадигма сентимент-анализа [5], а затем - эмоционального анализа текстовых данных [6]. Выполняемый исследовательской группой проект находится в рамках последнего из упомянутых направлений. Цель проекта - разработка компьютерного классификатора, способного автоматически определять ведущую эмоцию, вербализованную в интернет-тексте на русском языке. За основу была взята восьмичленная классификация эмоций, предложенная шведским исследователем Г. Лёвхеймом [7], так называемый «куб Лёвхейма». Семь эмоций в данной классификации имеют двойную номинацию, где первая часть является обозначением слабой степени выраженности эмоционального состояния, а вторая - самой сильной (исключение составляет эмоция удивления): Интерес / Возбуждение; Удовольствие / Радость; Удивление; Страдание / Тоска; Гнев / Ярость; Страх / Ужас; Презрение / Отвращение; Стыд / Унижение. На первом этапе проекта определены морфологические, синтаксические, лексические и семантические группы вербальных маркеров текстов, принадлежащих восьми эмоциональным классам [8]. Однако опыт организации эмоциональной разметки корпуса текстов с помощью группы асессоров, а также тестирование пилотной версии классификатора продемонстрировали необходимость создания 9-го класса текстов - нейтрального. Серия исследовательских вопросов, раскрываемых в той части исследования, результаты которой будут изложены в данной публикации, сформулирована следующим образом: имеют ли нейтральные тексты свою собственную языковую специфику относительно эмоциональных текстов? зависит ли эта специфика от жанра интернет-текста? насколько «далеко» отстоят тексты, оцениваемые информантами как нейтральные, от тех, которые ими же классифицируются как эмоциональные? В попытке ответить на поставленные вопросы мы последовательно рассмотрим материал и методы исследования (п. 2), три аспекта категории нейтральности, нашедшие отражение в лингвистических штудиях, - нейтральность стилистическая, оценочная и эмоциональная (п. 3); проведем корпусный лингвистический анализ двух подкорпусов нейтральных текстов разной жанровой принадлежности и сравним полученные результаты с теми, что были получены при анализе эмоционально окрашенных текстов (п. 4); наконец, сделаем вывод о наличии / отсутствии собственных дискриминантных черт у класса нейтральных текстов, зависимости этих черт от жанра текстов и о специфике категории нейтральности в интернет-коммуникации. 2. Материал и методы Цель данной публикации - описать результаты исследования, направленного на выявление вербальных маркеров эмоционально нейтральных текстов. Материалом исследования послужили три корпуса интернет-текстов: тексты из Википедии, рассматриваемые a priori как эмоционально нейтральные и составившие корпус данных в объеме 136 184 токенов (далее - НТ a priori); тексты из пабликов «Карамель», «Подслушано», «Палата № 6» русскоязычной социальной сети «ВКонтакте», размеченные асессорами как нейтральные в процессе эмоциональной разметки датасета эмоциональных текстов - корпус a posteriori нейтральных текстов (далее - НТ a posteriori); наконец, 8 подкорпусов эмоциональных текстов (далее - ЭТ) из указанных выше пабликов в объеме 1 092 327 токенов, которые служат фоном для контрастивного описания специфики нейтральных текстов. Выбор Википедии в качестве источника данных для класса НТ a priori обусловлен принадлежностью текстов к информационному дискурсу, предполагающему стремление авторов текстов избегать оценочно-сти. Так, по словам В.В. Дементьева, «Википедия старается избегать давать оценки - любые» [9. С. 241]. Кроме того, исследователи отмечают, что в Вики-педии образовалась критическая среда для развития коллективного мышления постнеклассического идеала рациональности [10]. Нейтральные тексты a posteriori были отобраны по итогам процедуры асессмента, проведенной на одной из краудсорсинговых платформ. Зарегистрированным на данной платформе 2 тыс. информантам было предложено разметить 3 920 текстовых фрагментов объемом от 80 до 120 слов, т.е. по 490 образцов из восьми эмоциональных классов текстов, согласно восьми базовым эмоциям, выделенным Г. Лёвхеймом. Упомянутые 8 классов текстов были первоначально сформированы путем сплошной выборки постов со страниц проектов «Подслушано», «Карамель», «Палата № 6» русскоязычной социальной сети ВКонтакте. Выборка производилась по хештегам, содержащим вербализованную отсылку к соответствующему эмоциональному состоянию (например, #_фуу - эмоция отвращения или #Грустненько) или номинацию ситуации, обычно вызывающей определенную эмоцию (#Предательство или #Одиночество). Общий объем выборки составил 15 тыс. текстов, из которых затем случайным образом были отобраны уже упомянутые 3 920 текстов. В процессе аннотирования информанты должны были разметить тексты, пользуясь шкалой и инструкцией. Инструкция: Внимательно прочитайте текст. Если необходимо, прочитайте его несколько раз. Какие эмоции автор выражает в тексте? На каждой из шкал поставьте отметку ближе к той эмоции, которая сильнее выражена в тексте. Поставьте отметку настолько близко, насколько очевидна и сильна эта эмоция в тексте. Например, один шаг от центра - оттенок эмоции присутствует, но выражен слабо; три шага - если эмоция явно присутствует; пять шагов - если эмоция, без сомнения, доминирует. Если в тексте нет эмоций, обозначенных на шкале, оставьте отметку в среднем положении. Далее информантам предлагалось 4 шкалы, между полюсами которых можно было ставить отметку-маркер: Грусть - Радость, Гнев - Отвращение, Стыд -Оживление, Страх - Удивление. Такое конструирование шкал было обусловлено моделью эмоций «Куб Лёвхейма», согласно которой данные эмоции на биохимическом уровне формируют оппозиции. Так, например, Грусть «запускается» при условии низкого уровня гормонов серотонина и дофамина в крови человека, в то время как Радость инициируется высоким уровнем этих нейротрансмитеров. В результате проведенной аннотации мы получили ограниченный 412 фрагментами, но, тем не менее, показательный корпус текстов, размеченный информантами как «нейтральные тексты», объемом 14 тыс. токенов. Подчеркнем, что в предварительную выборку данные тексты были включены как «эмоциональные», но информанты расценили их как нейтральные. Для анализа мы намеренно взяли два корпуса интернет-текстов разной жанровой принадлежности: a priori нейтральные тексты из Википедии и a posteriori нейтральные тексты из паблика «Подслушано». Первые репрезентируют информационный жанр «справочная информация», а вторые - жанр «интернет-откровение» [11]. Предполагается, что необходимо выделить, с одной стороны, такие дискриминант-ные черты нейтральных текстов, которые не зависят от жанра, а с другой - посмотреть, зависят ли вообще маркеры нейтральности от жанра. В качестве ведущего используется метод корпусного лингвистического анализа, предполагающий исследование коллокаций, ключевых слов, конструкций, окружения исследуемой единицы, а также использование квантитативных методов [12. С. 20]. Технологический базис исследования составил корпусный менеджер Sketch Engine - поисковая система для работы с данными корпуса, получения статистической информации и предоставления пользователю результатов в удобной форме [13. С. 141]. Помимо множества функций, статистических методов, поддержки большого количества языков и удобного интерфейса, корпусные менеджеры позволяют исследователю работать с большими собственными коллекциями данных, которые предварительно индексируют для ускорения процесса поиска. Объектом анализа является категория эмоционально нейтральных текстов, а предметом - их дис-криминантные черты. Последние понимаются как такие доступные параметризации характеристики группы текстов, которые отличают ее от других групп текстов. В нашем проекте дискриминантные черты текстов каждого из эмоциональных классов используются в качестве дополнительных факторов для формирования функций-предикторов в процессе машинного обучения по прецедентам, которое проходит компьютерный классификатор текстов на основе размеченной выборки. 3. О понятии нейтральности в лингвистике Понятие нейтральности в лингвистике далеко неоднозначно. В целом следует констатировать, что для лингвистов категория нейтральности (будь то в стилистике, семантике или эмотиологии) практически всегда является точкой отсчета для описания какого-то иного объекта, качества или характеристики: стилистического значения лексемы, степени экспрессивности или оценочности конструкции, выраженности эмоционального концепта. Однако практически никогда нейтральность не рассматривалась как самостоятельный объект исследования. Тем не менее есть определенная доля истины в известном афоризме -«чтобы быть эксцентричным, надо знать, где находится центр». Рассмотрим специфику трактовки категории нейтральности в трех аспектах: стилистическая нейтральность, оценочная нейтральность и эмоциональная нейтральность. 3.1. Стилистическая нейтральность В традициях стилистики нейтральность текста или составляющих его единиц трактуется в самом общем смысле как их «невыделенность», создающая фон для появления у некоторой единицы или совокупности единиц некоторой стилистической окраски или стилистического значения. Так, М.В. Панов отмечает [14. С. 179], что только окрашенные единицы создают стилистическую характерность текстов, - «нейтральные же единицы, встречаясь в любом тексте (курсив наш. - А.К.), не могут быть носителями характерности», однако первые проявляют свою характерность, только находясь в сочетании со вторыми. Р.Г. Пиотровский сужает границы нейтральных текстов, специфицируя их невыделенность новым ограничением - это должны быть некие типовые, стереотипные контексты, где лексические единицы встречаются в своем привычном окружении, поскольку «даже наиболее стилистически нейтральные слова, словосочетания и грамматические конструкции при перенесении их в другую речевую среду становятся стилистически окрашенными» [15. С. 22]. Эти «обычность» и «невыделенность» являются в том числе следствием соблюдения в нейтральных текстах базовых норм языка, предопределяющих отсутствие каких бы то ни было препятствий к их пониманию [16. С. 275]. И наоборот, всякое нарушение норм языка, согласно стилистике отклонений [17], трактуется его носителем - реципиентом некоторого текста как «отклонение», уже этим привлекает к себе внимание читателя, становясь «выделенным», а значит, приобретая стилистическую окраску. Невыделенность, типизированность контекста и стереотипность ситуации употребления, нормативность, отсутствие проблем понимания - основные признаки нейтрального текста, рассмотренного в стилистической перспективе. 3.2. Оценочная нейтральность Оценка, по мнению Н.Д. Арутюновой, является результатом соотнесения человеком мира реального и его идеализированной самим же человеком модели [18. С. 182-183], что порождает «разнообразные иллокутивные силы» - «оценочное высказывание стремится повлиять на адресата, а через него и на ход практической жизни». Следовательно, оценка находится в зоне прагматики языкового знака. Рассматривая ее в лексикографическом аспекте, Ю.Д. Апресян [19. С. 66-69] выделял два типа информации, составляющей данную зону: 1) культурные коннотации и семантические ассоциации, фиксирующие отношение национально-лингво-культурного коллектива к обозначаемой словом сущности; 2) «модальную рамку», отражающую оценку описываемой конкретной ситуации говорящим или слушающим. И. В. Арнольд связывает оба вида прагматической информации с понятием потенциальных или импли-кациональных сем [20], которые могут быть актуализированы в контексте, но могут и оставаться в латентном состоянии. Во втором случае лексема может, по-видимому, приниматься за нейтрально-оценочную. Таким образом, к нейтрально-оценочным языковым единицам принято относить лексемы, либо не имеющие в данном национально-лингво-культурном коллективе специфических культурных коннотаций, либо употребленные в таком контексте, который не актуализирует эти семы, а также в случае, если в контексте данные лексемы не имеют специфической модальной рамки, позволяющей увидеть через нее индивидуальное восприятие говорящим / слушающим описываемой ситуации. Соответственно, нейтрально-оценочные тексты -это тексты, которые не создают контекстных условий для актуализации какой бы то ни было оценки (ни социальной, ни индивидуальной) описываемой в них ситуации, минимизируя тем самым прагматическую направленность речевого произведения. 3.3. Эмоциональная нейтральность Наконец, третий аспект - собственно эмоциональная нейтральность. Эмоции долгое время не включались в число объектов лингвистического анализа, поскольку с «легкой руки» Э. Сепира считалось, что, хотя языковые символы и соотносились, возможно, когда-то с эмоциями, сейчас эта связь «уже непосредственно не просматривается» [21. С. 263]. Однако, когда появилась отдельная отрасль лингвистики -эмотиология, сконцентрировавшаяся на изучении проявления эмоциональности в языке, обнаружилась противоположная тенденция - стали высказываться мнения о том, что «весь язык эмотивен», что «не существует эмотивно нейтральной лексики» [22. С. 25]. Тем не менее о возможности существования эмоционально нейтральных текстов писал уже Ш. Балли в начале ХХ в. Он отмечал, что во всяком акте речепроизводства говорящий «придает своим мыслям либо объективную, рассудочную форму, максимально соответствующую действительности, либо чаще всего вкладывает в выражение в самых различных дозах эмоциональные элементы» - индивидуальные чувства, часто претерпевающие влияние чувств социальных [23. С. 29]. В языковых сообществах сложились определенные жанровые формы, которые тяготеют к «объективации интеллектуальной сферы духовной жизни человека» [23. С. 29]. Это в первую очередь жанры информативного дискурса [24]: научный текст (монография, статья, доклад), информационно-справочные тексты (словари, энциклопедии, справочники). С распространением интернет-дискурса корпусы текстов с так называемым нейтральным сентиментом (тональностью) также формируются и на основе постов в социальных сетях, отзывов о товаре или услуге на интернет-платформах. Это происходит в рамках достаточно новых парадигм анализа, использующих технологический потенциал компьютерной и математической лингвистики. Первое направление известно как извлечение мнений (opinion mining) [25, 26]. Оно также включает анализ тональности (sentiment analysis), где под тональностью понимается эмоционально-оценочное отношение к объекту оценки (товару или услуги), выраженное в тексте [27, 28]. Оно может быть позитивным, негативным или нейтральным. Текст считается нейтрально окрашенным, если он не содержит эмоциональной составляющей [29. С. 152]. Тональность в рамках такого подхода определяется либо по словарям тональностей, либо на основе вероятностных статистических моделей, выстраиваемых при помощи технологии машинного обучения. Если используется технология машинного обучения по прецедентам, то для тренировки алгоритма привлекается обучающая выборка, в которой каждый текстовый фрагмент имеет «эмоциональную этикетку», приписанную ему информантами-асессорами. Второе направление - эмоциональный анализ текстов. Его объектом является уже конкретная эмоция, вербализованная в тексте: страх, радость, гнев и др. Но в качестве нейтральных, как и в первом случае, рассматриваются тексты, не содержащие эмоциональной составляющей. Источником знаний, позволяющих квалифицировать некоторые тексты как эмоционально нейтральные, как в первом, так и во втором случае выступают статистические модели, выстраиваемые компьютерной системой самостоятельно (машинное обучение без учителя), на основе многочисленных итераций, либо с опорой на разметку, предварительно проведенную информантами (машинное обучение с учителем). Кроме того, существенно повысить точность классификации может подача «на вход» алгоритма неких дискриминантных черт (в англоязычной терминологии - features) класса нейтральных текстов, выделяющих его среди других и способных выступить в качестве основы функций-предикторов, определяющих работу программы-классификатора. Проведенный анализ теоретической литературы позволил сформулировать рабочую гипотезу, предопределяющую алгоритм последующей работы по поиску дискриминантных черт класса нейтральных текстов: вербальная специфика НТ может быть маркирована 1) соответствием стилистической норме (отсутствие обсценизмов); 2) невыраженностью модальной рамки высказывания, что скажется на функционировании маркеров чужого слова, функционировании слов-дейктиков, а также частотных предикатах; 3) отсутствием или статистической нерелевантностью «вокабуляра эмоций». 4. Корпусный анализ нейтральных выборок на фоне эмоциональной выборки 4.1. Сниженная и оценочная лексика Проведенный анализ частотности четырех наиболее употребительных обсценизмов в трех подкорпусах показал отсутствие подобных лексем (что в вики-текстах ожидаемо), поскольку у ресурса есть команда модераторов с правом блокировки пользователей и удаления записей, к тому же это публичный ресурс. Однако результаты анализа подкорпуса текстов из социальной сети ВКонтакте, оцененных информантами как нейтральные, продемонстрировали, что, когда речь идет об интернет-текстах, несоответствие стилистической норме не означает автоматическую не-нейтральность текста - в данном подкорпусе об-сценизмы есть, хотя значения их частотности в большинстве случаев ниже, чем в эмоциональных текстах. В табл. 1 указана частотность четырех наиболее распространенных обсценизмов. Таблица 1 Относительная частотность обсценизмов в трех подкорпусах Подкорпус / частотность наречия Обсценизм Обсценизм Обсценизм Обсценизм в ipm (items per million) № 1 № 2 № 3 № 4 НТ a priori 0 0 0 0 НТ a posteriori 260 0 43 130 ЭТ 708 68 72 79 Что касается оценочных прилагательных, то в каждом подкорпусе их доля в списке 50 наиболее частотных прилагательных также отличается: НТ a posteriori - 18 из 50 (красивый, счастливый, нужный, хороший, огромный, страшный, крутой, любимый и т.д.), НТ a priori - 3 из 50 (хороший, настоящий, основной) и ЭТ - 24 из 50 (хороший, счастливый, отвратительный, прекрасный, жуткий, и т.д.). 4.2. Способы передачи «чужого слова» Первая категория вербальных маркеров, верифицированная на материале НТ, - это категория ксенопока-зателей. Термин был введен Н.Д. Арутюновой [30] для обозначения частиц де, мол, дескать как знаков чужого голоса, отчуждаемой речи, чужого мира. Воспроизведение говорящим речи «другого», несущее груз двойной субъективности, выполняет функцию нивелирования социальной ответственности говорящего за передаваемое сообщение в его диктумном или модусном аспекте, что позволяет отнести анализируемые частицы к категории показателей «субъективной цитации» [31]. Как показал анализ, де и дескать не используются ни в ЭТ, ни НТ, по-видимому, тому виной оттенок книжности, который для них характерен. Что касается ксенопоказателя мол, то если в восьми эмоциональных подкорпусах он входит в число частотных служебных слов в диапазоне рангов от 13 до 64, то в обоих нейтральных подкорпусах (НТ a posteriori и a priori) нет ни одного употребления данной единицы. Уже имеющиеся у коллектива результаты свидетельствуют [32] о том, что ЭТ чувствительны к ксе-нопоказателям. По-видимому, эмоциональность часто объективируется путем апелляции к чужому слову, а нейтральность - ее отсутствием. 4.3. Глагольность и бытийность Сравнение частотности глагольных форм в девяти подкорпусах показало, что в корпусах НТ значительно меньше глаголов, чем в ЭТ (табл. 2). Таблица 2 Значения относительной частотности глаголов в подкорпусах ЭТ и НТ Подкорпус ЭТ НТ a posteriori НТ a priori Частоты в ipm от 137 613 до 160 123 101 907 84 061 Среди глаголов обоих подкорпусов самым частотным является глагол быть. Предварительный интерпретативный анализ корпусов НТ a posteriori позволил сформулировать предположение о том, что внимание нарратора в данных текстах сосредоточено, по-видимому, не на своем эмоциональном состоянии, а на некоторой наблюдаемой ситуации, в которой третьи лица, возможно, испытывают некоторые эмоции, но нарратор о них может только догадываться и эмпатично им сопереживать, однако это не его личные чувства. В [33] подобное явление названо эмотивной тональностью объектного типа. Глагол быть в нейтральных текстах в «Подслушано» используется в имперфективном и перфективном стативном употреблениях [34]. Сравните примеры текстов (орфография и пунктуация пользователей ВКонтакте сохранены). 1. Когда мне было лет 6 мы жили в р-не рядом с рощей. У нас во дворе часто гуляла пожилая женщина со взрослым сыном. Это сейчас я понимаю, что он был умственно-отсталым, а тогда всем детям во дворе он казался просто интересным и странным взрослым и конечно мы не считали его опасным. Как-то его заметили гулящим уже без матери, а потом перестали встречать на улице его вовсе. И вот однажды наша ровесница пропала. Ее не могли найти целый день. А вечером кто-то увидел этого парня, бредущего за руку с пропавшей малышкой в сторону рощи. Оказалось, что целый день они были в его квартире где он «знакомил» ее со своей мамой, которая лежала мертвая на кровати уже 3 недели. Умерла она своей смертью. Наверное он искал замену, чтобы было с кем гулять (корпус НТ a posteriori). Нарратор никак не эксплицирует свое эмоциональное состояние, хотя тот факт, что процитированный пост был изначально помещен редакторами паб-лика под хештегом #Одиночество, имплицирует эмоцию грусти, эмпатически, возможно, переживаемую автором поста, но не замеченную менее эмпатичным асессором, оценившим его как НТ. В нейтральных же вики-текстах (НТ a priori) глагол быть используется преимущественно в конструкциях с глаголами в пассивном залоге для констатации фактитивной информации, например: 2. В 1922 г. уезды преобразовали в округа. 11 октября 1923 г., согласно постановлению ВЦИК, в административное деление Крымской АССР были внесены изменения, в результате которых округа были ликвидированы, основной административной единицей стал Джанкойский район и село включили в его состав (НТ a priori). 4.4. Дейктики В подкорпусах ЭТ и НТ проведен анализ значений меры семантической близости MI (коэффициент взаимной информации) глагола быть и четырех дейкти-ков: я, он, она, они. Мера MI относится к точечным оценкам силы ассоциации. Она сравнивает зависимые контекстно-связанные частоты с независимыми (при случайном появлении слов в контексте) по формуле MI (n, c) = log2 ff f(n)•f(c) где n - ключевое слово; c - коллокат; f (n, c) - частота встречаемости ключевого слова n в паре с коллокатом с; f (n), f (c) - абсолютные (независимые) частоты ключевого слова n и коллоката c в корпусе (тексте) [35]. Оказалось, что значение MI для быть и указанных дейктиков в НТ a priori нулевое, это означает, что их совместная встречаемость статистически не значима, она случайна. Кроме того, частотность каждого из указанных местоимений в сочетании с быть не превышает 200 ipm, что является чрезвычайно низким показателем по сравнению с другими подкорпусами. В подкорпусе НТ a posteriori ситуация кардинально иная. На рис. 1 показаны в сравнении значения MI по восьми подкорпусам ЭТ и НТ a posteriori: значения данного коэффициента выше всего в подкорпусе НТ a posteriori, но если для я +быть этот рост незначителен, то для он+быть и они+быть скачок значений более выражен. Иначе говоря, «неслучайность» сочетания быть с местоимениями 3-го лица в корпусе НТ выше, чем в подкорпусах ЭТ. Таким образом, наблюдается значимое расхождение в функционировании местоимений-дейктиков в связке с глаголом быть в корпусах НТ a posteriori и a priori: в одном они тесно и статистически неслучайно связаны, в другом - практически не употребляются вместе, хотя сам глагол одинаково частотен в обоих подкорпусах. Наблюдаемый контраст можно объяснить тем, что в случае с НТ a posteriori нарратор является одновременно наблюдателем ситуации, происходящей с третьими лицами, - наблюдение требует достаточно длительной фиксации внимания на объекте. Это и влечет за собой, во-первых, употребление быть в его имперфективном или перфективном стативном значениях, во-вторых, использование местоименной репризы во избежание повторов (см. текст 1): он был умственно-отсталым; целый день они были в его квартире) и притяжательных конструкций (в его квартире). 2,63" Ж ^ ^ JF "V J Л° f J? 4? с/ J?

Ключевые слова

интернет-тексты, сентимент-анализ, эмоционально нейтральные тексты, корпусные методы в лингвистике, вики-тексты

Авторы

ФИООрганизацияДополнительноE-mail
Колмогорова Анастасия ВладимировнаСибирский федеральный университетд-р филол. наук, зав. кафедрой романских языков и прикладной лингвистикиnastiakol@mail.ru
Всего: 1

Ссылки

Кошкарова Н.Н., Яковлева Е.М. Дискурс новой эмоциональности: коммуникативные практики цифровой реальности // Политическая лингвистика. 2019. № 5 (77). С. 147-152. DOI 10.26170/pl19-05-15.
Becker M., Philippe E. Critical Theory and Social Media: Alternatives and the New Sensibility: Honors Theses (PPE). 2018. 66 р.
Ловинк Г. Критическая теория Интернета. М. : Ад Маргинем Пресс, 2019. 304 с.
Пожидаева Е.В., Карамалак О.А. Хэштеги в социальных сетях: интенции и аффордансы (на примере группы сообщений на английском языке по теме «Food» (Пища / еда)) // Вестник Томского государственного университета. Филология. 2018. № 55. C. 106-118. DOI: 10.17223/19986645/55/8
Pang B., Lee L. Opinion Mining and Sentiment Analysis // Foundations and Trends in Information Retrieval. 2008. Vol. 2, № 1-2. P. 1-135.
Haakk N., Kirmani M., Mohd M. Emotion analysis: A survey // International Conference on Computer, Communications and Electronics (Comptelix). 2017. P. 397-402.
Lovheim H. A New Three-dimensional Model for Emotions and Monoamine Neurotransmitters // Medical hypotheses. 2012. № 78. P. 341-348.
Колмогорова А.В., Калинин А.А., Маликова А.В. Типология и комбинаторика вербальных маркеров различных эмоциональных тональ ностей в интернет-текстах на русском языке // Вестник ТГУ. 2019. № 448. С. 48-58. DOI: 10.17223/15617793/448/6
Дементьев В. В. «Лукоморье» vs «Википедия» = «Неформально» vs «Формально»? // Жанры речи. 2015. № 1 (11). С. 137-151.
Cimini N., Burr J. An Aesthetic for Deliberating Online: Thinking Through «Universal Pragmatics» and «Dialogism» with Reference to Wikipe-dia // The Information Society. 2012. Vol. 28, № 3. P. 151-160. DOI: 10.1080/01972243.2012.669448.
Колмогорова А.В. Использование текстов жанра «интернет-откровение» в контексте решения задач сентимент-анализа // Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2019. Т. 17, № 3. С. 71-82. DOI 10.25205/1818-7935-2019-17-3-71-82
Мустайоки А., Копотев М.В. Современная корпусная русистика // Slavica Helsingiensia 34. Инструментарий русистики: корпусные подходы / под ред.: А. Мустайоки, М.В. Копотева, Л. А. Бирюлина, Е.Ю. Протасовой. Хельсинки, 2008. С. 7-24.
Николаев И.С., Митренина О.В., Ландо Т.М. Прикладная и компьютерная лингвистика. М. : ЛЕНАНД, 2016. 320 с.
Панов М.В. Труды по общему языкознанию и русскому языку. М. : Языки славянской культуры, 2007. Т. 2. 848 с.
Пиотровский Р.Г. Очерки по стилистике французского языка : морфология и синтаксис. Л. : Учпедгиз. Ленинградское отделение, 1960. 224 с.
Тинякова Е.А. Философский аспект рассмотрения языка. Москва; Берлин : Директ-медиа, 2015. 354 с.
Essays in semiotics / eds. J. Kristeva, J. Rey-Debove, D.J. Umiker. Paris : Mouton de Gruyter, 1971. 445 p.
Арутюнова Н.Д. Язык и мир человека. М., 1999. 896 с.
Апресян Ю.Д. Избранные труды. Т. II: Интегральное описание языка и системная лексикография. М. : Школа «Языки русской культуры», 1995. 167 с.
Арнольд И.В. Семантика. Стилистика. Интертекстуальность : сб. ст. / науч. ред. П.Е. Бухаркин. СПб. : Изд-во СПб. ун-та, 1999. 444 с.
Сепир Э. Избранные труды по языкознанию и культурологии: пер. с англ. / общ. ред. и вступ. ст. А.Е. Кибрика. М. : Прогресс-Универс, 1993. 656 с.
Шаховский В.И. Обоснование лингвистической теории эмоций // Вопросы психолингвистики. 2019. № 1 (39). С. 22-37.
Балли Ш. Французская стилистика. М. : УРСС, 2001. 392 с.
Adam J.-M. Les textes types et prototypes. Paris : Armand Colin, 2015. 290 p.
Koltsova O.Yu, Alexeeva S.V., Kolcov S.N. An Opinion Word Lexicon and a Training Dataset for Russian Sentiment Analysis of Social Media // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва,1-4 июля 2016 г.) / под общ. ред.: В. Селегей. М. : Изд-во РГГУ, 2016. Вып. 15. P. 277-287.
Negi S., Buitelaar P. Suggestion Mining From Opinionated Text // Sentiment Analysis in Social Networks / eds.: F.A. Pozzi, E. Fersini, E. Messina, B. Liu, M. Kaufmann. Elsevier, 2017. P. 129-139. DOI: https://doi.org/10.1016/B978-0-12-804412-4.00008-5.
Tiwari P., Yadav P., Agnihotri S., Mishra B., Nhu N., Gochhayat S., Singh J., Prasad M. Sentiment Analysis for Airlines Services Based on Twitter Dataset // Social Network Analytics. Computational Research Methods and Techniques. 2019. Р. 149-162. DOI: 10.1016/B978-0-12-815458-8.00008-6.
Yadav A., Jha C.K., Sharan, A., Vaish, V. Sentiment analysis of financial news using unsupervised approach // Procedia Computer Science. 2020. Vol. 167. P. 589-598. DOI: https://doi.org/10.1016/j.procs.2020.03.325.
Воронина И.Е., Гончаров В.А. Анализ эмоциональной окраски сообщений в социальных сетях (на примере сети «ВКонтакте») // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2015. № 4. С. 148-155.
Арутюнова Н.Д. Высказывание в контексте диалога и чужой речи // Revue des etudes slaves. 1990. Tome 62, fascicule 1-2. L'enonciation dans les langues slaves [En hommage a Rene L'Hermitte, sous la direction de Jean-Paul Semon et Helene Wlodarczyk]. P. 15-30.
Падучева Е.В. Показатели чужой речи мол и дескать // Известия РАН. Серия литературы и языка. 2011. Т. 70, № 3. С. 13-19.
Колмогорова А.В., Калинин А. А., Маликова А.В. Кто и о чем говорит в «радостных» и «грустных» текстах: в поисках дискриминантных черт текстов разных эмоциональных тональностей // Известия Уральского федерального университета. Серия 2: Гуманитарные науки. 2019. Т. 21, № 4 (193). С. 219-234. DOI 10.15826/izv2.2019.21.4.078
Ионова С.В. Эмотивность текста как лингвистическая проблема : дис.. канд. филол. наук. Волгоград, 1998. 197 с.
Падучева Е.В. Глаголы быть и бывать: история и современность // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции Диалог (Москва, 27-30 мая 2015 г.). М. : Изд-во РГГУ, 2015. Т. 1, вып. 14 (21). С. 500-514.
Захаров В.П., Хохлова М.В. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке. Компьютерная лингвистика и интеллектуальные технологии. 2010. № 9 (16). С. 137-143. URL: http://www.dialog-21.ru/dialog2010/materials/html/22.htm
 Эмоционально нейтральные интернет-тексты: в поисках специфики | Вестник Томского государственного университета. 2020. № 458. DOI: 10.17223/15617793/458/3

Эмоционально нейтральные интернет-тексты: в поисках специфики | Вестник Томского государственного университета. 2020. № 458. DOI: 10.17223/15617793/458/3