Представлен результат адаптации и применения теории риторической структуры У. Манна и С. Томпсон к стихотворным текстам. Предложены и апробированы принципы сегментации текста и идентификации отношений, ориентированные на реконструкцию гетерогенного познавательного процесса, воплощённого в тексте. Проведён сравнительный анализ схем, построенных для следующих групп текстов: лирическихстихотворений трёх периодов творчества А.К. Толстого, его прозаических текстов и переводов.
The Rhetorical Structure Theory as the Instrument for Analyzing Poetic Texts.pdf Введение Данная работа выполнена в рамках реализации проекта по многоуровневому анализу текстов русской классической поэзии XIX - начала XX в. Проект нацелен на разработку инструментария для анализа (в частности, сравнительного) различных аспектов текстов, алгоритмизацию и автоматизацию ряда процедур обработки текстов, создание на этой основе различного рода справочно-аналитических ресурсов: словарей, метрических справочников, конкордансов. Изучаемые в рамках проекта аспекты текстов включают как специфические для поэзии метроритмические характеристики, так и составляющие традиционных языковых уровней (фонетического, лексико-семантического, прагматического). Статья представляет результаты изучения прагматического уровня. Цель исследования состояла в применении теории риторической структуры (ТРС, Rhetorical structure theory) [1] к стихотворным текстам и предусматривала следующие этапы реализации: 1) разработка процедуры применения ТРС к стихотворным текстам; 2) построение схем ТРС для выбранного множества текстов; 3) анализ построенных схем. Необходимость первого этапа обусловлена тем, что опыт использования ТРС для анализа стихотворных текстов отсутствует. Материалом исследования послужили лирические стихотворения А.К. Толстого, а также фрагменты написанных им прозаических текстов, письма, переводы стихотворений других авторов. Общий объём проанализированных текстов составил 5985 словоупо- 1 Работа выполнена при поддержке Российского научного фонда, проект № 19-1800466 «Разработка и реализация информационной системы многоуровневого исследования стихотворных текстов». М.К. Тимофеева 110 треблений. Для построения структур ТРС использовался инструмент разметки RSTTool [2] (http://www.wagsoft.com/RSTTool/). Исследование проведено в рамках когнитивного подхода к ТРС [3. С. 30-31], нацеленного на изучение когнитивных (познавательных) процессов, происходящих в сознании человека при создании или понимании определённого текста. Когнитивная трактовка схем, построенных на основе ТРС, изначально мыслилась авторами данной теории как вероятная, ряд последующих экспериментальных исследований предоставил аргументы в поддержку данной гипотезы [4]. Структура дальнейшего изложения такова. В следующем разделе очерчиваются границы исследования и уточняется его цель. В разделе «Теория риторической структуры» дана общая характеристика ТРС и принципов применения этой теории к стихотворным текстам. Далее в разделах «Сегментация» и «Идентификация отношений» следует детализация правил анализа текстов. В разделе «Языковой материал» приведены количественные характеристики рассмотренных текстов. Следующий раздел посвящён сравнительному анализу схем, соответствующих разным группам текстов. В заключении подведён итог проделанной работы и намечены возможные пути использования полученных данных. Проблемная ситуация Предваряя свою книгу о поэтическом тексте, Ю.М. Лотман отмечает, что задача науки состоит в правильной постановке вопросов [5. С. 6-8]. Вопрос должен формулироваться в терминах того раздела науки, в рамках которого данный вопрос предполагается решать. Иначе говоря, метаязык формулировки вопроса должен соответствовать метаязыку поиска и формулировки ответа. Такое требование, хотя и сужает исследование, делает его корректным в научном отношении, так как даёт возможность судить, был ли в результате получен ответ именно на тот вопрос, который был задан. Если ответ соответствует вопросу, то результатом является не только собственно ответ на интересовавший исследователей вопрос, но и разработанная в ходе этого процесса воспроизводимая методология получения ответа. Данное соображение Ю.М. Лотмана видится нам очень важным. Следуя ему, определим прежде всего тот исследовательский контекст, в рамках которого проведена представленная в статье работа, а затем сформулируем в соответствующих терминах цель этой работы. Поэтический текст, как и многие другие виды текстов, многофункционален. Однако прежде чем изучать сложное взаимодействие присущих такому тексту функций, необходимо исследовать каждую функцию в отдельности. Для М.Ю. Лотмана [5] целью проведения структурного анализа поэтического текста является изучение способности такого текста выполнять эстетическую функцию. Текст при этом рассматривается как структурное целое. Теория риторической структуры как инструмент анализа 111 Помимо эстетической функции стихотворный текст выполняет также познавательную: «Стихотворство род познанья, возвышающего дух»1. Одним из инструментов изучения структуры познавательного процесса, отражённого в тексте, является теория риторической структуры. Риторические отношения мыслятся здесь как когнитивные сущности, «когнитивные механизмы», связывающие текст воедино в сознании говорящего и реконструируемые адресатом при понимании этого текста [4. С. 11]. Цель нашей работы состояла в изучении структур познавательных процессов, отражённых в стихотворном тексте, эстетическая функция не затрагивается. Абстрагирование от ведущей для такого типа текстов эстетической функции представляется оправданным, поскольку детальное изучение каждой функции в отдельности весьма трудоёмко и вместе с тем необходимо для развития комплексного синтезирующего взгляда. Коммуникация - это не просто передача информации как набора фактов, а также побуждение адресата к познанию определенного аспекта мира. Это можно проиллюстрировать на примере такого жанра, как научная статья. Предназначение научной статьи, опубликованной для близкого в научном отношении сообщества исследователей, состоит не только в сообщении некоего готового результата, но также в том, чтобы побудить адресата пройти определённый путь познания, позволяющий оценить степень доверия к данному результату. Причём в научной статье автор должен выстроить и предложить адресату путь познания, отвечающий регламентирующим нормам, принятым в сфере науки, хотя этот путь может отличаться от реального пути, пройденного автором в ходе соответствующего исследования. В стихотворном тексте регламентирующие нормы значительно более свободны, и автор-поэт может отразить в своём произведении тот путь познания, который ценен или убедителен прежде всего для него самого. Познавательный процесс, воплощаемый в тексте, гетерогенен как в плане формы, так и в плане содержания. Участвующие в этом процессе составляющие могут относиться к разным аспектам языка. Между ними возможны взаимозависимости, в [6], например, обсуждаются связи между метрикой поэтического текста, семантикой, синтаксисом. Некоторые процедуры анализа стихотворных текстов поддаются алгоритмизации, нередко используются методы математической статистики. В качестве примера можно привести область стилеметрии. Так, в [7] рассмотрены лексико-семантический и синтаксический уровни. Формализованные процедуры изучения интересующего нас уровня прагматики стихотворного текста в таких исследованиях затрагиваются лишь косвенно, как правило, при анализе лексики. Однако прагматика представляет собой обширную область, выходящую за пределы лексики. 1 Руставели Шота. Витязь в тигровой шкуре / пер. Н. Заболоцкого. М. : Худ. лит., 1969. C. 25. (Библиотека всемирной литературы. Серия первая: Литература Древнего Востока, Античного мира, Средних веков, Возрождения, XVII и XVIII вв. Т. 27). М.К. Тимофеева 112 Относительно границ и содержания прагматики единого мнения не существует, но в любом случае в фокусе внимания находятся имплицитные составляющие содержания текста: «Прагматика... есть искусство анализа несказанного» (Pragmatics. is “the art of the analysis of the unsaid” [8. Р. 2]. В нашем исследовании рассматриваются пропозициональные имплицитные составляющие, называемые реляционными пропозициями [1, 9]. Такие пропозиции представляют собой утверждения о типе связи между частями текста. Иерархическая структура реляционных пропозиций, реконструируемая посредством построения схем ТРС, наиболее значима для анализа хода познавательного процесса, движения мысли, отображённого в тексте. Познавательный процесс гетерогенен не только по языковой форме, но и по содержанию. Основа содержания текста - его логическая форма, т.е. представление смысла текста на каком-либо из метаязыков математической логики. Однако при описании содержания текста только посредством логической формы игнорируются компоненты, потенциально также способные участвовать в познании, например эмоции, интенции, оценки, восприятия, обращения к собеседнику. Возникает вопрос об адекватном средстве представления такого гетерогенного познавательного процесса. Использование ТРС позволяет соединить все указанные виды составляющих, связывая в единой структуре когнитивные вклады различных типов. Гетерогенность когнитивных составляющих прослеживается в эволюции представления о базовой модели коммуникации, менявшегося параллельно с расширением границ прагматики (как и лингвистики в целом) во второй половине ХХ в. Господствовавшая в середине ХХ в. модель Шеннона-Уивера [10], часто называемая «кодовой» и «механистической», представляющая процесс коммуникации как кодирование и декодирование информационного сообщения, была обогащена Г.П. Грайсом [11], трактовавшим коммуникацию как в значительной степени инференциальный процесс, обусловленный интенциями участников коммуникации. Следующее обогащение представления о коммуникации, расширившее её до остенсивно-инференциальной модели, связано с теорией релевантности Д. Спербера и Д. Уилсон, включивших в рассмотрение коммуникативные функции стимулов, относящихся к разным модальностям [12]. Представленная в данной статье работа не выходит за пределы текстовых данных и не учитывает других модальностей коммуникации. Вопрос о соотношении реляционных пропозиций с постулатами Г. П. Грайса не рассматривался, как и вопрос об уместности использования понятия остенсии в связи с ТРС. Можно лишь предположить, что модель коммуникации, на которую опирается обсуждаемое исследование, занимает промежуточное положение между инференциальной моделью Г.П. Грайса и остенсивно-инференциальной моделью Д. Спербера и Д. Уилсон. Для более определённого суждения требуется дополнительный анализ данных теорий. Таким образом, подводя итог сказанному, можно заключить, что цель данного исследования состоит в адаптации ТРС к анализу стихотворных Теория риторической структуры как инструмент анализа 113 текстов русского языка, применении этой теории к таким текстам, в изучении закономерностей, проявляющихся на пропозициональном уровне и представленных в иерархической структуре реляционных пропозиций, обеспечивающих связность и целостность стихотворного текста. Согласно априорной гипотезе, положенной в основу исследования, анализ закономерностей в таких структурах позволяет выявлять общие и специфичные свойства стихотворных текстов. В заключение данного раздела обратим внимание на одну семиотическую особенность стихотворных текстов. Развивая рассуждение Ю.М. Лотмана [5] о семиотическом потенциале языковых единиц, используемых в стихотворном тексте, Р. Познер рассуждает о «семиотической новизне» [13. С. 166] языковой формы такого текста, осознаваемой даже после того, как текст уже понят. Эта мысль представляется важной, поэтому позволим себе её интерпретацию и развитие. Стихотворный текст часто включает окказиональные семиотические построения, созданные автором именно для этого текста, не встречавшиеся ранее и ещё не успевшие стать конвенциональными. Такие составляющие в той или иной степени нуждаются в распознавании, разгадывании. Соответственно, при чтении стихотворения движение мысли не идёт по уже проторённым путям, а прокладывает новые, создаёт некий (структурно и содержательно) новый мыслимый мир, и в этом видится одна из причин притягательности поэзии. В связи с отмеченной выше неустранимостью новаторских семиотических аспектов из итогового понимания текста уместно вспомнить об одном из свойств знака, а именно о принципе прозрачности, сформулированном Леоном Коем [14]. Согласно принципу прозрачности любой знак в момент усмотрения его содержания утрачивает свои материальные характеристики, становясь «прозрачным» для восприятия этого содержания. Иначе говоря, семиотический путь, приведший к пониманию определённого содержания, становится ненужным и отбрасывается после того, как это содержание понято. Внимание направляется на то, на что указывает знак, а не на сам знак. Если новаторские семиотические аспекты стихотворного текста неустранимы из его итогового понимания, то это означает, что принцип прозрачности к стихотворным текстам в полной мере не применим. Знак здесь менее прозрачен, чем в других видах текстов. Благодаря своей нестандартности знак не покидает область внимания, как это обычно происходит, например, при деловом общении, если внимание собеседников направлено на суть обсуждаемого вопроса. Семиотическая новизна теоретически может проявляться на каждом из уровней языковой системы, затрагивая фонетические, просодические, лексические, синтаксические, семантические, прагматические аспекты. В частности, она может проявляться в ракурсах и траекториях движения мысли. Неустранимость новаторских аспектов этого уровня означает, что они запечатлены в итоговом понимании стихотворного текста. Иначе го- М.К. Тимофеева 114 воря, понимая такой текст, мы не теряем из вида путь, приведший к этому пониманию. Реконструкции таких путей посвящено данное исследование. Теория риторической структуры Теория риторической структуры была предложена Уильямом Манном и Сандрой Томпсон в середине 80-х гг. ХХ в. Уже более тридцати лет она активно используется для решения широкого круга задач, в частности из области автоматического анализа текстов (Natural language processing, NLP) и корпусной лингвистики. Конкретный перечень сфер приложения данной теории можно найти в обзорной статье [15] и её дополнении [4]. Среди разнообразных видов текстов, исследуемых посредством ТРС, можно встретить прозаические художественные сочинения (например, изучение манипуляторных «игр» с читателем в произведениях Агаты Кристи [16]), но нет применений для анализа стихотворных текстов, что, скорее всего, объясняется изначальной установкой авторов, ориентировавшихся прежде всего на область NLP и актуальные задачи этой области, а именно автоматическое реферирование, генерацию текста, снятие неоднозначностей и т.д. Авторы ТРС исключали из рассмотрения стихотворные тексты типа «язык-как-искусство» («language-as-art») [1. С. 20], к которым можно отнести поэзию авангарда, основанную на экспериментировании с языком, например произведения В. Хлебникова. Очевидно, что к данной категории относятся не все стихотворные тексты. Однако, по-видимому, в силу сложившейся традиции исследования применимости ТРС к поэтическим текстам единичны. Была обнаружена только одна работа, посвящённая анализу на основе ТРС нарративных стихотворных текстов на китайском языке [17]. Вместе с тем нет оснований априорно отвергать возможность применения ТРС и к лирическим стихотворным текстам. Изучение данного вопроса в [18] позволило прийти к позитивному выводу о возможности такого применения ТРС. Теория риторической структуры основана на предположении о том, что связный текст представим в виде последовательности сегментов, каждый из которых функционально значим для понимания текста в целом, и все сегменты в совокупности, благодаря связывающим их реляционным пропозициям, образуют единую иерархическую структуру, изображаемую в виде дерева. Набор возможных отношений (типов связей) один и тот же на всех уровнях структуры. Сегменты могут быть элементарными или сложными. Сложный сегмент соответствует подструктуре структуры всего текста в целом. В работах о применении ТРС к текстам русского языка (например, [3, 19, 20]) принято использовать термины «элементарная дискурсивная единица (ЭДЕ)» и «дискурсивная единица» для обозначения соответственно элементарного сегмента и любого сегмента (элементарного или сложного). Применительно к стихотворным текстам русского языка была разработана специальная процедура анализа, учитывающая специфику таких текстов и Теория риторической структуры как инструмент анализа 115 отличающаяся от принципов анализа прозаических текстов. Поэтому указанные традиционные термины не использовались, чтобы не размывать их общепринятые трактовки. Далее будут использоваться только наименования «элементарный сегмент» и «сегмент». Рассмотрим для иллюстрации схему, построенную в результате анализа стихотворения Генриха Гейне в переводе А.К. Толстого (рис. 1). Принципы установления отношений, в частности в этой структуре, обсуждаются в следующем разделе статьи. Рис. 1. Схема стихотворения Г. Гейне (перевод А.К. Толстого) Текст данного стихотворения разделён на четыре элементарных сегмента, соответствующих строкам стихотворения. Элементарные сегменты нумеруются слева направо. При объединении сегментов в более сложную единую структуру (сложный сегмент) номера входящих в эту структуру элементарных сегментов указываются в её главной вершине. Например, на рис. 1 надпись 3-4 означает, что данный сложный сегмент объединяет в себе элементарные сегменты 3 и 4. В тексте стихотворения Г. Гейне нет явной информации о том, как функционально связаны между собой сегменты и связаны ли они вообще. Нет явных индикаторов (дискурсивных маркеров) какой-либо связи, например союзов «так как», «поэтому», позволяющих идентифицировать причинно-следственную связь. Есть лишь двоеточие в конце второго сегмента, но оно не является однозначным индикатором именно причинноследственной связи и может иметь другие трактовки. Вместе с тем, читая и понимая данный текст, мы усматриваем связи между сегментами, в частности, нам ясно, что в стихотворении объясняется, почему именно флюгера находятся «в затрудненье». Такое понимание достигается благодаря реляционным пропозициям: мы как бы «насыщаем» ими текст, делая его связным. Реляционные пропозиции соответствуют дугам, связывающим сегменты, и образуют каркас данной схемы, без которого она распалась бы на отдельные сегменты. Понимание текста адресатом включает реконструкцию реляционных пропозиций. Как и всякий аспект понимания, такая реконструкция может допускать варианты и не вполне совпадать с авторской. Отношения между сегментами подразделяются на асимметричные и симметричные. Отношение первого типа ставит один сегмент (сателлит) в М.К. Тимофеева 116 подчинение другому сегменту (ядру), на схеме такое отношение отображается в виде стрелки. Стрелка направлена от подчинённого сегмента к главному. Отношение второго типа связывает два или более равноправных сегмента, ни один из которых не подчинён другому, такое отношение изображается на схеме в виде линии без стрелки. В зависимости от выполняемой функции отношения подразделяются на предметные отношения (subject matter relations) и отношения-воздействия (presentational relations). В [1. С. 17] предлагается также первые называть семантическими, а вторые - прагматическими. Все симметричные отношения относятся к числу предметных. Предметное отношение выполняет функцию информирования о фактах: оно отражает обсуждаемую ситуацию. Асимметричное отношение-воздействие используется автором текста для того, чтобы склонить адресата к принятию мысли, выраженной в сегменте-ядре. Например, Background трактуется как отношение-воздействие, посредством него автор текста задаёт фоновую информацию, которая, по его мнению, облегчит понимание сказанного в сегменте-ядре. Для использования ТРС применительно к определённому классу текстов необходимо ответить на три вопроса: - Как делить текст на элементарные сегменты? - Какие отношения использовать при построении схем? - На основе каких критериев идентифицировать эти отношения? Обсуждению этих вопросов посвящены следующие два раздела статьи. Длительный опыт использования ТРС продемонстрировал высокую степень универсальности набора отношений, предложенного в традиционной версии ТРС [1] и проверен на большом объёме разнообразных текстов. Этот набор отношений был взят за основу и в данном исследовании. Вместе с тем авторы ТРС подчёркивали, что список отношений не следует рассматривать как раз и навсегда зафиксированный: новый вид текстов и новые задачи могут обусловить изменение состава отношений. Выработка критериев идентификации отношений базировалась на следующих положениях. 1. За основу были взяты определения отношений и критерии их идентификации, сформулированные авторами ТРС в [1]. 2. При уточнении множества отношений и критериев их идентификации ведущим принципом было достижение единообразия анализа всего массива текстов, обеспечивающее воспроизводимость результатов. Важность этого принципа подчёркивали авторы ТРС [1]. Соблюдение его было основной причиной трудоёмкости решения поставленной задачи, так как для выработки воспроизводимых критериев потребовались многократные итеративные просмотры всех построенных структур. 3. При выработке правил построения схем было принято во внимание последующее сравнение стихотворных и прозаических текстов: несмотря на различия в правилах построения схем для этих двух видов текстов, результирующие схемы сравнимы. Теория риторической структуры как инструмент анализа 117 4. Были добавлены два новых общих критерия идентификации отношений при отсутствии однозначного текстового индикатора: а) возможность синонимического преобразования текста с введением однозначного индикатора отношения; б) проверка согласованности смысла текста с пропозициональной логической формой, соответствующей отношению. Поясним добавленные два критерия. В некоторых случаях отношение, связывающее сегменты, идентифицировать несложно, так как в тексте имеется однозначный идентификатор этого отношения. Например, в следующем фрагменте стихотворения А. К. Толстого «По гребле неровной и тряской» уступительный союз хоть служит однозначным индикатором отношения Concession (Уступка): Мне кажется всё так знакомо, /Хоть не был я здесь никогда. Однако, как показали многочисленные эмпирические исследования [15, 21, 22], такие ситуации встречаются нечасто. Некоторые виды отношений вообще, как правило, не имеют текстовых индикаторов. В случае отсутствия или неоднозначности индикатора можно попытаться перефразировать текст, высказав ту же мысль иначе. Например, в следующем фрагменте стихотворения А.К. Толстого «Когда кругом безмолвен лес дремучий» вставка союза так как перед вторым сегментом не меняет смысл сказанного, но явным образом показывает причинно-следственную связь между сегментами: И трудно мне умом понять разлуку, / Ты так близка. Как уже было сказано, воплощённый в тексте познавательный процесс гетерогенный, его составляющие не сводятся только к логической форме. Однако более или менее явная логическая основа в них всегда присутствует. Поэтому исследователь, интересующийся логикой рассуждения, может мысленно изолировать логическую форму текста, оставляя за пределами своего внимания остальные составляющие. Действуя таким образом, автор [23] предложил систему соответствий для отношений, используемых в ТРС, уподобив каждое отношение определённой формуле пропозициональной логики. Использование этих соответствий в обратном направлении послужило одним из критериев идентификации отношений в стихотворных и прозаических текстах. Сегментация текста Детальная разработка принципов сегментации текста на «кванты» мысли и критериев идентификации отношений представлена в исследовании [3], ориентированном на анализ устной речи на русском языке. Есть ряд исследований на материале других типов прозаических текстов русского языка (новостных, научно-популярных, научных), например [19, 20]. Однако стихотворные тексты обладают своей спецификой, которую необходимо учитывать при их анализе на основе ТРС. Особенность таких текстов состоит прежде всего в делении на строки. Кроме этого, для таких текстов характерны абстрагированность, рассуждения о непредметном мире, что М.К. Тимофеева 118 осложняет идентификацию отношений и делает необходимой разработку уточнённых критериев их различения, основанных скорее на семантических, прагматических и логических, а не на синтаксических и лексических аспектах (на которых обычно акцентируют внимание разработчики средств автоматического анализа текстов). Деление стихотворного текста на строки является структурной особенностью таких текстов, оно связано с просодической, синтаксической, семантической структурами и, значит, является информативным. В исследовании, проведённом посредством ТРС на материале стихотворных текстов китайского языка [17], деление на строки было сохранено при сегментации текста. В [18] оно также, как правило, сохранялось, хотя допускались исключения. Строка стихотворения может разрывать синтаксически связанные части предложения или, наоборот, объединять в себе ряд предложений. Разрыв синтаксической связи может возникнуть и в прозаическом тексте, например в случае вложенных конструкций. Правда, в проанализированных прозаических текстах такие случаи встречаются значительно реже, чем в стихотворных. В данном исследовании при сегментации стихотворного текста деление на строки было сохранено. Оно принималось во внимание при сопоставлении разных групп таких текстов. Вместе с тем при сравнении стихотворных и прозаических текстов деление на строки, разрушающее синтаксические связи, можно было исключить из рассмотрения. Границей между элементарными сегментами считались конец строки или знак препинания, обозначающий конец предложения (точка, многоточие, восклицательный или вопросительный знак). Строка стихотворения может соотноситься с пропозициями по-разному. Она может выражать: а) одну или более пропозиций полностью; б) пропозициональную форму (т.е. пропозицию с некоторым числом незаполненных аргументных мест); в) аргумент (аргументы) предиката, входящего в состав другой строки стихотворения, или свойства такого аргумента. Возможны смешанные варианты, например в строке имеется одна полная пропозиция и аргумент от другой пропозиции. Так, в следующем тексте аргумент указан в первой из строк, предикат -во второй Телега с разбитой лошадкой / Лениво подвозит мешки (А.К. Толстой «По гребле неровной и тряской»). Во фрагменте Неотвязчивый кружится / Над тобой комар, наоборот, предикат находится в первой строке, а аргумент - во второй (А.К. Толстой «Милый друг, тебе не спится»). В следующем примере строка стихотворения А.К. Толстого «Когда природа вся трепещет» делится на два сегмента, так как внутри неё есть точка: И в ближний лес вхожу. Там покрасневший клён. При разрыве предложения и отнесении его частей к разным сегментам для связывания этих сегментов могут использоваться разные отношения, это определяется содержанием соответствующей реляционной пропозиции. Если строка разделяет предложение на две части, причём предикат Теория риторической структуры как инструмент анализа 119 попадает во вторую часть и первая не имеет ясного завершённого смысла, то первая часть трактуется как сателлит второй, соединяясь с ней отношением Preparation. Однако при разрыве синтаксической связи возможны и другие типы отношений. Например, в следующих текстах однородные предикаты оказываются в разных строках и в разных сегментах. В первом случае сегменты связаны отношением Conjunction: Неровный круг планета совершила / И к солнцу снова катится назад (А.К. Толстой, «Я вас узнал»). Во втором примере это отношение Disjunction: Меж людей он добрый воин / Или мирный гражданин (А.К. Толстой, «В жизни светской»). Идентификация отношений Для единообразия проводимого анализа текстов потребовалось детализировать условия использования отношений, сформулировав правила их дифференциации. Далее рассмотрено несколько групп отношений, связанных по своему содержанию и зачастую непросто различимых. При анализе дифференцирующих признаков таких отношений использовались определения из [1] и параллели между отношениями и логическими формулами из [23]. Синонимические преобразования и соотнесения с логической формой применимы при дифференциации любых отношений. Ниже эти возможности проиллюстрированы только для некоторых отношений, чтобы чрезмерно не увеличивать объём статьи. Для определения направления связи использовался критерий авторов ТРС [1]: устранение сателлита в меньшей степени разрушает понятность текста, чем устранение ядра. Для наименования отношений служили англоязычные названия из [1], так как эти термины стали традиционными для публикаций о ТРС, включая публикации на русском языке. При первом упоминании отношения в скобках указан переводной аналог, для большинства отношений это перевод, использованный в [3]. 1. Предваряющая и дополняющая информация об обсуждаемой ситуации: Background (Фон), Preparation (Подготовка), Circumstance (Обстоятельство), Elaboration (Детализация). В случае использования отношения Background сателлит задаёт фон, необходимый для понимания ядра. Это могут быть какие-то сопутствующие события, ситуации, состояния. Например: Дорожная едет коляска (сателлит) / Сижу я задумчиво в ней (ядро) (А.К. Толстой. «По гребле неровной и тряской»). Без сателлита ситуация, представленная в ядре, была бы менее понятной. Отношение Background имеет логическую форму вида modus ponens: ((S^N)aS)^N, где символ импликации трактуется как отношение понятности (если понятно S, то понятно и N). Здесь и далее символом S обозначается сателлит, символом N - ядро, в случае многоядерного отношения используется символ N с индексом. Background относится к числу отношений-воздействий, при выборе S автор текста, ориентируясь М.К. Тимофеева 120 на когнитивные способности адресата, подбирает информацию, которая, как он полагает, облегчает понимание N. Отношение Preparation по своему изначальному смыслу [1] готовит к восприятию ситуации, представленной в ядре, но делает это менее определённым образом, чем отношение Background: оно не задаёт фон, а привлекает внимание к чему-либо, чтобы адресат мог решить, читать ли текст далее. Однако в данной работе отношение Preparation использовалось в суженном (по сравнению с [1]) варианте, а именно только в случае разрыва синтаксической связи, возникшего из-за проведения границы между сегментами внутри предложения. Сателлит здесь есть средство подготовки адресата к прочтению следующего текста. Как уже было сказано, такие ситуации встречаются как в стихотворных, так и в прозаических текстах. Иллюстрацией могут служить следующие примеры. В схеме, построенной для стихотворения А. К. Толстого «В жизни светской», использовано отношение Preparation: Но порой мечтою странной (сателлит) / Он томится одинок (ядро). Без второй строки первая строка неясна, она не описывает ситуацию понятным образом. То же самое можно сказать о сегменте От Львовых, который оказался оторванным от остальной части предложения уточнением в скобках: От Львовых (которые приехали) я ничего не мог узнать (фрагмент письма А.К. Толстого к В.М. Лазаревскому, 1865 г.). На рис. 2 приведён фрагмент схемы для сегментов 30-32. Здесь сегмент 30 (Спокойствием объятый) представляет свойство актанта предиката, вошедшего в другой сегмент. Поэтому использовано отношение Preparation. Отношение, связывающее получившуюся конструкцию с сегментом 32, идентифицировано как Background, поскольку сложный сегмент 30-31 содержит одну полную пропозицию. Если бы здесь был только актант без полной пропозиции, то отношение было бы идентифицировано как Preparation. Отношение Circumstance обстоятельственное, оно входит в множество предметных отношений, служащих для информирования о фактах, без намерения оказать какое-либо дополнительное воздействие на адресата. Сателлит S задаёт границы локализации ситуации, представленной ядром N. Чаще всего это границы во времени и/или пространстве. Этому отношению соответствует логическая форма вида (SaN)a(S^N). Символ импликации здесь трактуется предметно, как соотношение локализаций: из того, что задана локализация S, следует, что это есть локализация N. В примере из того же стихотворения «По гребле неровной и тряской» сателлит связан с ядром отношением Circumstance: Близ мельницы старой и шаткой (сателлит) / Сидят на траве мужики (ядро). Отношение Circumstance, подобно отношениям Preparation и Elaboration, может использоваться в случае разрыва синтаксической связи, обусловленного разделением стихотворного текста на строки. Поэтому все три отношения использовались при сравнении стихотворных текстов между собой, но были исключены из рассмотрения при проведении сравнительного анализа стихотворных и прозаических текстов. Теория риторической структуры как инструмент анализа 121 30-32 Background 30-31 Preparation Спокойстви ем объятый. Вновь дремлет юный лес. н облаком седым В недвижном воздухе висит ружейный дым. Рис. 2. Фрагмент схемы стихотворения А.К. Толстого «Сквозит на зареве темнеющих небес» Restatement Есть много звуков в сердца глубине, Неясных дум, непетых песней много; Но заглушает вечно их во мне Издавна сердце с жизнию боролось - Но жизнь шумит, как вихорь ломит бор. Как ропот струй, так шепчет сердца голос! Забот Тяжел ее немолчных непрошены скучная й напор, тревога. Рис. 3. Схема стихотворения А.К. Толстого «Есть много звуков в сердца глубине» Отношение Elaboration относится к числу предметных, это информирование о фактах. Сателлит добавляет информацию о ситуации, уже представленной ранее в ядре, уточняя какие-либо её характеристики. Смысловая связь между ядром и сателлитом может характеризоваться как общеечастное, объект-атрибут, процесс-этап, элемент-множество, абстракция-реализация. Например, О том поведать не могу я (ядро) / На ежедневном языке (сателлит) (А.К. Толстой «Судя меня довольно строго»). Отношение Elaboration может использоваться при разрыве синтаксической связи, если актант и предикат оказываются в разных сегментах, но ядро данного отношения понятно даже в отсутствие актанта и содержит предикат. Примером может служить часть схемы на рис. 3 (сегменты 3-5). Как правило, при отношении Background сателлит предшествует ядру, а при отношении Elaboration, наоборот, ядро предшествует сателлиту. 2. Совместное рассмотрение ситуаций: Conjunction (Конъюнкция), Joint (Соединение), Sequence (Последовательность), Contrast (Сопоставление), Disjunction (Дизъюнкция), Concession (Уступка), Antithesis (Антитезис), Otherwise (Альтернатива). М.К. Тимофеева 122 Разграничение отношений данной группы представляло наибольшие сложности. Первые четыре отношения соответствуют конъюнкции и являются симметричными, т.е. связывают только ядра и не имеют сателлитов. К ним примыкает симметричное отношение дизъюнкции. Эти пять отношений, а также асимметричные отношения Condition и Otherwise относятся к предметным, их назначение - информировать адресата об определённых фактах. Concession и Antithesis - асимметричные отношения-воздействия. Арреаі 13-14 15-19 р жизнь! о лес! о солнца О юность! о надсады' свет! Рис. 4. Фрагмент схемы стихотворения А.К. Толстого «То было раннею весной» Отношение Conjunction соответствует конъюнкция, при которой конъюнкты связаны между собой содержательно. Как видно по примеру на рис. 4, деление на строки учитывается: конъюнкты, соответствующие сегментам, размещённым в одной строке стихотворения, считаются связанными более тесно, чем сегменты-конъюнкты из разных строк (О жизнь! о лес! о солнца свет! / О юность! о надежды!). Отношение Joint также означает конъюнкцию, но конъюнкты в этом случае связаны не содержательно, а лишь своим вхождением в один и тот же текст, предназначенный для определённого адресата. Этот вариант конъюнкции нередко встречается в письмах, когда автор по ходу написания письма переходит от одной темы к другой, никак не связывая их между собой по сути. Sequence похоже на отношение Conjunction, но в отличие от него базируется на каком-либо упорядочении ситуаций. Это может быть, например, упорядочение по времени: Неровный круг планета совершила (ядро 1) / И к солнцу снова катится назад (ядро 2) (А.К. Толстой «Я вас узнал, святые убежденья»). Отношение Contrast также по смыслу является конъюнкцией, но в данном случае конъюнкты - это ситуации, в каком-то отношении противопоставляемые, хотя обычно совместимые. Например, Вчера два раза был у Вас... (ядро 1) но вас не было дома (ядро 2) (из письма А.К. Толстого к В.М. Лазаревскому, 1862 г.). Отношение Disjunction не вызвало сложностей при идентификации, поэтому достаточно проиллюстрировать его примером: Когда упрёк мне шепчет шелест нивы (ядро 1) / Иль шум дерев (ядро 2) (А.К. Толстой. «Ко
Mann W., Thompson S. Rhetorical Structure Theory: A Theory of Text Organization. Technical report No. ISI/RS-87-190. University of Southern California, Information Science Institute, 1987. 91 p. URL: https://www.sfu.ca/rst/pdfs/Mann_Thompson_1987.pdf (date of access: 10.08.2020).
O'Donnell M. RST-Tool: An RST Analysis Tool. // Proceedings of the 6th European Workshop on Natural Language Generation March 24-26, 1997 Gerhard-Mercator University. Duisburg, Germany, 1997. P. 92-96.
Рассказы о сновидениях: Корпусное исследование устного русского дискурса / под ред. А.А. Кибрика, В.И. Подлесской. М. : Языки славянских культур, 2009. 736 с.
Taboada M., Mann W. Rhetorical Structure Theory: Looking back and moving ahead // Discourse Studies. SAGE Publications, 2006. Vol. 8, № 3. P. 423-459.
Лотман Ю.М. Анализ поэтического текста: Структура стиха. Л. : Просвещение, 1972. 272 с.
Гаспаров М.Л. Метр и смысл. М. : Фортуна ЭЛ, 2012. 416 с.
Мартыненко Г.Я. Основы стилеметрии. Л. : Изд-во Ленингр. ун-та, 1988. 176 с.
Ruhlemann C., Aijmer R. Corpus Pragmatics: Laying the Foundations // Corpus pragmatics: a handbook Karin Aijmer / ed. by Christoph Ruhlemann. Cambridge University Press, 2014. 480 р.
Mann W., Thompson S. Relational Propositions in Discourse // Discourse Processes. Taylor and Francis Ltd. 1986. Vol. 9, № 1. P. 57-90.
Shannon C.E., Weaver W. The Mathematical Theory of Communication. The University of Illinois Press, 1949. 117 р.
Grice H.P. Logic and Conversation. In: Syntax and Semantics / eds. by Peter Cole, Jerry L. Morgan. New York : Academic Press, 1975. Vol. 3. P. 41-58.
Sperber D., Wilson D. Relevance: Communication and Cognition. Blackwell : Oxford and Harvard University Press, 1986. р. ѴШ + 279.
Познер Р. Рациональный дискурс и поэтическая коммуникация: методы лингвистического, литературного и философского анализа / науч. ред. И.П. Кужелева-Саган ; пер. с англ. С.С. Носовой. Томск : Издательский Дом Томского государственного университета ; Дизайн-студия «Провинция», 2015. 296 с.
Koj L. Zasada przezroczystosci a antynomie semantyczne // Studia Logica. 1963. 14. S. 227-253. (In Polish).
Taboada M., Mann W. Applications of Rhetorical Structure Theory // Discourse Studies. SAGE Publications, 2006. Vol. 8, № 4. P. 567-588.
Alexander M. Rhetorical Structure and Reader Manipulation in Agatha Christie's Murder on the Orient Express // Miscelanea: A Journal of English and American Philology. University of Zaragoza. 2009. Vol. 39. P. 13-27.
Lu Y. A Discourse Analysis of Zhuang Dialogue Folk Songs. A thesis submitted in partial fulfillment of the requirements for the degree of Master of Arts (linguistics) faculty of graduate studies. Mahidol University, 2016. 183 p.
Тимофеева М.К. Опыт использования теории риторической структуры для представления логико-когнитивной организации поэтического текста // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2020. Т. 18, № 2. С. 28-45.
Chistova E., Kobozeva M., Pisarevskaya D., Shelmanov A., Smirnov I., Toldova S. Towards the Data-Driven System for Rhetorical Parsing of Russian Texts // Proceedings of Discourse Relation Parsing and Treebanking. DISRPT2019, Minneapolis, MN, June 6, 2019. P. 82-87.
Бакиева А.М., Батура Т.В. Исследование применимости теории риторических структур для автоматической обработки научно-технических текстов // Cloud of Science, 2017. Т. 4, № 3. С. 450-464.
Das D., Taboada M. Multiple Signals of Coherence Relations // Discours [Online], 24 | 2019, Online since 30 October 2019, connection on 30 October 2019. URL: http:// journals.openedition.org/discours/10032 (date of access: 10.08.2020).
Taboada M. Implicit and Explicit Coherence Relations. In J.Renkema (ed.). Discourse, of Course. An overview of research in discourse studies. Amsterdam : John Benjamins, 2009. P. 125-138.
Potter A. Reasoning between the Lines: A Logic of Relational Propositions. Dialogue and Discourse // US: The Dialogue & Discourse Board of Editors. 2019. Vol. 9, № 2. P. 80-110.