Genre markup of the Tomsk dialect corpus: from concept to implementation | Sibirskii Filologicheskii Zhurnal - Siberian Journal of Philology. 2022. № 2. DOI: 10.17223/18137083/79/22

Genre markup of the Tomsk dialect corpus: from concept to implementation

The relevance of the study is due to the fact that it has been conducted at the intersection of two scientific fields: corpus linguistics and communicative dialectology. The paper presents a comparative analysis of corpus practice based on the material of spoken language. Also, consideration is given to the process and results of creating a discursively annotated corpus of dialect speech with a size of more than 2 million tokens. Discursive markup implies the labeling of three parameters: topic, type, and genre of the text. The novelty of this research project is related to the fact that, for the first time, a large array of dialectal texts has been marked up according to intentional orientation: not only folklore but also speech genres have been annotated. The value of the new source is provided by the combination of archived data with current materials. A methodological advantage of the corpus is the possibility of combining qualitative and quantitative analysis. The paper describes the principles of implementing the genre marking in the Tomsk dialect corpus, with the factors influencing the composition of the genres of the dialect corpus revealed. The results make it possible to determine the quantitative ratio of different speech genres in dialectal communication. The observations are supported by examples from the spoken language of villagers. The accuracy of the conclusions is ensured by the reliance on quantitative data and a considerable amount of material (over 16 thousand genre fragments).

Download file
Counter downloads: 27

Keywords

dialectal corpus, genre markup, speech genre, Russian dialects of Siberia, dialectology, communicative linguistics, spoken language

Authors

NameOrganizationE-mail
Zemicheva Svetlana S.Tomsk State Universityoptysmith@gmail.com
Всего: 1

References

Богданова-Бегларян Н. В., Блинова О. В., Зайдес К. Д., Попова Т. И., Шерстинова Т. Ю. Корпус естественной речи: проблемы ручного аннотирования прагматических маркеров и пути их решения // Анализ разговорной русской речи (АРз-2019). Труды восьмого междисциплинарного семинара. 2019. С. 5-10.
Борисова И. Н. Русский разговорный диалог: структура и динамика. М.: ЛИБРОКОМ, 2009. 320 с.
Вежбицкая А. Речевые жанры // Жанры речи. 1997. № 1. С. 99-112.
Волошина С. В. Речевой жанр автобиографического рассказа в диалектной коммуникации // Портреты речевых жанров: разные дискурсивные практики / Под ред. Т. А. Демешкиной. Томск: Изд-во Том. ун-та, 2016. С. 37-96.
Гольдин В. Е. Теоретические проблемы коммуникативной диалектологии: Дис. … д-ра филол. наук в виде науч. докл. Саратов, 1997. 52 с.
Гришина Е. А. Мультимедийный русский корпус (МУРКО): проблемы аннотации // Национальный корпус русского языка: 2006-2008. Новые результаты и перспективы. СПб., 2009. С. 175-214.
Гришина Е. А. Устная речь в Национальном корпусе русского языка // Национальный корпус русского языка: 2003-2005. М., 2005. С. 94-110.
Дементьев В. В., Степанова Н. Б. Корпусные методы в исследовании речевых жанров: проблема ключевых фраз // Жанры речи. 2016. № 3. С. 24-41.
Ермолов О. Б., Богданова-Бегларян Н. В. Языковое оформление прощания в современной разговорной речи (на материале звукового корпуса «Один речевой день») // Коммуникативные исследования. 2019. Т. 6, № 2. С. 307-331.
Казакова О. А. Диалектная языковая личность в жанровом аспекте. Томск: Изд-во Том. политехн. ун-та, 2007. 200 с.
Качинская И. Б., Малышева А. В. Народная речь в Национальном корпусе русского языка // Русская речь. 2019. № 4. С. 103-118.
Кибрик А. А., Коротаев Н. А., Федорова О. В., Евдокимова А. А. Единая мультиканальная аннотация как инструмент анализа естественной коммуникации // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая - 1 июня 2019 г.). М., 2019. Вып. 18 (25). С. 265-280.
Копотев М. В. Введение в корпусную лингвистику: Учеб. пособие для студентов филологических и лингвистических специальностей университетов. Прага: Animedia Company, 2014. 195 с.
Котов А. А., Будянская Е. М. Видеокорпус обращений граждан по вопросам оплаты коммунальных услуг // Вестник Ярослав. гос. ун-та им. П. Г. Демидова. Серия: Гуманитарные науки. 2016. № 2 (36). С. 93-99.
Крючкова О. Ю., Гольдин В. Е. Корпус русской диалектной речи: концепция и параметры оценки // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 25-29 мая 2011 г.). М., 2011. Вып. 10 (17). С. 359-367.
Крючкова О. Ю., Гольдин В. Е. Саратовский диалектный корпус: новый научный и образовательный ресурс. Концепция, методические материалы. Саратов, 2010. 39 с.
Плунгян В. А. Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики // Русский язык в научном освещении. 2008. № 16 (2). С. 7-20.
Шерстинова Т. Ю. Прагматическое аннотирование коммуникативных единиц в корпусе ОРД: микроэпизоды и речевые акты // Корпусная лингвистика - 2015. Тр. Междунар. конф. / Отв. ред. В. П. Захаров, О. А. Митрофанова, М. В. Хохлова. СПб., 2015. С. 451-459.
Шерстинова Т. Ю. Структура повседневного диалога как последовательность речевых актов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая - 2 июня 2018 г.). М., 2018. Вып. 17 (24). С. 637-651.
Шилихина К. М. Использование корпусов в исследованиях дискурса // Вестник ВГУ. Серия: Лингвистика и межкультурная коммуникация. 2014. № 3. С. 21-26.
Шмелёва Т. В. Модель речевого жанра // Жанры речи: Сб. науч. ст. Саратов, 1997. С. 91-96.
Шмурак Р. И. К уточнению понятия упрека с помощью корпусных инструментов // Изв. РАН. Серия литературы и языка. 2020. Т. 79, № 3. С. 24-48.
Юрина Е. А. Томский диалектный корпус: в начале пути // Вестник Том. гос. ун-та. Филология. 2011. № 2 (14). С. 58-63.
 Genre markup of the Tomsk dialect corpus: from concept to implementation | Sibirskii Filologicheskii Zhurnal - Siberian Journal of Philology. 2022. № 2. DOI: 10.17223/18137083/79/22

Genre markup of the Tomsk dialect corpus: from concept to implementation | Sibirskii Filologicheskii Zhurnal - Siberian Journal of Philology. 2022. № 2. DOI: 10.17223/18137083/79/22