The Oral Speech Corpus of Russian-Turkic Bilinguals of Southern Siberia: The Marking of Deviations from the Speech Standard | Voprosy leksikografii – Russian Journal of Lexicography. 2019. № 15. DOI: 10.17223/22274200/15/8

The Oral Speech Corpus of Russian-Turkic Bilinguals of Southern Siberia: The Marking of Deviations from the Speech Standard

The article describes approaches to the marking of deviations from the speech standard (error annotation) in the corpus of oral speech of Russian-Turkic bilinguals of Southern Siberia. The texts of the corpus are recordings of oral spontaneous speech of Russian-Turkic bilinguals, as a result of which the corpus is bimodal, the sound of speech is synchronized with the transcription, which is realized using ELAN. Morphological annotation is performed automatically using the Mystem console program of the Yandex company with further manual correction. Along with the traditional morphological annotation, the corpus contains the annotation of the so-called “errors” (error annotation). Two types of labeling “errors” are applied, the first in accordance with the levels of the language system, the second in accordance with their sources. The article describes tags, provides fragments of texts with these tags. The key corpus tags are: Phon - phonetics, Synt - syntax, Morph - morphology, Lex - lexis, Der - derivation, Disk - discourse, Sem - semantics, Accaccent, Infl - inflexion, Aff - affix,; Decl - declension, Agr - agreement,; Gov - government, Id - idiom, Prep - preposition, preposition; Gen - Gender, Num - number, Сon - construction; Red - reduction, etc. The annotation of deviations from the speech standard also includes tags of the source of the deviation. This type of marking is determined by the focus of the created corpus of texts on fixing speech practices of bilinguals, on identifying the factors that determine the nature and degree of interference manifestation at all language levels. Translingual and intralingual influence is annotated in the corpus. The influence of the norms of the regional variant of the Russian language is marked as an intralingual one. Regionally determined deviations from the speech standard are marked with a [Reg] - a regional tag. This tag unites all manifestations of regional variants - Siberian dialects, the Siberian variant of urban vernacular, regional variants of the literary language. Deviations from the speech standard, which are a manifestation of the influence of the features of the bilingual’s mother tongue, are indicated by [Int] - interference. The peculiarities of oral colloquial speech in the corpus of texts of Russian-Turkic bilinguals are not marked with additional tags. The article provides examples of annotation using two types of tags. The morphological annotation and marking of deviations from the speech standard define a wide range of the search engine of the corpus of oral speech of the Russian-Turkic bilinguals of Southern Siberia. Connecting to the body corpus metamarkup system expands the search capabilities by matching the types of deviations with the types of bilingualism and the sociocultural types of speakers.

Download file
Counter downloads: 193

Keywords

билингвизм, корпус текстов, аннотирование, отклонения от речевого стандарта, интерференция, тюркские языки, русский язык, сибирские говоры, bilingualism, corpus of texts, annotation, deviations from the speech standard, interference, Turkic languages, Russian, Siberian dialects

Authors

NameOrganizationE-mail
Rezanova Zoya I.Tomsk State Universityrezanovazi@mail.ru
Всего: 1

References

Резанова З.И. Подкорпус устной речи русско-тюркских билингвов Южной Сибири: типологически релевантные признаки // Вопросы лексикографии. 2017. № 11. C. 105-118.
Резанова З.И., Некрасова Е.Д., Миклашевский А.А. Исследование психолингвистических и когнитивных аспектов языкового контактирования в проекте «Языковое и этнокультурное разнообразие Южной Сибири в синхронии и диахронии: взаимодействие языков и культур» // Русин. 2018. № 2 (52). С. 107-117.
Зализняк А.А. Грамматический словарь русского языка: Словоизменение. М. : Рус. яз., 1980. 880 с.
Копотев М. Введение в корпусную лингвистику. Praha : Animedia Company, 2014. 195 с.
RLC. Русский учебный корпус. URL: http://www.web-corpora.net/RLC/ (дата обращения: 14.01.2019).
Корпус контактно-обусловленной русской речи. URL: http://web-corpora.net/tsakorpus_russian_nonst/ (дата обращения: 14.01.2019).
Земская Е.А., Китайгородская М.В., Ширяев Е.Н. Русская разговорная речь. Общие вопросы. Словообразование. Синтаксис. М. : Наука, 1981. 276 с.
Русская разговорная речь / отв. ред. Е.А. Земская. М. : Наука, 1973. 485 с.
Русская разговорная речь. Фонетика. Морфология. Лексика. Жест / отв. ред. Е.А. Земская. М. : Наука, 1983. 239 с.
Русские говоры Среднего Приобья. Ч. 1 / под ред. В. В. Палагиной. Томск : Изд-во Том. ун-та, 1984. 201 с.
Русские говоры Среднего Приобья. Ч. 2 / под ред. В. В. Палагиной. Томск : Изд-во Том. ун-та, 1989. 323 с.
Араева Л. А. Говоры Кузбасса в их современном состоянии // Координационное совещание по проблемам изучения сибирских говоров кафедр русского языка вузов Сибири, Урала и Дальнего Востока. Красноярск, 1991. С. 38-65.
Банкова Т.Б. Лексика томского городского просторечия (типология описания) : дис.. канд. филол. наук. Томск, 1987. 164 с.
Блинова О.И. Просторечная лексика в системе местного диалекта // Лексикологический сборник. Барнаул, 1977. С. 68-83.
Bacanli E. Inflectional suppletion in Turkic languages // Folia Linguistica Historica. 2011. № 32. P. 1-42.
Будренюк Г.М., Григоревский В.М. Языковая интерференция и методы ее выявления. Кишинев : Штиинца, 1978. 126 с.
Сравнительно-историческая грамматика тюркских языков. Лексика. М. : Наука, 2001. 288 с.
Сравнительно-историческая грамматика тюркских языков. Морфология. М. : Наука, 1988. 557 с.
Гордеева О.И. Некоторые закономерности влияния родного языка на усваиваемый язык в процессе становления двуязычия (на материале русского и татарского сибирских говоров) : дис.. канд. филол. наук. Томск, 1965. 239 с.
Гордеева О.И. Об освоении татарами грамматической категории рода существительных в условиях русского старожильческого окружения // Лингвистический сборник. Томск, 1962. С. 29-34.
Абдрахманов М.А. К вопросу о закономерностях диалектноязыкового смешения (на материале тюркского говора дер. Эушта Томского района : дис.. канд. филол. наук. Томск, 1960. 261 с.
 The Oral Speech Corpus of Russian-Turkic Bilinguals of Southern Siberia: The Marking of Deviations from the Speech Standard | Voprosy leksikografii – Russian Journal of Lexicography. 2019. № 15. DOI: 10.17223/22274200/15/8

The Oral Speech Corpus of Russian-Turkic Bilinguals of Southern Siberia: The Marking of Deviations from the Speech Standard | Voprosy leksikografii – Russian Journal of Lexicography. 2019. № 15. DOI: 10.17223/22274200/15/8

Download full-text version
Counter downloads: 1567