Tomsk Folklore Corpus: From idea to implementation | Voprosy leksikografii – Russian Journal of Lexicography. 2025. № 37. DOI: 10.17223/22274200/37/3

Tomsk Folklore Corpus: From idea to implementation

The article discusses the current problem of preserving and systematizing folklore material in the digital age. An overview of the existing electronic folklore corpora created and being created in Russia is presented. Despite the growing interest in corpus linguistics, electronic folklore corpora have not yet become widespread, especially in a regional context. The aim of the article is to present the concept of creating the electronic Tomsk Folklore Corpus based on the materials of the annual summer folklore practice of students of the Faculty of Philology of Tomsk State University. The expeditions took place in 1960-2010 in villages of Tomsk, Kemerovo and Novosibirsk Oblasts, as well as in Khakasia, Krasnoyarsk and Altai Krais. Following the results of the expeditions, the students prepared diaries and handwritten notebooks, in which they noted the place and time of collecting the material, indicated information about the collectors and informants, and wrote down texts with the designation of genres. The notebooks are stored in the TSU Laboratory of General and Siberian Lexicography. A total of 756 notebooks (5 of them contain diaries) and 51 expedition diaries have been preserved. The article substantiates the need to create such a resource, emphasizes the importance of preserving and cataloging folklore materials as an important part of traditional spiritual culture. The main stages of work on the corpus are described, including creating a catalog, digitizing handwritten notebooks, typing and checking texts, developing a markup system and building an information search system. Special attention is paid to the principles of marking up folklore texts, which should enable a multidimensional analysis of the material. The types of markup considered are: the year and place of collection of the material, the gender of the informant, language, genre, subject, the presence of a media file (photos and audio and video recordings for future expeditions). It is assumed that the search in the corpus will also be possible by word or combination of words. The development of the Tomsk Folklore Corpus is a continuation of the traditions of Tomsk Dialectological School and is aimed at preserving and popularizing the unique folklore heritage of Siberia. The article describes the potential uses of the corpus, including scientific (and lexicographical), educational, and cultural. The Tomsk Folklore Corpus will be accessible to a wide range of users, including researchers, teachers, students, and anyone interested in folklore, including folklore groups. The author declares no conflicts of interests.

Keywords

regional folklore, corpus folklore studies, electronic folklore corpus, Tomsk Folklore Corpus

Authors

NameOrganizationE-mail
Voloshina Svetlana V.Tomsk State Universityvsv1304@yandex.ru
Всего: 1

References

Куканова В.В. Фольклорный подкорпус: проблемы, структура и перспективы использования // Участие калмыков в укреплении Российской государственности : материалы Региональной науч.-практ. конф., посвящ. 1150-летию Российской государственности и Году российской истории (Элиста, 29 ноября 2012 г.). Элиста : КИГИ РАН, 2012. С. 192-197.
Тучкова Н.А. Корпусный метод в фольклористике и его возможности для этнографических исследований (опыт использования на селькупском фольклорном материале) // Томский журнал лингвистических и антропологических исследований. 2018. Вып. 2 (20). С. 100-111. doi: 10.23951/2307-6119-2018-2-100-111.
Кузьмина А.А. Концепция создания фольклорного подкорпуса Национального корпуса якутского языка: постановка проблемы, структура, технология // Филология: научные исследования. 2020. № 11. С. 11-18. doi: 10.7256/2454-0749.2020.11.34168.
Пенькова М.В. Фольклорный подкорпус Национального корпуса марийского языка: к вопросу создания // Финно-угроведение. 2023. № 1 (64). С. 75-80. doi: 10.51254/2312-0312-2023-64-75-80.
Зайцева Н.Г., Крижановская Н.Б. Корпусная лингвистика в прибалтийскофинском исследовательском пространстве (на материале Корпуса вепсского языка и Открытого корпуса вепсского и карельского языков) // Альманах североевропейских и балтийских исследований. 2018. № 3. С. 263-273.
Сафонова Д.П. Продуктивные модели аффиксального словообразования существительных по данным корпуса фольклорных корякских сказок // Известия Российского государственного педагогического университета им. А.И. Герцена. 2012. № 146. С. 120-128.
Ондар М.В. База данных текстов тувинского героического эпоса: первый этап // Новые исследования Тувы. 2016. № 4. С. 66-75.
Монгуш Ч.М., Ондар М.В. База данных и средства создания контекстов для представления и анализа тувинского героического эпоса // Программные продукты, системы и алгоритмы. 2017. № 3. С. 1-6.
Унарокова Р.Б., Соколова А.Н., Хакунова Э.Х. Ритуальные приговоры и импровизированные возгласы-призывы джегуако в контексте свадебной обрядности адыгов (в рамках корпусных исследований адыгейского языка) // Сибирский филологический журнал. 2023. № 1. С. 45-61.
Бадмаева Л.Д. О расширении корпуса бурятского языка // Банзаровские чтения : материалы междунар. науч. конф., посвященной 200-летию со дня рождения Д. Банзарова и 90-летию БГПИ-БГУ (Улан-Удэ, 30-31 марта 2022 г.): в 2 ч. Ч. 1. Улан-Удэ : Бурятский государственный университет имени Доржи Банзарова, 2022. С. 227-229.
Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., Шамсутдинова Г.Г. О структуре и содержании фольклорного корпуса башкирского языка // Электронная письменность народов Российской Федерации-2021 & IWCLUL 2021 : материалы междунар. науч.-практ. конф. (Сыктывкар, 2324 сентября 2021 г.). Сыктывкар : Коми Республиканская академия государственной службы и управления, 2022. С. 133-139.
Сиразитдинов З.А. Корпусные проекты лаборатории лингвистики и информационных технологий ИИЯЛ УНЦ РАН // Известия Уфимского научного центра РАН. 2013. № 4. С. 104-111.
Шамсутдинова Г.Г., Ишмухаметова А.Ш., Бускунбаева Л.А. Структура и состав базы данных загадок в подкорпусе текстов афористических жанров башкирского фольклора // Вестник Калмыцкого института гуманитарных исследований РАН. 2017. Т. 10, № 4 (32). С. 146-153.
Корпус нганасанских фольклорных текстов. М., 2003-2005. URL: https://iling-ran.ru/gusev/Nganasan/texts/index.php (дата обращения: 12.02.2025).
Электронный портал «Фольклор народов Сибири». Новосибирск, 2025. URL: https://folk-old.philology.nsc.ru/# (дата обращения: 12.02.2025).
Корпусы ИЭА РАН. М., 2011-2020. URL: https://corpora.iea.ras.ru/corpora/(дата обращения: 12.02.2025).
Литус Е.В. К вопросу о разметке фольклорных текстов в структуре электронного лингвокультурологического корпуса Кубани (на материале народных песен кубанского свадебного обряда) // Ресурсы региона: культурноисторическое развитие в контексте науки и образования : материалы Всерос. науч.-практ. конф. (Славянск-на-Кубани, 10-14 сентября 2015 г.). Славянск-на-Кубани : Филиал ГГБОУ ВПО «Кубанский государственный университет» в г. Славянске-на-Кубани, 2015. С. 138-142.
Фельде О.В. Электронный текстовый корпус лингвокультуры Северного Приангарья: принципы создания, структура и возможности использования // Вестник Кемеровского государственного университета. 2021. Т. 23, № 4 (88). С. 1086-1095.
Томский диалектный корпус // Лаборатория общей и сибирской лексикографии Томского государственного университета. Томск, 2025. URL: https://losl.tsu.ru/?q=corpus (дата обращения: 12.02.2025).
Васильева Е.В., Тиллабаева А.А., Шеметова Д.И. Корпус фольклорных текстов: от идеи до разметки // «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность : материалы науч. конф. молодых ученых (Иркутск, 15-18 ноября 2023 г.). Иркутск : Иркутский государственный университет, 2024. С. 45-51.
Маслова М.Д. Особенности создания морфологической разметки диалектного корпуса на примере собрания текстов исчезающих деревень Алапаевского и Верхотурского районов Свердловской области // Четвертая зимняя школа по гуманитарной информатике : сб. ст. (Калининград, 10-11 декабря 2020 г.). Калининград : БФУ им. И. Канта, 2020. С. 85-91.
Фольклорный архив Факультета гуманитарных наук НИУ «Высшая школа экономики». М., 2025. URL: https://folklore.linghub.ru/(дата обращения: 12.02.2025).
Жиров М.С., Жирова О.Я., Кузнецова Н.С. Электронный фольклорный архив в современном социокультурном пространстве // Самарский научный вестник. 2021. Т. 10, № 1. C. 283-286.
Тубалова И.В. «Свои» и «чужие» в фольклорном коллективе: лингвокогнитивные модели социализации в среднеобском фольклоре // Евроазиатский межкультурный диалог: «Свое» и «чужое» в национальном самосознании культуры. Томск : ТГУ, 2007. С. 398-404.
Тубалова И.В., Эмер Ю.А. Современная сибирская деревня в фольклорном отражении (лингвокультурологическое описание) // Вестник Томского государственного университета. 2007. № 294. С. 86-92.
Бохонная М.Е. Эстетическая интерпретация «вещного» мира в языке среднеобского фольклора (на материале лирической песни и частушки) : автореф. дис.. канд. филол. наук. Томск, 2006. 29 с.
Эмер Ю.А. Миромоделирование в современном песенном фольклоре (когнитивно-дискурсивный анализ) : автореф. дис.. д-ра филол. наук. Томск, 2011. 39 с.
Тубалова И.В. Полифонический текст в устных личностно-ориентированных дискурсах : автореф. дис.. д-ра филол. наук. Томск, 2015. 43 с.
Мишанкина Н.А., Тубалова И.В., Эмер Ю.А. Филология и информатика: специфика электронного представления региональных фольклорных текстов // Гуманитарная информатика. 2004. № 1. С. 102-113.
Юрина Е.А. Томский диалектный корпус: в начале пути // Вестник Томского государственного университета. Филология. 2011. № 2 (14). С. 58-63.
Земичева С.С., Иванцова Е.В. Проект создания Томского диалектного корпуса в свете тенденций развития корпусной лингвистики // Сибирский филологический журнал. 2018. № 3. С. 192-205.
Агапова Н.А., Волошина С.В., Демешкина Т.А. и др. Словарь детства: говоры Среднего Приобья (с лингвокультурологическим комментарием) / под ред. М.М. Угрюмовой. Томск : Изд-во Том. ун-та, 2018. 200 с.
Плохотнюк Т.Г. Народная культура остается востребованной: студенты ФилФ изучают фольклор во время учебной практики // Alma Mater. № 2387 21.06.2005. URL: http://almamater.tsu.ru/show_stoiy.phtmT?nom=2387&s=1861 (дата обращения: 28.03.2025).
Николаев Д.С. Создание электронного корпуса фольклорных текстов на русском языке. URL: https://profi.wciom.ru/fileadmin/file/nauka/grusha2015/s2_6/Nikolaev.pdf (дата обращения: 28.03.2025).
О фольклорном подкорпусе национального корпуса русского языка // Традиционная культура. 2012. № 1 (45). С. 14-25.
Вершининский словарь. Т 2. Г-З. / гл. ред. О.И. Блинова. Томск : Изд-во Том. ун-та, 1999. 319 с.
 Tomsk Folklore Corpus: From idea to implementation | Voprosy leksikografii – Russian Journal of Lexicography. 2025. № 37. DOI: 10.17223/22274200/37/3

Tomsk Folklore Corpus: From idea to implementation | Voprosy leksikografii – Russian Journal of Lexicography. 2025. № 37. DOI: 10.17223/22274200/37/3

Download full-text version
Counter downloads: 18