Tomsk dialectal corpora: the starting point | Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya – Tomsk State University Journal of Philology. 2011. № 2 (14).

Tomsk dialectal corpora: the starting point

The dialectal archive collected by the dialectologists of Tomsk State University consists of 1500copybooks with the records of regional variants of speech, representing the dialects of Russian oldtimersin the Middle-Ob region. As a unique memorial of the national speech culture, this data collectionmakes a precious source for those who research the history and current state of the dialectal formof the Russian national language. Thus, it is a matter of urgency to design dialectal corpora based onthe Middle-Ob dialects. The methods of corpus linguistics make it possible to take Tomsk dialectalschool up to the next level of research in accordance with modern technologies.To solve this task, in 2010 a group of dialectologists and programmers of Tomsk State University(E.A. Yurina, V.V. Poddubny, S.V. Voloshina, M.A. Tolstova, O.G. Shevelev) worked out a project ofthe Middle-Ob dialectal corpora. The project is expected to result in dialectal corpora available for awide range of researchers, which lately can be integrated as sub corpora into larger national projects.Within the project paper-based dialectal texts will be translated into the digital form, for whichsake the research team members have developed a Unicode-based system of graphical symbols toreproduce peculiarities of dialectal phonetics and morphology. For the purpose of meta-tagging theyhave determined the parameters of passportization, theme qualification and genre specification oftexts. The passport of a text includes data about informants, the time and place of the recording, thenumber of the copybook. The theme section specifies the time of the event (1920s, 1930s, 1940s, etc.)and the theme of the record by means of the key concept determining the semantic unity of the text(War, Family, Kitchen-garden, Kolkhoz, House, etc.). The genre characteristic of the text is given bymeans of the text genre in accordance with the type of speech and narration on the whole: Biography,Narrative, Description, Interview, Fairy-tale, Song, Chastooshka (two-line or four-line humorous folksong), Proverb. The genre qualification ends with the indication to the text subgenre: informative (reportingabout an event, expressing intention, opinion, etc.); imperative (request, order, instruction, etc);ritual (greeting, farewell, apology, etc.); evaluating (approval, disapproval, etc.).In the nearest time the research team plans to make a compiled electronic dictionary of the MiddleOb dialects and to design a software platform of the corpora with the functions of automated text tagging,linguistic database storage, multi-aspect search for words and phrases by set-up parameters, statisticaldata processing and saving search results.

Download file
Counter downloads: 297

Keywords

Томский диалектный корпус, параметры метаразметки, говоры Среднего Приобья, Tomsk dialectal corpora, meta-tagging parameters, the Middle-Ob dialects

Authors

NameOrganizationE-mail
Yurina Yelena A.Tomsk State Universityyourina2007@yandex.ru
Всего: 1

References

Блинова О.И. О термине «старожильческий говор Сибири» // Вопросы языкознания и сибирской диалектологии. Томск, 1971. Вып. 2. С. 3-8.
Русские говоры Среднего Приобья / О.И. Блинова, Л.Г. Гынгазова, Л.А. Захарова и др.; ред. В.В. Палагина. Ч. 1. Томск: Изд-во Том. ун-та, 1985. 205 с.
Русские говоры Среднего Приобья / О.И. Блинова, О.И. Гордеева, М.Н. Янценецкая и др.; ред. В.В. Палагина. Ч. 2. Томск: Изд-во Том. ун-та, 1989. 324 с.
Словарь русских старожильческих говоров средней части бассейна р. Оби / сост. О.И. Блинова, Ф.П. Иванова, В.В. Палагина, О.М. Соколов, М.Н. Янценецкая; ред. В.В. Палагина. Томск: Изд-во Том. ун-та, 1964. Т. 1: А-Е. 143 с.; 1965. Т. 2: Ж-О. 233 с.; 1967. Т
Среднеобский словарь: (Дополнение) / сост. Л.Г. Гынгазова, Т.А. Демешкина, Н.Г. Не- стерова и др.; ред. В.В. Палагина. Томск: Изд-во Том. ун-та, 1983. Ч. 1: А-К. 180 с.; 1986. Ч. 2: П-Я. 212 с.
Словарь просторечий русских говоров Среднего Приобья / Сост. О.И. Блинова, В.В. Палагина, С.В. Сыпченко и др.; ред. О.И. Блинова. Томск: Изд-во Том. ун-та, 1977. 183 с.
Вершининский словарь / сост. Т.Б. Банкова, О.И. Блинова, Е.В. Иванцова, В.В. Палагина и др.; Гл. ред. О.И. Блинова. Томск: Изд-во Том. ун-та, 1998. Т. 1: А-В. 308 с.; 1999. Т. 2: Г-З. 309 с.; 2000. Т. 3: И-М. 318 с.; 2001. Т. 4: Н-О. 368 с.; Т. 5: П. 512
Полный словарь диалектной языковой личности / сост. О.И. Гордеева, Л.Г. Гынгазова, Е.В. Иванцова и др.; под ред. Е.В. Иванцовой. Томск: Томск: Изд-во Том. ун-та, 2006. Т. 1: А-З. 358 с.; Т. 2: И-О. 338 с.; Т. 3: П-Р. 324 с.
Томская диалектологическая школа: историограф. очерк / под ред. О.И. Блиновой. Томск: Изд-во Том. ун-та, 2006. 392 с.
Раков Г.А. Принципы отбора языковых данных при составлении словаря народного говора на машинном носителе // II Всесоюз. конф. по созданию Машинного фонда русского зыка. М., 1987.
Раков Г.А. Автоматический словарь народного говора как фрагмент Машинного фонда русского языка // III Всесоюзн. конф. по созданию Машинного фонда русского зыка. М., 1989.
Раков Г.А. Диалектные словари и ЭВМ: Подготовка данных и некоторые результаты сравнения // Русские говоры Сибири: Семантика. Томск, 1995. С. 53-62.
http://www.ruscorpora.ru
Летучий А.Б. Корпус диалектных текстов: задачи и проблемы // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М., 2005. с. 215.
Гольдин В.Е. К проекту текстового диалектологического подфонда Машинного фонда русского языка // Докл. III Всесоюз. конф. по созданию машинного фонда русского языка. М., 1990.
Казакова О.А. Диалектная языковая личность в жанровом аспекте. Томск: Изд-во Том. политехн. ун-та, 2007. 196 с.
Волошина С.В. Речевой жанр автобиографического рассказа (на материале диалектной речи) // Вестн. Том. гос. ун-та. Филология. 2010. № 2 (10). С. 5-10.
 Tomsk dialectal corpora: the starting point | Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya – Tomsk State University Journal of Philology. 2011. № 2 (14).

Tomsk dialectal corpora: the starting point | Vestnik Tomskogo gosudarstvennogo universiteta. Filologiya – Tomsk State University Journal of Philology. 2011. № 2 (14).

Download file