Лингвистический корпус «Томский региональный текст»: теоретико-методологическое обоснование проекта | Вестник Томского государственного университета. 2014. № 389. DOI: 10.17223/15617793/389/4

Лингвистический корпус «Томский региональный текст»: теоретико-методологическое обоснование проекта

Статья посвящена теоретико-методологическому обоснованию концепции текстового корпуса, отражающего специфику варианта русского языка, функционирующего на территории Томского региона. В качестве теоретико-методологической базы рассматриваются работы, посвященные проблеме региолекта - регионального варианта общенационального языка, реализованные и предлагаемые исследовательские проекты, посвященные этой проблематике. Концепция текстового корпуса должна отражать определенные параметры лингвистического портретирования региона, позволяющие отразить его геополитическую, демографическую, лингвоанропологическую специфику.

Linguistic corpus “Tomsk regional text”: theoretical and methodological background of the project.pdf И.А. Бодуэн де Куртене еще в XIX в. настаивал на значимости включения в эмпирическую базу лингвистики разнообразных фактов проявления языковой деятельности. Известный лингвист писал о необходимости изучения живых языков «во всем их разнообразии»: как в форме книжно-письменного языка, так и в виде разговорной речи всех социальных страт. Кроме того, по мнению И.А. Бодуэна де Куртене, формирование объективной модели языка невозможно и без обращения к диахроническому аспекту и поэтому необходимо вовлекать в поле исследования памятники языка - как тексты официальные (литературные и исторические тексты), так и тексты, фиксирующие формы повседневной жизни: «С этой точки зрения и в настоящее время важным материалом для языковедения служат, например, письма лиц, не знающих правил правописания и вообще неграмотных и необразованных, непосредственных» [1. С. 23, 24]. Обоснованность этой исследовательской стратегии, сформированной более века назад, подтверждается целым рядом теоретических и прикладных проблем современной лингвистики, в определенном смысле отвлекшейся от исследования процессов, протекающих в речевой деятельности. Кризис дедуктивных структуралистских моделей описания языка, связанный с решением проблем алгоритмического представления и формализации языковых структур, повлек за собой в конце XX в. смену исследовательской парадигмы и породил целый ряд новых направлений лингвистики, решающих задачу описания реального функционирования языка. При этом практически для всех этих направлений принципиальным стало обращение к языковому факту в его функционировании. Именно эта необходимость в живом эмпирическом лингвистическом материале актуализировала проблему его фиксации и хранения. Решение фундаментальной задачи описания общенационального языка как живого, с учетом различных функциональных аспектов, сложно, но осуществимо на современном этапе развития науки. И современная лингвистика активно начинает использовать разработанные к концу XX в. информатикой и кибернетикой технологий сбора, хранения и представления информации, в нашем случае - эмпирического языкового материала, релевантного для построения функциональной модели языка. Наиболее оптимальными и эффективными в этом аспекте представляются технологии создания лингвистических корпусов, аккумулирующие технологии баз данных и информационного поиска. Создание информационно-справочных систем лингвистического типа, дающих возможность применения методов автоматизированной обработки языковых данных, статистических и количественных методов, - одно из активно развивающихся направлений современной лингвистики, так как подобные ресурсы позволяют решить ряд исследовательских проблем, связанных с репрезентативностью и верифицируемо-стью лингвистических исследований, описанием языка, основанном на его реальном функционировании и статистических данных, фиксацией различных хронологических и социально-исторических, социальнокультурных состояний языка. В настоящее время успешно реализуются проекты, представляющие национальные языки в целом. Примером таких успешных реализаций выступают Британский национальный корпус (http://www.natcorp.ox.ac.uk, http://sara.natcorp. ox.ac.uk) - 100 млн словоупотреблений, Банк английского языка (http://www.collins. co.uk/books.aspx? group=153, http://www.collins.co.uk/Corpus/ CorpusSearch. aspx) - 524 млн словоупотреблений, Венгерский национальный корпус (http://corpus. nytud.hu/mnsz) -100 млн словоупотреблений, Национальный корпус словенского языка (http://www.fida. net/eng) - более 100 млн словоупотреблений, Польский национальный корпус (http://korpus.ia.uni. lodz.pl) - 93 млн словоупотреблений, Словацкий национальный корпус (http://korpus.juls.savba.sk) - 180 млн словоупотреблений, Хорватский национальный корпус (http://www.hnk.ffzg.hr) - 53 млн словоупотреблений и другие ресурсы [2]. Российские лингвисты уже в течение более чем десяти лет реализуют собственный проект - Национальный корпус русского языка (НКРЯ) [3], разработанный значительным коллективом ученых-лингвистов из разных регионов России и специалистами поисковой системы Яндекс (Yandex). На настоящий момент НКРЯ представляет собой открытый ресурс, объединяющий систему подкорпусов. В его состав входит основной корпус текстов, представляющий современный русский литературный язык в его письменной форме. В этом корпусе представлены художественно-эстетический, публицистический, научный (в том числе дидактический), религиозный, официально-деловой дискурсы, а также бытовые тексты. Одновременно организована работа с отдельными подкорпусами: газетным корпусом (корпус современных СМИ), корпусом диалектных, поэтических текстов, корпусом устной речи, корпусом мультимедийным, параллельных текстов и др. Спектр эмпирического материала, представленного в НКРЯ, широк, но не является исчерпывающим. Можно говорить о том, что до сих пор не решена проблема представления в НКРЯ и в целом, в национальных корпусах, региональных вариантов общенационального языка, отличающихся социальной и территориальной спецификой. В связи с этим перед российскими лингвистами остро встает проблема определения теоретикометодологических обоснований и поиска концептуальных решений для создания лингвистических корпусов, представляющих региональные варианты русского языка. Именно эта проблема является ключевой и для данной статьи. В работах, посвященных проблемам культурного регионализма, язык рассматривается как отдельный параметр региональной идентичности [4]. Однако следует отметить при этом, что лингвистика, исследующая язык регионов, как отдельное направление лингвистических исследований находится на этапе становления, что отражается отчасти и в неопределенности его номинации. Ряд исследовательских проектов, представленных в сети Интернет, обозначает данное направление как «региональная лингвистика» (например, названия ряда научно-исследовательских лабораторий включает эту номинацию: научно исследовательская лаборатория «Региональная лингвистика» (Волгоградский государственный педагогический университет)). Используется оно и в работе Л.М. Шипановской [5]. Иной термин - «лингвистическая регионалистика» - предлагается в работе Т.В. Шмелёвой [6], так как предыдущая номинация неоднозначна и может быть проинтерпретирована как «лингвистика региона». А.А. Ворожбитова и А.С. Зубцов вводят термин «линговрегионология», который «в отличие от термина “региональная лингвистика”, номинирует научное направление, исследующее не “язык в регионе”, а “регион в языке”, т.е. объектом исследования при таком подходе являются особенности самого конкретного региона как индивидуальной дискурсивной сущности, зафиксированные в тех или иных языковых фактах» [7. С. 20]. Еще один термин - «лингворегионоведение» предлагается в работе Т.Ф. Новиковой [8]. Таким образом, можно убедиться, что становление данного направления только начинается. Несмотря на его новизну, базовой для него предметной областью можно считать «особенности и вариации в языке, обусловленные этнической картиной региона, территориальными особенностями языка, особенностями его использования различными социальными группами, а также в зависимости от целей и условий коммуникации» [Там же. С. 39]. Исходя из того, что термин «региональная лингвистика» хронологически является более ранним и имеет большее распространение, именно он будет использоваться в данной работе как основной. Региональная лингвистика зарождается на стыке классической диалектологии и исследований языка города (W. Labow, В.И. Беликов, А.С. Герд, Е.В. Ерофеева, В.Т. Клоков, В.В. Колесов, О.Б. Сиротинина, Б.Я. Шарифуллин, А.А. Юнаковская и др.). В частности, В.Т. Клоков [9] отмечает, что изучение французских региолектов начиналось с исследования языка городов, представляющих региональные варианты, противопоставленные диалектам. В работах, посвященных языку города, отмечается, что он представляет собой вариант общенационального языка, обладающий специфическими чертами, отмечаются его сложность и многоаспектность организации, связанные как с лингвистическими, так и экстралингвисти-ческими факторами [10]. Впервые интерес к языку города возникает в 20-х гг. XX в.: профессор Б.А. Ларин [11] в своем докладе 1926 г. обозначил программу намечавшихся исследований. Однако вновь к данной проблематике русские исследователи обращаются только в 70-е гг. по следам работ, выполненных зарубежными лингвистами, в силу социальных, политических и исторических причин. На современном этапе развития данного направления социолингвистики можно говорить о существовании различных векторов исследований. В работах У. Лабова, О.Б. Сиротининой, Б.А. Ларина, А.А. Юна-ковской язык города рассматривается с точки зрения близости к нормам литературного языка и на этом основании выявляются типы речевой культуры. Б.А. Ларин говорит о существовании высокого книжного языка города и его «низовых диалектов» [12. С. 196], О.Б. Сиротинина [13] проводит дифференциацию носителей языка города с точки зрения их речевой культуры. А.А. Юнаковская [14] дает развернутое описание структуры языка города с точки зрения речевой культуры ее носителей, выделяя: 1) элитарную, или книжную, городскую культуру; 2) массовую городскую культуру, которая также неоднородна (нейтральная, общепонятная для носителей среднелитературной культуры - интерсоциальная, переходная для носителей просторечия, молодежного жаргона, полудиалекта, повышающих свой уровень образованности - массовая просторечная культура - массовая молодежная культура для носителей литературноречевой культуры и фамильярно-разговорной системы); 3) «полудиалектную» культуру; 4) городскую субкультуру; 5) замкнутую культуру воровского арго. Таким образом, можно убедиться, что уже в данных работах одной из базовых идей является идея социальной неоднородности языка города. А если принять во внимание тот факт, что каждый город представляет собой уникальную социальную и этническую систему, то, соответственно, язык любого города представляет собой уникальный вариант общенационального языка. Эта специфика отмечается в работе А.С. Герда, предложившего для «вариантов национального языка, реализующихся в речи жителей средних и малых городов, в которой ощущается влияние местных говоров и просторечия» новый термин - региолект [15. С. 20]. Еще один вектор исследований решает задачи сопоставительного анализа языка разных городов. Например, сопоставление языков Петербурга и Москвы в лексическом аспекте проводит В.И. Беликов [16], выявляя значительные различия в составе лексических единиц. Он отмечает при этом, что подобная работа должна быть системной и последовательной, в то время как в данный период времени «в частном порядке делают это и лингвисты, но вместо того, чтобы всерьез взяться за скрупулезный лексикографический анализ, они почему-то склонны всего лишь “нащупывать разницу”, считая все различия малосущественными для лингвистической науки» [Там же. С. 23]. В данной работе напрямую ставится вопрос о том, что различия в языке разных городов обусловлены регионально. Очень активно данная проблематика разрабатывается представителями Пермской социолингвистической школы [17] и рядом представителей других региональных школ [18, 19]. Очевидно, что сопоставительные исследования в области лингвистической регионалистики нуждаются в серьезной эмпирической базе, и лингвисты предлагают различные варианты решения проблемы. Свидетельством того, что проблема существования региолектов (в значении, предложенном А.С. Гердом) актуальна, являются новые проекты, позволяющие аккумулировать эмпирические факты существования региональных различий. В частности, корпорация ABBYY Lingvo реализует сетевой проект «Языки города», направленный на сбор фактов региональной вариативности лексических единиц (http://community.lingvo.ru/goroda). Целью проекта является создание переводного словаря, учитывающего региональную вариативность ABBYY Lingvo X3 Medved Edition [20]. Полиэтническая структура городского языка попадает в фокус исследовательского интереса в работах Е.В. Ерофеевой [21] и Б.Я. Шарифуллина: «Сложность и многоуровневость (многовариантность) городского языка обусловлены прежде всего вариативностью самой структуры современного провинциального города, разнородностью городского населения по социальным, возрастным, профессиональным и этническим признакам, по своему происхождению и длительности “городского стажа”, по степени владения литературным языком и т.п.» [22]. Полиэтническая структура того или иного региона обусловлена географическими и историческими условиями его развития и также представляет собой уникальное явление, определяющее специфику языковой ситуации. Языковая ситуация, в свою очередь, определяет такое явление, как локальная окрашенность языка города, которую отмечали А.И. Соболевский, А.И. Томсон, В.А. Богородицкий, А.А. Шахматов, Н.М. Каринский и другие лингвисты. Лингвистическая окрашенность языка городов, в свою очередь, является показателем лингвистической окрашенности языка, функционирующего в регионе. В ряде работ исследователей современного состояния диалектов остро рефлексируется проблема их разрушения и появления новой формы существования языка, занимающей промежуточное положение между диалектом и общенациональным языком. Трансформацию традиционной модели, в которой существует оппозиция «литературный язык - диалект», отмечают и германские диалектологи разных школ, используя термины «полудиалект» (Halbmundart) или «письменный диалект» (Schriftdialekt). Исследователи в области русской диалектологии, в частности Л.И. Баранникова, также отмечают расширение функционирования диалекта и, по сути, трансформацию его в региональный язык. Подобные процессы отмечают и другие диалектологи, например в трудах В.Г. Орловой, Р.И. Аванесова употребляется термин «объединение диалектов» [23. С. 30]. Отечественные исследования региональных вариантов функционирования языка позволяют говорить о том, что в настоящее время накоплен значительный лингвистический материал, отражающий специфику лингвокультурного состояния регионов. Первыми исследованиями в этой области стали работы, посвященные проблемам существования диалектов в европейских языках. В статье «Диалекты или региональные языки? (К проблеме языковой ситуации в современной Франции)», опубликованной в 1982 г., отмечается, что проблема разграничения диалекта и регионального языка ранее была поставлена только в германской филологии. К французскому языку в аспекте его диалектных форм романисты обращаются только в 70-е гг. XX в. Статус французских диалектов изменялся в ходе исторического развития: «Во французском языке расцвет диалектов отмечен периодом конца XII - начала XIV в. В последующие периоды наблюдается деградация диалектов, их перерождение до уровня патуа - термин, которым обозначаются разрозненные реликты диалектов, наблюдающиеся повсеместно на территории современной Франции. При этом степень их сохранности и функционирования различна. Само собой разумеется, что в последней четверти XX в. речь не может идти о “диалектах”, явлении, в целом свойственном другой исторической формации, от которой в силу различных условий непосредственных свидетельств (записей) диалектной речи не осталось вовсе или остались единичные свидетельства. Мы присутствуем сейчас при трансформации былых диалектов в местную региональную речь как одну из характеристик “региона”. Это проблема номер один языковой ситуации современной Франции» [23. С. 29]. Размышляя об изменении традиционных форм существования языка, автор обращается к системе терминов, маркирующих эту динамику, в частности к термину «региолект». Однако в данной работе он имеет несколько иное значение, предложенное германскими исследователями: «В литературе вопроса все чаще термин “региональный язык” дублируется терминами “региолект”, “региональные говоры”, “регионализм”, “региональные черты” (последние иногда называются провинциализма-ми)» [Там же. С. 30]. Констатируя терминологическую синонимию, автор рассуждает о понятийной нетождественности названных терминов: региональные черты, регионализмы - отдельные специфические черты местной разговорной речи, они могут не входить в систему региональных говоров или языка, в отличие от первых, термины «региональный говор», «региолект», «региональный язык» предполагают системность и представляют собой «самостоятельные лингвистические единства», которые могут быть реконструированы. Вместе с тем единство это незаконченное и неустойчивое. Понимание термина «реги-олект» во французском языкознании неоднозначно (см. подробнее обзор, представленный в работе), и значительное число исследователей предлагают рассматривать региональный язык, прежде всего, как вариант общенационального (и / или литературного) языка на отдельной территории. При этом данная форма может не представлять собой отдельной лингвистической системы и может варьироваться в зависимости от территории распространения, но является устойчивым вариантом национального языка более крупным, нежели отдельный говор. М.А. Бородина [23] отмечает, что региолект является звеном в цепочке языковых состояний. Приведем вслед за М.А. Бородиной параметры, на основании которых та или иная форма существования языка может быть квалифицирована как региолект. Первый - территориальный, связанный с тем, что региональный язык, как правило, распространен на большей территории, нежели диалект. Длительность существования региолекта - второй значимый критерий. В французском языке «региональные формы речи как потенциальные системы появляются в начале XIX в. в результате французской буржуазной революции, прекратившей феодальную замкнутость. В XX в. эти потенциальные системы превращаются в реальные региональные системы» [Там же. С. 32]. Третий критерий связан с характеристикой уровней языка. Для французского языка характерным является большая выраженность региональных черт на уровне текста - в синтаксических и стилистических особенностях, в том числе и фразеологических. Соотношение с литературным языком - еще один критерий: в отличие от диалекта, последовательно противопоставленного литературному языку, региолект соотносится с ним в значительно большей степени. Критерий формы реализации (устная / письменная) дополняет предыдущий и позволяет говорить о промежуточности региолекта: диалект реализуется только в устной форме, в то время как региолект имеет разновидности, реализованные в письменной форме. Кроме этого, автор указывает на такие свойства регионального языка, как: 1) меньшая изученность; 2) сложность картографирования, обусловленная недостаточной ясностью общей характеристики региолекта как теоретического объекта. В работе В.Т. Клокова [9] основной причиной достаточно позднего обращения французского языкознания к исследованию региолектов называется определенный лингвистический «снобизм», противопоставлявший парижскую «культурную» речь как образцовую другим формам существования французского языка. Вторая причина (и в этом авторская позиция совпадает с позицией М. А. Бородиной) - слабая определяемость региолекта с позиций структурной лингвистики [Там же. С. 6]. Однако уже к 1980-м гг. региолектология заменяет в европейской зоне диалектологические исследования. Французское языкознание к настоящему времени имеет значительный опыт исследования региональных вариантов: с середины 80-х последовательно разрабатываются методология и терминологический аппарат теории региональной вариативности. Был выработан ряд подходов к их изучению. Базовыми являются нормативный и дескриптивный. Нормативный подход предполагает выявление специфики региолекта путем сопоставления с нормами французского языка. Дескриптивный предполагает описание регионального варианта как единой системы вне какого-либо сопоставления. Данные подходы не исключают, а дополняют друг друга и «отражают научное понимание региональных вариантов французского языка как специфических образований в общей системе французского языка, фактически отличающейся слабой гомогенностью» [Там же. С. 17]. Кроме выявленных ранее свойств региолекта B.Т. Клоков отмечает, что на формирование региолекта оказывает влияние ситуация билингвизма и / или диглоссии. Второе важное свойство - «горизонтальное» (территориальное) варьирование региолекта в сельской местности и «вертикальное» (социальное) в городе [Там же. С. 47]. Проблематика, связанная с исследованием французских региолектов, получает дальнейшее развитие в работе А.А. Сидорова «Региолекты в общенациональном французском языке: перспективы на современном этапе развития» [24]. Анализ гастрономических регионализмов позволяет автору сделать ряд новых выводов: наиболее последовательно региональные языки реализуются в сфере бытового общения. На их функционирование оказывает влияние целый ряд социальных факторов, связанных с условиями общения, уровнем социальной активности говорящих, степенью официальности общения [Там же. C. 125]. Названное направление получает активное развитие и на материале русского языка. В последнее десятилетие появляются работы, посвященные региолек-там русского языка. Анализ показывает, что в исследовательское поле попадает как русский язык диаспор, проживающих не территориях других государств, так и собственно региональные варианты русского языка. В частности, в работе Е.А. Оглезневой [25] исследуется состояние русского языка в восточном зарубежье (в Харбине). В.И. Теркулов [26] обсуждает проблему языковой интерференции в ситуациях билингвизма (русский и украинский языки). Эта проблематика становится объектом исследования и белорусских ученых (см. работы Л.В. Рычковой). Кроме описания вариантов русского языка, функционирующих в иноязычной среде, появляются целостные проекты, направленные на исследование отдельных региональных вариантов русского языка, хотя следует отметить, что таковые пока единичны. К числу реализованных исследований можно отнести исследование О.Н. Иванищевой «Социолингвистический портрет приграничного северного региона» [27], диссертационное исследование Ю.А. Резвухиной «Колымская региональная лексика 20-х - начала 30-х годов ХХ века» [28], статью Е.А. Оглезневой «Дальневосточный региолект русского языка как региональный вариант русского национального языка» [29]. Все три проекта объединяет понимание того, что специфику функционирующего в определенном регионе России русского языка обусловливают исторические, социокультурые особенности развития данного региона. О.Н. Иванищева ставит своей целью «определить аспекты комплексного социолингвистического изучения функционирования языков и языковых вариантов в Баренцевом регионе как особом этноязыковом пространстве с целью разработки социолингвистической составляющей модели “разнообразия северов” [27. С. 3]. В работе в научный оборот вводится новое понятие - «региональная языковая личность» -как компонент социолингвистического портрета региона или среды, выполняющей функцию консолидации отдельных языковых личностей. Автор исследует полиэтничность как региональный феномен и выявляет социолингвистические параметры регионального билингвизма. Таким образом, в качестве исходного звена в изучении лингвистической специфики региона автор избирает речевую деятельность жителей региона, что представляется вполне оправданным, так как именно в речевой деятельности, тесно связанной с различными экстралингвистическими факторами, происходит трансформация общенационального языка, приводящая к формированию регионального варианта. Работа Ю.А. Резвухиной посвящена другому аспекту исследования региональной специфики: исследуя архивные материалы, автор вводит в научный оборот ранее не известные лингвистические факты, характерные для региональной деловой документации 20-х - начала 30-х гг. ХХ в. в аспекте региональной лингвистики. Несмотря на то что фокус исследовательского интереса сосредоточен на лексическом компоненте ограниченного временного периода, автору удается сделать выводы о существовании колымского региолекта. Отдельные регионализмы были зафиксированы в более ранних работах (см. обзор в работе), но их последовательное описание позволило говорить о наличии системной организации региональной лексики, отличающейся «достаточно разветвленной внутренней структурой со сложившимися синонимическими, антонимическими и деривационными связями» [28. С. 7]. Кроме того, региональные особенности проявляются и на других языковых уровнях, хотя наиболее полно они реализуются в лексике. Колымский региолект, по мнению Ю.А. Резву-хиной, возникает как «результат сложного продолжительного взаимодействия русского литературного языка, старожильческих говоров территории, языков аборигенного населения и языков Азиатско-Тихоокеанского региона» [Там же. С. 8]. В статье Е.А. Оглезневой [29] предпринимается попытка описания дальневосточного региолекта русского языка как регионального варианта общенационального языка с точки зрения его системной организации. Автор представляет специфику речи Дальнего Востока, сопоставляя ее с русским литературным языком и другими региональными вариантами. Специфичность дальневосточного региолекта обусловлена диалектным влиянием, промыслово-хозяйственной деятельностью в регионе и, соответственно, языковыми подсистемами, обслуживающими эти виды деятельности, геополитическим положением, определяющим языковые контакты и, соответственно, интерференционные процессы. Названные факторы являются определяющими для формирования иных реги-олектов и приводились в других работах. Однако Е. А. Оглезнева обращает внимание на еще один фактор, связанный с «возможностями самой языковой системы, ведущими к своеобразной, своеобычной реализации, что проявляется, например, в лексических новообразованиях» [Там же. С. 23]. Автор обнаруживает региональную специфику речи дальневосточников на различных языковых уровнях, что позволяет говорить о системности и единстве этого образования, дает возможность квалифицировать его как вариант языка. Проекты, связанные с исследованием региолектов, предлагаются и другими исследователями. В публикации Л. А. Шипановской представлен проект коллективной монографии «Лингвистический портрет Приамурья» [5], направленный на выявление языкового своеобразия региона. Региональная проблематика начинает активно внедряться в образовательные программы [8]. Более широкий спектр задач, связанных с исследованием регионального словотворчества, ставит перед собой научно-исследовательская лаборатория «Филологическая регионалистика “Курское слово» [30]. Исследованию региональной языковой картины мира посвящена конференция «Язык и культура Русского Севера: к вопросу о региональной языковой картине мира», результаты которой нашли отражение в сборнике научных трудов [31]. Таким образом, можно говорить о том, что в рамках современной социолингвистики уже оформилось и активно развивается такое направление, как региональная лингвистика, объектом которой является новая форма существования общенационального языка - региолект. Исследование этой формы существования языка требует значительного объема эмпирических фактов, которые могут быть получены только с применением новых технологических решений - на основе полнотекстовых баз данных и лингвистических корпусов. Томский регион, как и другие регионы России, обладает целым рядом специфических черт, сформировавшихся в силу исторических и культурных условий его развития. Специфика заселения региона тесно связана с историческими процессами. Во-первых, до появления на этой территории русскоязычного населения в XVI-XVII в. здесь проживали представители автохтонных этносов (коренное тюркское население: сибирские татары, чулымские тюрки), малочисленные народы Севера (селькупы, ханты, эвенки, эвены, манси, коряки, кеты, нанайцы). В настоящее время «большая часть коренного населения Томской области сосредоточена в шести районах компактного проживания: Александровском (ханты), Верхнекетском (селькупы, эвенки), Каргасокском (селькупы и ханты), Колпашевском (селькупы и ханты), Парабельском (селькупы) и Тегульдетском (чулымцы)» [32]. Во-вторых, в сибирском (Томском) регионе обосновались представители этносов, переселившиеся сюда в результате сложных миграционных процессов под влиянием экономических, политических, военных, религиозных и иных факторов, возникших в разное историческое время. В связи с интенсивным освоением Сибири Томская губерния стала одним из центров переселенческого движения в XIX в., в это время отмечается мощный приток мигрантов из разных частей России и соседних, в частности, на данной территории появляются евреи, поляки, немцы, эстонцы, латыши, украинцы и представители других этносов. В Государственном архиве Томской области хранятся документы Томского переселенческого управления, Томской казенной палаты, Томского губернского управления, Томского губернского управления земледелия и государственных имуществ и других организаций, связанных с процессом переселения [33]. В-третьих, еще одна волна переселения связана с массовой насильственной депортацией в 30-е гг. XX в., когда на территорию Томской губернии переселялись жители Прибалтики, поволжские немцы, поляки и др. Процессы естественной миграции вновь актуализируются в настоящее время в связи с экономическими и политическими процессами, происходящими на территории бывшего СССР. Можно говорить о существовании целого ряда национальных диаспор (армянская, чеченская и др.), также вносящих свой вклад в формирование этнокультурной специфики Томской области [34]. Все названные процессы обусловили синтетический характер сибирского культурного пространства, в настоящее время территорию Томской области населяют представители более 120 национальностей: русские (88%), татары (1,6%), украинцы (1,1%), немцы (0,8%), чуваши (0,38%), узбеки (0,4%), белорусы (0,3%), азербайджанцы (0,4%), армяне (0,26%), башкиры (0,15%), мордва (0,1%), удмурты (0,1%), молдаване (0,09%), а также коренные малочисленные народы Севера: селькупы, эвенки, ханты, кеты. На территории Томской области официально зарегистрированы: Ассоциация коренных малочисленных народов Севера «Колта куп», Региональная общественная организация Азербайджанский национальнокультурный центр «Азери», Центр украинской культуры «Джерело», Центр польской культуры «Дом польский», Национально-культурная автономия корейцев, Томское региональное отделение «Союза армян России», Польский национальный центр «Белый орел», Томская региональная национальнокультурная автономия российских немцев, Томская региональная национально-культурная автономия греков, Томская региональная еврейская национально-культурная автономия, Национально-культурная автономия белорусов г. Томска, Томская городская национально-культурная автономия «Кыргызстан», Томская национально-культурная автономия «Узбекистан», Центр казахской культуры «Бирлик», Местная общественная организация Бурятская национально-культурная автономия г. Томска «ГЭСЭР», Местная таджикская национально-культурная автономия города Томска, Томская национально-культурная автономия «Томская Полония», Центр удмуртской культуры Чаинского района, Томская национальнокультурная автономия татар «Туган Иль». Статус государственных учреждений имеют Российско-немецкий дом и Областной центр татарской культуры [34]. Одним из значимых компонентов культуры и сохранения национально-культурной идентичности является язык, его культурная значимость подтверждается общественным пониманием необходимости изучения национальных языков. В.Н. Стрелецкий [4] отмечает, что наряду с региональным самосознанием, специфической поселенческой структурой, специфической культурой природопользования, индикатором региональной идентичности является местная языковая (лингводиалектная) система. Авторы работы «Этнокультурное образование в Томской области» отмечают, что «проблема обучения нерусского, иноэтнич-ного контингента учащихся и их адаптации в социокультурную среду сибирского региона являлась насущной для Томской области (губернии) начиная с середины XIX века... В конце XIX века актуализировался вопрос о создании национальных школ для обучения детей коренных жителей (томские татары, селькупы, кеты и др.) и пришлого нерусского населения (евреи, поляки, немцы, эстонцы, латыши, украинцы и др.). Первоочередной задачей для сибирского региона явилась разработка программ и учебников по русскому языку, адаптированных для нерусского населения, а также букварей на родном языке для коренных народов. После войны в Томске, при Томском государственном педагогическом институте А.П. Дульзоном была основана научная школа комплексного изучения языков, культуры, истории народов Сибири. В 19701980-е гг. учеными создаются учебники для коренных народов Севера, методические пособия по изучению языка и культуры селькупов, ханты, кетов, чулымцев, усовершенствуются словари языков коренных малочисленных народов Сибири» [32]. Таким образом, можно говорить о языковой специфичности Томского региона, тесно связанной как с геополитическими, историческими процессами заселения этой территории представителями различных этносов, так и смешанным, разнодиалектным составом русскоязычного населения. Сказанное выше ставит перед нами ряд задач, связанных с решением общетеоретических и прикладных проблем описания специфики и форм регионального существования русского языка на территории Томской области. Региональный вариант русского языка в Томском регионе никогда не становился объектом отдельного лингвистического описания, поэтому предлагаемый проект направлен на его системное комплексное изучение. Ранее учеными Томского государственного университета предпринимались попытки создания информационных ресурсов локального характера. В качестве примера одного такого ресурса может быть названа база данных «Среднеобский фольклор» [35], созданная исследовательским коллективом в рамках реализации проекта Томского МИОН. Названный ресурс представляет собой полнотекстовую базу данных, содержащую информацию и материалы одной из специфических форм народной культуры Сибири -среднеобского фольклора. Данный проект вводит в научный оборот новый материал - сибирский русский фольклор, зафиксированный фрагментарно даже по сравнению с сибирским фольклором малых народов, решает проблему публикации этих уникальных записей, ранее еще не изданных и не доступных для ученых, занимающихся исследованиями в области антропологии, этнографии, культурологии, лингвистики, истории и др. Сибирского региона. Однако названный ресурс содержит ограниченное количество текстов народной культуры жителей Сибирского и Алтайского регионов, в том числе Среднего Приобья, собранных студентами и сотрудниками Томского государственного университета с 60-х гг. XX в. текстов. Архив записей хранится на филологическом факультете ТГУ в виде рукописных тетрадей. Эти тексты позволяют составить представление о специфике среднеобского фольклора, но, к сожалению, данный ресурс не отражает лингвистической специфики региона. Кроме этого, в поле зрения исследователей попадали языки этнических сообществ, проживающих на данной территории (см. работы ученых лаборатории «Языки народов Сибири» Томского государственного педагогического университета), диалектная форма общенационального языка (среднеобский диалект) (см. работы Томской диалектологической школы), отдельные дискурсы (просторечная лексика, язык СМИ и т.п.), однако комплексного описания специфики языка региона предпринято не было. За пределами исследовательского внимания остался ряд вопросов (например, существование русского языка в полиэтнической ситуации, ситуации билингвизма, при которой всегда возможны трансформации языка на различных уровнях за счет интерференции языковых структур). Полагаем, что при создании лингвистического корпуса, отражающего специфику регионального варианта русского языка, необходимо учесть все эти аспекты. Концептуальное проектирование такого ресурса требует разработки системных принципов лингвоантропологического портретирования региона. Мы полагаем, что оно должно включать следующие параметры описания: 1. Формы и способы существования русского языка в условиях полиэтничности: в местах проживания коренных народов Сибири (селькупы, ха

Ключевые слова

archival materials, multi-ethnicity, Tomsk region, regiolect, regional linguistics, corpus linguistics, linguistic corpus, архивные материалы, полиэтничность, Томский регион, региолект, региональная лингвистика, лингвистический корпус, корпусная лингвистика

Авторы

ФИООрганизацияДополнительноE-mail
Мишанкина Наталья АлександровнаТомский политехнический университет; Томский государственный университетпрофессор кафедры общего, славяно-русского языкознания и классической филологииmishankina@ido.tsu.ru / n1999@rambler.ru
Всего: 1

Ссылки

Словарь народно-разговорной речи г. Томска XVII - начала XVIII века / под ред. В.В. Палагиной, Л.А. Захаровой. Томск : Изд-во Том. ун-та, 2002.
База данных «Среднеобский фольклор». URL: http://mion.tsu.ru/sobase
Орлова О.В. Специфика реализации медиаконцепта нефть в дискурсе малой прессы Томской области (на примере газеты «Нарымский вестник») // Вестник Томского государственного педагогического университета. 2012. Вып. 1. С. 232-236.
Сайт Государственного архива Томской области. URL: http://pereselenie.gato.tomica.ru/index.html
Сайт Департамента по культуре Томской области. URL: http://depculture.tomsk.gov.ru/ru/culture
Симашко Т.В. Научно-практическая конференция «Язык и культура Русского Севера: к вопросу о региональной языковой картине мира // Вестник Северного (Арктического) федерального университета. Сер. Гуманитарные и социальные науки. 2014. Вып. № 3. С. 169171.
Этнокультурное образование в Томской области: стратегия и межведомственная программа / под ред. О.В. Горских, З.С. Камалетдиновой, Т.В. Хахалкиной. Томск : РЦРО, 2010.
Оглезнева Е.А. Дальневосточный региолект русского языка как региональный вариант русского национального языка // Слово: Фольклорно-диалектологический альманах. 2013. № 10. С. 20-37.
Сайт научно-исследовательской лаборатории «Филологическая регионалистика “Курское слово”». URL: http://kursksu.ru/labs/ information/kursk_word
Резвухина Ю.А. Колымская региональная лексика 20-х - начала 30-х годов ХХ века : дис.. канд. филол. наук. Магадан, 2014.
Теркулов В.И. Региолект или национальный вариант: к постановке проблемы // Филология и культура. Philology and culture. 2012. № 2 (28). С. 117-120.
Иванищева О.Н. Социолингвистический портрет приграничного северного региона. Мурманск, 2008.
Сидоров А.А. Региолекты в общенациональном французском языке: перспективы на современном этапе развития // Гуманитарные исследования. 2012. № 2 (42). С. 123-128.
Оглезнева Е.А. Русский язык в восточном зарубежье (на материалах русской речи в Харбине). Благовещенск : Амур. гос. ун-т, 2009.
Бородина М.А. Диалекты или региональные языки? (К проблеме языковой ситуации в современной Франции) // Вопросы языкознания. 1982. № 5. С. 29-38.
Шарифуллин Б.Я. Язык современного сибирского города // Теоретические и прикладные аспекты речевого общения. Красноярск, 1997. Вып. 5. С. 8-26. Русский филологический портал. URL: http://www.philology.ru/linguistics2/sharifullin-97.htm
Проект «Языки городов» // Портал ABBYY Lingvo. URL: http://community.lingvo.ru/goroda
Ерофеева Е.В. Языковая ситуация современного города и методы ее исследования // Вестник Пермского университета. Сер. Российская и зарубежная филология. 2009. Вып. 5. С. 16-23.
Федянина О.Н. Некодифицированная лексика языка города Кирова: на материале просторечия и жаргона : автореф. дис.. канд. филол. наук. Калуга, 2010. URL: http://tl-ic.kursksu.ru/pdf/001-12.pdf
Петрова Е.А. Язык и речь как составная часть городской культуры. URL: http://tl-ic.kursksu.ru/pdf/001-12.pdf
Доценко Т.И., Ерофеева Е.В., Ерофеева Т.И. Пермская школа социолингвистики: теоретические и методологические основания // Вест ник Пермского университета. Российская и зарубежная филология. 2010. Вып. 2 (8). С. 144, 155.
Беликов В.И. Сравнение Петербурга с Москвой и другие соображения по социальной лексикографии // Русский язык сегодня. Вып. 3 : Проблемы русской лексикографии. М., 2004. С. 23-38.
Герд А.С. Диалект - региолект - просторечие // Русский язык в его функционировании : тез. докл. междунар. конф. / Ин-т языкозн. РАН. М. : Рус. словари, 1998. С. 20, 21.
Юнаковская А.А. Социальная дифференциация языка города (проблемы и перспективы). URL: http://www.univer.omsk.su/trudy/fil_ezh/n2/unakov.html
Сиротинина О.Б. Русская разговорная речь как явление городской культуры. Екатеринбург, 1996.
Клоков В. Т. Особенности регионализации французской речи во Франции. Ч. II // Известия Саратовского университета. 2010. Т. 10. Сер. Филология. Журналистика. Вып. 2. С. 43^8.
Labow W. The social stratification of English in New York City. Washington, 1966. 203 p.
Колесов В.В. Язык города. М. : Высш. шк., 1991.
Ларин Б.А. О лингвистическом изучении города // История русского языка и общее языкознание. М. : Просвещение, 1977.
Новикова Т.Ф. Лингворегионоведение. Ч. 1 : Программа и программно-методические материалы. Белгород : Изд-во БелГУ, 2010.
Шмелева Т.В. Диалекты и язык города // Русские народные говоры: история и современное состояние : тез. докл. межвуз. конф. Новго род, 1997. С. 103-104.
Ворожбитова А.А., Зубцов А.С. Дискурсивное пространство Сочинского региона как объект лингвориторического исследования. М. : Флинта, 2014.
Шипановская Л.М. О проекте коллективной монографии «Лингвистический портрет Приамурья», посвященной проблемам региональной лингвистики. Благовещенск, 2012.
Стрелецкий В.Н. Культурный регионализм: сущность понятия, проблемы изучения и система индикаторов // Псковский регионологиче ский журнал. 2012. Вып. № 14. Электронная библиотека «Киберленинка». URL: http://cyberleninka.ru/article/n/kulturnyy-regionalizm-suschnost-ponyatiya-problemy-izucheniya-i-sistema-indikatorov
Захаров В.П. Корпусная лингвистика : учеб.-метод. пособие. СПб., 2005.
Национальный корпус русского языка. URL: http://ruscorpora.ru
Бодуэн де Куртене И.А. Некоторые общие замечания о языковедении и языке. СПб., 1871. Сайт «Научное наследие России». URL: http://books.e-heritage.ru/book/10075814
 Лингвистический корпус «Томский региональный текст»: теоретико-методологическое обоснование проекта | Вестник Томского государственного университета. 2014. № 389. DOI: 10.17223/15617793/389/4

Лингвистический корпус «Томский региональный текст»: теоретико-методологическое обоснование проекта | Вестник Томского государственного университета. 2014. № 389. DOI: 10.17223/15617793/389/4