Перцептивный компонент семантики существительных, прилагательных, глаголов русского языка в билингвальной перспективе (психолингвистическая база данных ruwordperception) | Вестник Томского государственного университета. 2020. № 450. DOI: 10.17223/15617793/450/6

Перцептивный компонент семантики существительных, прилагательных, глаголов русского языка в билингвальной перспективе (психолингвистическая база данных ruwordperception)

Представлена структура базы данных психолингвистических стимулов, содержащая информацию о словах трех частей речи (существительных, прилагательных и глаголов), оцененных по пяти модальностям восприятия (зрение, вкус, слух, обоняние и осязание) тюркско-русскими билингвами. Созданная база данных рассматривается с точки зрения трех теорий, заложенных в ее основу: теории воплощенного познания, гипотезы лингвистической относительности и теории ментального лексикона билингва.

A Bilingual Perspective on the Perceptual Component of Word Semantics in Russian: The RuWordPerception Psycholinguistic .pdf Цель данной статьи - представить теоретические основы и структуру создаваемой коллективом авторов1 психолингвистической базы данных оценок связи слов русского языка (имен существительных, прилагательных, глаголов) с модальностями их восприятия тюркско-русских билингвов. Создаваемая база данных является частью психолингвистического исследования тюркско-русского билингвизма, осуществляемого в проекте «Языковое и этнокультурное разнообразие Южной Сибири в синхронии и диахронии: взаимодействие языков и культур»2. В статье теоретические установки и структура базы данных характеризуются в соотнесении с реализованными проектами, наиболее близкими к представляемой по цели и материалам. Базы данных (БД) являются в настоящее время одним из эффективных инструментов систематизации сведений об объекте / объектах, накопленных в разных дисциплинах. Сведения в БД формируются как система признаков и структурируются способом, позволяющим устанавливать их соотношения с использованием механизмов автоматического поиска. Технологии БД позволяют на основе концентрации объемного структурированного материала применить количественные методы анализа для проверки сформированных научных гипотез, получить выводы не о единичных языковых фактах, не об особенностях восприятия единиц языка индивидом, но об общих закономерностях, проявляющихся в исследуемом классе единиц, и для получения усредненных данных об оценках восприятия единиц изучаемого класса языковых явлений носителями языка. Так, Е. Keuleers и D.A. Balota в обзоре психо- и собственно лингвистических баз данных подчеркивают, что, основываясь на больших объемах данных, эти методы изменяют представления о самом исследовательском процессе [2. P. 1458]. Различного рода БД в настоящее время находят широкое применение во всех предметных сферах научных исследований, в том числе в лингвистике. Лингвистические БД создаются для накопления и систематизации данных о единицах всех уровней языковой системы, а также об единицах текстуального (дискурсивного) уровня, это так называемые лингвистические размеченные корпуса текстов. В настоящее время большая часть лингвистических БД организует сведения о единицах текстуального и лексического уровней. При выделении единиц одного уровня, например лексического, системы БД могут различаться, во-первых, набором признаков единиц, которые выделяются и структурируются в ресурсе. Современные лингвистические и психолингвистические БД включают информацию не только о формальных признаках языковых единиц, но о такой области слабоструктурированных данных, как семантика. Во-вторых, существуют значительные различия в методах предварительного отбора материала при собственно лингвистической и психолингвистической характеристике представляемых в БД единиц, отражающей существенные различия в подходах и целях интерпретации одних и тех же языковых единиц. При создании лингвистических БД, предполагающих выделение лингвистически релевантных параметров составляющих их единиц, авторы обращаются либо к первичным текстовым источникам, либо к вторичным: изданным академическим словарям и грамматикам, которые, в свою очередь, создаются на основе первичного текстологического анализа с использованием собственно лингвистических приемов. Таким образом, лингвистические выводы о статусе единицы, ее признаках базируются на анализе текстов с опорой на так называемую тренированную интроспекцию лингвиста-исследователя, использующего ее в соотнесении с теоретическими установками научного направления (ср., например, различия в принципах диахронического и синхронного выделения морфем в составе слова, определения морфемного шва, границ полисемии и омонимии и под.). Примером БД, интегрирующей лингвистическую информацию о словах русского языка, может служить проект А.В. Алексеевой, Н.А. Слюсарь, Д.А. Черновой «StimulStat Project. Лингвистическая база данных для слов русского языка» [3], в котором более 50 000 наиболее частот-ныхслов русскогоязыка и их форм описаны более чем по 97 различным параметрам, «касающимся, в числе прочего, (1) частотности лемм, форм, а также входящих в них слогов и букв, (2) омонимов, омографов, орфографических соседей, (3) различных грамматических характеристик» (см. также описание проекта [4], см. также: [5]). Как отмечают авторы, в качестве источника материала использовались академические словари и грамматики, ряд параметров рассчитывался авторами проекта самостоятельно. При формировании данных о психолингвистиче-ски релевантных параметрах слова исследователи прибегают к методам первичного сбора материала в психолингвистических опросных методиках, направленных на выявление оценок исследуемого явления на основе актуализации интроспекции значительного числа носителей языка. При решении данной задачи в психологии и психолингвистике стало уже традиционным использование шкалы Ликерта, предназначенной для количественного измерения явлений, т.е. перевода нечисловой информации в числовую, суть которых заключается в построении смыслового пространства (например, заданного координатами от 1 до 7) и размещении объекта на заданной шкале, т.е. в определенной точке семантического пространства. Так, например, респонденту предлагается оценить степень проявления признака по шкале от 1 до 7 (или 5, или 3, где 1 будет означать самую слабую степень проявления, а 7, 5 или 3 - наибольшую (см., например, в [6-8] и др.). Субъективная частотность определяется как средняя величина оценок респондентами этого параметра слова (например, слово используется редко - 1, часто - 3, постоянно - 5). Исследователи довольно часто прибегают к определению степени корреляции субъективной частотности и объективной, устанавливаемой на основе анализа использования единиц в объемных корпусах текстов (регулярно используемая характеристика - частота на миллион словоупотреблений в текстах корпуса, ipm). В фокусе представляемой БД находятся психолингвистические характеристики языковых единиц: оценка вклада пяти модальностей восприятия - зрение, вкус, обоняние, слух, тактильные ощущения в формировании семантики русских имен существительных, прилагательных и глаголов (см. далее), с которыми в структуре БД соотнесены лингвистически релевантные параметры слова - комплекс его семантических, формальных, функциональных характеристик. Следовательно, в базе данных соотносится материал, собираемый при помощи психолингвистических и собственно лингвистических методик. Как правило, создаваемые лингвистические и пси-холингвистически ориентированные БД включают и метаданные о респондентах, позволяющие интерпретировать информацию об использовании единиц одного класса разными группами респондентов. Существующие БД включают типовые данные (возраст, пол, образование респондента) и могут включать широкий спектр дополнительных признаков, выбор которых обусловливается теоретическими основаниями, выдвигаемыми авторами БД. Так, например, в проекте «Библиотека психолингвистических стимулов: новые данные для русского и татарского языка» [9] авторы, расширив создаваемую БД материалами реакций татарско-русских билингвов, ввели процедуру их предварительного анкетирования. Анкета, направленная на установление связей между полученными значениями психолингвистических переменных и определение степени билингвизма, содержала «вопросы относительно уровня владения языком, субъективного предпочтения, использования языка в разном возрасте и разных социальных ситуациях и т.д.» [9. С. 94]. Представляемая в статье БД содержит оценки вклада модальностей восприятия тюркско-русскими билингвами, вследствие чего наряду с данными о возрасте, половой принадлежности, образовании и его направленности во время анкетирования собирались данные о первом и втором языке билингва, а также соотношении их использования в настоящее время3. При создании представляемой в статье БД авторы опирались на имеющийся опыт создания БД в отечественных и зарубежных психолингвистических исследованиях. В психолингвистике имеется длительный опыт создания психолингвистических баз данных (см. [2]), среди которых одной из наиболее известных является работа A. Paivio, J. Yuille, S. Madigan, в которой представлена база данных об оценках конкретности, образности, осмысленности 925 существительных английского языка [12]. На материале русского языка примером подобных работ является словарь «Органы чувств, эмоции и прилагательные русского языка» [8], в котором собраны сведения об оценке связи русских прилагательных с различными органами чувств. Непосредственным предшественником представляемой в статье БД является подготовленная А. Миклашевским БД, включающая наряду с информацией об оценке модальностей восприятия следующие оценки: 1) образность слова, т.е. степень легкости, с которой слово вызывает у респондента образы объекта, качества, действия; 2) манипулируемость - возможность манипулировать объектом при помощи рук, 3) расположение референта в пространстве по шкале верх-низ; 4) субъективный возраст понимания (или возраст усвоения, в терминологии других авторов), т.е. возраст, в котором респонденты, по их мнению, выучили какое-либо слово; 5) субъективная частотность слова -степень того, насколько часто респонденты, по их мнению, встречаются с тем или иным словом или употребляют его. По данной системе оценок в указанной ПБД охарактеризованы 506 существительных русского языка (описание БД и применение ее данных для анализа см.: [8, 13]). По отношению к БД А. Миклашевского представляемый в данной статье ресурс, с одной стороны, характеризуется значительной редукцией системы пси-холингвистически релевантных оценок, устанавливаемых в методиках опросов с применением приема шкалирования (в ней на данном этапе представлены только оценки вклада модальностей восприятия), с другой стороны, она характеризуется существенным расширением спектра характеристик слов по лингвистическим параметрам, а также расширением спектра оцениваемых слов - в нее включены оценки по 5 модальностям восприятия 200 существительных, 200 глаголов и 200 прилагательных. Однако более существенные отличия определяются особым целеполаганием представляемой базы данных. Существенным своеобразием создаваемой базы данных является то, что она является частью более сложного проекта - исследования лингвокогнитивных основ билингвизма, включающего также корпус текстов и предполагающего проведение экспериментальных исследований при решении разнотипных задач, связанных с обработкой языка билингвами [1]. Цель данной части проекта - создание базы данных, включающей информацию о перцептивном компоненте семантики единиц трех частей речи, о влиянии грам-магических, лексико-грамматических и лексических особенностей единиц первого и второго языка билингва и о влиянии языкового опыта билингвов на оценку перцептивного компонента семантики. В основе создаваемой Психолингвистической базы данных оценок связи слов русского языка с модальностями восприятия лежит гипотеза о том, что репрезентация перцептивного опыта человека в семантике слова находится в зависимости от способов языковой формализации средствами родного (L1) и второго (L2) языков. При формулировании данной гипотезы и методов ее проверки авторы проекта опирались на имеющиеся в мировой когнитивной лингвистике, психо- и нейролингвистике теории: теорию воплощенного познания (embodied cognition), гипотезу лингвистической относительности и теорию ментального лексикона билингва. Кратко охарактеризуем основные положения данных теорий. Теория воплощенного познания, ассоциирующаяся, прежде всего, с Л. Барсолу и Ф. Пульвермюлле-ром, в настоящее время включает широкий круг частных направлений, однако во всех них можно выделить несколько объединяющих базовых положений, среди которых отметим идею о том, что познание / мышление основано на телесных механизмах и не может быть рассмотрено в отрыве от внешних условий его протекания. В теории перцептивных символьных систем Л. Барсолу формируемое в когнитивных процессах знание имеет модально специфическую природу и хранится в виде перцептивных символов, представляя собой не целостные, но схематические отражения чувственных переживаний мира и его элементов человеком. Символические отражения муль-тимодальны, т.е. возникают на базе различных модальностей восприятия, способны порождать так называемые симуляции (отдельные образы в рабочей памяти), опирающиеся на те же мозговые структуры, что и восприятие реальности. По теории Л. Барсолу, слова естественного языка, имеющие символьную природу, связаны с симуляторами, и в процессе использования языка осуществляется активация соответствующих перцептивных символов и формирование симуляций, не находящихся, как правило, под контролем сознания [14-16]. Активация языковых единиц вызывает бессознательную активацию связанных с ними зон перцептивного и моторного опыта, что в настоящее время подтверждается результатами многочисленных экспериментальных исследований (некоторые: [17-21]). Однако мы полагаем, что, во-первых, в символьной структуре слова соответствующие модальные симуляции устанавливают связи с другими смысловыми компонентами сложной, многомерно устроенной семантики слова, во-вторых, в организации смысловых соотношений значительную роль должен играть способ языковой формализации. Соответствующие перцептивные компоненты в соединении с другими компонентами символьной структуры в языковом знаке объединяются, «схватываются» особой формой, что оказывается небезразличным для их проявления. Таким образом, концепция воплощенного познания объединяется с гипотезой лингвистической относительности. Гипотеза о глобальном влиянии языковых структур на восприятие и интерпретацию явлений окружающего человека мира, сформулированная в работах Э. Сепира и Б. Уорфа почти сто лет назад, находится в поле активных дискуссий представителей разных научных направлений и в настоящее время. Одним из способов подтверждения гипотезы лингвистической относительности является проведение сопоставительных этноязыковых исследований. Такие исследования в настоящее время могут опираться на использование последовательно лингвистического текстологического анализа (например, широко известные сопоставительные работы А. Вежбицкой, российских исследователей А.Д. Шмелева, И.Б. Левонтиной, А.А. Зализняк и других, коллективные проекты, например серийное издание «Картины русского мира» [22-25]) или на методы экспериментальных исследований. В свою очередь, экспериментальные методы могут быть направлены на сбор как осознаваемых, так и неосознаваемых реакций на предъявляемые стимулы носителями языка. Результаты измерений неосознаваемых реакций носителей языка (например, время реакции в заданиях на лексическое решение или категоризацию, количество фиксаций взгляда на слове в процессе естественного чтения) рассматриваются в качестве некоторых объективных показателей значимости анализируемой характеристики единицы языка, специфики ее когнитивной обработки носителями разных языков (например, известно, что наличие грамматической категории рода в языке влияет на концептуализацию гендерных различий в культурах с наличием или отсутствием грамматикализации данной категории [26-28]). Осознаваемые реакции могут быть получены с применением опросных методик, в которых участники осуществляют оценивание единиц языка, отобранных по тем или иным лингвистически релевантным параметрам, при помощи психолингвистических шкал. Манипулирование при проведении таких экспериментальных сессий формально-языковыми параметрами единиц (например, введение в систему оценок прототипиче-ски единого концептуального содержания, репрезентированного в формально разных языковых единицах: синий, синеть, синева, синька, посинеть и т.п.) позволяет выявлять вклад специфической языковой формализации на процессы языковой концептуализации (названные ранее базы данных [5, 9]). Третья теория, положения которой легли в основу формирования представляемой БД, - теория ментального лексикона билингва. Не обращаясь в данной статье к обсуждению глобальных проблем устройства ментального лексикона, отметим, что нам близка позиция авторов, интерпретирующих ментальный лексикон как динамическую структуру, интегрированную в единый языковой порождающий механизм, взаимодействующий, в свою очередь, с другими когнитивными структурами [29-34]. Важно отметить для дальнейшего рассуждения, что при неоднозначности решений вопроса об основной единице ментального лексикона (слово vs морфема) наличие лексических репрезентаций в ментальном лексиконе не оспаривается. Основная идея теории ментального лексикона билингва - наличие в языковом сознании билингва двух взаимодействующих систем. Основной обсуждаемый вопрос при этом - каковы особенности сосуществования и взаимодействия ментальных лексиконов, репрезентирующих первый и второй язык билингва? Модели противопоставляются по выделяемым в них способам взаимодействия концептуальных структур, их семантических и формальных репрезентаций языковыми структурами первого и второго языка. Вариативность моделей проявляется в первую очередь в различной роли первого языка в формировании трех компонентов ментальных репрезентаций: концепты -семантика - языковая форма (см. представление моделей взаимодействия ментальных лексиконов в [35, 36]). Вариативность моделей во многом определяется различием вариантов билингвизма, значимыми параметрами которых в первую очередь являются возраст (ранний vs поздний) и характер (естественный vs искусственный) усвоения второго языка. В исследованиях характера взаимодействия ментальных лексиконов в языковом сознании билингва широкое применение находят, прежде всего, экспериментальные методы. Манипулируя в качестве переменных не только различными параметрами соотносимых единиц первого и второго языка, но и учитывая в модели тип языкового опыта билингва, можно определить характер взаимодействия языковых и ме-таязыковых параметров в процессах взаимодействия ментальных лексиконов при решении разнотипных задач. Базы данных, включающие информацию о вариантах языкового опыта респондентов, значительно повышают их информативные возможности. Далее охарактеризуем в соответствии с обозначенными теоретическими установками принципы отбора материала. Итак, организация информации в БД отражает три аспекта характеристики единиц: оценки слов по пяти модальностям восприятия, лингвистические признаки единиц языка, социолингвистические характеристики респондентов, оценки их языкового опыта. I. Оценки вклада модальностей восприятия в семантику слов. Для оценки перцептивного компонента семантики слов русского языка использовался метод психолингвистического анкетирования. Процесс анкетирования участников исследования проводился одним из двух способов: при помощи напечатанных анкет и при помощи сервиса онлайн-анкетирования компании Google (https://docs.google.com/forms). Бумажные варианты анкет используются для анкетирования билингвов, не имеющих опыта обращения с компьютером, а также в условиях полевых экспедиций, во время которых доступ к интернету ограничен. При заполнении комплекта анкет в бумажной форме участник также заполняет социолингвистическую анкету и анкету опыта и знания языка. Каждый комплект бумажных анкет состоит из 15 анкет (5 модальностей восприятия на каждую из 3 частей речи) и формы информированного согласия. В анкетах участнику предлагается оценить связь каждого из 200 слов с конкретной модальностью восприятия по шкале от 1 до 7, где 1 обозначает слабую связь слова с модальностью, а 7 - максимальную (например, нужно оценить, насколько слово ожог связано с осязанием / зрением / слухом / обонянием / вкусом). Пример анкеты представлен на рис. 1. В A AI D 1 ИНСТРУКЦИЯ Разные слова могут быть связаны с разными модальностями восприятия - зрением, слухом, вкусом, запахом или тактильными ощущениями (осязанием). Пожалуйста, оцените слова в списке по их связи со слухом 7 обозначает максимально сильную связь слова со слухом, 1 - самую слабую связь слова со слухом. 1 2 3 4 5 6 7 I I I I I I I Работайте по возможности быстро, не задумываясь подолгу над каждым словом. Б то же время старайтесь быть объективными и сосредоточенными. Если у Бас возникает такая необходимость. Вы можете вернуться к инструкции и прочитать ее еше раз, а после продолжить оценивать существительные. Пожалуйста, не делайте перерывов во время работы над данной анкетой, оцените все слова за 1 сеанс лежачии дождливым страстны» червивым равнодушный откровенный брезгливый неприличным монотонн МП дружелюбный Рис. 1. Пример напечатанной анкеты, используемой в исследовании В верхнем правом углу указан тип анкеты: B - для билингвов (bilingual), A - прилагательные (adjectives), AUD - слуховая модальность (auditory), 1 - вариант анкеты (во втором варианте анкеты присутствовали те же самые слова, только представленные в другом порядке). Порядок представления анкет был рандомизиро-ван: например, некоторые участники сначала заполняли анкеты по прилагательным и слуховой модальности, а другие - по существительным и модальности осязания. Чтобы минимизировать влияние оценки предшествующего слова на оценку текущего слова, порядок слов внутри анкет также был подвергнут предварительной рандомизации: было составлено два варианта анкет, в которых различался порядок представления слов. Онлайн-варианты анкет используются для анкетирования участников в лаборатории, но также могут заполняться участниками на дому. Каждая онлайн-анкета также включает 200 слов. Порядок представления онлайн-анкет также был рандомизирован, для этого варьировалась последовательность предъявления респондентам анкет, представляющих единицы разных частей речи и направленных на сбор оценок по разным модальностям. Слова в пределах списка представляются в случайном порядке при помощи встроенной в сервис функции рандомизации вопросов. На рис. 2 приведен онлайн-вариант анкеты. Вкус Разные слобэ могут быть связаны с разными модальностями восприятия - зрением, слухом, вкусом, запахом или тактильными сщущеиипми (осязанием). Пожалуйста, оцените слова в списке по их связи со вкусом: 7 обозначает максимально сильную свнэь слова со вкусом, 1 - самую слабую связь слова со вкусом. Обратите внимание, что речь идет о Ваших личных ощущениях, эмоцинх, воспоминаниях, связанных с каждым сло еом, а н е о том, как зтю п ри н ятю сч итать, к а к зтю дл я большинства людей hi Работайте по возможности быстро, не задумываясь подолгу над каждым словом. Е то же время старайтесь быть о&ъектиЕными и сосредоточенными. Если у Вас возникает такая необходимость. Вы можете вернуться к инструкции и прочитать ее еще раз, а г осле продолжить оценивать существительные. Пожалуйста, не делайте перерывоЕ во Еремя работы над данной анкетой, оцените все слова за 1 сеанс. тишина * дуэль О О О О О О О Рис. 2. Пример онлайн-анкеты, используемой в исследовании Отметим, что в онлайн-версии в инструкции имеется одно дополнительное предложение. Это связано с тем, что участники могли заполнять данную анкету не в присутствии исследователей. Кроме того, в он-лайн-версии участники выбирали значение от 1 до 7 на готовой шкале, а не вписывали значение самостоятельно. Это связано с техническими ограничениями, накладываемыми использованным сервисом. На настоящий момент в онлайн-анкетировании приняли участие 55 билингвов, а бумажные версии анкет заполнили 45 участников. Общая продолжительность заполнения комплекта анкет составила от 1 часа 30 минут до 3 часов. II. Второй тип параметризации материала, как было отмечено ранее, относится к объективным параметрам, приписывается по единицам с опорой на имеющиеся академические источники. В лингвистике наблюдается вариативность подходов и решений, создатели любой базы данных встречаются с задачей выбора наиболее теоретически нейтрального решения, то есть такого, которое на данном этапе принято большинством в научном сообществе, обладает научным авторитетом, в том числе авторитетом академического издания. В любом случае авторы должны сделать выбор из имеющихся решений. Охарактеризуем принятые теоретические решения и соответствующие им источники, на основе которых проводилась параметризация материала в формируемой БД. Лексические единицы базы данных характеризуются по ряду параметров: 1. Формально-семантические: а) морфологические: - принадлежность к лексико-грамматической категории: существительные - конкретные vs абстрактные vs вещественные vs собирательные; прилагательные -качественные vs относительные; глаголы - переходные vs переходные; возвратные vs невозвратные; совершенный vs несовершенный вид; б) деривационные: - количество морфем в слове (у существительных - от 2 до 5: вес, частота, обмен, потепление; у прилагательных - от 1 до 6: курчавый, бумажный; у глаголов - от 2 до 6: плыть, бежать, протопать, сформировать, огорчаться, сформировываться); - количество деривационных морфем (у существительных - от 0 до 4: мотив, вид, испуг, зрелость, взволнованность; у прилагательных - от 0 до 4: лукавый, ветвистый, травянистый, безрассудный, несгораемый; у глаголов - от 0 до 4: плыть, протопать, сформировать, сформировываться); - типы деривационных морфем; - наличие и тип деривационной основы единицы; 2. Лексико-семантические - принадлежность к ЛСГ. 3. Формальные - длина слова в буквах. 4. Функциональные - объективная частота слова. Принадлежность лексемы к лексикограмматическим категориям определялась на основании данных «Грамматического словаря русского языка» А.А. Зализняка [37]. При определении морфемной и деривационной структуры слова в качестве основного источника использовался «Словообразовательный словарь русского языка» А.Н Тихонова [38]. При определении числа деривационных морфем и типов деривационных морфем отмечались все морфемы словообразовательной цепочки, например, беспокоиться - 3 (деривационные морфемы: бес-, -и-, -ся); деривационные морфемы даются перечислительно: prefix, suffix, postfix, в качестве производящей основы выделяется исходное слово деривационной цепочки: беспокоиться - покой. Источником данных по объективной частотности слова послужил «Новый частотный словарь русской лексики» О.Н. Ляшевской и С.А. Шарова, основанный на материале Национального корпуса русского языка [39]. Пример организации фрагмента базы данных приведен на рис. 3. number noun N of morf N of der. morph Type of der. morph Der.base morpheme lex.gram.category lex.category Length Freq.ipm. 1 модель 2 0 го no concr hum б 153.5 2 опьянение 6 4 verb prefix, suffix, suffix, s abstr physiol 9 6.3 3 грызун 3 1 verb suffix concr animal 6 2.9 4 размер 3 2 verb prefix, Osuffix abstr pararr б 189.3 5 суждение 4 1 verb suffix abstr ment 8 20.5 6 забегаловка 5 3 verb prefix, suffix, suffix concr contain, space 11 2.Б 7 болезнь 4 2 verb suffix, suffix abstr disease 7 109.6 8 лампа 2 Ого no concr tool 5 34.0 9 лссьон 2 О го no mater stuff 6 2.6 10 пустыня 3 1 adjective suffix concr space 7 29.9 Рис. 3. Фрагмент психолингвистической базы данных (имена существительные) III. Метаданные в представляемой базе данных были собраны и организованы следующим образом. Пользователь создаваемой базы данных сможет получить о респондентах данные двух уровней - базовые данные, которые собиралась во время психолингвистического анкетирования, и расширенная информация - в рамках реализации другой части данного проекта, заключавшейся в создании лингвистически размеченного корпуса русской речи тюркско-русских билингвов («Бимодальный корпус устной речи жителей Южно-Сибирского региона»)4. Участники заполняли две анкеты, направленные на создание их социолингвистического портрета, а также выявление характеристик их языкового опыта. Как было отмечено ранее, онлайн-анкеты и их бумажные эквиваленты включали также вопросы о языковом опыте билингва. В качестве основных параметров языкового опыта билингва, каждый из которых может, по гипотезе авторов проекта, вступать во взаимодействие с характером даваемых оценок, в БД фиксируется пять основных параметров: а) возраст; б) пол; в) уровень образования: начальное vs неполное среднее vs среднее vs среднее специальное vs высшее vs другое; г) тип образования: техническое vs гуманитарное vs естественно-научное vs другое; д) родной язык: татарский vs хакасский vs шорский vs русский; е) а также тип полилингвизма: - по количеству вступающих во взаимодействие языков: билингв vs полилингв (внутритюркский vs другой); - по конкретному варианту первого и второго языка билингва5: татарско-русский vs хакасско-русский vs шорско-русский; русско-татарский vs русско-шорский vs русско-хакасский. В заключение кратко охарактеризуем источниковедческие возможности предложенной базы данных. Как было отмечено, в базе данных представлены оценки вклада модальностей восприятия, даваемые носителями русского языка, родным языком которых является один из трех тюркских языков. Татарско-русские, ха-касско-русские и шорско-русские билингвы оценивают слова трех частей речи по их связи с пятью модальностями восприятия - зрение, слух, осязание, вкус, обоняние. Обращение к этим данным в сравнении с имеющимися данными об аналогичных системах оценок носителями русского языка как родного позволяет проследить влияние родного языка билингва на перцептивную оценку единиц русского языка. Мы ожидаем увидеть сдвиг в оценках вклада разных модальностей в семантику слов различных лексико-грамматических и лексико-семантических классов. Последовательная квалификация лексем по лингвистически релевантным параметрам (принадлежность к лексико-грамматическим, лексико-семантическим классам, особенности формально-семантических (деривационных структур), частотности) позволяет проверить гипотезы о влиянии способов языкового оформления на оценку вклада разных модальностей в формирование аналогичной семантики. При этом материалы представляемой базы позволяют выявить смещающее воздействие фактора билингвизма на взаимодействие перцептивной семантики и способов языковой формализации. Наличие в базе данных многомерной квалификации речевого опыта билингвов в сфере родного (тюркского) и второго (русского) языков позволяет проследить вариативность смещающего воздействия типа билингвального опыта носителей русского языка как на оценку вклада модальностей в семантику слова, так и на оценку степени чувствительности билингвов к способам языковой формализации аналогичной семантики. Таким образом, содержащаяся в базе данных информация по психолингвистическим, лингвистическим и социолингвистическим характеристикам слов русского языка позволит исследователям установить сложный характер взаимоотношений между перцептивным и языковым опытом билингвальных носителей русского языка, использовать данные при проверке гипотез о влиянии данных факторов при решении билингвом разного типа когнитивных и лингвокогни-тивных задач. ПРИМЕЧАНИЯ 1 В реализации проекта кроме авторов статьи на разных этапах его осуществления приняли участие А.А. Миклашевский, Е.Ю. Ершова, К.С. Шиляев, О.В. Царегородцева (лингвистическая параметризация материала, разработка системы анкетирования и анкетирование респондентов), а также Е.Д. Артеменко, А.С. Буб, А.С. Душейко, И.Г. Темникова, О.В. Нагель (анкетирование респондентов и руководство анкетированием, проводимым в ходе учебных и производственных практик студентами бакалавриата и магистратуры направления «Фундаментальная и прикладная лингвистика»). 2 Цель данной части проекта и место психолингвистической базы данных представлены в статье [1]. 3 Наряду с данными, собираемыми непосредственно в процессе электронного анкетирования, информанты заполняли расширенные социолингвистическую анкету, разработанную О.А. Казаевич [10], и анкету опыта и знания языка [11]. 4 Свидетельство о государственной регистрации базы данных № 2019620803. 5 Отметим, что в создаваемых в общем проекте корпусе текстов и БД абсолютно преобладают материалы, представляющие тюркско-русский билингвизм, однако незначительное количество данных связано с обратным языковым соотношением - русско-тюркского билингвизма. Отметим, что в исследуемом нами регионе объективно преобладает именно тюркско-русский билингвизм.

Ключевые слова

база данных, психолингвистика, билингвизм, ментальный лексикон, семантика, гипотеза лингвистической относительности, теория воплощенного познания, database, bilingualism, mental lexicon, semantics, linguistic relativity, embodied cognition

Авторы

ФИООрганизацияДополнительноE-mail
Резанова Зоя ИвановнаТомский государственный университетд-р филол. наук, зам. зав. лаборатории лингвистической антропологииrezanovazi@mail.ru
Машанло Тимур ЕвгеньевичТомский государственный университетмл. науч. сотр. лаборатории лингвистической антропологииmashanlote@gmail.com
Степаненко Андрей АлександровичТомский государственный университетмл. науч. сотр. лаборатории лингвистической антропологииstepanenkone@mail.ru
Всего: 3

Ссылки

Резанова З.И., Некрасова Е.Д., Миклашевский А.А. Исследование психолингвистических и когнитивных аспектов языкового контактиро вания в проекте «языковое и этнокультурное разнообразие Южной Сибири в синхронии и диахронии: взаимодействие языков и культур» // Русин. 2018. № 2 (52). С. 107-117.
Keuleers E., Balota D.A. Megastudies, crowdsourcing, and large datasets in psycholinguistics: An overview of recent developments // The Quarter ly Journal of Experimental Psychology. 2015. Vol. 68, № 8. P. 1457-1468. DOI:10.1080/17470218.2015.1051065
StimulStat Project | Лингвистическая база данных для слов русского языка. URL: http://stimul.cognitivestudies.ru/ru_stimul (дата обращения: 06.10.2019)
Алексеева С.В., Слюсарь Н.А., Чернова Д.А. StimulStat: база данных, охватывающая различные характеристики слов русского языка, важные для лингвистических и психологических исследований // Материалы международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2015». 2015.
Alexeeva S., Slioussar N., Chernova D. StimulStat: A lexical database for Russian // Behav Res. 2018. № 50. P. 2305-2315. DOI:10.3758/s13428- 017-0994-3
Библиотека стимулов: Глаголы и существительные. URL: http://stimdb.ru/database (дата обращения: 06.10.2019).
Колбенева М.Г., Александров Ю.И. Органы чувств, эмоции и прилагательные русского языка: Лингво-психологический словарь. М. : Языки славянских культур, 2010. 369 с.
Резанова З.И., Миклашевский А.А. Моделирование образно-перцептивного компонента языковой семантики при помощи психолингви стической базы данных // Вестник Томского государственного университета. Филология. 2016. № 5 (43). С. 71-92. DOI: 10.17223/19986645/43/6
Акинина Ю.С., Грабовская М.А., Вечкаева А., Игнатьев Г.А., Исаев Д.Ю., Ханова А.Ф. Библиотека психолингвистических стимулов: новые данные для русского и татарского языка // Седьмая международная конференция по когнитивной науке : тезисы докладов. Светлогорск, 20-24 июня 2016 г. М. : Ин-т психологии РАН, 2016. С. 93-95.
Казакевич О.А. Документация исчезающих языков Сибири (на материале двух поселков Красноярского края) // Вестник Российского гуманитарного научного фонда. 2006. № 3 (44). С. 221-231.
Marian V., Blumenfeld H.K., Kaushanskaya M. The Language Experience and Proficiency Questionnaire (LEAP-Q): Assessing language profiles in bilinguals and multilinguals // Journal of Speech, Language, and Hearing Research. 2007. Vol. 50, № 4. P. 940-967.
Paivio A., Yuille J.C., Madigan S.A. Concreteness, imagery, and meaningfulness values for 925 nouns // Journal of experimental psychology. 1968. Vol. 76, № 1. P. 1-25.
Miklashevsky A. Perceptual Experience Norms for 506 Russian Nouns: Modality Rating, Spatial Localization, Manipulability, Imageability and Other Variables // Journal of psycholinguistic research. 2018. Vol. 47, № 3. P. 641-661. DOI: 10.1007/s10936-017-9548-1
Barsalou L.W. Perceptual symbol systems // Behavioral and brain sciences. 1999. Vol. 22, № 4. P. 577-660.
Barsalou L.W. Grounded cognition // Annu. Rev. Psychol. 2008. Vol. 59. P. 617-645. DOI: 10.1146/annurev.psych.59.103006.093639
Barsalou L.W., Simmons W.K., Barbey A.K., Wilson C.D. Grounding conceptual knowledge in modality-specific systems // Trends in cognitive sciences. 2003. Vol. 7, № 2. P. 84-91. DOI:10.1016/S13646613(02)000293
Hauk O., Johnsrude I., PulvermUller F. Somatotopic representation of action words in human motor and premotor cortex // Neuro n. 2004. Vol. 41, № 2. P. 301-307.
Hommel B., Pratt J., Colzato L., Godijn R. Symbolic control in visual attention // Psychol Sci. 2001. № 12 (5). P. 360-5.
Janyan A., Vankov I., Tsaregorodtseva O., Miklashevsky A. Remember down, look down, read up: Does a word modulate eye trajectory away from remembered location? // Cognitive processing. 2015. Vol. 16, № 1. P. 259-263. DOI: 10.1007/s10339-015-0718-5
Connell L., Lynott D. Look but don't touch: Tactile disadvantage in processing modality-specific words // Cognition. 2010. Vol. 115, № 1. P. 19. DOI: 10.1016/j.cognition.2009.10.005
Ernst M.O., Banks M.S. Humans integrate visual and haptic information in a statistically optimal fashion // Nature. 2002. Vol. 415, № 6870. P. 429-433. DOI: 10.1038/415429a
Вежбицкая А. Язык. Культура. Познание / пер. с англ.; отв. ред. М.А. Кронгауз; вступ. ст. Е.В. Падучевой. М. : Русские словари, 1996. 412 с.
Зализняк А.А., Левонтина И.Б., Шмелев А.Д. Константы и переменные русской языковой картины мира. М. : Языки славянских культур, 2012. 696 с.
Рыбальченко Т.Л., Резанова З.И., Тубалова И.В. Картины русского мира: образы языка в дискурсах и текстах. Томск, 2009. 356 с.
Порядина Р.Н., Гынгазова Л.Г., Эмер Ю.А. Картины русского мира: пространственные модели в языке и тексте. Томск, 2007. 384 с.
Boroditsky L., Schmidt L.A., Phillips W. Sex, syntax, and semantics // Language in mind: Advances in the study of language and thought. 2003. P. 61-79.
Landor R. Grammatical categories and cognition across five languages: The Case of Grammatical Gender and its Potential Effects on the Conceptualisation of Objects: Thesis (PhD Doctorate). Griffith University, Brisbane, 2014. 310 p.
Резанова З.И., Ершова Е.Ю. Влияние грамматического рода на концептуализацию объектов (экспериментальное исследование) // Вестник Томского государственного университета. Филология. 2017. № 50. С. 104-124. DOI: 10.17223/19986645/50/7
Aitchison J. Words in the mind: an introduction to the mental lexicon. Oxford : Basil Blackwell, 1987. 299 p.
Арутюнян В.Г. Мозг и язык: междисциплинарный подход к ментальному лексикону. Калининград, 2014. 204 с.
Martin A., Chao L.L. Semantic memory and the brain: Structure and process // Current Opinion on Neurobiology. 2001. Vol. 11. P. 194-201.
Paivio A. Dual coding theory and the mental lexicon // The Mental lexicon. 2010. Vol. 5, is. 2. P. 205-230.
Залевская А.А. Проблемы организации внутреннего лексикона человека. Калинин, 1977. 83 с.
Залевская А.А. Слово в лексиконе человека: Психолингвистическое исследование. Воронеж : Изд-во Воронежского университета, 1990. 208 с.
Pavlenko A. The Bilingual Mental Lexicon: Interdisciplinary Approaches. Bristol : Multilingual Matters, 2009. 272 p.
Саркисова Э.В. Модели ментального лексикона билингва // Вестник Тверского государственного университета. Сер. Филология. 2012. № 10, вып. 2. С. 200-207.
Зализняк А.А. Грамматический словарь русского языка. Словоизменение. М. : Русские словари, 2007. 800 с.
Тихонов А.Н. Словообразовательный словарь русского языка : в 2 т. М. : Рус. яз., 1990.
Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка на материалах Национального корпуса русского языка. М. : Азбуковник, 2009. 1090 с.
 Перцептивный компонент семантики существительных, прилагательных, глаголов русского языка в билингвальной перспективе (психолингвистическая база данных ruwordperception) | Вестник Томского государственного университета. 2020. № 450. DOI: 10.17223/15617793/450/6

Перцептивный компонент семантики существительных, прилагательных, глаголов русского языка в билингвальной перспективе (психолингвистическая база данных ruwordperception) | Вестник Томского государственного университета. 2020. № 450. DOI: 10.17223/15617793/450/6