Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения | Вопр. лексикографии. 2014. № 2 (6).

Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения

В статье сделан краткий обзор существующих лингвокультурологических и этнолингвистических словарей, представляющих собой примеры взаимодействия теоретических разработок и практических результатов. Дана общая концепция электронного лингвокультурологического словаря примет; обосновано его принципиальное отличие от существующих в данный момент интернет-ресурсов, содержащих аналогичную информацию; охарактеризованы базовые особенности и основные разновидности интернет-сайтов подобного типа. Введено понятие «конструктор словаря»; очерчен круг свойств и функциональных требований, актуальных для создаваемого электронного словаря; произведен обзор существующих программ, используемых для создания электронных словарей, и обоснована необходимость разработки собственно электронного приложения.

The electronic dictionary of a linguoculturological type project: general conception and the specifics of technical realization.pdf Теория и практика в процессе работы над словарем связаны неразрывно - действительно, «история мирового языкознания полна свидетельств связи и взаимосвязи теоретических разработок и их лексикографического воплощения» [1. С. 6]. Лингвокульту-рология не является исключением из этого правила: лингвокульту-рологические и этнолингвистические словари, с одной стороны, являются плодом теоретических изысканий, обобщений и выводов; с другой - сам словарь может стать ценной базой данных, используемой для анализа и проведения новых исследований. В качестве примера такого словаря можно привести этнолингвистический словарь «Славянские древности» под ред. Н.И. Толстого [2]. Данный лексикографический объект создавался на протяжении длительного времени (1995-2009 гг.) и стал ценным источником информации для исследователей различных направлений - этнографов, этнолингви-стов, лингвокультурологов, лингвогеографов и многих других. Еще один пример - лингвокультурологический словарь «Русское культурное пространство» [3]: этот источник представляет особую ценность для исследователей, анализирующих зооморфные образы с лингвокультурологической и этнолингвистической точек зрения, поскольку содержит подробный лингвокультурный комментарий к лексемам, номинирующим представителей животного мира. Особого внимания заслуживает иллюстративный материал словаря: составители привлекают широкий круг фольклорных и авторских произведений, демонстрируя таким образом процесс реализации культурного кода, закрепленного за лексикографируемыми зоонимами. Неоспоримой практической и теоретической ценностью обладают и терминологические словари лингвокультурологического и этнолингвистического типов - в качестве примера можно привести «Этнолингвистический словарь свадебной терминологии Северного Прикамья» [4]. Отдельными учеными предлагается объединять словари лингво-культурологического и этнолингвистического типов одним понятием - «лингвокультурография». В толковании этого термина мы идем вслед за О.К. Ансимовой, говорящей о том, что «объектом лингво-культурографии являются языковые и неязыковые (например, мимика, жесты) единицы, содержащие культурную информацию, знание которой необходимо для успешной коммуникации в рамках определенного лингвокультурного сообщества; предметом - параметры описания данных единиц в соответствующих словарях, т.е. их лексикографическая интерпретация» [5]. Логичным выглядит предположение о том, что словари подобного типа диктуют более сложную по сравнению с другими типами словарей форму организации материала: связано это, прежде всего, с тем, что в поле зрения лексикографа наряду с собственно языковыми попадают неязыковые явления (обычаи, обряды, жесты, костюмы.), требующие особого подхода к возможности их представления в словарной статье. Безусловно, более прихотливый и специфичный материал ставит перед лексикографом довольно сложную задачу: его нужно классифицировать, подать и проиллюстрировать наиболее приемлемым и наглядным способом, что само по себе достаточно сложно. Вместе с тем именно специфика материала, отображаемого в словаре лингво-культурологического типа, соединившись с навигационными и техническими возможностями современной компьютерной лексикографии, способна дать впечатляющие результаты в виде не только удобно выстроенной навигации: использование медиаприложений (видео-, аудиозаписей, анимированных приложений) служит эффективным инструментом для иллюстрирования статей лингвокульту-рологического характера. Компьютерная лексикография, ставшая особенно актуальной в последнее время, является важной составляющей прикладной лингвистики. Как справедливо отмечает Е.Ю. Чепик, «лингвистами и программистами сегодня обсуждаются такие вопросы, как структура и объем электронных словарей, принципы системной организации лексики, методы лингвистического программного обеспечения, параметры систематизации информационного материала. Один из важных аспектов в научных дискуссиях - возможности использования компьютерных технологий при создании и применении словарей. Специальные программы (базы данных, программы обработки текста) позволяют формировать словарные статьи, хранить информацию и обрабатывать ее в автоматическом режиме» [6]. Анализ существующих словарей лингвокультурологического и этнолингвистического характера позволил сделать вывод о том, что, несмотря на активное развитие корпусной лингвистики и электронной лексикографии, происходящее в последние годы, в рамках отечественной лингвокультурографии пока не создано электронных словарей. Авторами статьи была поставлена задача разработать электронный словарь именно лингвокультурологического типа: в качестве примера такового было принято решение создать электронный словарь народных примет, призванный в компьютерном формате объединить корпус народных примет и лингвокультурологический комментарий, сопровождающий собранный материал. Практическая ценность заявленного лексикографического проекта заключается в том, что создание электронного словаря лингво-культурологического типа позволит выработать и апробировать ряд универсальных принципов лексикографической работы с материалом, обладающим лингвокультурологической ценностью, прежде всего - в области репрезентации такого материала в формате компьютерного словаря. Актуальность и научная ценность исследования заключается в наполнении содержательной части словаря. Это связано с тем, что содержательное наполнение заявленного лексикографического продукта базируется на уникальном материале - корпусе народных примет, фиксируемых в процессе работы с разнообразными источниками, который обладает несомненной культурологической ценностью, он создавался в течение нескольких лет и пополняется до сих пор. Авторы видят своей целью создание словаря, обладающего практической ценностью как для исследователей, в чье поле зрения попадают народные приметы в качестве материала или объекта изучения: паремиологов, паремиографов, фольклористов, лингвокуль-турологов, этнолингвистов, лингвогеографов, - так и для рядовых носителей языка, интересующихся народными приметами и суевериями. Таким образом, любой потенциальный читатель (пользователь) словаря сможет получить доступ одновременно к большому количеству примет (в настоящий момент корпус насчитывает около 1500 единиц), объединенных рамками одного электронного лексикографического продукта. Разрабатываемый словарь подразумевает не только создание базы данных примет; согласно авторской концепции он призван объединить материал (сами приметы) и лингвокультурологический комментарий, его сопровождающий. Это является принципиально важной отличительной чертой создаваемого словаря. Воплощение этого проекта в жизнь предполагает разработку общей концепции словаря, структуры (модели) словарной статьи и принципов организации представленного в словаре материала, а также разработку компьютерного приложения, посредством которого создаваемым словарем можно будет эффективно пользоваться как составителям словаря, так и читателям. Сегодня в сети Интернет представлено большое количество ресурсов, содержащих списки народных примет в различных видах и вариациях [7]. Считаем справедливым замечание о том, что подавляющее большинство интернет-сайтов, содержащих материал народных примет, как правило, предлагает пользователю только списки примет; при этом довольно часто представленный материал репрезентирован по тематическому принципу [8], [9], [10]. Тематический принцип организации материала реализуется в том, что приметы разбиты на разделы: «быт», «погода», «семья», «свадьба», «дети», «деньги» и др. Возможно выделение других рубрик или редуцирование некоторых из перечисленных - в зависимости от того, для каких целей предполагается использовать конкретный информационный ресурс. Так, например, достаточно большое количество интернет-ресурсов содержит только свадебные приметы [11], приметы, посвященные исключительно беременности и родам [12]; «бизнес-приметы» или «денежные» приметы [13]; существовать такой специализированный тематический каталог примет может как отдельно (в виде самостоятельного Интернет-сайта), так и будучи интегрированным в другой ресурс, выступая в качестве его органичной части, объединенной с ним основной темой [14]. Отдельную категорию представляют интернет-ресурсы, в рамках которых приметы представлены не в виде списков, организованных по тематическому принципу, а соотносятся с календарными датами: пользователь, таким образом, получает возможность ознакомиться со всеми суевериями, «закрепленными» за определенным днем календаря (например, за сегодняшним днем или за любой другой конкретной датой [15]): как правило, это погодные и календарные приметы. Наконец, особого внимания заслуживает разновидность интернет-ресурсов, отличительной чертой которых является наличие определенного рода комментария, сопровождающего представленный материал. В основном это попытки интерпретации примет, поиски рационального их объяснения [16]; однако нигде представленный материал не сопровождается лингвокультурологическим комментарием. Можно указать ряд других недостатков, которыми обладают перечисленные интернет-источники народных примет. В первую очередь речь идет об отсутствии метаданных представленных примет: пользователь не может получить информацию о том, насколько старой или новой является примета, на какой географической территории она распространена - этот недостаток усугубляется тем, что большинство сайтов предоставляют разнородный материал, буквально «смешивая» (а иногда даже компилируя) приметы, бытующие у разных народов, а также приметы, которые могут быть оценены как традиционные и приметы современные, и никак это не обозначают. В создаваемом электронном словаре примет данный недостаток устраняется путем использования ссылок на источник (словари, энциклопедии, записи живой разговорной речи), из которого взята та или иная примета. Концепция создаваемого словаря подразумевает особый способ организации материала, поскольку перед лексикографами стоит довольно сложная задача, заключающаяся в органичном и закономерном соединении лексикографируемых единиц - примет - и культурологического комментария, их сопровождающего. Поскольку заявленный проект словаря подразумевает отличную от традиционной - бумажной - электронную форму существования, работа над его созданием ведется одновременно в двух направлениях. Первое направление включает в себя подготовительную работу (сбор материала); его классификацию, производимую по различным основаниям, и лингвокультурологический анализ содержащихся в словаре примет. Реализация поставленной задачи стала возможной благодаря созданному и апробированному Н.А. Агаповой и Т.Б. Банковой алгоритму выделения ключевого слова народной приметы [17]. Именно выработанный алгоритм - частично скорректированный и обновленный - решено было использовать при создании электронного словаря. Наконец, в качестве неотъемлемой задачи собственно лингвистического направления работы над словарем необходимо обозначить создание лингвокультурологического комментария, сопровождающего выделенные ключевые слова. Неотъемлемой частью работы над заявленным лексикографическим объектом является техническое воплощение словаря. В нем представляется возможным выделить два этапа реализации: первый этап подразумевает создание конструктора словаря лингвокультуро-логического типа. Под «конструктором словаря» в рамках настоящей работы понимается компьютерная программа, с помощью которой создается электронный словарь. В процессе второго этапа работы с помощью написанного ранее конструктора создается сам словарь. В настоящий момент авторы работают над созданием рабочей версии электронного словаря. Логичным выглядит предположение о том, что у словаря лин-гвокультурологического типа есть ряд спецификаций - признаков, свойств и особенностей, объединяющих все лексикографические объекты подобного рода. В частности, конструктор электронного словаря лингвокультурологического типа должен обладать следующими свойствами и возможностями: наличие информации от составителя словаря (для рабочей версии: введение, содержащее информацию о принципах выделения ключевого слова, описание алгоритма его выделения); списка источников и использование элементов этого списка для цитирования в словарных статьях (для рабочей версии: цитирование источников в лингвокультурологических комментариях ключевых слов); определение ключевого объекта словаря (в лексикографической терминологии - объект лексикографирования: для рабочей версии в качестве такового выступает народная примета); создание иерархии объектов словаря (для рабочей версии: темы примет ^ приметы); создание гиперссылок (для рабочей версии: ключевые слова народных примет выделяются как гиперссылки); создание словарных статей (для рабочей версии: лингвокультуроло-гический комментарий ключевого слова приметы); автоматически создаваемая и настраиваемая навигация по элементам словаря; настраиваемый поиск по словарю (возможность поиска по одной и нескольким лексемам; поиск исключающего типа2; поиск по шаблону3). Представленный список свойств и навигационных возможностей создаваемого словаря является неполным, его корректировка и конкретизация будут произведены в процессе работы над приложением (на этапе конкретизации требований к компьютерному приложению). Именно на начальном этапе разработки приложения скорректированные и уточненные требования будут задокументированы программистом-разработчиком. Таким образом, функционал конструктора словаря должен удовлетворять потребностям трех ролей. На первом месте, безусловно, стоит роль составителя - лингвиста, разрабатывающего общую концепцию словаря, собирающего и классифицирующего материал, ставящего цели для программиста (рис. 1). В качестве второй базовой выступает роль человека, создающего и настраивающего новый словарь при помощи конструктора - программиста: как выглядит создаваемый словарь для него, представлено на втором скриншоте (рис. 2). Наконец, словарь должен удовлетворять потребностям читателя, пользующегося словарем как источником информации (рис. 3). Рис. 1. Интерфейс составителя словаря: вид электронного словаря с точки зрения лингвиста, работающего со словарем и наполняющего его материалом: приметами, лин-гвокультурологическим комментарием, любой другой информацией, например данными об источниках Рис. 2. Интерфейс конструктора словаря: вид электронного словаря с точки зрения программиста, создающего и настраивающего новый словарь при помощи заявленной программы Рис. 3. Интерфейс читателя словаря: вид электронного словаря с точки зрения читателя, пользующегося словарем как источником информации Заявленный перечень свойств создаваемого словаря может быть реализован только при условиях оптимального выбора электронных средств создания. Авторами был произведен анализ существующих и используемых сейчас способов создания электронных словарей различных типов, который позволил сделать ряд выводов. Прежде всего, представляется справедливым утверждение о том, что среди способов создания электронных словарей не представлено готовых унифицированных решений. Иначе говоря, пока не существует универсальных программных продуктов, разработанных специально для создания электронных словарей. Практически все специализированные технические средства созданы для конкретных словарных продуктов (таких, например, как словари компании ABBYY [18] или «Оксфордский словарь английского языка» [19]) и не могут быть использованы другими лексикографами что, в свою очередь, иллюстрирует практическую ценность заявленного словарного проекта. Отдельные создатели электронных словарей используют уже существующие технические средства, изначально создававшиеся для других целей: по сути, они лишь адаптируются для решения задач электронной лексикографии. Средства подобного типа способны обеспечивать минимальный необходимый функционал электронного словаря, прежде всего расширяемость (возможность пополнять существующую базу данных) и поиск; в качестве примеров таких средств можно назвать редакторы пакетов MS Office и Open Office, шаблоны на основе wiki-технологий). Безусловно, являясь инструментами, изначально создаваемыми для других целей, эти решения априори не могут обеспечивать полный функционал, необходимый по техническому заданию анонсируемого словаря, а их доработка является достаточно трудоемкой. Именно по этой причине авторами создаваемого словаря было принято решение разработать приложение, предназначенное для конструирования электронного лексикографического объекта и оптимальным образом подходящее для того, чтобы в дальнейшем использовать его для создания словарей похожих типов. На осуществляемом этапе работы авторам предстоит произвести анализ уже созданных электронных словарей различных типов. Это позволит получить необходимую информацию об используемых в рамках работы над другими электронными словарями технических средствах и возможностях осуществить выбор собственных средств разработки (язык программирования, среда разработки, система управления базами данных) согласно заявленным требованиям. В процессе проводимого анализа авторам предстоит решить следующие вопросы: на каких платформах должно работать приложение? Предполагается ли создание on-line-версии словаря, в том числе как единственной? Разработку конструктора словаря планируется вести по модели унифицированного процесса разработки, подробно описанной А. Якобсоном, Г. Бучем и Дж. Рамбо. Такой процесс характеризуется многими составляющими (более подробно они будут охарактеризованы в дальнейших работах авторов), однако в качестве наиболее актуальной для процесса создания заявленного словаря (как и любого междисциплинарного исследовательского продукта) можно отметить следующую: «Унифицированный процесс разработки программного обеспечения может использоваться любым человеком, вовлеченным в процесс разработки.» [20. С. 19], что позволит максимально эффективно реализовать потенциал всех участников проекта, включенных в работу над технической составляющей словаря.

Ключевые слова

корпусная лингвистика, народная примета, лингвокультуро-логия, электронный словарь, конструктор, техническое задание, computational lexicography, dictionary project, Internet-resource, dictionary builder, terms of reference, test domain, Unified Software Development Process, corpus linguistics, linguoculturography, national sign, linguoculturological commentary

Авторы

ФИООрганизацияДополнительноE-mail
Агапова Нина АлександровнаТомский государственный университетассистент кафедры русского языка, инженер-исследователь лаборатории общей и сибирской лексикографииNinaAgapowa@yandex.ru
Картофелева Наталья ФедоровнаТомский государственный университетстудентка факультета информатикиnatconnor.neo@gmail.com
Всего: 2

Ссылки

Блинова О.И. Теория ^ словарь ^ теория ^ словарь.. // Вопр. лексикографии. - 2012. - № 1. - С. 6-26.
Славянские древности: этнолингвистический словарь: в 5 т. / под общ. ред. Н.И. Толстого. - М.: Междунар. отношения, 1995. - 2009.
Русское культурное пространство: Лингвокультурологический словарь: Вып. 1 / И.С. Брилева [и др.]. - М.: Гнозис, 2004. - 318 с.
Подюков И.А., Хоробрых С.В., Антипов Д.А. Этнолингвистический словарь свадебной терминологии Северного Прикамья. - Усолье; Соликамск; Березники; Пермь: Перм. кн. изд-во, 2004. - 360 с.; ил.
Ансимова О.К. Лингвокультурография как отдельная филиация общей лексикографии [Электронный ресурс]. - URL: http://sociosphera.com/publication/conference/ 2012/119/lingvokulturografiya_kak_otdelnaya_filiaciya_obwej_leksikografii/
Чепик Е.Ю. Опыт создания электронного словаря политической лексики [Электронный ресурс]. - URL: http://el.crimea.edu/arcthesis.html
Народные приметы - Google [Электронный ресурс] URL: https:// www. google.ru/search?q=%D0%9D%D0%B0%D1%80%D0%BE%D0%B4%D0%BD%D1%8 B%D0%B5+%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%82%D1%8B
Народные приметы [Электронный ресурс]. - URL: http://primetka.ru/
Народные приметы.ру: Народные приметы и суеверия, поверия [Электронный ресурс]. - URL: http://narodnye-primety.ru/primeti/
Народные приметы [Электронный ресурс]. - URL: http://www. ekstrasensy. su/narodnyie-primetyi
Свадебные приметы [Электронный ресурс]. - URL: http://tili-testo.com/vse-o-svadbe/8-svadebnie-primeti.htm
Страна детства [Электронный ресурс]. - URL: http://stranadetstva.ru/ beremennost-i-primety
Миллион долларов [Электронный ресурс]. - URL: http://mlndollarov.ru/ denezhnye-primety
БудуМамой.ру [Электронный ресурс] URL: http://www.budumamoi.ru/
Народный календарь народных примет [Электронный ресурс] URL: [Электронный ресурс]. - URL: http:// astroscope.ru/map/Php/Primeti/
Суеверия и приметы [Электронный ресурс]. - URL: http://sueveriya.ru/
Агапова Н.А. Лингвокультурологический потенциал ключевого слова народной приметы: дис.. канд. филол. наук. - Томск, 2013. - 184 с.
Ассоциация лексикографов Lingvo [Электронный ресурс]. - URL: http://www. lingvoda.ru/dictionaries/create.asp#p2
Оксфордский словарь английского языка [Электронный ресурс]. - URL: http://www. oxforddictionaries.com/
Якобсон А., Буч Г., Рамбо Дж. Унифицированный процесс разработки программного обеспечения. - СПб.: Питер, 2002. - 496 с.: ил.
 Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения | Вопр. лексикографии. 2014. № 2 (6).

Проект электронного словаря лингвокультурологического типа: общая концепция и специфика технического воплощения | Вопр. лексикографии. 2014. № 2 (6).