О принципах создания электронного словаря лингвокультурологического типа: к постановке проблемы | Вестн. Том. гос. ун-та. 2014. № 382. DOI: 10.17223/15617793/382/1

О принципах создания электронного словаря лингвокультурологического типа: к постановке проблемы

Обосновывается актуальность создания электронных словарей различных типов; конкретизируются понятия «электронный словарь» и «электронный вариант словаря»; проводится сравнение информативных и навигационных возможностей традиционных бумажных и электронных лексикографических продуктов. Дается краткая характеристика существующих компьютерных словарей; рассматривается понятие «лингвокультурография»; намечаются перспективы создания словаря лингвокульту-рологического типа в электронном формате. Авторы выстраивают общую концепцию словаря, раскрывают содержание основных этапов работы над ним, презентуют базовый принцип организации материала в рамках создаваемого лексикографического продукта.

On the principles of creating an electronic dictionary of the linguoculturological type: raising the problem.pdf Лексикографическая практика является неотъемлемой и органичной частью науки о языке. При этом данные словаря могут быть использованы в качестве материалов исследования, и наоборот - сам словарь может выступать в качестве конечного результата, практического итога научной деятельности: «Словари обладают большими информативными возможностями и служат источником для теоретических построений и разработки других аспектов анализа. Существует и обратная связь "научная разработка - словарь", при которой словарь представляет собой поле реализации той или иной научной концепции (например, теория мотивации, лингвоперсонология)» [1. С. 31-37]. Особую актуальность и востребованность в настоящее время приобрело такое направление, как компьютерная лексикография: сейчас разработка и создание электронных словарей, корпусов и баз данных являются наиболее продуктивными ее областями. Ценность данного направления заключается не только в разработке наглядных и удобных методов представления и классификации материала, но и в том, что электронные словари и компьютерные корпусы позволяют сохранить для дальнейшей обработки уже собранный (иногда - на протяжении очень долгого времени) материал, хранившийся ранее в менее удобной и неустойчивой к внешним воздействиям форме (бумажные картотеки, рукописные источники, аудио-, а также видеоносители, уязвимые перед внешними пагубными факторами, -аудиокассеты, видеокассеты, дискеты и т.д.). Существует необходимость конкретизации терминов «компьютерная лексикография» и «электронный словарь»: как справедливо отмечает В.П. Селегей, «обычно подразумевается, что словарь на компьютере - это введенный в него бумажный словарь, снабженный удобными средствами поиска и отображения . Компьютерная лексикография как область прикладной лингвистики, производящая такие словари, оказывается лишенной собственного языкового предмета. На ее долю оставляется только эффектная демонстрация канонического содержания» [2]. Безусловно, необходимость перевода существующего массива словарей различных типов из бумажного формата в электронный назрела уже давно; данное направление сейчас достаточно успешно развивается в рамках отечественной лексикографии. Конечно, назвать это собственно научной деятельностью сложно, однако без предварительно проведенной технической работы невозможно получить готовый к исследованию материал - именно перевод информации в электронный формат является первым этапом работы с любым компьютерным корпусом. В отдельных случаях перевод данных в электронную форму сопровождается дополнительной и подчас весьма трудоемкой деятельностью. В качестве примера можно привести работу по переводу в электронный формат записей диалектной речи: это не только оцифровка самого материала (картотек, тетрадей), но и масштабная подготовительная работа, реализующаяся в виде разработки сложной системы мета-разметки и ее применения в текстах, составляющих основу компьютерного диалектного корпуса [3]. В то же время словарь, существующий в электронном формате, - это не просто электронная (отсканированная, оцифрованная) версия уже созданного бумажного словаря, это полностью самостоятельный продукт, и форма его бытования логично продолжает и дополняет содержательную составляющую. Актуальным представляется замечание о том, что «компьютерная лексикография является особым направлением в практической лексикографии со своими собственными подходами не только к отображению, но и к содержанию словаря» [2]. Безусловно, электронный словарь - не только «особый лексикографический объект, в котором могут быть реализованы и введены в обращение многие продуктивные идеи, невостребованные по разным причинам в бумажных словарях» [Там же], но также и эффективный исследовательский инструмент, использование которого может способствовать более продуктивным накапливанию и обработке информации. Кроме того, сами электронные словари в настоящее время всё чаще становятся объектом исследований. Обращение лингвистов к словарям именно этого типа, как справедливо отмечает О.С. Рублева, «объясняется тем, что в последнее время создается значительное количество электронных словарей, развивается всемирная сеть Интернет, информация хранится в электронном виде, но нет комплексного лингвистического описания электронных словарей и возможностей их использования пользователями в разных целях» [4. С. 3]. Между тем именно исследование возможностей использования электронных словарей в настоящее время представляется одним из наиболее продуктивных направлений данной сферы. В.П. Селегей противопоставляет электронные словари традиционным, опираясь на несколько основополагающих принципов: исследователь называет их «антиномиями бумажной лексикографии». Во-первых, как отмечает автор, большой объем бумажного словаря (являющийся следствием богатой лексической базы и полноты словарных статей) выступает серьезным препятствием для удобного пользования: многотомный (или же просто очень объемный) словарь становится буквально непригодным для быстрого поиска информации - не говоря уже о том, что он абсолютно не мобилен в процессе использования. Таким образом, высокое качество словаря на содержательном уровне является непосредственной причиной низкого качества удобства его использования; в качестве примера автор приводит 20-томный Оксфордский словарь. Вторая антиномия касается актуальности представленной в словаре информации: необходимо отметить, однако, что данное замечание справедливо в первую очередь для двуязычных (переводных) словарей, а также словарей терминологических: «Чрезвычайно долгий цикл создания и модификации фундаментальных бумажных словарей приводит к тому, что образ мира, который они фиксируют в системе своих значений, примеров и переводов, уже заметно отличается от действительности. Многие словари, основной корпус статей которых сформировался в языковой атмосфере середины века, представляют собой лексикографические музеи (а то и терминологические кладбища, если говорить о специализированных словарях)» [2]. Третье противоречие строится на асимметрии формы и содержания: исследователь говорит о том, что чем интереснее собственно лексикографическая концепция словаря, чем интегральнее средства описания лексических значений, тем уже его лексическая база. Еще один недостаток бумажных (традиционных) словарей - отсутствие удобной навигации: в данном вопросе наиболее объективной представляется позиция пользователя, работающего со словарем; при этом чем больше объем словаря, тем сильнее данный недостаток проявляется. Основным навигационным инструментом, используемым в словарях, является способ расположения материала: в алфавитном порядке или по тематическому принципу. Возможен и смешанный вариант данных способов подачи материала. Этим возможности бумажного словаря исчерпываются. Возможности компьютерной лексикографии позволяют успешно преодолеть перечисленные трудности и противоречия. Так, первая «антиномия» в рамках электронной лексикографии разрешается благодаря возможности поместить большой объем данных на легкий и мобильный носитель информации, а также разместить созданный словарь (корпус) в сети Интернет. Таким образом, к словарю можно будет обращаться практически в любое время и любом месте. Неблагоприятные последствия, связанные с долгим циклом создания словаря, можно нейтрализовать, если программа, в которой создается лексикографический продукт, допускает возможность внесения новой информации и корректировки уже имеющейся. Эта же опция позволяет пополнять базу словаря: таким образом, лексикографический объект перестает быть статичным, застывшим во времени и пространстве, и получает возможность обновляться, если таковая потребность возникает. В отличие от бумажной, электронная лексикография обладает весьма обширными навигационными возможностями. Помимо традиционных способов организации материала - в алфавитном порядке и по тематическому принципу - лексикограф получает возможность выстроить максимально удобные для пользователя словаря связи между объектами: лексикогра-фируемыми единицами, статьями, комментариями, списками источников и литературы, списком составителей и т. д. О. С. Рублева продолжает мысль В. П. Селегея и создает развернутую классификацию достоинств (плюсов) электронных словарей (обширный объем словника, удобство и скорость поиска информации, наличие звуковой и графической иллюстрации слова, возможность самостоятельного заказа структуры словарной статьи через заданный путь поиска, возможность разностороннего раскрытия значения слова и др.) [4]. Наибольшее количество электронных лексикографических продуктов в настоящее время создается в области переводческой деятельности. Существовать переводные словари могут как в самостоятельном формате - в виде скачиваемой и устанавливаемой отдельной программы, так и в формате интерактивном, т.е. интегрированными в какой-либо электронный ресурс: иначе говоря, пользоваться таким словарем можно в режиме on-line, посетив нужный сайт в сети Интернет. Как правило, способы представления материала в таких словарях однотипны и достаточно просты: пользователю нужно в максимально короткие сроки получить точный перевод отдельной лексемы или выражения, это, в свою очередь, диктует специфику навигации: в таком словаре всегда есть поле для ввода переводимого слова и поле, в котором появляются перевод либо варианты перевода. Практически все двуязычные словари, существующие в электронном формате, подразумевают подобный способ работы с материалом. Специально для создания словарей переводческого типа компанией ABBYY - одним из наиболее известных в России разработчиков, занимающихся созданием электронных словарей, - был придуман язык DSL (Dictionary Specification Language) [5]. Широко известных аналогов данного языка в рамках российской электронной лексикографии в настоящий момент не применяется: связано это, прежде всего, с тем, что большинство компьютерных приложений для использования в разных областях - и электронная лексикография не является исключением - до сих создается за рубежом. Использование языка DSL возможно и для создания толковых словарей: способ представления материала по принципу «слово - толкование» аналогичен первоначальной схеме «слово - перевод»; меняется только наполнение словаря. Однако давно назрела необходимость создания электронных словарей не только переводного и толкового, но и других типов: перечисленные ранее «антиномии бумажной лексикографии» актуальны для всех лексикографических областей; не являются исключением словари лингвокультурологического и этнолингвистического типов. Закономерным выглядит предположение о том, что организация материала в словарях этого типа предполагает принципиально иной подход, отличающийся от подхода к организации материала толковых и двуязычных словарей; следовательно, и создание компьютерных приложений для них будет строиться иных на принципах. Некоторыми учеными предлагается объединять словари лингвокультурологического и этнолингвистического типов одним понятием - «лингвокультурогра-фия». В толковании этого термина мы идем вслед за О.К. Ансимовой, говорящей о том, что «объектом лингвокультурографии являются языковые и неязыковые (например, мимика, жесты) единицы, содержащие культурную информацию, знание которой необходимо для успешной коммуникации в рамках определенного лингвокультурного сообщества; предметом - параметры описания данных единиц в соответствующих словарях, т.е. их лексикографическая интерпретация» [6]. Словари такого типа диктуют более сложную - по сравнению с другими типами словарей - форму организации материала: связано это, прежде всего, с тем, что в поле зрения лексикографа наряду с собственно языковыми попадают неязыковые явления (обычаи, обряды, жесты, костюмы.), требующие особого подхода к возможности их представления в рамках словарной статьи. Это актуально для традиционного - бумажного - формата словаря и является не менее актуальным для электронной лингвокультурографии. В то же время специфика материала, отображаемого в словаре лингвокультурологического типа, соединившись с навигационными и техническими возможностями компьютерной лексикографии, способна дать продуктивные результаты в виде не только удобно выстроенной навигации между материалом и иллюстрациями [7]. Использование медиа-приложений (видео-, аудиозаписей, анимированных приложений) является эффективным инструментом для иллюстрирования статей лингвокультурологического характера. Представляется справедливым утверждение о том, что в рамках отечественной культурографии пока не создано полноценных компьютерных словарей. Однако электронные словари на материале русского языка создаются сейчас достаточно активно; определенным разнообразием отличаются типы создаваемых электронных лексикографических продуктов. Достаточно подробный список существующих электронных словарей размещен в рамках ресурса «Грамота.ру» [8]: так, в разделе «Словари русского языка» представлены, в основном, словари толкового типа. Причем на равных с новыми - недавно созданными - словарями фигурируют и уже ставшие классическими словари, воплощенные в электронном варианте («Толковый словарь живого великорусского языка В.И. Даля» [9]; «Толковый словарь русского языка» под ред. Д.Н. Ушакова [10]). Отдельную группу формируют энциклопедические, терминологические словари и издания [8]; иноязычные словари и переводчики также достаточно широко представлены в рамках обозначенного электронного ресурса. Компьютерных словарей лингвокультурологическо-го и этнолингвистического типов среди перечисленных на сайте словарей и справочников не встречается. Авторы настоящей статьи видят своей целью разработку электронного словаря именно лингвокультурологи-ческого типа: в качестве примера такового было принято решение разработать и создать электронный словарь народных примет, призванный в компьютерном формате объединить корпус народных примет и лингвокультуро-логический комментарий, сопровождающий собранный материал. Воплощение этого проекта в жизнь предполагает разработку общей концепции словаря, структуры (модели) словарной статьи и принципов организации представленного в словаре материала, а также разработку компьютерного приложения, посредством которого данным словарем можно будет эффективно пользоваться как составителям словаря, так и читателям. Уникальность заявленного проекта словаря заключается, с одной стороны, в его формальном воплощении - подобные типы словарей пока не представлены в рамках лингвокультурологических (как, впрочем, и филологических в целом) работ. Создание электронного словаря подобного типа позволит выработать и апробировать ряд универсальных принципов лексикографической работы с материалом, обладающим линг-вокультурологической ценностью, прежде всего в области репрезентации такого материала в формате компьютерного словаря. С другой стороны, актуальность и научная ценность исследования заключаются в содержательной части словаря. Это связано, в свою очередь, с тем, что содержательное наполнение заявленного лексикографического продукта базируется на уникальном материале - корпусе народных примет, фиксируемых в рамках работы с разнообразными источниками, обладающих несомненной культурологической ценностью, создаваемом в течение нескольких лет и пополняемом до сих пор. Работа над представленным лексикографическим продуктом включает в себя несколько базовых этапов. Первый этап. Сбор материала, который выступит в качестве основы словаря; написание словарных статей, репрезентирующих лингвокультурологический комментарий. В настоящий момент этот этап в целом завершен [11]. Второй этап. Разработка общей концепции словаря; выбор формы существования словаря; составление программистом технического задания в соответствии с разработанной концепцией. Третий этап. Выявление функциональных и нефункциональных требований, детализация технического задания на основе выявленных требований; написание словарных статей для электронного словаря. Четвертый этап. Проектирование архитектуры компьютерного приложения с несколькими вариантами поиска и группировки материала, выбор средств разработки. Пятый этап. Реализация электронного лингвокуль-турологического словаря народных примет на основе спроектированной архитектуры приложения. Разработка программной платформы словаря, позволяющей осуществлять поиск по заданным параметрам, проводить статистическую обработку материала, сохранение результатов поиска. Завершение разработки электронного ресурса: создание интуитивно понятного интерфейса и удобной навигации. Шестой этап. Апробация созданного электронного словаря в рамках научных исследований, проводимых в сфере лингвокультурологии и смежных с ней научных областей, а также в сфере лексикографической практики (на базе кафедры русского языка и лаборатории общей и сибирской лексикографии филологического факультета Национального исследовательского Томского государственного университета). В качестве базового принципа организации материала в словаре решено использовать принцип ключевых слов, ставший уже традиционным при создании лексикографических продуктов различной направленности. Основное отличие данного принципа от способов организации материала в словарях, написанных на языке DSL, заключается в том, что он позволит выстроить максимально удобную навигацию между материалом (корпусом примет) и лингвокультурологическим комментарием, сопровождающим данный материал. Данный способ организации материала, структура словарной статьи, а также специфика технического воплощения представленного лексикографического продукта -особенности проектирования архитектуры приложения и выбранных средств разработки - будут подробным образом описаны в последующих работах авторов.

Ключевые слова

linguoculturogical commentary, national sign, linguoculturogra-phy, ethnolinguistics, linguoculturology, electronic dictionary, corpus linguistics, computational lexicography, лингвокультурологический комментарий, народная примета, лингвокультурография, этнолингвистика, лингвокультурология, словарь компьютерного типа, корпусная лингвистика, электронная лексикография

Авторы

ФИООрганизацияДополнительноE-mail
Картофелева Наталья ФедоровнаТомский государственный университетстудентка факультета информатикиnatconnor.neo@gmail.com
Агапова Нина АлександровнаТомский государственный университетассистент кафедры русского языка, инженер-исследователь лаборатории общей и сибирской лексикографииNinaAgapowa@yandex.ru
Всего: 2

Ссылки

Агапова Н.А. Лингвокультурологический потенциал ключевого слова народной приметы : дис.. канд. филол. наук. Томск, 2013. 184 с.
Грамота.ру. URL: http://www.gramota.ru/slovari/online
Даль В.И. Толковый словарь живого великорусского языка. URL: http://vidahl.agava.ru
Ушаков Д.Н. Толковый словарь русского языка. URL: http://ushdict.narod.ru
Анисимова О.К. Лингвокультурография как отдельная филиация общей лексикографии. URL: http://www.sociosphera.com/publi-cation/conference/2012/119/lingvokulturografiya_kak_otdelnaya_filiaciya_obwej_leksikografii/
Евсюкова Т.В. Лингвокультурологическая концепция словаря культуры : дис.. д-ра филол. наук. Нальчик, 2002. 304 с.: ил.
Ассоциация лексикографов Lingvo. URL: http://www.lingvoda.rU/dictionaries/create.asp#p2
Рублева О.С. Слово в электронном словаре (с позиции пользователя электронными ресурсами) : автореф. дис.. канд. филол. наук. Тверь : Тверской государственный университет, 2010. 20 с.
Селегей В.П. Электронные словари и компьютерная лексикография. URL: http://www.lingvoda.ru/transforum/articles/selegey_a1.asp
Юрина Е.А. Томский диалектный корпус: в начале пути // Вестник Томского государственного университета. Филология. 2011. № 2. С. 58-63.
Демешкина Т.А. Лексикографическое направление в Томской диалектологической школе. Итоги и перспективы // Вестник Томского госу дарственного университетта. Филология. 2011. № 3. С. 31-37.
 О принципах создания электронного словаря лингвокультурологического типа: к постановке проблемы | Вестн. Том. гос. ун-та. 2014. № 382. DOI: 10.17223/15617793/382/1

О принципах создания электронного словаря лингвокультурологического типа: к постановке проблемы | Вестн. Том. гос. ун-та. 2014. № 382. DOI: 10.17223/15617793/382/1