Электронный идеографический словарь: теоретический и прикладной аспекты (на материале «Русского тематического словаря») | Вопр. лексикографии. 2017. № 12. DOI: 10.17223/22274200/12/3

Электронный идеографический словарь: теоретический и прикладной аспекты (на материале «Русского тематического словаря»)

В статье рассматриваются концепции «Русского тематического словаря» и способы её реализации средствами компьютерной лексикографии. Авторы обращаются к обсуждению преимуществ электронной версии словаря. К ним относятся визуальная материализация линейных и иерархических связей между единицами лексикона, снятие трудностей словарной интерпретации со стороны гипотетических пользователей, расширенные возможности поиска и мультимедийная поддержка словарного текста.

An electronic ideographic dictionary: theoretical and practical aspects (on the material of The Russian Thematic Diction.pdf Любой словарь может быть рассмотрен с двух позиций внутренней, связанной с его лингвистической и лексикографической концепцией, и внешней, связанной с форматом его воплощения. Абстрагируясь от конкретики обсуждаемого предмета, указанное противопоставление можно свести к оппозиции формы и содержания. Вопрос формы (формата) лексикографического произведения долгое время оставался на периферии исследовательского внимания. Его обсуждение осуществлялось разве что в рамках учебной лексикографии, для которой внешнее исполнение словаря в большей степени связано с его дидактическим эффектом11. Появление компьютерной лексикографии резко актуализировало параметр формы, который запечатлелся в противопоставлении бумажных и электронных словарей. Если следовать широко известному философскому постулату о том, что «содержание определяет форму, а форма зависит от содержания», электронный формат следует рассматривать не сам по себе, а в тесной взаимосвязи с реализуемой в данном конкретном случае концепцией. Иными словами, при обращении к компьютерной реализации словаря лексикографу следует задуматься над тем, каким образом внутренние характеристики лексикографического произведения могут быть гармонизированы с возможностями электронного формата. При этом необходимо помнить, что электронный формат - по крайней мере пока - не создаёт нового лексикографического качества сам по себе, однако способен его многократно усиливать. Настоящая статья посвящена рассмотрению способов материализации основных принципов «Русского тематического словаря» (далее также РТС) средствами компьютерной лексикографии. Оговоримся, что компьютерное воплощение РТС находится в данный момент на этапе идейного оформления, но не реализации. Прежде всего - несколько слов о ключевой идее рассматриваемого словаря. Около полувека назад основоположник теории и практики отечественной идеографии, В. В. Морковкин, высказал весьма плодотворную идею о необходимости создания такого идеографического словаря, который представлял бы собой «макет лексической системы» [3. С. 43-58]. Опираясь на положение о том, что «речевая актуализация включает в себя две операции: 1) выбор нужного слова из лексической парадигмы; 2) употребление выбранного слова по законам данного языка» [3. С. 47], он приходит к выводу, что достижение обозначенной цели возможно за счёт демонстрации в словаре лексической парадигматики и лексической синтагматики. Как видно из данного суждения, принцип языковой системности интересовал учёного не сам по себе, а как проявление коммуникативной целесообразности. Добавим также, что системность, безусловно, соответствует и когнитивным основам организации языковой способности. Хотя лингвистике по сей день доподлинно неизвестны принципы хранения языка в сознании его носителей, исследования психолингвистического толка и прежде всего ассоциативные эксперименты свидетельствуют в пользу того, что ментальная языковая организация в целом соразмерна языковой системности (выделение парадигматических, синтагматических, словообразовательных и других ассоциаций). Основная задача «Русского тематического словаря» состоит в практической реализации идеи о словаре-макете лексической системы, а также в раскрытии её коммуникативного потенциала. В процессе работы над словарём идея начала наполняться кровью и плотью, что позволило определить ключевые принципы РТС [4] и по-новому взглянуть на ряд вопросов идеографической лексикографии. Коснёмся здесь лишь тех, которые имеют непосредственное отношение к макетированию лексической системы. 1. Уточнение вопроса о минимальной единице идеографического описания Общеизвестно, что лексикология и лексическая семантика обладают двумя единицами изучения - базовой, в качестве которой выступает слово, и элементарной, которой является лексико-семантический вариант [5. С. 111]. Единицей идеографического описания по понятным причинам является речевое, или «потебниан-ское», слово, т.е. ЛСВ (в противовес многозначному слову). Однако наложение тематического принципа на ЛСВ в некоторых случаях приводит к его расщеплению на две тематические специализации, не разрушающие его смыслового тождества, ср.: пастушья сумка (группа «Лекарственные растения»): семена (лечебные свойства) ~и; содержание чего-л. в ~е; собирать (сушить) ~у; • «Кашка, сумка пастушья | от любых болевых | ощущений зрачок | в одночасье готовы избавить» (И.А. Бродский. Колокольчик звенит..) и пастушья сумка (группа «Сорные растения»): вырвать [с корнем] ~у12 (группы связаны взаимными отсылками). Это позволяет говорить о политематичности некоторых единиц, а также о принципиальной пересекаемости тематических полей. Последняя, разумеется, давно известна лингвистике, ср.: «... семантические поля суть классы пересекающиеся; единственного разбиения словаря на семантические поля, если не принимать искусственных принципов классификации и не подменять семантические компоненты бинарными или иными дифференциальными признаками, не существует» [6. С. 251], однако её природу нельзя считать изученной. Неясно, в частности, для каких областей такая пересекаемость является естественным явлением: периферийных (что относит её к категории явлений «системного шва») или ядерных. Вполне возможно, ясность относительно этого вопроса внесет работа над словарём. В противоположность «расщеплению» одного ЛСВ на несколько тематических специализаций в словаре фиксируется и обратное явление - частичное наложение семантики разных, хотя близких и эпидигматически связанных, речевых слов. Основанием для подобного наложения является диффузность значений полисеманта, проблему которой в своё время обозначил Д.Н. Шмелёв [7] и детально рассмотрела Анна А. Зализняк [8]. В общем и целом диффузность проявляется в непротиворечивой (не каламбурной) совместимости значений многозначного слова в рамках одного контекста, ср.: «Помнишь, так говорил ты, бывало, | И спокойные щуря глаза, | Улыбался, когда бушевала | Над тобою и мною гроза...» (М. Вега. Смех богов) - сочетание спокойные глаза представляет значение 'взгляд', в то время как щурить глаза - значение 'орган зрения'. Возможность неоднозначных употреблений говорит о том, что коммуникативный потенциал слова в живой речи реализуется весьма прихотливо: часто один ЛСВ «перетягивает» на свою орбиту узнаваемые семантические фрагменты других ЛСВ. Традиционная лексикография, как известно, отражает семантическую структуру полисеманта дискретно, уклоняясь от переходных случаев. Между тем диффузность может считаться ключевым принципом речевого бытования некоторых значений слова - прежде всего тех, которые связаны тривиальным метонимическим сдвигом. На основании этого можно сделать вывод, что стремление лексикографов «освободить словарные статьи от "неопределённых" примеров существенно искажает представление о семантической структуре описываемых слов» [7. С. 86]. В РТС диффузные ЛСВ подаются в одной словарной статье с использованием сочетаемостных иллюстраций обоих значений. Так, анализ контекстов употребления слова жизнь даёт основание «слить» в одной статье два его значения: 'время существования кого-л. от рождения до смерти' и 'чьё-л. существование как процесс, наполненный событиями, имеющий ка-кие-л. особенности и т.п.': (б) жизнь (тематическая область «Фазы человеческой жизни») ... долгая (короткая, бурная, холостая) ~; половина (остаток, полнота, разнообразие) ~и; начать где-л. (продлить кому-л., любить нсв.) ~. Отметим, однако, что возможность «слияния» значений слова в идеографическом словаре непосредственно зависит от степени близости стоящих за ними тематических категорий - чем они ближе, тем вероятность «слияния» больше, и наоборот. Таким образом, основной единицей идеографического описания, вне всякого сомнения, следует считать речевое слово, однако тема-тико-коммуникативный принцип представления материала время от времени вносит свои коррективы, либо «расщепляя» ЛСВ без ущерба его значению, либо «объединяя» в одной словарной статье эпи-дигматически и тематически близкие единицы. Тематико-коммуникативный подход к моделированию лексической системы имеет ещё одно следствие, касающееся минимальной единицы описания в словаре. Оно заключается в предъявлении тематически маркированных фразеологизмов на правах заголовочных единиц, обладающих собственной парадигматикой и синтагматикой. Например: в расцв'ете (во цв'ете) лет (сил), фр. * Син. ^в [с'амом] сок'у. . мужчина (женщина) ~; быть нсв. (жениться св. и нсв., стать кем-л., погибнуть) ~; • «[Умный, красивый, в меру упитанный] мужчина в полном расцвете сил» (крылат. выраж.; из мультфильма «Малыш и Карлсон», реж. Б.П. Степанцев); «Он даже снял воротничок | И расстегнул слегка жилет | И весь дрожал как старичок | Хотя он был в расцвете лет» (Д.И. Хармс. В ночной пустынной тишине.). С одной стороны, фразеологизмы образуют отдельную подсистему, функционирующую по собственным законам и правилам; не случайно в традиционной лексикографии они отражаются либо в словарях особого жанра (фразеологических), либо в специальной зоне словарной статьи. С другой стороны, в коммуникативном аспекте фразеологические единицы ничем не отличаются от собственно слов, что доказывает, например, их совершенно естественное вхождение в синонимические ряды на равных правах со словами (ср.: немолодой, в возрасте, не первой молодости). Иначе говоря, на коммуникативном уровне различия между некоторыми лексическими единицами разной природы и разной структуры если не стираются вовсе, то уходят на второй план. 2. Способы представления векторов лексической системы Языковая системность в современной науке, как известно, моделируется тремя векторами - парадигматическим, синтагматическим и деривационным (в терминологии Д.Н. Шмелёва - эпидигматиче-ским). Хотя способы материализации первых двух векторов, как кажется, не нуждаются в отдельном обсуждении, коротко обозначим их. Языковая парадигматика запечатлена в словаре, во-первых, посредством сгущения лексических единиц в тематические единства; во-вторых, за счёт специальной зоны словарной статьи, в которой собраны синонимы, антонимы, аналоги13 и паронимы заголовочной единицы. Языковая синтагматика представлена в сочетаемостной зоне словарной статьи с помощью перечня грамматических моделей, заполненных типичными лексическими распространителями, а также в так называемой лингвокультурологической зоне с помощью примеров из поэтических произведений. Что касается деривационного вектора, то его коммуникативный потенциал менее очевиден, а потому вопрос его отражения в идеографическом словаре заслуживает отдельного обсуждения. Нас будут интересовать два момента: а) коммуникативная природа словообразовательного гнезда; б) многозначность как инструмент придания слову семантической глубины. С одной стороны, словообразовательное гнездо является результатом системных по своей природе процессов, реализацией существующих в языке деривационных моделей. С другой стороны, множество производных единиц может считаться откликом на разнообразные коммуникативные потребности носителей языка (потребность передать оттенки качества, состояния, отношения, размер, стилистический регистр и т.д.). Поскольку производные единицы модифика-ционного типа - в силу их очень большой смысловой близости к производящей единице - являются её постоянными «спутниками» не только в составе словообразовательного гнезда, но и коммуникативно, т. е. всегда готовы передать нужный нюанс ее значения в соответствии с ситуацией речи, то и в словаре авторы сочли логичным расположить их рядом, сопроводив соответствующими пометами (ласк, уменьш.-ласк., уменьш, увел, ослабл., пренебр, уничиж., детск., женск. и т.п.), например: старый, старенький, староватый; дряхлость, дряхлый; охота, охотиться; старик, стариковский, по-стариковски, стариковски, старичок, старикан, старикашка, старичонка; воробей, воробьиха, воробьёнок и т.д. Отметим, что в отличие от многих тематических словарей РТС не придерживается час-теречного принципа формирования тематических групп, поскольку живая коммуникация строится на основе использования единиц разных частей речи. Приблизительно так же решается вопрос с единицами, образованными в результате мутационных процессов: члены словообразовательного гнезда по возможности располагаются контактно, что, с одной стороны, демонстрирует их родство, а с другой - предоставляет адресату весь спектр единиц, которые могут понадобиться в процессе порождения речи. В этом случае значение единицы выводится не соотнесением значения производящего слова и пометы -указателя словообразовательного значения, а обычным образом, т. е. опорой на сочетаемость, синонимы и другие средства: тело ... * Син. ^телеса... человеческое (мужское, женское, здоровое, загорелое) строение (мышцы, температура) ~а ...; телеса. разг., шутл., ирон.* Син. ^тело. ... пышные (обширные, могучие) Многозначность является, пожалуй, единственным системным феноменом, отражение которого противоречит концепции идеографического словаря. Это связано не только с тем, что значения полисемантичного слова, как правило, разнесены по разным тематически блокам, но и с тем, что сложно представить ситуацию, в которой пользователю словаря понадобится несколько ЛСВ для решения конкретной речевой задачи. Тем не менее компьютерное воплощение РТС предоставляет возможности для «связанного» предъявления значений одного слова. В этом случае в конкретной словарной статье размещаются ссылки на словарные статьи, расположенные в других тематических группах, с указанием названия и индекса этих групп. Так пользователь знакомится не только с правилами употребления данного речевого слова, но и с его семантическим, в том числе ассоциативно-экспрессивным, фоном (см. ниже примеры для слов зелёный и золотой), что сообщает плоскостному идеографическому описанию смысловую глубину. 3. Вопрос о толковании как элементе идеографического словаря Значение лексической единицы (абсолютная ценность), безусловно, относится к системообразующим факторам, поскольку обусловливает и значимость слова (относительную ценность), и его со-четаемостные возможности (сочетательную ценность). Учитывая это обстоятельство, можно предположить, что словарь, призванный стать моделью лексической системы, в необходимом порядке включает в себя толкования лексических единиц. Однако этот вывод вряд ли можно считать правомерным по нескольким причинам. Во-первых, в отношении языка, явленного нам в аспекте функционирования (языковой данности), толкование, безусловно, выступает в качестве лингвистического конструкта. Представление модели, максимально свободной от «вмешательства» извне, предполагает как бы простую фиксацию тех явлений и связей, которые есть в языке. Во-вторых, толковательную функцию отчасти выполняет идеографический синопсис словаря вкупе с наполнением различных словарных зон, прежде всего зоны сочетаемости и синонимо-антонимической зоны. Вот как, например, раскрывается значение 'внутреннее пространство между верхними и нижними челюстями у человека, ограниченное спереди губами' слова рот: а) в синопсисе представлена интегральная часть, т. е. отношение к тематическим областям и группам (родовые признаки) - «Тело человека», «Голова», «Лицевая часть»; б) в словарной статье представлены дифференциальные признаки (видовые отличия), здесь - главным образом посредством сочетаемости: открытый (закрытый, беззубый) ~ без зубов; полость (гигиена) рта; открыть (разинуть разг., полоскать) дышать нсв. ртом; влить что-л. в ~ и т.д. Иллюстративные предложения (пре- 1 имущественно извлечённые из поэтических произведений ), во-первых, дополняют коллекцию словосочетаний; во-вторых, демонстрируют функционирование заголовочного слова в законченном текстовом отрезке; в-третьих, позволяют показать некоторые важные периферийные семантические элементы; в-четвёртых, просто раскрывают художественные возможности данного слова. Ср. иллюстрации для слова рот в упомянутом выше значении: «Огни - как нити золотых бус. | Ночного листика во рту - вкус» (М.И. Цветаева. В огромном городе моём - ночь..); «О, болтливый язык! Для чего ты подвешен | В гулкой области рта?..» (С.В. Петров. Черновик человека); «И я живу, | тебя, | как воздух, | ртом ловлю, | стихом, | последнею строкой | леплю | тебе | из губ: | люблю» (С.И. Кирсанов. Твоя поэма). Обозначив в нескольких чертах концептуальные основы «Русского тематического словаря», перейдём к рассмотрению способов его компьютерного воплощения. Среди первоочередных достоинств электронного формата можно назвать визуальную материализацию многообразных линейных и иерархических связей между единицами лексикона, которые в бумажной версии всегда остаются имплицитными и плоскостными. Придание объёма осуществляется тремя основными способами - с помощью системы гиперссылок, кластерного предъявления тематических групп и совмещённого видения объектов разной принадлежности. Гиперссылки сегодня являются неотъемлемым элементом интернет-пространства и локальных документов. Их назначение, как известно, состоит в установлении связи между информационными объектами разного характера и обеспечении быстрого перехода от одного к другому. В рамках электронной версии РТС гиперссылками связаны компоненты, работающие на моделирование парадигматических связей между единицами словника (рис. 1). К таким компонентам относятся представленные в словарной статье синонимы (абсолютные и относительные), аналоги, антонимы, паронимы и таро-нимы. Например: (а) страх * Син. бо'язнь (а)употр. реже. Ср. 'ужас (а), исп'уг (а), тр'епет (а); лет'е|ть (о скорости протекания времени) * Син. пролет'ать, беж'ать, пробег'ать, мч'аться, нест'ись, пронос'иться, мельк'ать. Ант. ползт'и, тян'уться; мете'ор * Ср. бол'ид. Не путать с метеор'ит; кр'емниев|ый * Ср. кр'емнистый. Не путать с кремнёвый. Думается, что за счёт гиперссылок такого рода воссоздаётся существующая в сознании человека языковая системность. Неорганический мир. Неживая материя / Земная поверхность / Водные пространства / Источники I Родник родн'ик. родник|'а, м., нд., I в. •ЬСин. ипючг. Ср. ист'очн^к. холодный (живой) чистить пить зй. нсв. (напиться) из ~'а ~ бьёт зд.нсе. откуда-л. (журчит wee., питает нсв. озеро, иссяк) • «Родник между ними из почвы бесплодной, | Журча, пробивался волною холодной..» (М.Ю. Лермонтов. Три пальмы). ^ ключик2 родниковый ^ Рис. 1. Гиперссылки в РТС В основе идеографического синопсиса Словаря лежат пять крупных разделов - «Абстрактные категории и отношения, формы существования материи и духа», «Неорганический мир. Неживая материя», «Неодухотворённая живая материя», «Человек» и «Общество, страна, государство». Каждый из указанных разделов имеет древовидную структуру и дробится на всё более мелкие группы и подгруппы. Наиболее подходящим способом визуального представления данного языкового материала являются, на наш взгляд, тематические облака кластерного типа с возможностью последовательного погружения в их содержание. Таким образом, основной принцип графического дизайна Словаря состоит в облачно-кластерном моделировании лексикона. Поскольку тематические разделы, расположенные на главной странице, выполняют функцию основного (семантико-ориентированного) входа в словарь, принципиально важно, чтобы они давали пользователю достаточно ясное представление об их наполнении. Перечисленные ранее названия глобальных тематических полей такого представления, как кажется, не дают, поэтому необходимо перейти на более низкий уровень смыслового обобщения. Тематические группы второй ступени действительно могут служить надёжным навигатором в поиске слова, поскольку соответствуют интуитивному представлению человека о существующих в языке смысловых блоках. Ср.: внутри раздела «Абстрактные категории» выделяются группы «Время», «Пространство», «Форма», «Движение», «Количество» и др., внутри раздела «Неорганический мир. Неживая материя» - группы «Вещества», «Космос», «Земной шар», «Атмосфера земли, климат и погодные явления», «Поверхность Земли», «Недра Земли», внутри раздела «Неодухотворённая живая материя» - группы «Растительный мир», «Животный мир» и т.п. Если воспользоваться принятой в когнитивной лингвистике классификацией категорий на категории подчинённого, базового и высшего уровней, то такие тематические группы можно считать категориями высшего уровня, в то время как глобальные разделы относятся, судя по всему, к суперкатегориям, искусственно конструируемым и плохо осознаваемым рядовыми носителями (за исключением, пожалуй, раздела «Человек»). Таким образом, на главной странице Словаря целесообразно предъявить тематические группы первой и второй ступени обобщения (рис. 2). Каждая тематическая группа оформляется в виде окружности, диаметр которой зависит от объёма входящего в группу языкового материала. При этом желательно, чтобы окружности, относящиеся к одному тематическому разделу, были окрашены в один цвет. При клике по окружности пользователь перемещается вглубь тематического древа, соответственно, перед ним разворачивается тематический кластер выбранной группы Рис. 2. Главная страница РТС (рис. 3). Иерархическая связь между группами передаётся соединительными линиями, отсутствие таковой - соположением окружностей. Хотя кластерное оформление тематического каркаса представляется наиболее оптимальным, электронная версия РТС позволяет выбрать стандартный списочный способ его предъявления. Рис. 3. Кластер тематической группы Что касается совмещённого видения объектов разной принадлежности, то оно, по задумке авторов, будет реализовано в двух моментах. Первый связан с возможностью пользователя видеть присловную и присловарную грамматическую характеристику слова на одной странице14. Технически это можно сделать за счёт всплывающего окна c окончаниями парадигмы, которое появляется при клике на её индекс (рис. 4). Ввезите текс/п Зля поиска в словаре Неорганический мир. Неживая материя -- _ _ _ Индекс Единственное число Родит.падеж -а / -а' Дат. падеж -у / -у' Винит, падеж = Им. Творит, падеж -ом' -о'м Предл. падеж -е / -е Множественное чнелло Именит, падеж а/ -а' Родит, падеж -0 Дат. падеж -ам / -а'м Винит, падеж нд - Им. од - Род. Творит, падеж -ами / -а'ми Предл. падеж -ах / -а'х с'олнышк|о. -а, только е

Ключевые слова

electronic dictionary, ideography, thematic dictionary, computer lexicography, lexicography, электронный словарь, тематический словарь, идеография, компьютерная лексикография, лексикография

Авторы

ФИООрганизацияДополнительноE-mail
Парамонова Мария КонстантиновнаГосударственный институт русского языка им. А.С. Пушкинамл. науч. сотр. проектной научно-исследовательской лаборатории инновационных средств обучения русскому языкуmkparamonova@gmail.com
Ольховская Александра ИгоревнаГосударственный институт русского языка им. А.С. Пушкинаканд. филол. наук, вед. науч. сотр. проектной научно-исследовательской лаборатории инновационных средств обучения русскому языкуaleksandra_olhovskaya@mail.ru
Богачёва Галина ФёдоровнаГосударственный институт русского языка им. А.С. Пушкинаканд. филол. наук, вед. науч. сотр. проектной научно-исследовательской лаборатории инновационных средств обучения русскому языкуms.galbo@mail.ru
Всего: 3

Ссылки

Морковкин В.В., Морковкина А.В. Русские агнонимы (слова, которые мы не знаем). - М.: АО «Астра семь», 1997. - 415 с.
Стернин И.А. Проблемы анализа структуры значения слова. - Воронеж: Изд-во Воронеж. ун-та, 1979. - 122 с.
Морковкин В.В., Богачёва Г.Ф., Луцкая Н.М. Большой универсальный словарь русского языка / под ред. В.В. Морковкина. - М.: Словари XXI века: АСТ-ПРЕСС ШКОЛА, 2016. - 1456 с.
Ольховская А.И. Поэзия как элемент «Русского тематического словаря» // Международный аспирантский вестник. - 2016. - № 3. - С. 55-60.
Апресян Ю.Д. Исследования по семантике и лексикографии. - Т. 1: Парадигматика. - М.: Языки славянских культур, 2009. - 568 с.
Зализняк А.А. Многозначность в языке и способы ее представления. - М.: Языки славянских культур, 2006. - 672 с.
Шмелев Д.Н. Современный русский язык: Лексика: учеб. пособие. - М.: Еди-ториал УРСС, 2003. - 336 с.
Новиков Л.А. Семантика русского языка. - М.: Высш. шк., 1982. - 272 с.
Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. - М.: Наука, 1974. - 367 с.
Морковкин В.В. Идеографические словари. - М.: Изд-во МГУ, 1970. - 71 с.
Богачёва Г.Ф., Ольховская А.И. Русский тематический словарь: традиции и новации // Русский язык за рубежом. - 2016. - № 4. - С. 49-55.
Денисов П.Н. Очерки по русской лексикологии и учебной лексикографии. -М.: Изд-во МГУ, 1974. - 256 с.
Денисов П.Н. Лексика русского языка и принципы её описания. - М.: Рус. яз., 1993. - 248 с.
 Электронный идеографический словарь: теоретический и прикладной аспекты (на материале «Русского тематического словаря») | Вопр. лексикографии. 2017. № 12. DOI: 10.17223/22274200/12/3

Электронный идеографический словарь: теоретический и прикладной аспекты (на материале «Русского тематического словаря») | Вопр. лексикографии. 2017. № 12. DOI: 10.17223/22274200/12/3