Интеграция инструментов лингвистического поиска в лингводидактических целях | Вопросы лексикографии. 2016. № 2 (10). DOI: 10.17223/22274200/10/4

Интеграция инструментов лингвистического поиска в лингводидактических целях

Лингвисты, преподаватели, учителя и студенты-германисты осуществляют поиск лексикографической информации к немецкоязычным текстам с помощью традиционных и сетевых словарей и баз данных. Для повышения эффективности поиска в сетевых источниках информации автор предлагает к использованию новый программный продукт для генерации немецкоязычного текстоори-ентированного лексического минимума Vokabelliste. В статье представлены основные характеристики программы.

Integration of linguistic search tools for didactic purposes.pdf Поиск лексикографической информации к текстам в сетевых словарях и лингвистических корпусах осуществляется по разным алгоритмам в зависимости от его целей. Накопленная разнородная информация зачастую требует детальной ручной обработки. Для автоматизации процесса поиска и форматирования лексико-графической информации (для немецкого языка) была разработана программа Vokabelliste [1]. В данной статье охарактеризованы целевые группы пользователей программы, описаны источники лексикографической информации и подробно представлен функционал предлагаемого программного продукта. В области лингводидактики можно выделить три целевые группы пользователей, стремящихся к получению углублённой лингвистической информации, это преподаватели специального вуза, школьные учителя и студенты, изучающие немецкий язык как специальность. Пользователь преподаватель вуза преподаёт теоретические лингвистические дисциплины студентам-германистам и осуществляет поиск при подготовке практического (справочного) материала для лингвистического анализа текста. Например, для подбора информации о терминах, заимствованиях, метафорах, метонимиях, культурно-специфической лексике, территориально окрашенной лексике, архаизмах, неологизмах; для выбора лексики при построении семантического / функционального поля; для сбора синонимов к отдельным лексемам текста; для подбора примеров употребления слов; для анализа коллокаций (на основе сведений о частотности); для анализа грамматических категорий слова, и др. Пользователь школьный учитель обучает детей и подростков немецкому как иностранному языку (на разных уровнях) и использует лингвистические сетевые ресурсы при подготовке справочного материала к тексту для чтения. Например, для сбора новой для учеников лексики и ее переводов; для подбора примеров употребления слов в минимальном контексте, для выбора грамматических парадигм слов (имеющих сложные грамматические формы); для составления лексических парадигм (синонимы, антонимы, семантические поля); для поиска транскрипции слов, трудных для произношения и др. Пользователь студент изучает немецкий как специальность (первый или второй иностранный язык) и осуществляет сбор справочного материала для чтения текста. Например, для перевода незнакомых слов; для поиска толкований значений слов; для поиска грамматических парадигм сложных слов; для подбора синонимических рядов, антонимических пар, семантических полей, коллокаций и типичного левого / правого окружения; для проверки произношения незнакомых / сложных слов и др. Для решения вышеперечисленных поисковых задач наряду с традиционными словарями часто используются электронные (сетевые) словари, например: толковый интернет-словарь современного немецкого языка DWDS [2], сетевая лексическая информационная система немецкого языка OWID [3], онлайн-словарь Duden [4], поисковая лексическая система Wortschatz университета Лейпцига [5], грамматическая информационная система GRAMMIS [6], база данных Немецкие словари и грамматика СANOO [7], многоязычный онлайн-словарь PONS [8] и др. Кроме того, часть подобных задач может успешно решаться с помощью лингвистических корпусов, таких как Мангеймский корпус немецкого языка [9], Архив устного немецкого языка [10] и др. Несомненное преимущество использования для лингвистического поиска именно онлайн-ресурсов - актуальность информации (обычно все подобные ресурсы обновляются в режиме реального времени). Наиболее авторитетные онлайн-словари и корпусы содержат исключительно аутентичные примеры функционирования лексических единиц, что также свидетельствует об их высоком качестве. К недостаткам можно отнести необходимость многократного и повторного обращения к одному или нескольким ресурсам, если поиск включает не один поисковый запрос, а несколько (например, при работе с текстом). Собранная таким образом информация обычно довольно разнородна и требует кропотливой ручной обработки - сортировки по типу информации, а также приведения к единому формату. Стремление нивелировать названные недостатки с помощью одного поискового инструмента, интегрирующего лингвистический поиск по разным немецкоязычным сетевым ресурсам, привело к созданию Программы генерации текстоориентированного лексического минимума (Recherchetool zur Erstellung von textbezogenen Vokabellisten), или Vokabelliste. Программа Vokabelliste предназначена для автоматизации процессов сбора лингвистической информации из немецкоязычных лингвистических баз данных, функционирующих в режиме онлайн. Она позволяет оптимизировать трудоёмкий процесс дидактизации текстов для чтения, что способствует повышению эффективности труда учителя / преподавателя немецкого языка. Пользователями программы могут быть также студенты, изучающие немецкий язык. Традиционно процесс сбора лингвистической информации с целью дидактизации иноязычного текста включает следующие шаги: 1) выбор лексем, подлежащих включению в лексический минимум, из текста для чтения; 2) отбор лингвистической информации по каждой из лексических единиц из разных баз данных; 3) приведение собранной информации в дидактически удобный вид. При использовании программы Vokabelliste пользователь выполняет вручную только первый шаг: вводит текст в рабочее поле, отмечает в нем лексические единицы, для которых должна быть собрана лингвистическая информация, и указывает необходимые типы лингвистической информации. Два следующих шага программа осуществляет автоматически: выполняет запрос к одной / нескольким базам данных по каждой из лексических единиц, маркированных в исходном тексте, копирует отмеченные типы информации, соединяет их в единый документ и приводит в стандартный вид (рис. 1). Рис. 1. Логическая модель функционирования программы Vokabelliste (ЛИ - лингвистическая информация) Программа обеспечивает возможность выполнения следующих функций: 1) импортирование текстового файла; 2) выделение и отбор лексем в импортированном тексте; 3) выбор типов лингвистической информации из предлагаемых базами данных в качестве опций (отдельно для каждой лексемы); 4) направление запроса к соответствующим базам данных; 5) отбор соответствующих типов лингвистической информации; 6) накопление лингвистической информации в одном текстовом документе; 7) приведение собранной информации к унифицированному виду. Интерфейс программы существует в двух языковых версиях - на немецком языке (по умолчанию) и на русском языке. При запуске программы открывается главное (первичное) окно (рис. 2). В нем расположены все функциональные элементы. ™ 1 Нагтппйга 1 Сппяякя 1 о гаплгпямме | Выбор текста импортировать из файлов .txt .rtf. .doc, docx или вставить из буфера Выбор источников лингвистическом информации последовательно активировать для каждой лексемы необходимые ТнЯН П ниГЛЦ|"Лг-нМ'КЛ1> инфпрмл 1 |ии |бочий cTcwrtSybfllas E-Mail doc Обзор | Удалить вьйрзшый те5ст | j Выбор лексических единиц последовательно выделить двойным кликом нужные лексические единиц и FiMW.xu их п пмгк-^мкий минимум cwoonrt ИИМ^И Л Ц г | | [Х)ианиш«ни« | Часть речи г Грамматические характеристики г- Правописание FЗначение Р Сиипимиы Г (ипнчнин икружнкна г Дополнительная информация г Выбыть асе Lieber Reinlrard, vieien Dark fur die nubschen Fotos! Es sirxJ wundersthone FrinriArtJivjffrt Sift hatefl mlfh airfrjftmnniMTi In Mcinchen isl immer noch B»rgartenwelterP AJs ich gestem an euch alle denkend mitdem Fahrrad - Radieschen, Obatzfa und Brezen sa*nt Tiscrtiecke m кого - zu memem Liesiinqsbier^arten un soaen moikiwis fuiir, hatte ich einefi FrorrtatzuMmmens-toft mit einem Made), das genau wie dv neulich erzafiftest - mit iPod-Stopsel in den Ohren vollkommcn .ihwer-Mifl auf cten ftrkpn Wegesrand кэш nrxl mit vollem Kararho in rnemem Lhahlesel krachte. kh tandete recM unaanlt in ikn tJienneiieln bzw mem Kopf knallte geqen einen Gartenzaun Dummerwetse hatte ich kcincn Hctni auf, und JiPi iPod-Madd iisl wk: ach ЫлгшзЭДИи.', on *1идя1 щкДИШи авЬпШв KiivterniwtehHii AJms merited* far«l Lie be GruGe SyWIe Сменить wrap | Сбрхитъ выбор Внести в лексический минимум Составить список леим понимать, какие типы информации необходимы ему для включения в генерируемый лексический минимум, отдавать себе отчет в возможном возникновении лингвистических трудностей приотборе лингвистической информации (по причине многозначности и омонимии) и осознавать необходимость проверки готового тексто-ориентированного лексического минимума. Входные данные (немецкоязычные тексты) загружаются в программу в виде текстового документа или через буфер обмена. Отмеченные пользователем лексемы направляются в виде запроса в лингвистические базы данных. Программа ведет отбор информации указанных типов и собирает ее в единый документ. Выходные данные (собранная лингвистическая информация) организованы в виде текстового документа, сгенерированного в текстовом редакторе MS Word. Программа автоматически приводит лексический минимум в стандартный формат. На этом поисковый запрос считается выполненным. Семантическими особенностями лексических единиц (омонимия, полисемия) может быть обусловлено то, что результат будет содержать избыточную информацию. В таком случае он может быть откорректирован пользователем вручную. Трудоёмкость ручной работы напрямую зависит от цели и количества собранной информации - лишнее можно просто удалить из результата (текстового документа). В готовом лексическом минимуме информация упорядочена по типу: орфографические и фонетические особенности (произношение, правописание); грамматическая информация (часть речи, грамматические характеристики, формы слова); семантическая информация (значение); примеры употребления (примеры, соотнесенные со значениями, типичные примеры); парадигматические связи (в том числе синонимы); коллокации (типичное левое и правое окружение); перевод на русский язык. Источники информации указаны в виде логотипа соответствующей базы данных (рис. 3). Kindermadchen Orthograpbische und phonetische Besonderheiten Орфографические и фонетические особенности Aussprache Betonung: Kindermadchen Произношение Lautschrift: [ kindsme t(3n] Iduden 1 Grammatische Informationen Грамматическая информация Wortformen Wortklasse: Nomen Формы слова Genitiv Singular: Kindermadchens Cdliountft Nominativ Plural: Kindermadchen Artlkel: da; Flexionsklasse: s/- Besonderheiten: n-Tilgung im Dativ Plural Semantische Informationen Семантическая информация Bedeutung [jungere] weibliche Person, die in einer Familie гиг Значение Bet re и и rig der Kinder angestellt ist Iduden 1 Bedeutung (veraltend) in einer Farnilie fest angestelltes Madchen, das Значение die Kinder betreut DWDS das Kindermadchen spielte mit den Kindern Paradigmatische Beziehungen Парадигматические связи Paradigmatische Beiiehungen Synonymgruppe: Kinderfrau, Kindermadchen, Nanny, Парадигматические связи Та ges mutter DWDS Synonyme Amme, Kinderpflegerin, Nanny; (veraltend) Kinderfraulein, Синонимы Nurse; (veraltet) Bonne; (friiher) Gouvernante Iduden 1 Kollokationeri Коллокации Typische linke Nachbarn a Is (317,S5), ein (162,61), das (145,36), einem (95,8S), dem Типичнее левое окружение (94,23), ehemaliges (92,11), philippinische (84,63), . "Я philippinisches (70,88), Das (63,98), stachelige (59,4), ehemalige (58,19), philippinischen (45,89), friiheres (45,47), neues (43,79) Ubersetzung in; Russische Перевод на русский язык Ubersetzung ins Russische няня Перевод на русский язык Рис. 3. Пример результата поиска лингвистической информации к одной лемме (при запросе было активировано 8 опций в пяти базах данных) Информационное обеспечение функционирования программы включает следующие немецкоязычные сетевые лингвистические базы данных: 1) онлайн-словарь Duden [4]; 2) толковый интернет-словарь современного немецкого языка DWDS (Digitales Worterbuch der deutschen Sprache des 20. Jh.) [2]; 3) поисковая лексическая система Wortschatz (Deutscher Wort-schatz Portal) [5]; 4) грамматическая сетевая база данных CANOO (Deutsche Wor-terbticher und Grammatik CANOO) [7]; 5) многоязычный онлайн-словарь PONS (немецко-русское направление перевода) [8]. Процесс генерации лексического минимума может потребовать разного количества времени в зависимости от количества отобранных лексем и активированных опций (т.е. требуемого количества лингвистической информации по каждой лексеме), а также от свойств сетевого подключения. Проведённая оценка эффективности программы по скорости выполнения поискового запроса на базе 600 наблюдений по коэффициенту линейной корреляции Пирсона показала, что скорость выполнения поискового запроса (т.е. количество единиц, обработанных программой за единицу времени) тем выше, чем больше лексических единиц в поисковом запросе. При этом скорость в любом случае выше скорости сбора информации человеком. SWOT-анализ6 [11] прототипа программы и перспектив его внедрения в систему автоматизированного рабочего места преподавателя-лингвиста (см. таблицу) показал, что Программа генерации тек-стоориентированного лексического минимума Vokabelliste может быть использована в нескольких направлениях: • автоматизация сбора лингвистической информации лингвистами / преподавателями при проведении лингвистических исследований; • автоматизация сбора лингвистической информации учителями немецкого языка в лингводидактических целях; • автоматизация сбора лингвистической информации студентами в рамках самостоятельной работы над немецкоязычным текстом. SWOT-анализ программы Vokabelliste Сильные стороны Слабые стороны • экономит время пользователя на поиск лингвистической информации; • позволяет вести целенаправленный отбор информации одного типа из разных баз данных; • позволяет наглядно и эффективно сравнивать полученную информацию одного типа из разных источников; • не требует инсталляции; • имеет двуязычный интерфейс; • позволяет импортировать разные текстовые типы файлов • имеет ограниченное количество подключенных баз данных; • не позволяет оценить объем информации до ее сбора и сохранения; • имеет традиционный интерфейс; • использует несовершенный лем-матизатор (который, однако, позволяет себя корректировать); • существует только на носителе; • работает только на компьютерах с предустановленным MS Word; • не справляется с многозначностью и омонимией (выдает все существующие в базах данных значения лексем, включенных в поисковый запрос); • не позволяет вести поиск аналитических лексических форм (существительное с артиклем, глаголы и прилагательные в сложных формах, отделяемые приставки, сложные слова, устойчивые словосочетания); • может включать в результаты поиска нечёткие совпадения (он-лайн-словарь PONS) Возможности Угрозы • использование при подготовке к чтению / анализу текста; • использование для выполнения поискового запроса без текста; • применение для различных целевых групп (преподаватели, учителя, студенты); • применение в научных и / или лингводидактических целях • наличие в загрузочной папке большого количества файлов (что может привести в замешательство неопытного пользователя); • возможный отказ в выполнении поискового запроса при изменении параметров доступа владельцами используемых баз данных Разработанная Программа генерации текстоориентированного лексического минимума Vokabelliste повышает эффективность труда преподавателя, поскольку позволяет интегрировать лингвистическую информацию различных сетевых баз данных. Таким образом, программа может стать одним из элементов автоматизированного рабочего места лингвиста за счет автома-тизации рутинных процессов, связанных с обучением.

Ключевые слова

интеграция лингвистического поиска, немецкоязычный тек-стоориентированный лексический минимум, integration of linguistic search, text-based basic learner dictionary for the German language

Авторы

ФИООрганизацияДополнительноE-mail
Савина Ольга ЮрьевнаТюменский государственный университет ст. преподаватель кафедры немецкой филологииosawina@gmail.com
Всего: 1

Ссылки

Программа генерации текстоориентированного лексического минимума «Vokabelliste»: Свидетельство о государственной регистрации программы для ЭВМ № 2015619379 / О.Ю. Савина; заявитель и правообладатель Тюменский государственный университет. Заявл. 13.07.2015; гос. регистр. 01.09.2015. Бюл. № 2015619379, опубл. 20.09.2015.
Digitales Worterbuch der deutschen Sprache DWDS. - URL: http://www. dwds.de (дата обращения: 16.07.2016).
OWID. Online-Wortschatz-Informationssystem Deutsch. - URL: http:// www. owid.de/ (дата обращения: 16.07.2016).
Duden-Online. Worterbuch. Verlag Bibliographisches Institut GmbH. - URL: http://www.duden.de (дата обращения: 16.07.2016).
Deutscher Wortschatz Portal. Universitat Leipzig. - URL: http://www. wortschatz. uni-leipzig.de. (дата обращения: 16.07.2016).
Grammis 2.0. Das grammatische informationssystem des Instituts fur deutsche Sprache (IDS). - URL: http://hypermedia.ids-mannheim.de/ (дата обращения: 16.07.2016).
Deutsche Worterbucher und Grammatik CANOO. - URL: http://www.canoo.net (дата обращения: 16.07.2016).
PONS Online-Worterbuch. - URL: http://de.pons.com. (дата обращения: 16.07.2016).
Deutsches Referenzkorpus. DeReKo. - URL: http://www1.ids-mannheim.de/ kl/projekte/korpora.html (дата обращения: 16.07.2016).
Archiv fur Gesprochenes Deutsch. - URL: http://agd.ids-mannheim.de/ index. shtml (дата обращения: 16.07.2016).
Майсак О.С. SWOT-анализ: объект, факторы, стратегии. Проблема поиска связей между факторами // Прикаспийский журнал: управление и высокие технологии. - 2013. - № 1. - С. 151-157.
 Интеграция инструментов лингвистического поиска в лингводидактических целях | Вопросы лексикографии. 2016. № 2 (10). DOI: 10.17223/22274200/10/4

Интеграция инструментов лингвистического поиска в лингводидактических целях | Вопросы лексикографии. 2016. № 2 (10). DOI: 10.17223/22274200/10/4