Potencial of corpus managers in the analysis of German language teaching terms | Yazyk i Kultura – Language and Culture. 2025. № 72. DOI: 10.17223/19996195/72/2

Potencial of corpus managers in the analysis of German language teaching terms

This article explores the potential of Sketch Engine and AntConc in extracting and analyzing German terms in the standardized language testing. This field is rapidly evolving in connection with the development of language teaching knowledge, which is reflected in terms as ways of its encoding. Term extraction is one of the main stages in terminological research and, in the area under consideration, is complicated by the consubstantial character of many designations - i.e., their formal coincidence with commonly used words. Consubstantial terms acquire specialized meanings only in specific contexts, which necessitates the analysis of their collocations during term selection and raises the issue of effective tools for this process. The research is carried out within the framework of corpus linguistics, which proposes the use of both general scientific methods (description, induction, deduction, classification, modeling, comparison) and field-specific methods (the corpus method and contextual analysis). Many modern language teaching terms are absent from large German corpora like DeReKo. Consequently, there is a need to create custom corpora, for which corpus managers are used. Corpus managers, tools in computational linguistics, optimize terminological research through their diverse functions. The functions of the corpus managers considered in this study (Sketch Engine, AntConc) may include, depending on the chosen tool: automatic extraction of single-word and multi-word terms, thesaurus creation, dispersion calculation, N-gram identification, word list generation, concordance development, and collocation comparison. To assess the potential of these corpus managers in extracting German terms for standardized testing, a corpus was compiled from 16 Goethe certificate guidelines (2001-2023), totaling 379,348 tokens. Sketch Engine and AntConc show high results in analyzing German terms for standardized testing, offering structured concordances, automatic collocation identification, and term classification according to given criteria (by morphemes, parts of speech). These tools can optimize the process of term selection when working with large data volumes by supplying data based on set criteria. Despite their significant advantages, corpus managers also exhibit errors and inaccuracies due to incorrect or incomplete data processing: automatic extraction of common words instead of terms, incomplete determination of word form, and incorrect identification of collocations and semantic parameters. This indicates the need to combine computer tools with manual methods of term extraction. The authors declare no conflicts of interests.

Keywords

term, terminology, the German language, standardized language testing, term extraction, collocation, computer tools, corpus, corpus manager, Sketch Engine, AntConc

Authors

NameOrganizationE-mail
Edlichko Anzhela I.Lomonosov Moscow State Universityang299@yandex.ru
Mishnova Anna V.Lomonosov Moscow State Universitymishnovaa@mail.ru
Всего: 2

References

Комарова З.И. Информационные вызовы современного общества: лингвотерминоведческие и терминографические процессы // Политическая лингвистика. 2017. № 5 (65). С. 12-34.
Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А. С. Компьютерная лингвистика: задачи, подходы, ресурсы // Автоматическая обработка текстов на естественном языке и анализ данных. М. : Изд-во НИУ ВШЭ, 2017. С. 7-30.
Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Часть I. Основы теоретической, вычислительной и экспериментальной лингвистики, или Размышления о месте лингвиста в компьютерной лингвистике // Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. М. : МИЭМ, 2011. С. 7-89.
Комарова З.И. Методология, метод, методика и технология научных исследований в лингвистике : учеб. пособие. Екатеринбург : Изд-во УрФУ, 2012. 818 с.
Glaboniat M., Perlmann-Balme M., Studer T. Zertifikat B1. Prufungsziele. Testbeschreibung. Munchen : Hueber, 2018. 230 S.
Hennemann D., Karamichali E., Perlmann-Balme M., Stelter C. Goethe Zertifikat A2. Prufungsziele. Testbeschreibung. Munchen : Hueber, 2015. 117 S.
Perlmann-Balme M., Stoffers M. Goethe Zertifikat A1: Start Deutsch 1. Prufungsziele. Testbeschreibung. Munchen : Goethe Institut, 2022. 107 S.
Пахолкова И. А. Применение методов корпусной лингвистики в традиционном языкознании // Вестник МГЛУ. 2012. Вып. 13 (646). С. 125-135.
Плунгян В.А. Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики // Русский язык в научном освещении. 2008. № 2 (16). С. 7-20.
Кибрик А.Е., Брыкина М.М., Леонтьев А.П., Хитров А.Н. Русские посессивные конструкции в свете корпусно-статистического исследования // Вопросы языкознания. 2006. № 1. С. 16-45.
Соколова М.А. Использование корпусных инструментов в исследовании терминологии (на материале английского политического языка) // Политическая лингвистика. 2024. № 4 (106). С. 229-234.
Das Deutsche Referenzkorpus - DeReKo. URL: https://www.idsmannheim.de/digspra/kl/projekte/korpora/ (дата обращения: 15.12.2024).
Archive // IDS. Leibniz-Institut fur deutsche Sprache. URL: https://www2.ids-mannheim.de/cosmas2/projekt/referenz/archive.html (дата обращения: 15.12.2024).
Едличко А.И., Захарова О.Л., Мишнова А.В. Терминологический справочник к программе «Учимся обучать немецкому» = Fachlexikon zu DLL - Deutsch Lehren Lernen / под ред. А.И. Едличко, О. Л. Захаровой. М. : Изд-во Моск. ун-та, 2022. 191 с.
Моделирование в корпусной лингвистике: специализированные корпусы русского языка / В.П. Захаров, И.В. Азарова, О. А. Митрофанова, А.М. Попов, М.В. Хохлова ; отв. ред. В.П. Захаров. СПб. : Изд-во СПбГУ, 2019. 208 с.
Sketch Engine. URL: https://www.sketchengine.eu/ (дата обращения: 20.12.2024).
Kilgarriff A., Baisa V., Busta J., Jakubicek M., Kovaf V., Michelfeit J. et al. The Sketch Engine: ten years on. Lexicography // Lexicography ASIALEX. 2014. Vol. 1. P. 7-36.
Lexical Computing // Lexical Computing. URL: https://www.lexicalcomputing.com/lexical-computing/ (дата обращения: 07.12.2024).
Thesaurus - synonyms, antonyms and similar words // Sketch Engine. URL: https://www.sketchengine.eu/guide/thesaurus-synonyms-antonyms-similar-words/ (дата обращения: 7.12.2024).
AntConc // Laurence Anthony’s Website. URL: https://www.laurenceanthony.net/software/antconc/ (дата обращения: 12.12.2024).
Introduction to AntConc // NLS Foundry. URL: https://nlsfoundry.s3.amazonaws.com/reports/nls-reports-intro-antconc-march-2023.pdf (дата обращения: 04.12.2024).
Большакова Е.И., Воронцов К. В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н. В., Сапин А. С. Извлечение информации из текстов: портрет направления // Автоматическая обработка текстов на естественном языке и анализ данных. М. : Изд-во НИУ ВШЭ, 2017. С. 83-126.
Distributional thesaurus // Sketch Engine. URL: https://www.sketchengine.eu/glossary/distributional-thesaurus/ (дата обращения: 13.01.2025).
Котюрова И.А. Корпусные исследования с помощью сервиса AntConc в условиях работы в вузе // Язык и культура. 2020. № 52. С. 36-50.
 Potencial of corpus managers in the analysis of German language teaching terms | Yazyk i Kultura – Language and Culture. 2025. № 72. DOI: 10.17223/19996195/72/2

Potencial of corpus managers in the analysis of German language teaching terms | Yazyk i Kultura – Language and Culture. 2025. № 72. DOI: 10.17223/19996195/72/2

Download full-text version
Counter downloads: 6