Большие языковые модели как инструмент практической деятельности переводчика: обзор зарубежных научных проектов
С момента своего появления на рынке ChatGPT привлёк значительное внимание пользователей по всему миру и стал востребованным инструментом среди специалистов, чья профессиональная деятельность связана с обработкой текстов. Несмотря на конкуренцию со стороны многочисленных специализированных онлайн-сервисов, ChatGPT постепенно расширяет своё присутствие и в сфере машинного перевода. Возможности и ограничения данной программы стали темой для обсуждения в различных общественных кругах, в том числе и в научной среде. Исследования, затрагивающие ChatGPT и другие большие языковые модели в аспекте переводческой деятельности, являются пока немногочисленными и публикуются преимущественно за рубежом. Однако стремительное совершенствование и распространение этой технологии диктует необходимость обобщения подобных работ, что, в свою очередь, позволит предвосхитить основные тенденции развития переводческой отрасли в ближайшем будущем. Цель настоящей статьи - освещение результатов исследовательских проектов зарубежных учёных относительно применения больших языковых моделей в практике перевода. Научная новизна заключается в определении спектра основных направлений для внедрения технологий искусственного интеллекта в переводческую детальность и обобщении прикладного потенциала нейросетевых технологий на примере использования ChatGPT. Материалом для анализа послужили 12 печатных и электронных источников на английском и немецком языках, опубликованных преимущественно в 2023 и 2024 гг. Обозреваемые публикации посвящены тестированию упомянутого чат-бота для перевода разножанровых текстов на языки с низкой и высокой ресурсной базой, в ходе которого используются различные дизайны промтов. В результате реализованного анализа литературы выявлены общие тенденции и особенности применения больших языковых моделей как инновационных, многофункциональных и постоянно развивающихся инструментов переводчиков-практиков. В статье обобщаются работы специалистов из Китая, Ирана, Великобритании, США и ряда стран Европы, представленные в виде практических исследований, методических рекомендаций и экспертных оценок. Широкой географический и жанровый охват проанализированных научных текстов позволяет сформировать комплексное и многоаспектное представление о роли больших языковых моделей на рынке цифровых продуктов для профессиональной переводческой деятельности. В работе использованы концептуально-сопоставительный и оценочно-критический методы анализа, позволяющие выделить и систематизировать данные, представляющие особый интерес для отечественного цифрового переводоведения. Обзор показал, что специалисты подтверждают высокую эффективность ChatGPT в переводческой практике. Он демонстрирует качественный машинный перевод и может составить конкуренцию известными сервисами от Google, DeepL и других крупных компаний. Отмечается, что ChatGPT успешно справляется не только с межъязыковым, но и с межстилевым переводом. Согласно мнению специалистов, способность языковых моделей трансформировать стиль и жанр текста оригинала, сохраняя во вторичном тексте исходную ключевую семантику, найдёт широкое применение во многих отраслях экономики. Кроме того, ChatGPT применим не только для решения непосредственных переводческих задач, но и для автоматизации предпереводческого анализа текстов, включая извлечение из них специальных слов и терминов, систематизацию данной лексики по определённым группам и предоставление лингвистической информации, необходимой переводчику. В то же время эксперты указывают на риск генерации большими языковыми моделями ложных данных, в том числе при выполнении переводческих задач, а также на зависимость качества перевода от генеалогической близости и ресурсной обеспеченности обрабатываемых этими системами национальных языков. Для преодоления указанных ограничений специалисты проводят исследования по оптимизации архитектур больших языковых моделей и развитию промт-инжиниринга в переводческой отрасли. По мнению экспертов, совершенствование библиотек промтов для решения переводческих задач должно осуществляться за счёт разработки комплексных запросов, включающих исчерпывающую контекстуальную информацию, в том числе требования к жанрово-стилистической принадлежности и структурно-организационным свойствам конечного текста. В модификаторы и надстройки промтов необходимо включать эталонные образцы перевода и требования к машинному постредактированию полученных первичных результатов. Проведённый обзор зарубежных исследований позволяет заключить, что, несмотря на активную работу специализированных коммерческих и научно-образовательных организаций по совершенствованию больших языковых моделей и их растущую конкуренцию с распространёнными онлайн-сервисами машинного перевода, они пока не могут заменить профессиональных переводчиков. Следует отметить, что наблюдающийся рост качества машинной обработки естественного языка, многофункциональность и адаптивность выпускаемых на рынок цифровых продуктов и их постоянно расширяющийся ассортимент уже сейчас требуют от переводчиков освоения новых навыков и умений, а от учёных - интенсификации усилий по исследованию сфер применения, рисков и преимуществ технологий искусственного интеллекта для решения задач лингвистического характера. Авторы заявляют об отсутствии конфликтов интересов.
Ключевые слова
машинный перевод,
нейросетевой перевод,
обработка естественного языка,
большие языковые модели,
искусственный интеллект,
ChatGPT,
литературный обзорАвторы
| Александров Олег Анатольевич | Национальный исследовательский Томский государственный университет | доктор филологических наук, доцент, профессор кафедры английской филологии | olegaleksandrov79@gmail.com |
| Чистова Елена Викторовна | Университет мировых цивилизаций им. В.В. Жириновского | доктор филологических наук, доцент, профессор кафедры теории, практики и дидактики перевода | kovelena82@mail.ru |
Всего: 2
Ссылки
Wang S., Scells H., Zuccon G., Koopman B. Can ChatGPT Write a Good Boolean Query for Systematic Review Literature Search? // ArXiv e-prints. 2023. 19 p. URL: https://doi.org/10.48550/arXiv.2302.03495 (дата обращения: 12.12.2024).
Kung T.H., Cheatham M., Medenilla A., Sillos C., Leon L.D., Elepano C., Madriaga M., Aggabao R., Diaz-Candido G., Maningo J. Performance of Chatgpt on usmle: Potential for ai-assisted medical education using large language models // PLoS Digital Health. 2023. № 2 (2). 12 p. URL: https://doi.org/10.1371/journal.pdig.0000198 (дата обращения: 11.12.2024).
Oertner M. ChatGPT als Recherchetool? Fehlertypologie, technische Ursachenanalyse und hochschuldidaktische Implikationen // Bibliotheksdienst. 2024. № 58 (5). S. 259-297. URL: https://doi.org/10.1515/bd-2024-0042 (дата обращения: 02.12.2024).
Liebrenz M., Schleifer R., Buadze A., Bhugra D., Smith A. Generating scholarly content with ChatGPT: ethical challenges for medical publishing // The Lancet Digital Health. 2023. № 5 (3). P. e105-e106. URL: https://doi.org/10.1016/s2589-7500(23)00019-5 (дата обращения: 09.12.2024).
Becker J. J. Konnen Chatbots Romane schreiben? Der Einfluss von KI auf kreatives Schrei-ben und Erzahlen // KI: Text. Diskurse uber KI-Textgenerationen. Berlin : De Gruyte, 2024. S. 83-99.
Doshi A.R., Hauser O.P. Generative AI enhances individual creativity but reduces the collective diversity of novel content // Science Advances. 2024. № 10. URL: https://doi.org/10.1126/sciadv.adn5290 (дата обращения: 23.12.2024).
Анахов С.В. AI и GPT: достижения, вызовы, перспективы // Новые информационные технологии в образовании и науке. 2024. № 13. С. 9-28.
Омелик А.А. ИИ в сфере культуры и искусства: обзор публикаций // Социология искусственного интеллекта. 2024. Т. 5, № 1. С. 42-48.
Бермус А.Г. Преимущества и риски использования ChatGPT в системе высшего образования: теоретический обзор // Педагогика. Вопросы теории и практики. 2024. Т. 9, № 8. С. 776-787.
Бермус А.Г., Сизова Е.В. Педагогические, лингводидактические и психологические условия использования ChatGPT в системе высшего образования: систематический обзор // Научно-методический электронный журнал «Концепт». 2024. № 11. С. 150166.
Pugachev A. A., Kharchenko A V., Sleptsov N.A. Transforming the future: a review of artificial intelligence models // RUDN Journal of Studies in Literature and Journalism. 2023. Т. 28, № 2. Р. 355-367.
Белов С.Д., Зрелова Д.П., Зрелое П.В., Кореньков В.В. Обзор методов автоматической обработки текстов на естественном языке // Системный анализ в науке и образовании. 2020. № 3. С. 8-22. URL: http://sanse.ru/download/401 (дата обращения: 13.12.2024).
Ширяева А.А., Новицкая И.В. Преимущества и недостатки использования нейросетей для обработки естественного языка (NLP) // Язык и культура. 2024. № 67. С. 89101. doi: 10.17223/19996195/67/5 (дата обращения: 14.12.2024).
Сорокина С.Г. Интеллектуальная обработка текстовой информации: обзор автоматизированных методов суммаризации. Виртуальная коммуникация и социальные сети. 2024. Т. 3, № 3. С. 203-222. doi: 10.21603/2782-4799-2024-3-3-203-222 (дата обращения: 05.12.2024).
Czulo O. Trotz ChatGPT, DeepL und Co: Translator:innen geht die Arbeit nicht aus // Linguistische Werkstattberichte. 2023. doi: 10.58079/qwl1 (дата обращения: 07.12.2024).
Lyu Q., Tan J., Zapadka M.E., Ponnatapura J., Whitlow C.T., Niu C., Wang G., Myers K.J. Translating radiology reports into plain language using ChatGPT and GPT-4 with prompt learning: results, limitations, and potential // Vis.Comput. Ind. Biomed. Art. 2023. № 6. Р. 9. doi: 10.1186/s42492-023-00136-5 (дата обращения: 25.12.2024).
Tang G., Ronchen Ph., Sennrich R., Nivre J. Revisiting Negation in Neural Machine Translation // Transactions of the Association for Computational Linguistics. 2021. № 9. P. 740-755. doi: 10.1162/tacl_a_00395 (дата обращения: 15.11.2024).
Muegge U. Terminology Extraction for Translation and Interpretation Made Easy: How to use ChatGPT and other low-cost, web-based programs to create terminology extraction lists and glossaries quickly and easily. Uwe Muege, 2023. 84 p.
Farquhar S., Kossen J., Kuhn L. Detecting hallucinations in large language models using semantic entropy // Nature. 2024. № 630. P. 625-630. doi: 10.1038/s41586-024-07421-0 (дата обращения: 28.11.2024).
Xu W., Agrawal S., Briakou E, Martindale M.J., Carpuat M. Understanding and Detecting Hallucinations in Neural Machine Translation via Model Introspection // Transactions of the Association for Computational Linguistics. 2023. № 11. P. 546-564. doi: 10.1162/tacl_a_00563 (дата обращения: 12.11.2024).
Wenxiang J., Wenxuan W., Jentse H., Xing W., Zhaopeng T. Is ChatGPT A Good Translator? A Preliminary Study // ArXiv e-prints. 2023. doi: 10.48550/ arXiv.2301.08745 (дата обращения: 27.12.2024).
Jiao H., Peng B., Zong L., Zhang X., Li X. Gradable ChatGPT Translation Evaluation // ArXiv e-prints. 2024. URL: https://arxiv.org/html/2401.09984v2 (дата обращения: 09.12.2024).
Kojima T., Gu S.S., Reid M., Matsuo Y., Iwasawa Y. Large Language Models Are Zero-Shot Reasoners // ArXiv e-prints. 2023. URL: https://arxiv.org/pdf/2205.11916v4 (дата обращения: 17.11.2024).
Shao Zh., Gong Y., Shen Y., Huang M., Duan N., Chen W. Synthetic Prompting: Generating Chain-of-Thought Demonstrations for Large Language Models // Proceedings of the 40th International Conference on Machine Learning. Honolulu, Hawaii : JMLR.org., 2023. P. 30706-30775.
Reynolds L., McDonell K. Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm // CHI EA’21: Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems. New York : Association for Computing Machinery, 2021 doi: 10.1145/3411763.3451760 (дата обращения: 18.12.2024).
Puppel M., Borg C. Evaluating ChatGPT’s performance in creative text translation for communication: A case study from English into German // Media and Intercultural Communication: A Multidisciplinary Journal. 2025. № 3 (1). Р. 1-27. doi: 10.22034/mic.2024.480506.1023 (дата обращения: 26.12.2024).
Nooshin P., Shler E.S. Machine Translation with Large Language Models: Prompt Engineering for Persian, English, and Russian Directions // ArXiv e-prints. 2024. URL: https://arxiv.org/abs/2401.08429 (дата обращения: 09.12.2024).
Tan Z., Wang S., Yang Z., Chen G., Huang X., Sun M., Liu Y. Neural machine translation: A review of methods, resources, and tools // AI Open. 2020. Р. 5-21. doi: 10.1016/j.aiopen.2020.11.001 (дата обращения: 03.12.2024).
Casas N., Costa-juss'a M.R. et al. Linguistic knowledge-based vocabularies for Neural Machine Translation. Natural Language Engineering. UK: Cambridge University Press, 2018. № 1 (1). Р. 1-27.