Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 19(315)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9, скачать журнал часть 10, скачать журнал часть 11

Библиографическое описание:
Селиванов С.С. АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА С АНГЛИЙСКОГО ЯЗЫКА НА РУССКИЙ // Студенческий: электрон. научн. журн. 2025. № 19(315). URL: https://sibac.info/journal/student/315/374700 (дата обращения: 01.06.2025).

АКТУАЛЬНЫЕ ПРОБЛЕМЫ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА С АНГЛИЙСКОГО ЯЗЫКА НА РУССКИЙ

Селиванов Сергей Сергеевич

студент, кафедра информационных технологий, искусственного интеллекта и общественно-социальных технологий цифрового общества, Российский государственный социальный университет,

РФ, г. Москва

Протасов Евгений Борисович

научный руководитель,

старший преподаватель, Российский государственный социальный университет,

РФ, г. Москва

CURRENT PROBLEMS OF AUTOMATED TRANSLATION FROM ENGLISH TO RUSSIAN

 

Sergey Selivanov

student, Department of Information Technology, Artificial Intelligence and Socio-Social Technologies of Digital Society, Russian State Social University,

Russia, Moscow

Evgeny Protasov

scientific supervisor, teacher, Russian State Social University,

Russia, Moscow

 

АННОТАЦИЯ

В статье рассматривается вопросы актуальности перевода с одного языка на другой, анализируются истоки возникновения теоретических идей автоматизированного машинного перевода, рассматриваются основные системы машинного перевода, выявляются их достоинства и недостатки. Рассматриваются стратегии постредактирования машинного перевода.

ABSTRACT

The article examines the relevance of translation from one language to another, analyzes the origins of the theoretical ideas of automated machine translation, examines the main machine translation systems, identifies their advantages and disadvantages. The strategies of post-editing machine translation are considered.

 

Ключевые слова: системы автоматизированного перевода на основе грамматических правил; статистические системы автоматизированного перевода; гибридные системы автоматизированного перевода; системы нейронного машинного перевода.

Keywords: automated translation systems based on grammatical rules; statistical automated translation systems; hybrid automated translation systems; neural machine translation systems.

 

Проблемы перевода с одного языка на другой интересовали людей с древности. Квинт Гораций Флакк в своей работе «Наука поэзии, или Послание к Пизонам» поднимает вопросы особенностей перевода текстов в контексте их истолкования. С изобретением печатного станка Иоганном Гуттенбергом в XVвеке количество книг резко возрастает, что приводит к расширению переводческой деятельности.

Осмыслению проблем и трудностей перевода с одного иностранного языка на другой большое внимание уделялось в таком течении западно-европейской мысли как герменевтика. Так Фридрих Шлейермахер прочитал цикл лекций «О разных методах перевода» [6]. Он констатирует значимость перевода с одного языка на другой для общения людей, живущих в разных частях света, а также для знакомства с письменными текстами культур, которые уже прекратили свое существование. С точки зрения Шлейермахера, письменный перевод носит творческий характер и требует передачи духа языка.

В деловой жизни при переводе различия в употреблении слов незначительны и такой перевод не требует глубокого знания языка.

При переводе же произведений искусства и науки с одного языка на другой слова одного языка не имеют точного соответствия в другом языке. Для адекватного перевода необходимо глубокое изучение истории и духа народа.

Развитие технологий в ХХ веке позволило облегчить нелегкий труд переводчиков. Идеи необходимости и возможной реализации машинного перевода высказывались в 40-е годы ХХ века криптографом Уорреном Уивером, математиком Эндрю Бутом и основоположником кибернетики и теории искусственного интеллекта Норбертом Винером. Именно У. Уорену принадлежит первенство в теоретической разработке принципов автоматизированного перевода. Он полагал, что во всех языках существуют единые инварианты и с их помощью можно осуществлять перевод. Уивер писал: «Хочется думать, что книга на китайском языке — это на самом деле книга на английском, просто зашифрованная "китайским кодом"» [3].

В дальнейшем было осознана невозможность на данном этапе развития технологий реализации этой идеи. Стало ясна необходимость ограничить перевод конкретной областью. В 1954 году усилиями сотрудников Джорджтаунского университета и IBM была создана первая автоматизированная система перевода с русского языка на английский. Данная программа переводила тексты в области органической химии и была узко специализированной.

В дальнейшем проводились исследования по выработке методик автоматизированного перевода. Проводилось разбиение текста на составляющие - токены (слова или предложения) с целью выявления важности токена и выявления его эмоциональной окраски. При этом значимым было удаление слов, не несущих важной информационной нагрузки. Для последующей обработки слова сокращались до корневых форм и осуществлялась маркировка частей речи. Данные сохранялись в памяти, что давало возможность повторного их использования на уровне абзацев, заголовков, отдельных разделов. Эти способы обработки текста были реализованы в системе САТ.

Данные системы эффективны как помощники переводчику, но они не способны улавливать культурный контекст, тонкости дискурса и то, что Шлейермахер называл «духом языка».

Существуют различные виды систем автоматизированного перевода. Среди них системы на основе грамматических правил, статистические системы, гибридные системы и системы нейронного машинного перевода [1].

Системы, в основе которых лежит набор лингвистических правил и грамматических структур осуществляют перевод  путем применения правил к исходному тексту на базе уже существующего словаря, фиксирующего значения отдельных слов и фраз. Их преимущество - способность адаптации к текстам любого содержания, осуществление качественного контроля над механизмами перевода и низкий процент ошибок. К недостаткам этих систем относят высокую стоимость создания программ, необходимость постоянного обновления лингвистических баз данных, трудности, возникающие при переводе неоднозначных или двусмысленных фрагментов текста.

Системы статистического автоматизированного перевода формируются на базе статистических моделей. Они предполагают самообучение системы, что позволяет при изменении языка системе самой ввести в свой словарь новые термины. К недостаткам таких систем относят необходимость введения большого количества, до миллиона, параллельных текстов.  При этом возможно появление разницы в переводе устойчивых выражений в зависимости от контекста.

Гибридные системы автоматизированного перевода текстов соединяют алгоритмы статистического перевода и перевода на основе лингвистических правил и грамматических структур. Данные системы высоко производительны и позволяют получить достаточно неплохой перевод. Однако возможна неустойчивость перевода, при которой контекст игнорируется в отдельных случаях.

Одними из наиболее современных систем являются системы, осуществляющие нейронный машинный перевод на основе использования нейросетей. Нейросети детальным образом исследуют взаимосвязи каждого слова. Они делают это точнее, чем статистические модели, учитывают контекст, выявляют системные зависимости в тексте, что позволяет осуществлять перевод на более качественном уровне. Среди недостатков таких систем обычно выделяют требование больших мощностей и постоянное дообучение нейросети, так как при попадании незнакомого фрагмента текста нейросеть либо выбрасывает его, либо существенно искажает смысл [2].

Для достижения приемлемого автоматизированного перевода на первый план выходят проблемы его постредактирования [5]. Они возникают в связи с тем, что обыденные язык сложно закодировать, он гибок и многозначен. Многозначность приводит к тому, что из-за большого количества лексических и грамматических неточностей при автоматическом переводе отражается только общий смысл текста. Для выхода из данной ситуации возможна разработка стратегии, когда переводчику программой предлагается несколько вариантов перевода текста и он выбирает лучший [4].

 

Список литературы:

  1. Егоров В. А. Анализ и выбор систем автоматизированного перевода» // Экономика и социум, №4 (35), 2017.С.2009–2012.
  2. Мифтахова Р.Г., Е. А. Морозкина Е. А. Машинный перевод. Нейроперевод// Вестник Башкирского университета.. Т. 24. №2, 2019.С. 497-502.
  3. От системы Кирхера до «электронного мозга»: как развивался машинный перевод .URL : https://www.techinsider.ru/technologies/1573689-kak-kompyutery-nauchilis-perevodit-ot-yazykovogo-kovchega-do-elektronnogo-mozga/?ysclid=matsy8k4b661200928(время доступа 19.05.2025).
  4. Родина С. В., Лакиза Е. В. Лингвистические проблемы машинного перевода (на материале русского и английского языков) // Universum: филология и искусствоведение», № 6 (108), 2023. С. 17-19.
  5. Ушакова А.О. Постредактирование машинного перевода технического текста // Евразийский гуманитарный журнал. № 3. 2022. С. 69–76.
  6. Шлейермахер Ф. О разных методах перевода// Вестник МГУ. Сер. 9: «Филология» , № 2, 2000.С.127–145.

Оставить комментарий