Статья опубликована в рамках: Научного журнала «Студенческий» № 6(6)
Рубрика журнала: Филология
Секция: Лингвистика
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
АВТОМАТИЧЕСКИЙ ПЕРЕВОД ХУДОЖЕСТВЕННЫХ ТЕКСТОВ: ЗА ИЛИ ПРОТИВ
Перевод как вид языковой деятельности с момента своего возникновения играл важную роль в человеческом обществе, т.к. обеспечивал возможность межъязыкового общения, а следовательно успешного взаимодействия и коммуникации.
Для любого вида перевода важна коммуникативная эквивалентность текста на языке перевода. Необходимо отметить, что этот критерий определяется следующими основными требованиями [4]:
- текст перевода должен в возможно более полном объеме передавать содержание оригинала;
- текст перевода должен соответствовать нормам языка перевода, чтобы исключить искажение восприятия;
- текст перевода должен быть примерно сопоставим с оригиналом по своему объему, чем обеспечивается сходство стилистического эффекта с точки зрения лаконичности или развернутости выражения.
Могут ли этим критериям соответствовать системы машинного перевода, получившие значительную популярность в последние годы? Для ответа на этот вопрос необходимо определить понятие машинного перевода, а также общие принципы работы этих систем.
Машинный перевод — это письменный перевод, который «осуществляет … не переводчик, а особая компьютерная программа» [2]. За время его существования появилось (в соответствии с одной из классификаций) три основных вида машинного перевода, каждый из которых имеет свои особенности и сферу применения [5]: 1) автоматизированный машинный перевод при участии человека – подразумевает редактирование выходного текста человеком в целях приведения его в соответствие нормам языка; 2) перевод, осуществляемый человеком с использованием компьютера – в этом случае компьютерные средства рассматриваются только как инструмент (например, электронные словари); 3) полностью автоматизированный машинный перевод.
С последним видом связаны наиболее значительные проблемы в сфере машинного перевода, причина которых заключается в принципах работы систем автоматического перевода.
Для того, чтобы корректно перевести текст, системы машинного перевода используют базы данных словарного запаса языка, а также алгоритмы построения фраз в соответствии с правилами грамматики языка. В первом случае системе машинного перевода необходимо правильно соотнести словоформу в тексте и запись в словаре и найти верное значение слова в случае, если оно полисемантическое. Во втором случае «анализируется синтаксис и семантика входного текста, уточняется его структура, затем происходит преобразование структуры данного входного предложения в ядерную структуру по правилам машинной грамматики» [2].
На основании этого можно выделить несколько главных проблем машинного перевода, одной из которых является объём словаря программы. Кроме того, для создания адекватного перевода она должна располагать базой устойчивых выражений – фразеологизмов. Также система должна «переводить» синтаксис с целью сделать перевод звучащим естественно. К решению этой проблемы есть несколько подходов, выражающихся в создании систем автоматического перевода различных видов. Основными являются [1, с. 64–66] трансферные системы (основаны на преобразовании синтаксиса одного языка в другой) и интерлингвистические системы (предполагают наличие т.н. метаязыка).
Сегодня компьютерные программы перевода в достаточной степени подходят для формирования так называемого чернового варианта будущего текста, который к окончательному виду должен привести профессиональный переводчик. При этом необходимо отметить, что в области машинного перевода в последнее время наблюдается ощутимый прогресс (например, подключение в конце 2016 года к сервису Google Translate самообучающейся нейросети, со временем выполняющей все более приближенные к человеческим переводы [7].)
Но возникает вопрос: может ли машинный перевод использоваться для перевода художественных текстов, которые отличаются огромным количеством средств выразительности?
Необходимо отметить, что в процессе передачи средств художественной выразительности на другом языке очень важна индивидуальность занимающегося переводом человека, поскольку однозначный и единственно верный вариант перевода часто отсутствует. В результате этого перевод художественного текста превращается в процесс творческого характера, а переводчик – в соавтора создателя оригинала [3, с. 99–103]. Кроме того, в художественных произведениях часто присутствует культурно обусловленный подтекст, который без затруднений воспринимается носителями данной культуры. Для переводчика в этом случае культурная дистанция в некоторых случаях может сделать поиск аналога такой импликации достаточно сложным [6].
Нетрудно заметить, что перевод художественных произведений связан не только с лингвистическими, но и со значительным количеством экстралингвистических факторов. Учёт всех этих факторов в работе автоматических систем перевода является очень непростой задачей и одной из основных целей и перспектив в компьютерной лингвистике. Способен ли компьютер на сегодняшний день принимать их во внимание и переводить художественный текст так же хорошо, как человек?
В рамках нашего исследования в качестве материала для изучения эффективности систем автоматического перевода Google Translate [https://translate.google.ru/] и Яндекс.Переводчик [https://translate.yandex.ru/] использовался адаптированный фрагмент [http://window.edu.ru/catalog/pdf2txt/375/63375/33495] рассказа американского писателя М. Твена «General Miles and the Dog» [https://books.google.ru/books?isbn=1493027107].
Анализ конечного результата показывает, что в автоматическом переводе допущен ряд ошибок различного характера: грамматических (морфологических и синтаксических), лексических, стилистических. Рассмотрим некоторые из них.
Грамматические ошибки
Данный тип ошибок связан с неправильной интерпретацией системами автоматического перевода связей внутри предложений и словосочетаний, с нарушениями правил русского языка (языка перевода). Грамматические ошибки в переводе можно разделить на несколько типов: синтаксические (неправильное построение предложений), неверное употребление словоформ, ошибки в согласовании падежей.
Так, среди ошибок системы Google Translate, связанных с неверным построением предложений, можно выделить следующие:
"Да, я сделал,” ответил я. ("Yes, I did," I answered.) – по правилам русского языка, краткий ответ должен содержать повтор глагола (ответил), либо ограничиться словом «да».
Я играл с собакой, когда человек вошел в зал (I was playing with the dog, when a man came into the hall) – в переводе предложения нарушены тема-рематические отношения. В оригинале конструкция came into the hall – тема, а man – рема, на что указывает неопределенный артикль. В русском варианте для сохранения рема-тематической структуры слово человек необходимо поставить в конец предложения.
…я сразу же, что он был генерал Майлз знал (…I knew at once that he was General Miles) – ошибка в порядке слов: сказуемое из главного предложения поставлено в конец высказывания.
Ошибки в согласовании падежей:
Теперь расскажу вам историю, которая покажет вам, как честный я всегда был всю свою жизнь (Now I shall tell you a story which will show you how honest I have always been all my life) – правильно честным (творительный падеж).
После того, как мы нуждались в трех долларов (Once were in need of three dollars) – правильно нуждались в трех долларах.
Неверное употребление словоформ:
Он искал кого-то (It was looking for somebody) – неверное личное местоимение (в предыдущем предложении говорится о собаке).
Я сидел там, когда красивая маленькая собака побежала в зал (I was sitting there when a beautiful small dog ran into the hall) – вследствие использования неверного префикса глагола искажается смысл: корректен вариант вбежала.
В варианте системы Яндекс.Переводчик также допущен ряд грамматических ошибок, которые можно аналогично разделить на несколько типов.
К ошибкам в построении предложения относятся:
Сейчас я расскажу вам историю, которая покажет вам, насколько честен я всегда, всю жизнь (Now I shall tell you a story which will show you how honest I have always been all my life) – пропущен глагол-связка был.
Я был беден, то и очень часто у меня не было денег даже на хлеб (I was poor then and very often I did not have money even for my bread) – смешение сложносочиненного и сложноподчиненного союзов.
Ошибки в формах слов:
"Ты живешь в Вашингтоне в 1867 году?” ("Did you live in Washington in 1867?") – грубая ошибка, связанная с неправильным грамматическим временем: из контекста понятно, что речь идет о прошлом.
Когда-то мы были нужны три долларов (Once we were in need of three dollars) – присутствует винительный падеж, значит – три доллара.
Я сидел там, когда красивый маленький собака побежала в зал (I was sitting there when a beautiful small dog ran into the hall) – ошибка согласования в словосочетании красивый маленький собака.
Неправильное употребление словоформ:
Собака была хорошая… поэтому я позвонил ему и начал играть с ним (The dog was nice… so I called it and began to play with it) – ошибка в неверном соотнесении местоимения и денотируемого им слова.
Лексические ошибки
Данный тип ошибок связан с неправильным пониманием смысла языковых единиц внутри текста, а также отсутствием у систем автоматического перевода способности к анализу контекста нескольких предложений и текста в целом. Рассмотрим лексические ошибки в тексте Google Translate.
Общие Майлз был хорошим человеком (General Miles was a nice man) – general здесь является не прилагательным, а существительным генерал. Аналогично в предложении “Общие”, сказал я…
Я не помню, почему нам нужны эти три доллара так много (I don't remember why we needed these three dollars so much…) – основным значением конструкции so much является именно так много. Однако в этом предложении говорится не о сумме денег, а о степени интенсивности действия (можно подобрать синоним-наречие, например, badly).
Собака была хорошая, и я не имел никакого отношения, поэтому я назвал его и начал играть с ним (The dog was nice and I had nothing to do, so I called it and began to play with it) – выражение to have nothing to do (with) в английском языке действительно означает не иметь никакого отношения к ч.-л. Но в данном случае подразумевалось его буквальное значение. Кроме того, выбрано неверное значение слова call: назвать вместо подозвать.
Он был одет в красивую форму, и я сразу же, что он был генерал Майлз знал (He wore a beautiful uniform and I knew at once that he was General Miles) – слово to know переведено буквально. Глагол знать – несовершенного вида и имеет обобщенное значение обладать какой-либо информацией. То есть смысл предложенного системой предложения в том, что герой всегда знал генерала Майлза. На самом деле фраза означает следующее: в момент, когда вошел генерал Майлз, герой догадался о том, что это был именно он. То есть правильный перевод – я сразу же понял…
Можно отметить, что данные ошибки объединяет общая природа – неверный выбор варианта значения у многозначного слова. Это происходит из-за несовершенного анализа смысла предложения системой и его неправильной интерпретации.
Теперь рассмотрим лексические ошибки в варианте от Яндекс.Переводчика.
Генерал Майлз был прекрасным мужчиной и мы стали очень быстро хорошими друзьями (General Miles was a nice man and we became great friends very quickly) – дополнительное указание на пол героя в данном случае никак не связано с авторским замыслом, вложенным в предложение. Более корректно в контексте перевести слово man как человек.
Ты забываешь, что ты уже был великим полководцем, тогда и я был бедным молодым писателем… (You forget that you were already a great general then, and I was a poor young writer…) – слово полководец является гиперонимом по отношению к употребленному в оригинале слову генерал и неуместно в контексте.
Он был слишком хорошим писателем (He was a poor writer too) – неправильно переведено прилагательное poor, что полностью исказило смысл оригинального предложения.
Собака была хорошая и мне было нечего делать, поэтому я позвонил ему и начал играть с ним (The dog was nice and I had nothing to do, so I called it and began to play with it) – семантическая ошибка. Слово сall здесь означает позвал/подозвал.
В целом, в варианте Яндекс.Переводчика лексические ошибки также представляют собой неверный выбор одного из значений слов. Системы онлайн-перевода не анализируют контекст, а переводят текст по отдельным предложениям, вследствие чего возникают несоответствия варианта перевода с общим смыслом.
Стилистические ошибки
Стилистические ошибки связаны с невозможностью передать в машинном переводе специфические смыслы художественного текста.
Я постараюсь, чтобы получить деньги, но вы также должны попробовать (I shall try to get the money, but you must also try) – т.н. уважительное Вы неуместно в данном контексте, так как персонаж обращается к лучшему другу.
В целом, на основании рассмотренного материала можно сказать, что литературные произведения, написанные в художественном стиле, на данный момент невозможно переводить на русский язык с использованием систем автоматического перевода в связи со значительным количеством допускаемых такими системами ошибок грамматического, лексического, а также стилистического характера, затрудняющих выполнение художественной задачи, т.е. воздействие на читателя, а также их неспособностью анализировать контекст и, как следствие, верно и в полной мере передавать замысел автора. При этом общее качество перевода от Google Translate выше, так как этой системой было допущено меньше искажающих смысл текста ошибок.
В качестве основной причины серьёзных недостатков в машинном переводе художественного текста видится отсутствие у автоматических систем средств для достаточно глубокого анализа языковых связей в тексте. Для работы над переводом художественного текста требуются обширные и многосторонние, в том числе культурно обусловленные знания о мире, с помощью которых можно адекватно передать содержащуюся в тексте художественную информацию. Особую роль в этом играют опыт и личность переводчика, как отмечалось ранее. На современном уровне развития технологий машинный перевод фундаментально недостаточно совершенен для учёта этих факторов, так как в нем используются иные принципы работы по сравнению с человеческим подходом. При этом машинный перевод уже сегодня с успехом применяется в переводе текстов функциональных стилей речи, не подразумевающих значимую роль личности работающего с текстом (официально-деловой, научный стили).
Список литературы:
- Андреева А. Д., Меньшиков И. Л., Мокрушин А. А. Обзор систем машинного перевода // Молодой ученый. – 2013. – №12. – С. 64–66.
- Везнер И.А. Компьютерный перевод [Электронный ресурс] // irinavezner.ru: сайт. – URL: http://irinavezner.ru/index.php?option=com_content&task=view&id=74&Itemid=45 (дата обращения 13.05.2017)
- Гудий К.А. От оригинала к переводу: проблема взаимодействия автора и переводчика // Филология и лингвистка в современном обществе: материалы Междунар. науч. конф. (Москва, май 2012 г.) – Москва, 2012. – С. 99–103.
- Кабаченко И.Л., Игнатова Н.Н. Специфика письменного перевода и его коммуникативная эквивалентность [Электронный ресурс] // Издательский дом «Руснаука»: сайт. – URL: http://rusnauka.com/13_NPT_2008/Philologia/31596.doc.htm (дата обращения 13.05.17)
- Осьминина Е.К. Сегментирование текста в системе машинного перевода // Вестник Воронежского государственного технического университета. – 2011. – №6. – С. 160–163.
- Чиронова И.И. Культурная детерминированность межкультурной коммуникации как переводческая проблема // Современные научные исследования и инновации: электр. науч. практ. интернет-журн. 2013. URL: http://web.snauka.ru/issues/2013/12/29198 (дата обращения: 13.05.2017)
- Katyanna Quach. Google’s neural network learns to translate languages it hasn’t been trained on // The Register. – 2016. – [электронный ресурс] – Режим доступа. – URL: http://theregister.co.uk/2016/11/17/googles_neural_net_translates_languages_not_trained_on/ (дата обращения 13.05.2017)
Оставить комментарий