Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XXI Международной научно-практической конференции «В мире науки и искусства: вопросы филологии, искусствоведения и культурологии» (Россия, г. Новосибирск, 18 марта 2013 г.)

Наука: Филология

Секция: Прикладная и математическая лингвистика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Стахмич Ю.С. СИСТЕМЫ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ПЕРЕВОДА: КОГНИТИВНО-ИНТЕРПРЕТАЦИОННЫЙ АСПЕКТ // В мире науки и искусства: вопросы филологии, искусствоведения и культурологии: сб. ст. по матер. XXI междунар. науч.-практ. конф. – Новосибирск: СибАК, 2013.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов
Статья опубликована в рамках:
 
 
Выходные данные сборника:

 

СИСТЕМЫ  ПРОГРАММНОГО  ОБЕСПЕЧЕНИЯ  ПЕРЕВОДА:  КОГНИТИВНО-ИНТЕРПРЕТАЦИОННЫЙ  АСПЕКТ

Стахмич  Юлия  Станиславовна

аспирант  Национального  педагогического  университета  имени  М.П.  Драгоманова,  г.  Киев

E-mail: 

 

Когнитивно-интерпретационный  аспект  систем  программного  обеспечения  перевода  заключается  в  моделировании  и  автоматизации  интеллектуальных  функций  и  когнитивной  деятельности  человека.  Основными  задачами  в  этом  контексте  являются  анализ  и  синтез  текста  на  естественном  языке,  которые  моделируют  различные  уровни  языковой  личности,  ее  когнитивные  процессы,  понимание,  интерпретацию  и  типы  мышления.  Несмотря  на  применение  различных  подходов  к  системам  перевода  [3;  8;  12;  13],  на  сегодняшний  день  не  существует  единого  решения  проблемы  создания  универсальной  автоматической  программы  перевода,  которая  могла  бы  адекватно  имитировать  речемыслительные  процессы  человека.  Поэтому  анализ  существующих  моделей  позволяет  сделать  вывод  об  эволюционности  аспекта  моделирования  в  лингвистических  и  смежных  науках. 

Термин  «системы  программного  обеспечения  перевода»  не  имеет  единого  определения.  Украинская  исследовательница  Т.И.  Коваль  [9]  определяет  программное  обеспечение  переводческой  деятельности,  распределяя  его  на  системное  и  прикладное.  Системное  программное  обеспечение  —  это  набор  программ,  которые  выполняют  базовые  функции  для  организации  процесса  поиска  и  обработки  данных,  обслуживания  составляющих  компьютера  и  предоставляют  пользователю  удобные  способы  диалога.  Прикладное  программное  обеспечение  —  это  комплекс  прикладных  программ,  с  помощью  которых  переводчик  выполняет  управленческие,  творческие,  переводческие,  учебные  и  другие  задачи.  К  прикладному  программному  обеспечению  относятся  текстовые  процессоры,  графические  редакторы,  системное  управление  базами  данных,  электронные  таблицы,  веб-редакторы,  системы  автоматического  перевода,  электронные  словари  и  другие  [9,  с.  27]. 

Дж.  Хатчинс  предлагает  разделять  программное  обеспечение  перевода  на  системы  машинного  перевода  (machine  translation  systems)  и  компьютерные  переводческие  инструменты  (computer-based  translation  support  tools).  При  этом  важную  роль  в  определении  играет  единица  перевода.  Таким  образом,  система  программного  обеспечения  называется  «системой  машинного  перевода»,  если  она  принимает  на  входе  полные  предложения  на  одном  языке  и  одновременно  генерирует  соответствующие  полные  предложения  на  другом  языке  (не  обязательно  выполняя  перевод  высокого  качества)  [16].  Система  программного  обеспечения  называется  «переводческим  инструментом»,  если  она  принимает  на  входе  одно  слово  или  фразу  одновременно  и  синтезирует  переводные  эквиваленты,  которые  пользователь  может  вставить  в  предложения  и  тексты  [16]. 

Таким  образом,  системы  программного  обеспечения  —  это  компьютерные  программы,  которые  можно  использовать  для  перевода  вводимого  текста  с  одного  естественного  языка  на  другой,  при  этом  сохраняя  формат  подлинного  документа. 

В  статье  мы  более  подробно  остановимся  на  системах  автоматического  машинного  перевода  и  на  моделировании  языковой  личности  в  них.  Под  системой  машинного  перевода  мы  понимаем  тип  программного  обеспечения,  который  осуществляет  преобразование  текста  из  одного  естественного  языка  на  другой.  Машинный  перевод  считается  высшим  видом  моделирования  перевода,  который  может  объяснить  и  эксплицировать  скрытые  механизмы  как  вида  языковой  деятельности  человека  [12,  с.  190].  Изучение  мыслительных  операций,  определяющих  понимание  и  выбор  языковых  средств  в  процессе  перевода,  является  сложной  задачей.  Ее  решение  связано  со  значительными  трудностями,  так  как  предполагает  вторжение  в  мыслительную  деятельность  переводчика,  исследование  его  когниции,  как  проявления  умственных,  интеллектуальных  способностей. 

Существуют  разные  способы  членения  процесса  перевода,  выполняемого  человеком  и  машиной.  А.В.  Зубов  выделяет  в  процессе  перевода  текста  человеком  3  основных  этапа:  1)  постижение  (понимание)  текста  на  исходном  языке;  2)  интерпретация  текста  на  исходном  языке;  3)  перевыражение  текста  на  исходном  языке  и  создание  текста  на  языке  перевода  [8,  с.  251—252].  Суть  постижения  исходного  текста  заключается  в  понимании  того,  о  чем  говорится  в  исходном  тексте,  и  может  быть  дословным,  стилистическим,  а  также  восприятием  идейного  замысла  автора  [8].  Процесс  перевыражения  текста  из  одного  языка  на  другой  носит  сугубо  творческий  характер. 

Основываясь  на  более  широком  материале,  Л.Л.  Иомдин  отмечает,  что  человеческий  и  машинный  перевод  состоят  из  двух  последовательных  задач:  задачи  понимания  текста  (постижения  его  смысла)  и  задачи  производства  текста  (облечения  смысла  в  слова,  т.  е.  создания  нового  текста)  [10]. 

Перевод  также  рассматривается  как  последовательность  формально-логических  операций,  которые  доступные  и  вычислительной  машине  соответствующей  мощности  [14].  Правда,  строго  логические,  алгоритмизированные  операции  могут  сопровождаться  сугубо  человеческими  интуитивно-эвристическими  действиями,  побуждаемыми  когнитивными  ассоциациями  к  догаткам  и  непредсказуемыми  озарениями,  основанными  на  тезаурусе  когнитивного  опыта  [14,  с.  23].  Именно  эти  действия  остаются  сложно  моделируемыми  для  машинного  перевода. 

В  процессе  перевода  человеку  необходимы  знания  соответствующей  лексики  и  грамматики,  предметного  содержания  текста  и  правил  преобразования.  Эта  информация  используется  в  ходе  морфологического  анализа  каждого  слова  предложения  исходного  языка  и  синтаксического  анализа  каждого  предложения  текста  исходного,  с  их  последующим  преобразованием  и  синтезом  переводящего  языка.  Человек  выполняет  эти  действия,  опираясь  на  знания  языка  и  опыт.  По  мнению  А.В.  Зубова,  «компьютер,  осуществляющий  перевод  текстов,  тоже  должен  уметь  выполнять  те  же  самые  действия»  [8,  с.  252—253]. 

Еще  в  самом  начале  разработок  в  сфере  машинного  перевода  было  введено  представляющееся  продуктивным  деление  перевода  на  собственно  перевод  (на  уровне  языковых  средств),  который  можно  передать  на  выполнение  машине,  и  на  интерпретацию  (творческий  поиск,  характерный  только  для  человека-переводчика)  [12,  с.  46]. 

Появление  идеи  машинного  перевода  и  эвристический  подход  к  задаче  породили  особый  взгляд  на  проблему  формального  осуществления  процесса  перевода.  Для  этого  требовалось  разбить  перевод  на  отдельные  последовательные  этапы.  Таким  образом,  в  начале  моделирования  перевода  было  принято  деление  процесса  на  анализ  и  синтез  с  промежуточными  стадиями  [12,  с.  43—44].  Моделирование  перевода  состояло  в  имитировании  разбора  предложения  по  уровням  языковой  системы  с  использованием  единиц  каждого  уровня.  При  этом  каждой  единице  анализа  ставилась  в  соответствие  определенная  единица,  синтезирующая  выходное  предложение.  Однако  между  этими  этапами  и  действиями  человека-переводчика  не  было  прямой  аналогии.

Машинное  моделирование  в  целях  машинного  перевода  не  отличало  перевод  от  языковой  деятельности  другого  рода.  Перевод  моделировался  как  любой  языковый  процесс,  с  теми  же  стадиями  и  с  теми  же  единицами  анализа,  как  и,  например,  обычный  разбор  предложения.  Это  моделирование  шло  по  пути  «анализ-синтез»,  «анализ-трансфер-синтез»  или  «синтез-анализ»  (гипотетический  путь  анализа  через  синтез,  не  осуществленный  даже  экспериментально)  [12,  с.  47]. 

Современные  стратегии  машинного  перевода,  которые  также  отражают  и  процесс  перевода  человека,  включают  прямой  перевод,  перенос  (трансфер)  и  интерлингву  (смысловой  язык-посредник)  [1;  4]. 

Прямой  перевод  представляет  собой  перевод  на  лексико-морфологическом  уровне  [1].  Предложения  анализируются  и  синтезируются  не  в  виде  синтаксического  образования,  а  как  совокупность  линейных  фрагментов  [4]. 

Трансфер  может  осуществляться  на  уровне  синтаксиса  или  даже  на  уровне  семантики  [1].  В  этом  случае  большое  значение  имеет  грамматика  (шаблоны  линейных  рядов  синтаксических  классов,  грамматика  зависимостей  или  грамматика  непосредственных  составляющих).  Для  совершенствования  работы  системы  привлекают  семантическую  составляющую,  которую  накладывают  на  синтаксические  структуры  текстов  языка  оригинала  и  перевода  [4,  с.  33].  База  знаний  системы  требует  разработки  ряда  правил  для  идентификации  грамматической  и  семантической  структуры  предложения  [1]. 

Интерлингва  представляет  собой  некий  универсальный  код  для  репрезентации  смысла  в  результате  семантической  композиции  [1;  4].  Таким  образом,  независимо  от  языка,  текст  на  этапе  анализа  превращается  в  свободное  от  конкретных  языков  описание,  передающее  содержание  исходного  текста.  После  этого  смысловое  представление  превращается  в  текст  переводящего  языка  [5].  Безусловно,  опытные  переводчики  работают  именно  так:  не  бездумно  «транслируют»  исходный  текст  средствами  выходного  языка,  а  сначала  понимают  содержание  переводимого  текста,  и  лишь  потом  работают  с  этим  содержанием.

На  современном  этапе  когнитивный  подход  к  моделированию  перевода  актуален  для  описания  как  инициальной  фазы  процесса  перевода  —  понимания,  так  и  для  интерпретации  его  последующих  фаз  —  смены  кода  и  выдачи  готового  продукта.  Всякое  понимание  основано,  прежде  всего,  на  контекстуальной  интерпретации  мыслительных  моделей  человека.  При  этом,  основополагающее  для  перевода  понятие  интерпретации  трактуется  как  когнитивные  действия,  объектом  которых  являются  продукты  речевой  деятельности  [6].  Интерпретация  выступает  как  ментальная  деятельность,  предметом  которой  является  текст,  объектом  —  смысл  текста,  целью  —  получение  смысла  текста,  результатом  —  понимание  текста  на  различных  уровнях  [7].  Центральной  задачей  моделирования  перевода  является  построение  автомата,  способного  переводить  или,  по  крайней  мере,  осуществлять  в  переводе  функции,  присущие  обычно  человеческому  интеллекту  [12,  с.  191].  Поскольку  когнитивные  процессы  преобразования  текста  с  одного  языка  на  другой  не  поддаются  прямому  наблюдению,  функционирование  систем  перевода  некоторым  образом  отражает  попытку  формализации  мыслительных  операций  в  сознании  переводчика  как  языковой  личности.  При  этом  под  языковой  личностью  понимается  «совокупность  способностей  и  характеристик  человека,  обусловливающих  создание  и  восприятие  им  речевых  произведений  (текстов)  [11,  c.  3]. 

Во  время  анализа  входного  языка  системы  машинного  перевода  используют  средства  моделирования  механизмов  понимания  человека,  а  в  случае  синтеза  выходного  языка  —  средства  моделирования  механизмов  производства  текста.  В  системах  автоматизированного  перевода  текстов  моделируются  типы  мышления,  свойственные  человеку,  среди  которых  перцептивное,  когнитивное  и  практическое  (поведенческое)  мышление  [15].  Перцептивное  мышление  реализуется  в  процессе  восприятия  текста  системой  и  его  последующего  преобразования  в  машинное  представление  на  различных  уровнях  глубины.  Когнитивное  мышление  актуализируется  в  виде  ограниченной  модели  предметной  области  и  способе  взаимодействия  с  ней  как  с  некой  базой  знаний  о  мире.  В  этом  случае  применяют  эмпирический  подход,  которые  состоит  в  использование  готовых  речевых  произведений  носителей  языка,  а  также  пар  речевых  произведений  авторов  оригиналов  текстов  и  их  переводчиков  для  составления  лексико-семантической  и  грамматической  базы  знаний  системы.  Суть  моделирования  поведенческого  мышления  заключается  в  способах  передачи  отдельных  лексико-грамматических  конструкций  с  одного  языка  на  другой.  Таким  образом,  моделью  практического  мышления  могут  выступать  тезаурусы  соответствий  слов  и  словосочетаний  на  двух  языках,  возможные  ограничения  на  их  использование,  а  также  правила  переноса  в  системах  соответствующего  типа  [1,  с.  86]. 

Сущность  этапов  анализа  и  синтеза  определяется  как  понимание  переводчиком  значения  (суммы  или  системы  значений)  исходного  текста  и  выражения  того  же  значения  (той  же  суммы  или  системы  значений)  средствами  переводящего  языка  [2,  с.  233].  Для  обозначения  эффективности  системы  М.С.  Блехман  вводит  понятие  «уровня  понимания  текста»,  обозначающее  такую  переработку  текста,  которая  обеспечивает  определенную  меру  пользы  для  человека,  стремящегося  удовлетворить  свою  информационную  потребность  или  информационную  потребность  другого  человека  —  конечного  пользователя  [4].  При  этом  он  выделяет  два  низших  уровня  понимания:  нулевой  и  первый.  Нулевой  «уровень  понимания»  обозначает,  что  в  выходной  записи  отображается  все,  что  есть  в  явном  виде  в  оригинале.  При  первом  «уровне  понимания»  выходная  запись  содержит  информацию  некоторую  имплицитную  информацию,  которая  в  явном  виде  не  обозрима  в  оригинальном  тексте.  В  зависимости  от  применения  в  работе  системы  характеристик  разных  уровней  языка,  понимание  текста  может  быть  морфологическим,  синтаксическим,  семантическим  и  гиперсинтаксическим  (когда  система  «понимает»  отношения  между  предложениями  текста)  [4].  Одна  и  та  же  система  может  иметь  способность  к  комбинации  указанных  разновидностей  понимания.  Таким  образом,  «уровень  понимания»  тем  выше,  чем  больший  объем  существующей  в  тексте  информации  можно  получить  от  системы.  Практически  максимальным  может  быть  такой  уровень  понимания  системы,  который  отвечал  бы  уровню  понимания  его  человеком-специалистом  в  данной  области  знаний  [4]. 

Компьютерное  понимание  должно  рассматриваться  как  понимание,  ограниченное  некоторой  целью  («понять,  чтобы  провести  синтаксический  анализ  предложения»),  поскольку  полное  понимание  предложения,  фразы,  текста  вне  достаточно  широкого  контекста  невозможно  даже  человеком  [8].  Один  из  возможных  путей  к  этому  —  ориентация  на  тексты  узкой  предметной  области.

Вне  зависимости  от  степени  глубины  понимания  текста  система  при  анализе  и  синтезе  использует  языковые  компетенции  языковой  личности  носителя  языка,  точнее,  совокупности  языковых  личностей.  О.И.  Бабина  считает,  что  с  позиций  моделирования  анализ  представляет  собой  более  сложный  процесс,  нежели  синтез,  поскольку  он  подразумевает  работу  с  текстом,  сгенерированным  вне  системы  отдельной  языковой  личностью.  При  этом  для  синтеза  достаточно  учитывать  лингвистические  особенности  лишь  одной  языковой  личности  [1,  c.  83].  Таким  образом,  идеальный  механизм  анализа  должен  содержать  в  себе  такую  обработку  и  корректную  интерпретацию  результата  речевой  деятельности  языковой  личности,  которая  является  потенциальным  генератором  текстов,  с  которыми  работает  система.  Такое  условие  практически  невыполнимо,  поэтому  в  ЭВМ  применяется  модель,  разработанная  на  основе  ограниченной  выборки  возможных  входов  и  распространяющая  результат  их  обработки  на  все  входящие  тексты.  Результат  работы  системы  может  рассматриваться  как  результат  генерирования  текста  своеобразной  языковой  личностью,  которая  смоделирована  в  базе  знаний  соответствующей  системы  [1,  с.  83].

Повысить  эффективность  системы  машинного  перевода  можно,  если  научить  ее  справляться  с  типичными  языковыми  случаями,  наличными  во  входных  текстах.  Именно  поэтому  эмпирические  лингвостатистические  методы  широко  используются  при  разработке  систем  автоматической  обработки  текстов.  Статистические  методы  включают  сбор  статистической  информации  о  лексико-семантической  и  грамматической  составляющих  корпуса  текстов  предметной  области.  В  качестве  инструмента  для  формирования  базы  знаний  используются  словари,  частотные  списки  слов,  n-граммы,  конкордансы,  грамматические  шаблоны.  Аналогичный  подход  используется  и  для  моделирования  лексического  компонента  лингвистической  базы  знаний  системы  перевода  [1,  c.  84]. 

Таким  образом,  статистический  аппарат  является  неотъемлемой  частью  функционирования  систем  машинного  перевода,  так  как  позволяет  моделировать  речевое  поведение,  типичное  для  усредненной  языковой  личности  в  пределах  моделируемой  предметной  области.  Также  использование  технологии  «памяти  переводов»  позволяет  сохранять  индивидуальные  трансформационные  решения  конкретного  переводчика.

Задача  улучшения  работы  систем  перевода  сводится  к  определению  стратегий  по  развитию  «интеллектуальных»  характеристик  машины,  которые  охватывают  способы  увеличения  лексической  базы  данных,  включая  многословные  идиоматические  единицы,  и  возможности  добавления  необходимых  знаний  в  процессе  использования  системы.  Также  ориентация  базы  знаний  на  работу  с  конкретной  предметной  областью  обеспечивает  относительную  простоту  системы  перевода,  что  дает  возможность  увеличить  точность  модели  языковой  личности  в  системе  перевода,  а  это,  в  свою  очередь,  способствует  успешной  генерации  адекватного  результата.

Выводы.  Системы  программного  обеспечения  перевода  —  это  компьютерные  программы,  которые  можно  использовать  для  перевода  вводимого  текста  с  одного  естественного  языка  на  другой,  при  этом  сохраняя  формат  подлинного  документа.  Когнитивно-интерпретационный  аспект  систем  программного  обеспечения  перевода  состоит  в  моделировании  способностей  и  характеристик  человека,  которые  обусловливают  восприятие  и  преобразование  им  текстов,  как  лингвистической  единицы,  в  процессе  творческой  речемыслительной  деятельности  —  перевода.  Когнитивные  процессы,  посредством  которых  осуществляется  перевод  текста  с  одного  языка  на  другой,  не  поддаются  прямому  наблюдению,  поэтому  системы  перевода  представляют  собой  попытку  формализовать  мыслительные  операции  языковой  личности,  разделяя  их  на  этапы  анализа  и  синтеза.  При  этом,  модель  синтеза  относительно  проще  модели  анализа,  поскольку  она  представляет  усредненную  языковую  личность.  Синтезируемые  переводы  можно  персонализировать  при  условии  использования  и  улучшения  «интеллектуальных»  характеристик  машины  с  помощью  эвристического  подхода  и  лингвостатистических  методов  обработки  языковых  данных.

 

Список  литературы:

  1. Бабина  О.И.  Роль  личности  переводчика  в  машинном  переводе  //  Языковая  личность  переводчика:  коллектив.  моногр.  /  отв.  ред.  Л.А.  Нефедова;  науч.  ред.  М.В.  Загидуллина.  —  Челябинск:  Изд-во  Челяб.  гос.  ун-та,  2011.  —  420  с.  —  С.  77—90. 
  2. Бархударов  Л.С.  Язык  и  перевод:  вопросы  общей  и  частной  теории  перевода  —М.:  Междунар.  отношения,  1975.  —  240  с.
  3. Беляева  Л.Н.  Информационное  пространство  филолога  и  принципы  его  организации  //  Известия  РГПУ  им.  А.И.  Герцена.  —  2004.  —  №  9.  [Электронный  ресурс]  —  Режим  доступа.  —  URL:  http://cyberleninka.ru/article/n/informatsionnoe-prostranstvo-filologa-i-printsipy-ego-organizatsii  (дата  обращения  13.03.2013).
  4. Блехман  М.С.  Комп’ютерна  лінгвістика.  —  Х.:  ХГУ,  1997.  —  153  с.
  5. Бочан  П.О.  Історія  машинного  перекладу:  стислий  огляд:  навч.  посібник.  —  Чернівці:  Чернівецький  нац.  ун-т,  2010.  —  48  с.
  6. Гусев  В.В.  Эмпатическая  модель  в  формировании  стратегии  перевода  //  Вестник  МГЛУ.  —  2002.  —  Вып.  480:  Перевод  как  когнитивная  деятельность.  —  С.  26—41.
  7. Журавльова  О.  Переклад  як  складова  процессу  інтерпретації  тексту  //  Науковий  вісник  Херсонського  державного  університету.  Серія  «Лінгвістика»:  Збірник  наукових  праць.  —  Випуск  Х  —  Херсон:  Видавництво  ХДУ,  2009.  —  434  с.  —  С.  244—249.
  8. Зубов  А.В.  Основы  искусственного  интеллекта  для  лингвистов  /  А.В.  Зубов,  И.И.  Зубова.  —  Учеб.  пособие.  —  М.:  Университетская  книга;  Логос,  2007.  —  320  с. 
  9. Інформаційні  технології  в  перекладі:  [навч.  посібник  /  за  заг.  ред.  Т.І.  Коваль].  —  К.:  Видавничий  центр  КНЛУ,  2010.  —  261  с.
  10. Иомдин  Л.Л.  Уроки  машинного  перевода  для  детей  и  взрослых  [Электронный  ресурс]  —  Режим  доступа.  —  URL:  http://proling.iitp.ru/bibitems/lessons_winter_school.pdf
  11. Караулов  Ю.Н.  Русская  языковая  личность  и  задачи  ее  изучения  /  Ю.  Н.  Караулов  //  Язык  и  личность.  —  М.,  1989.  —  С.  3—8.
  12. Марчук  Ю.Н.  Методы  моделирования  перевода.  —  М.:  Наука,  1985.  —  202  с.
  13. Пиотровский  Р.Г.  Инженерная  лингвистика  и  теория  языка.  —  Л.:  Наука,  Ленингр.  отд-ние,  1979.  —  112  с.
  14. Цвиллинг  М.Я.  Когнитивные  модели  и  перевод  (к  постановке  проблемы)  //  Вестник  МГЛУ.  —  2002.  —  Вып.  480:  Перевод  как  когнитивная  деятельность.  —  С.  21—26.
  15. Шамис  А.Л.  Пути  моделирования  мышления:  Активные  синергетические  нейронные  сети,  мышление  и  творчество,  формальные  модели  поведения  и  «распознавания  с  пониманием».  —  М.:  КомКнига,  2006.  —  336  с. 
  16. Hutchins  J.  The  IAMT  Certification  initiative  and  defining  translation  system  categories  [Электронный  ресурс]  —  Режим  доступа.  —  URL:  http://hutchinsweb.me.uk/EAMT-2000.pdf
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий