Chat with us, powered by LiveChat

Постредактирование машинных переводов человеком

В последние годы технологии машинного перевода достигли значительных успехов. Существует споры о том, достигли ли машинные системы перевода «паритета» с человеком? В Trusted Translations мы считаем, что в некоторых ситуациях такой паритет уже достигнут. Однако в большинстве случаев мы признаем, что эти системы пока не могут заменить квалифицированного переводчика-человека. Ценность участия человека зависит от нескольких факторов, например, языковой комбинации, предметной области, сложности и технического уровня, является ли контент рутинным или творческим, насколько хорошо он написан, формат ввода и прочее.

Из-за разнообразия вариантов машинные переводы не могут (и, вероятно, никогда не смогут) обеспечивать стабильно правильные переводы. Следовательно, в большинстве случаев для получения надежных результатов при использовании машинного перевода его постредактирование человеком является незаменимым элементом рабочего процесса. Кроме того, для улучшения качества переводов, сделанных системой настраиваемого машинного перевода (CMTE) необходима обратная связь от человека-переводчика, которая позволит избежать повторения ошибок.

В Trusted Translations работают опытные лингвисты, прошедшие специальное обучение по постредактированию машинных переводов. Наши опытные редакторы корректируют результаты машинного перевода не только для того, чтобы изменить текст, но и улучшить его качество в будущем.

При наличии соответствующих инструментов процесс постредактирования улучшает качество текста, позволяя сохранить данные в памяти переводов (TM), а также использовать их для обучения и повышения эффективности механизма машинного перевода в будущих проектах.

Процессы перевода и постредактирования

Процессы перевода и постредактирования машинного контента сильно отличаются. Для каждого из них необходимо пройти специальное обучение и выработать определенные навыки. Не все лингвисты могут выполнять постредактирование. И, даже если они захотят попробовать себя в этой сфере, им может потребоваться определенная подготовка. Академия совсем недавно начала разрабатывать учебные планы, чтобы удовлетворить растущий спрос на переводчиков, выполняющих постредактирование машинных переводов.

Такие специалисты используют другой подход при просмотре двуязычного контента. При переводе с нуля в распоряжении человека оказывается чистый лист (потенциальный перевод), поэтому он/она пользуется следующей последовательностью:

  • Внимательно читают исходный контент.
  • Обдумывают перевод внутренне (в своем мозгу).
  • А затем набирают текст на целевом языке (перевод) с помощью программного обеспечения или интерфейса.

В зависимости от содержания и проекта переводчик может сразу отредактировать внесенный текст, уточнить детали или вернуться к нему позже, когда весь текст будет переведен.
Процесс перевода нечетких или полных совпадений из памяти переводов (TM) может незначительно отличаться, но обычно он состоит из трех этапов. Если найдено соответствие:

  • Переводчик внимательно читает исходный текст.
  • Затем внимательно читает целевой текст, предложенный ТМ.
  • Затем адаптируют текст на целевом языке (перевод) с помощью программного обеспечения или интерфейса.

Процесс постредактирования машинно перевода отличается и включает следующие этапы:

  • Редактор читает переведенное предложение или сегмент (то есть процесс начинается с прочтения целевого текста).
  • Результат машинного перевода сравнивается с исходным текстом.
  • Редактор на основе четких инструкций оценивает качество результата.
  • Если результат машинного перевода достаточно хороший, редактор может его улучшить.
  • Если перевод плохой, редактор его удаляет и переводит заново (как в процессе перевода, указанном выше).

Постредактирование и переводы, выполненные человеком

Существует значительная разница в навыках и подходах, используемых при редактировании переводов, сделанных человеком и машиной. В целом, типы ошибок, которые встречаются в переводах человека, отличаются от типов ошибок в машинных переводах. Например, обычно в машинных переводах точнее передаются числовые значения. Системы машинного перевода реже пропускают фрагменты текста (например, подпункты длинного параграфа юридического документа). Однако в машинных переводах чаще встречаются неверные формулировки. Некоторые системы МП также могут использовать неверную терминологию.

С другой стороны, переводы, выполненные человеком, лучше звучат, содержат меньше контекстных ошибок, но более склонны к ошибкам при переводе числовых значений. Переводчики также могут пропускать фразы. Или вносить дополнительные текст, чтобы устранить неоднозначность перевода. Но это, безусловно, является отклонением от исходного текста. В Trusted Translations мы обучаем наших редакторов машинного перевода распознавать эти различия и использовать наши собственные инструменты для повышения качества. Кроме того, специальные инструменты помогают редактору повторно переводить неверные формулировки, чтобы система машинного перевода больше не допускала подобных ошибок.

Легкое и полное постредактирование

В Trusted Translations мы уверены, что не существует единого решения для всех, поэтому мы должны адаптировать каждое решение к потребностям наших клиентов.

Если для клиента на первом месте находится качество, мы оцениваем не только перспективы использования системы МП, но и уровень постредактирования, необходимый для получения необходимого результата. В этом случае для задачи мы используем полное постредактирование (подготовку к публикации). То есть, если двуязычный контент проходит дополнительный этап проверки (например, редактирование), редактор не должен обнаруживать каких-либо различий между отредактированным сегментом MП и сегментом, переведенным человеком.

Если для клиента важным критерием является стоимость или скорость перевода, а машинный перевод дает достаточный уровень качества, мы можем рекомендовать только легкое постредактирование, которое помогает улучшить читаемость текста, исправить основные грамматические ошибки с помощью программ проверки правописания, а также провести проверку терминологии.

Постредактирование и предварительное редактирование

Постредактирование не следует путать с предварительным редактированием. Предварительное редактирование относится к подготовке текста, которая проводится перед его внесением в систему автоматического перевода. Оно включает проверку текста на наличие основных ошибок, внесение пометок для определенной части текста (например, элементов, которые переводить не нужно) и оптимизацию форматирования. Такая подготовка перед внесение в систему может значительно улучшить качество перевода и считается обязательным этапов в большинстве проектов машинного или автоматического перевода.

Эффективное предварительное редактирование позволяет значительно улучшить качество машинного перевода, облегчая работу пост-редакторам и качество готового перевода. Поскольку технологии машинного перевода продолжают совершенствоваться, для создания качественных переводов необходимо обладать навыками как предварительного редактирования, так и постредактирования.