Постредактирование машинных переводов силами человека

Хотя за последние годы технология машинного перевода добилась впечатляющих успехов, пока она не может заменить разумного суждения квалифицированного переводчика-человека. Компания Trusted Translations понимает, что эти два метода лучше всего работают в тандеме, когда человек-переводчик редактирует переводы, сделанные машиной.

Home » Услуги » Машинный перевод » Постредактирование машинных переводов силами человека

Достигли ли машинные переводы полного паритета с человеческими? Не совсем, что и делает обработку силами человека необходимой. Точность и эффективность машинных переводов зависит от множества факторов, таких как сочетание языков, предметная область, сложность и технический уровень, является ли содержание прозаическим или творческим, насколько хорошо написан исходный контент, исходный формат и многое другое.

Из-за этих бесконечных вариаций машинные переводы не в состоянии выявить все лингвистические нюансы и в каждом случае обеспечить правильный перевод. В большинстве случаев, чтобы гарантировать высокую надежность при использовании машинного перевода, постредактирование силами человека является обязательным. Кроме того, если вы используете пользовательский механизм нейронного машинного перевода (CMTE), обратная связь от человека-лингвиста необходима для целей переобучения и повышения производительности.

В Trusted Translations работают опытные лингвисты, специально обученные постредактированию машинных переводов. Наши опытные постредакторы полагаются на свой опыт работы с машинным или автоматическим переводом не только для внесения исправлений, но и для улучшения результатов будущих переводов.

При наличии подходящих технологических инструментов процесс постредактирования позволит повысить качество текущего проекта перевода, сохранить полученные качественные данные в памяти переводов (TM), а также повысить эффективность и точность механизма машинного перевода для будущих проектов.

Процессы перевода и постредактирования

Процессы перевода и постредактирования машинно-генерируемого контента значительно отличаются друг от друга; каждый из них требует определенных навыков и обучения. Не всем переводчикам удобно выполнять постредактирование; даже если они начинают заниматься постредактированием, им часто требуется обучение.

Совсем недавно академические круги начали разрабатывать учебные программы, чтобы удовлетворить растущий спрос на людей-постредакторов. Это обучение начинается с умственного процесса, используемого при просмотре двуязычного контента. При переводе контента с нуля, столкнувшись с «целью» (потенциальным переводом), которая представляет собой чистый холст, переводчики обычно:

  • внимательно читают исходный текст;
  • внутренне формулируют перевод (т. е. в голове);
  • и, наконец, вводят свою версию на целевом языке (перевод) в программе или интерфейсе.

В зависимости от содержания и проекта, переводчик может сразу отредактировать текст, провести дополнительное исследование или вернуться к нему позже, когда весь текст будет переведен.

Однако при постредактировании контента, переведенного с помощью машины, процесс значительно отличается, и он обычно выполняется с использованием инструмента автоматизированного перевода (CATT):

  • Сначала постредактор (лингвист) читает предложение или сегмент вывода МП (то есть процесс начинается с целевого языка).
  • Вывод MП сравнивается с исходным текстом.
  • постредактор моментально оценивает качество вывода машинного перевода, основываясь на лингвистических знаниях и четких инструкциях.
  • Если результат машинного перевода приемлем, он продолжает работу над совершенствованием текста.
  • Если вывод MП имеет низкое качество, постредактор удаляет все, что предлагает МП, и повторно переводит текст с нуля (как в процессе перевода, описанном выше).

Как часть процесса постредактирования машинного перевода, проект часто включает в себя память переводов (TM), которая содержит сегменты перевода из предыдущих заданий на перевод аналогичного/связанного материала, обычно полученного от клиентов или из других аналогичных проектов. Эти ранее переведенные сегменты, содержащиеся в ТМ, могут быть либо приблизительным (аппроксимация), либо полным совпадением с текущим исходным сегментом. Взглянув на то, что предлагает ТМ, постредактор может либо полностью использовать эти предыдущие сегменты перевода, либо внести необходимые коррективы.Постредактор моментально оценивает качество вывода машинного перевода, основываясь на лингвистических знаниях и четких инструкциях.

Знаете ли вы, что...?
При переводе разговорных фраз и идиом Google Translate выдает точный результат всего в 72% случаев.
Знаете ли вы, что...?
Постредактирование человеком может повысить производительность перевода до 60%.
Знаете ли вы, что...?
Проверка перевода человеком имеет решающее значение, если речь идет о работе в критически важных условиях, например в больницах.
Знаете ли вы, что...?
Trusted Translations адаптирует уровень постредактирования, который осуществляет наша компания, к потребностям вашего проекта.
Знаете ли вы, что...?
Знаете ли вы, что...?

Постредактирование и перевод силами человека

По сравнению с редактированием переводов, сделанных человеком, редактирование машинных переводов требует совсем иного подхода и набора навыков. 

Типы ошибок, обнаруживаемые в переводе, выполненном человеком, в целом значительно отличаются от тех, которые встречаются в тексте, переведенном машиной. Например, машинный перевод, как правило, более точен при переносе числовых значений. Системы машинного перевода также менее склонны упускать содержимое (например, пропустить пункт в длинном юридическом абзаце). Однако машинный перевод также имеет тенденцию выдавать более неуклюжие фразы. Некоторые механизмы машинного перевода также очень плохо работают с терминологией.

Переводы, сделанные человеком, могут быть более подвержены ошибкам при переводе числовых значений, для них также характерны пропуски. Некоторые лингвисты, пытаясь уточнить значение, могут даже добавлять содержание, отклоняющееся от источника. В целом, однако, человеческие переводы намного лучше создают естественно звучащий целевой текст с меньшим количеством ошибок с учетом контекста и значения.

Trusted Translations обучает постредакторов машинного перевода распознавать эти различия и использовать фирменные инструменты компании для улучшения результатов. Кроме того, наши инструменты помогают редакторам повторно переводить неуклюже звучащие фразы таким образом, что происходит «обучение» системы машинного перевода для улучшения будущих результатов.

«Легкое» и полное постредактирование

Компания Trusted Translations считает, что не существует универсального решения; вместо этого мы адаптируем каждое решение к потребностям наших клиентов.

Если главное для вас — качество, то мы оцениваем не только рабочие характеристики механизма перевода, но и уровень необходимого постредактирования в соответствии с удобством использования готового продукта. В этом случае целью будет полное (готовое к публикации) постредактирование. То есть, если ваш двуязычный контент должен был бы пройти дополнительный этап проверки (например, редактирование), то редактор не должен был бы обнаружить каких-либо различий между сегментом, отредактированным в машинном переводе, и сегментом, на 100% переведенным человеком.

Если решающим фактором является стоимость или существенное значение имеет время, и если качество результата машинного перевода достаточное, мы можем рекомендовать «легкое» постредактирование, чтобы текст звучал лучше. Мы также исправим основные грамматические ошибки с помощью проверки орфографии и даже улучшим использование терминологии.

Постредактирование и предварительное редактирование

Постредактирование не следует путать с предварительным редактированием. Предварительное редактирование относится к подготовке перед запуском определенного текста через инструмент автоматического перевода. Пре-редактор просматривает содержимое на наличие основных ошибок, помечая определенный контент для перевода определенным образом (или контент, который вообще не надо переводить) и оптимизируя форматирование — например, дополняя какую-либо часть исходного файла, которая была неудобочитаемой.

Такая подготовка значительно повышает качество текста на выходе и считается жизненно важным шагом в большинстве проектов машинного или автоматизированного перевода, облегчая постредакторам выполнение качественного перевода. Поскольку технология машинного перевода продолжает совершенствоваться, крайне важно, чтобы редакторы-люди выполняли предварительное редактирование и постредактирование для получения надежных результатов.

Если вы заинтересованы в совершенствовании своих машинных переводов с помощью команды опытных специалистов, обратитесь в Trusted Translations уже сегодня.