Машинный перевод или переводчик: что выбрать?

С 2010 года отрасль машинного перевода сделала большой шаг вперед — компьютерные программы переводят не только отдельные слова и словосочетания, но и тексты объемом в тысячи знаков и даже звуковые сообщения. И развитие этой сферы только набирает обороты.

Однако существуют вполне действительные аргументы в пользу традиционного перевода людьми. И каждый из нас встречался с ситуациями, когда перевод, сделанный человеком, качественнее, чем перевод Google Translate.

Давайте рассмотрим в этой статье достоинства и недостатки обоих видов перевода, и на основании этого сделаем выводы о том, в каких ситуациях какой вид перевода будет для нас наилучшим выбором.

Машинный перевод

Плюсы машинного перевода

Дадим общее определение: машинный перевод — это процесс перевода с одного естественного языка на другой без непосредственного участия человека, а также область научных исследований в сфере такого перевода.

1. Цена. Машинный автоматический перевод зачастую бесплатен, и даже в платной форме перевод значимого объема текстов будет во много раз дешевле, чем перевод, заказанный у агенств. Месячная подписка Lingvanex на локальное ПО для машинного перевода начинается от 200 евро, что дешевле заказа на перевод пары документов в бюро переводов.

Труд переводчиков-людей требует куда более высокой оплаты в том числе по причине, которую рассмотрим ниже — этот труд занимает на порядки больше времени.

2. Эффективность Скорость машинного перевода текста невероятна для самого профессионального переводчика-человека. Развитие компьютеров и программ-переводчиков сделали процесс перевода практически мгновенным.

Локальное ПО для машинного перевода Lingvanex, использующее нейронный машинный перевод, к примеру, за секунду переводит текст до 20 000 знаков — то есть объемом в два раза больше, чем эта статья. То есть вы получаете объем переведенного текста, который человеку за это время даже не прочитать, не говоря уже о том, чтобы понять и набрать (на клавиатуре или голосом) на другом языке.

Более того, бюро переводов, которому вы доверяете, вообще может быть в нужный день полностью загружено переводами других фирм — и свободных переводчиков вообще не будет.

3. Единообразие. Программы машинного перевода последовательны при переводе повторяющихся фраз и терминов, что важно для технических, юридических и бизнес-документов.

В случае же перевода людьми объем текста больше нескольких десятков тысяч знаков переводческие агентства разделяют между несколькими сотрудниками. В результате фрагменты одного и того же текста отличаются по стилю и использованным терминам. Да и один человек может к середине текста забыть, что уже встречал какое-то слово или словосочетание, после чего переведет то же слово по-новому.

4. Географическая доступность. Онлайн-сервис машинного перевода остается с вами везде, где в наличии мобильная или спутниковая связь.

Можно, конечно, брать с собой в другую страну переводчика-человека — но это дорого. А связаться с проверенным бюро переводов из другой стороны вообще может быть невозможно в нужное время из-за несовпадения часовых поясов.

5. Отраслевая всеохватность. Машинные переводчики располагают словарным запасом во всех сферах человеческих знаний — от музыки и литературоведения до химии и строительства.

Найти такого же разносторонне образованного человека-переводчика невозможно. Да и далеко не всякое агентство с сотнями переводчиков удовлетворит все требования к переводу в узкой профессиональной сфере. В результате качество перевода может не просто снизиться — текст может быть искажен до неузнаваемости.

6. Языки машинного перевода. Развитые машинные переводчики работают с более чем сотней языков — от африкаанс и албанского до уэльского и зулусского.

Далеко не каждое агентство в Европе, Африке или Америке сможет оперативно предложить услуги переводчика-человека, владеющего отнюдь не самым редким языком — например, монгольским. А ведь Монголия — немаленькая страна, и на монгольском языке говорят более 8 миллионов человек.

7. Конфиденциальность. Оригинальные тексты и их переводы, сделанные машинным способом, по умолчанию видит только один человек — заказчик перевода. Информация при машинном переводе документов не уходит за пределы защищенных от взлома серверов переводческого сервиса.

В то же время переводчик-человек — это уже неизбежная лишняя пара глаз, а в переводческом агентстве ваш конфиденциальный документ (например, проект договора или квартальный отчет) может увидеть и разгласить случайно или сознательно кто-то из многочисленных офисных сотрудников, переводчиков, редакторов, корректоров и т.д.

Преимущества перевода человеком

Машинный перевод — это относительно новая отрасль, в которой сочетаются усилия науки, техники и бизнеса. Поэтому, несмотря на реальный и быстрый прогресс в сфере, например, нейронного машинного перевода, есть области, в которых более эффективным пока может оказаться человек-переводчик.

За прошедшие годы программы машинного перевода ушли далеко вперед, однако и до сих пор особенно тяжелую проблему представляют художественные тексты, в которых автор и различные персонажи могут использовать и литературный язык, и диалекты, и профессиональную лексику, и, например, подростковый или уголовный жаргоны.

1. Распознавание вида текста. Переводчик-человек может легко понять, что перед ним произведение художественной, технической или научной литературы. Для перевода будут подбираться соответствующие виду литературы значения слов.

Программе-переводчику понять вид литературного произведения сложнее, тем более что в некоторых текстах могут быть отрывки из нескольких видов литературы или стилизации под них.

2. Распознавание стиля текста. Образованному переводчику-человеку сделать довольно просто, в то время как программа-переводчик должна опознать эти характеристики текста по ряду признаков, учесть все из которых непросто.

Если стиль текста распознан неправильно, то перевод может стать неточным — нейтральный безоценочный текст, например, может превратиться из-за использования эмоционально нагруженных слов в переводе в разгромный памфлет или, наоборот, в панегирик.

3. Распознавание контекста. Многие слова меняют свое значение в зависимости от контекста — и опять же профессиональному человеку-переводчику легче распознать контекст.

Например, английское слово bow может означать и поклон, и лук (из которого стреляют), и нос корабля, и смычок скрипки.

14 лет назад в интернете был замечен казус с англоязычной страницей Института белка Российской академии наук. Сотрудники, ведущие страницу, «не глядя» перевели ее каким-то автоматическим переводчиком и даже не заметили, что вместо Institute of Protein у них вышел Squirrel Institute (Институт белки).

4. Распознавание идиоматических выражений. Опять же, если переводчик-человек хорошо подготовлен, то он не будет слово в слово переводить выражения, которые имеют переносное значение и образные соответствия в языке, на который осуществляется перевод.

Так, к примеру, английское выражение 'spill the beans' может быть переведено буквально как 'пролить/просыпать бобы', но его основное значение 'выдать секрет'.

Или еще более забавное выражение 'the proof is in the pudding' буквально переводится как 'доказательство находится в пудинге', но на самом деле указывает на нечто самоочевидное, понятное без доказательств и объяснений - оно может переводиться (опять же, в зависимости от контекста) как 'факты говорят сами за себя'.

Машинные переводчики зачастую могут встречаться с затруднениями, когда нужно отличить идиоматическое выражение от буквального, в том числе когда речь идет об иронии и юморе.

Когда нужен профессиональный переводчик?

Вы заметили, как часто приходилось писать «образованный переводчик-человек», «профессиональный переводчик-человек», «если переводчик-человек хорошо подготовлен»? Да, к сожалению, это необходимые оговорки.

Человек-переводчик зачастую может делать те же самые ошибки в стиле, контексте, распознавании идиом и образной речи, что и системы машинного перевода.

Мы переводили с английского и на английский за деньги и бесплатно совершенно разные тексты — финансовую отчетность корпораций и стихи, книги об истории и промышленных роботах, отрывки из «Властелина колец» Толкина и юридические документы, энциклики Папы Римского и инструкции к оружию.

В некоторых случаях была прежде всего важна буквальная точность перевода, в других — красота и дух, и почти всегда была важна скорость.

Итак, что мы выберем, если нужно будет перевести, например, на белорусский язык роман Вальтера Скотта «Айвенго»?

Это художественная книга 19 века о событиях 13 века в Англии, в котором нужно отличать авторскую речь от речи крестьян, а речь крестьян — от речи рыцарей и благородных дам. Герои и автор зачастую используют образную речь и шутят. Конечно, для этой работы мы выберем собаку съевшего на переводе художественной литературы человека, да еще желательно имеющего представление об истории и быте Средневековья. Более того, чтобы передать английские языковые архаизмы, было бы хорошо, чтобы переводчик хотя бы немного знал и старобелорусский язык.

Перевод займет минимум год с соответствующей оплатой переводчика и редакторов. Но оно того стоит. Думаем, пройдет еще не один год, когда к решению подобных задач смогут приблизиться машинные переводчики с искусственным интеллектом.

Так что же выбрать?

А что если нужно быстро перевести целый корпоративный сайт? Или финансовые документы с кучей стандартной терминологии и простыми грамматическими конструкциями даже без намека на образную речь? Что если это переписка или обмен голосовыми сообщениями между логистом в Беларуси и владельцем 10 фур в Германии?

Что если в планах туристическая поездка в Шри-Ланку и нужно связаться с хозяином отеля, выбрать еду в меню или арендовать автомобиль?

Во всех этих случаях мы выбираем хороший машинный переводчик.


Часто задаваемые вопросы (FAQ)

Для чего используется обработка естественного языка NLP?

Для распознавания речи, анализа и генерации текста.

Что такое NLP простыми словами?

Направление искусственного интеллекта, которое дает возможность компьютерам анализировать, постигать и продуцировать человеческую речь и текст.

Чем Стемминг отличается от Лемматизации?

Стемминг: Удаляет окончания слов, чтобы сократить их до корневой формы, часто создавая неполные или нестандартные слова. Например, 'running' превращается в 'run', а 'runner' — тоже в 'run'.
Лемматизация: Учитывает контекст и приводит слово к его базовой или словарной форме.

Что такое Токенизация NLP?

Токенизация в NLP — это процесс разбиения текста на минимальные единицы, называемые токенами. Токены могут быть словами, частями слов или даже отдельными символами.

Вас ждет еще больше увлекательного чтения

Машинный перевод в военной сфере

Машинный перевод в военной сфере

April 16, 2025

Преобразование текста в речь для колл-центров

Преобразование текста в речь для колл-центров

January 8, 2025

ИИ-контент vs. человеческий подход: поиск оптимального баланса

ИИ-контент vs. человеческий подход: поиск оптимального баланса

December 18, 2024

Связаться с нами

* Обязательное поле

Ваша конфиденциальная информация имеет для нас первостепенное значение; ваши персональные данные используются строго в целях связи.

Электронная почта

Отправлено

Ваш запрос был успешно отправлен

×