Машинный перевод или переводчик: что выбрать?

С 2010 года отрасль машинного перевода сделала большой шаг вперед — компьютерные программы переводят не только отдельные слова и словосочетания, но и тексты объемом в тысячи знаков и даже звуковые сообщения. И развитие этой сферы только набирает обороты.

Однако существуют вполне действительные аргументы в пользу традиционного перевода людьми. И каждый из нас встречался с ситуациями, когда перевод, сделанный человеком, качественнее, чем перевод Google Translate.

Давайте рассмотрим в этой статье достоинства и недостатки обоих видов перевода, и на основании этого сделаем выводы о том, в каких ситуациях какой вид перевода будет для нас наилучшим выбором.

Плюсы машинного перевода

Дадим общее определение: машинный перевод — это процесс перевода с одного естественного языка на другой без непосредственного участия человека, а также область научных исследований в сфере такого перевода.

1. Цена. Машинный автоматический перевод зачастую бесплатен, и даже в платной форме перевод значимого объема текстов будет во много раз дешевле, чем перевод, заказанный у агенств. Месячная подписка Lingvanex на локальное ПО для машинного перевода начинается от 200 евро, что дешевле заказа на перевод пары документов в бюро переводов.

Труд переводчиков-людей требует куда более высокой оплаты в том числе по причине, которую рассмотрим ниже — этот труд занимает на порядки больше времени.

2. Эффективность Скорость машинного перевода текста невероятна для самого профессионального переводчика-человека. Развитие компьютеров и программ-переводчиков сделали процесс перевода практически мгновенным.

Локальное ПО для машинного перевода Lingvanex, использующее нейронный машинный перевод, к примеру, за секунду переводит текст до 20 000 знаков — то есть объемом в два раза больше, чем эта статья. То есть вы получаете объем переведенного текста, который человеку за это время даже не прочитать, не говоря уже о том, чтобы понять и набрать (на клавиатуре или голосом) на другом языке.

Более того, бюро переводов, которому вы доверяете, вообще может быть в нужный день полностью загружено переводами других фирм — и свободных переводчиков вообще не будет.

3. Единообразие. Программы машинного перевода последовательны при переводе повторяющихся фраз и терминов, что важно для технических, юридических и бизнес-документов.

В случае же перевода людьми объем текста больше нескольких десятков тысяч знаков переводческие агентства разделяют между несколькими сотрудниками. В результате фрагменты одного и того же текста отличаются по стилю и использованным терминам. Да и один человек может к середине текста забыть, что уже встречал какое-то слово или словосочетание, после чего переведет то же слово по-новому.

4. Географическая доступность. Онлайн-сервис машинного перевода остается с вами везде, где в наличии мобильная или спутниковая связь.

Можно, конечно, брать с собой в другую страну переводчика-человека — но это дорого. А связаться с проверенным бюро переводов из другой стороны вообще может быть невозможно в нужное время из-за несовпадения часовых поясов.

5. Отраслевая всеохватность. Машинные переводчики располагают словарным запасом во всех сферах человеческих знаний — от музыки и литературоведения до химии и строительства.

Найти такого же разносторонне образованного человека-переводчика невозможно. Да и далеко не всякое агентство с сотнями переводчиков удовлетворит все требования к переводу в узкой профессиональной сфере. В результате качество перевода может не просто снизиться — текст может быть искажен до неузнаваемости.

6. Языки машинного перевода. Развитые машинные переводчики работают с более чем сотней языков — от африкаанс и албанского до уэльского и зулусского.

Далеко не каждое агентство в Европе, Африке или Америке сможет оперативно предложить услуги переводчика-человека, владеющего отнюдь не самым редким языком — например, монгольским. А ведь Монголия — немаленькая страна, и на монгольском языке говорят более 8 миллионов человек.

7. Конфиденциальность. Оригинальные тексты и их переводы, сделанные машинным способом, по умолчанию видит только один человек — заказчик перевода. Информация при машинном переводе документов не уходит за пределы защищенных от взлома серверов переводческого сервиса.

В то же время переводчик-человек — это уже неизбежная лишняя пара глаз, а в переводческом агентстве ваш конфиденциальный документ (например, проект договора или квартальный отчет) может увидеть и разгласить случайно или сознательно кто-то из многочисленных офисных сотрудников, переводчиков, редакторов, корректоров и т.д.

Преимущества перевода человеком

Машинный перевод — это относительно новая отрасль, в которой сочетаются усилия науки, техники и бизнеса. Поэтому, несмотря на реальный и быстрый прогресс в сфере, например, нейронного машинного перевода, есть области, в которых более эффективным пока может оказаться человек-переводчик.

За прошедшие годы программы машинного перевода ушли далеко вперед, однако и до сих пор особенно тяжелую проблему представляют художественные тексты, в которых автор и различные персонажи могут использовать и литературный язык, и диалекты, и профессиональную лексику, и, например, подростковый или уголовный жаргоны.

1. Распознавание вида текста. Переводчик-человек может легко понять, что перед ним произведение художественной, технической или научной литературы. Для перевода будут подбираться соответствующие виду литературы значения слов.

Программе-переводчику понять вид литературного произведения сложнее, тем более что в некоторых текстах могут быть отрывки из нескольких видов литературы или стилизации под них.

2. Распознавание стиля текста. Образованному переводчику-человеку сделать довольно просто, в то время как программа-переводчик должна опознать эти характеристики текста по ряду признаков, учесть все из которых непросто.

Если стиль текста распознан неправильно, то перевод может стать неточным — нейтральный безоценочный текст, например, может превратиться из-за использования эмоционально нагруженных слов в переводе в разгромный памфлет или, наоборот, в панегирик.

3. Распознавание контекста. Многие слова меняют свое значение в зависимости от контекста — и опять же профессиональному человеку-переводчику легче распознать контекст.

Например, английское слово bow может означать и поклон, и лук (из которого стреляют), и нос корабля, и смычок скрипки.

14 лет назад в интернете был замечен казус с англоязычной страницей Института белка Российской академии наук. Сотрудники, ведущие страницу, «не глядя» перевели ее каким-то автоматическим переводчиком и даже не заметили, что вместо Institute of Protein у них вышел Squirrel Institute (Институт белки).

4. Распознавание идиоматических выражений. Опять же, если переводчик-человек хорошо подготовлен, то он не будет слово в слово переводить выражения, которые имеют переносное значение и образные соответствия в языке, на который осуществляется перевод.

Так, к примеру, английское выражение 'spill the beans' может быть переведено буквально как 'пролить/просыпать бобы', но его основное значение 'выдать секрет'.

Или еще более забавное выражение 'the proof is in the pudding' буквально переводится как 'доказательство находится в пудинге', но на самом деле указывает на нечто самоочевидное, понятное без доказательств и объяснений - оно может переводиться (опять же, в зависимости от контекста) как 'факты говорят сами за себя'.

Машинные переводчики зачастую могут встречаться с затруднениями, когда нужно отличить идиоматическое выражение от буквального, в том числе когда речь идет об иронии и юморе.

Когда нужен профессиональный переводчик?

Вы заметили, как часто приходилось писать «образованный переводчик-человек», «профессиональный переводчик-человек», «если переводчик-человек хорошо подготовлен»? Да, к сожалению, это необходимые оговорки.

Человек-переводчик зачастую может делать те же самые ошибки в стиле, контексте, распознавании идиом и образной речи, что и системы машинного перевода.

Мы переводили с английского и на английский за деньги и бесплатно совершенно разные тексты — финансовую отчетность корпораций и стихи, книги об истории и промышленных роботах, отрывки из «Властелина колец» Толкина и юридические документы, энциклики Папы Римского и инструкции к оружию.

В некоторых случаях была прежде всего важна буквальная точность перевода, в других — красота и дух, и почти всегда была важна скорость.

Итак, что мы выберем, если нужно будет перевести, например, на белорусский язык роман Вальтера Скотта «Айвенго»?

Это художественная книга 19 века о событиях 13 века в Англии, в котором нужно отличать авторскую речь от речи крестьян, а речь крестьян — от речи рыцарей и благородных дам. Герои и автор зачастую используют образную речь и шутят. Конечно, для этой работы мы выберем собаку съевшего на переводе художественной литературы человека, да еще желательно имеющего представление об истории и быте Средневековья. Более того, чтобы передать английские языковые архаизмы, было бы хорошо, чтобы переводчик хотя бы немного знал и старобелорусский язык.

Перевод займет минимум год с соответствующей оплатой переводчика и редакторов. Но оно того стоит. Думаем, пройдет еще не один год, когда к решению подобных задач смогут приблизиться машинные переводчики с искусственным интеллектом.

Так что же выбрать?

А что если нужно быстро перевести целый корпоративный сайт? Или финансовые документы с кучей стандартной терминологии и простыми грамматическими конструкциями даже без намека на образную речь? Что если это переписка или обмен голосовыми сообщениями между логистом в Беларуси и владельцем 10 фур в Германии?

Что если в планах туристическая поездка в Шри-Ланку и нужно связаться с хозяином отеля, выбрать еду в меню или арендовать автомобиль?

Во всех этих случаях мы выбираем хороший машинный переводчик.


Часто задаваемые вопросы (FAQ)

Для чего используется обработка естественного языка NLP?

Для распознавания речи, анализа и генерации текста.

Что такое NLP простыми словами?

Направление искусственного интеллекта, которое дает возможность компьютерам анализировать, постигать и продуцировать человеческую речь и текст.

Чем Стемминг отличается от Лемматизации?

Стемминг: Удаляет окончания слов, чтобы сократить их до корневой формы, часто создавая неполные или нестандартные слова. Например, 'running' превращается в 'run', а 'runner' — тоже в 'run'.
Лемматизация: Учитывает контекст и приводит слово к его базовой или словарной форме.

Что такое Токенизация NLP?

Токенизация в NLP — это процесс разбиения текста на минимальные единицы, называемые токенами. Токены могут быть словами, частями слов или даже отдельными символами.

Вас ждет еще больше увлекательного чтения

Что такое локальное распознавание речи?

Что такое локальное распознавание речи?

September 27, 2024

Тесты видеокарт для машинного обучения

Тесты видеокарт для машинного обучения

September 10, 2024

Оценка статистической значимости в системах перевода

Оценка статистической значимости в системах перевода

September 10, 2024

Связаться с нами

0/250
* Указывает обязательное поле

Ваша конфиденциальность имеет для нас первостепенное значение; ваши данные будут использоваться исключительно в целях связи.

Электронная почта

Завершенный

Ваш запрос был успешно отправлен

× 
Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site.

We also use third-party cookies that help us analyze how you use this website, store your preferences, and provide the content and advertisements that are relevant to you. These cookies will only be stored in your browser with your prior consent.

You can choose to enable or disable some or all of these cookies but disabling some of them may affect your browsing experience.

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Always Active

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Always Active

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Always Active

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Always Active

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.