Выбранные места из переписки с друзьями
На сайте Мозгорилла прочитал новость:
IBM сделает самообучающийся переводчик
"Самообучающаяся программа автоматического перевода n.Fluent в фоновом режиме позволит переводить документы, веб-страницы и даже реплики в IM-приложениях".
Про подобную самообучающуюся программу перевода один знакомый по переписке прислал мне аж в 2006 году статью How to build a Babel Fish из обзора Science Technology Review журнала The Economist.
[Картинка из оригинальной статьи в "Экòномисте"]
Вот выдержки из моего тогдашнего развернутого ответа:
Очень давно, в начале 1970-х, читал в "Науке и жизни" статью прямо-таки с дословным (!) изложением "принципа действия" этой "новейшей" (!) самообучающейся машинки.
Что-то навроде "Как самому построить самообучающуюся кибернетическую машину по игре в крестики-нолики". Не шучу. Предлагалось из нескольких десятков спичечных коробок склеить "стеллаж", в каждую коробочку первого уровня положить бумажку с одним из возможных вариантов первого хода, затем в коробочки последующих, более низких уровней, положить бумажки со всеми возможными ответными ходàми на каждый из предыдущих, и т.д.
После чего - начинать играть, случайно вытягивая, в ответ на каждый свой ход бумажку с ответным ходом "машины-соперника". Способность "машины" к самообучению заключалось в том, что каждый раз, когда она проигрывала, человек должен был выбросить из соответствующей коробочки бумажку с ходом машины, непосредственно предшествовавшим ее поражению.
После всего нескольких десятков таких "человеко-машинных" партий, та научалась играть беспроигрышно, поскольку число комбинаций ходòв в этой игре конечно и невелико, а все проигрышные ходы отбраковывались в процессе обучения этой умницы.
То есть классическая древовидная схема, с обрезкой "неплодоносных" ветвей.
Только вот в шахматах, игре с заведомо конечным, хотя и очень большим числом комбинаций, то же самое не получается. Пара проигрышей Каспарова - не в счет. Если теоретически представить себе шахматного Маугли, который с детства играл бы в шахматы не с людьми, а только с машинами... А так, среди сыгранных Каспаровым партий только 0,01% (условно) - с машиной, то есть она для него заведомо незнакомый соперник. А машина все 100% своих партий сыграла с людьми, а уж каспаровские - знает и помнит все, поскольку изначально именно на него и натаскана.
А теперь - к конкретике. Известный литературный персонаж, Козьма Прутков, имел обыкновение утверждать, что "нельзя объять необъятное" (или может, ровно наоборот, "нельзя впихнуть невпихуемое", что-то в этом роде...)
В книге Бориса Климзо "Ремесло технического переводчика" есть глава "Логика на службе переводчика", где, в частности, говорится:
At the maximum Pd setting, the mixing zone is located near the throat inlet; further increase of Pd will cause backflow into the air suction port.
Нелогично говорить о "дальнейшем увеличении" некой максимальной величины Pd. Автор несомненно имел ввиду не maximum Pd, но maximum allowable Pd. При переводе нелогичность легко устраняется:
При установлении [с помощью вентиля] максимально допустимого давления Pd зона смешения располагается вблизи входа в горловину; дальнейшее повышении Pd вызывает обычно заливание воздушного всасывающего патрубка.
Теперь пример посложнее:
It appears, however, that the scratches of grooves that are formed during abrasion by the abrading media are large enough in many cases to "plow" out of small carbides in a single pass, while larger carbides will withstand several passes before being worn down and pulled out.
Здесь автор одновременно думал о
- абразивном материале (abrading medium);
- абразивных частицах, содержащихся в абразивном материале (abrading media, хотя точнее было бы abrading particles или abrading grains);
- царапинах и канавках, вырезаемых в обрабатываемой детали абразивными частицами (scratches, grooves);
- частицах карбида, присутствующих в металле обрабатываемой детали (carbides, хотя точнее было бы carbide particles).
Немудрено, что он допустил анаколуф и породил текст, "добросовестный" перевод которого недопустим. Ведь согласно автору, получается, что частицы карбида выбиваются из тела обрабатываемой детали царапинами и канавками, хотя на самом деле, царапины - следствие, а не причина выдирания частиц карбида. Вариант перевода после восстановления нарушенных логических связей выглядит так:
Однако, по-видимому, абразивные частицы, приводящие в процессе шлифования к появлению царапин и канавок, во многих случаях достаточно крупны и поэтому "выпахивают" мелкие частицы карбида за один проход, тогда как более крупные частицы карбида выдерживают несколько проходов, прежде чем они истираются и выдираются.
И т.д. Глава длинная, а в книге - 286 страниц.
Короче, где там машине с нами тягаться! Ну куда ей угадать, о чем одновременно думал автор! Где ей сдюжить "восстановить нарушенные логические связи"! И ведь эти случаи вовсе не редкие и не исключительные, как может по первоначалу-то показаться. Это каждодневная переводческая практика!
Австрийские партнеры российской компании, в которой я тогда работал, писали нам по-английски. Приложение к контракту, 86 тысяч знаков, то ли писали, то ли переводили с немецкого на английский минимум четыре человека (или пять).
Заказчика [строительства] они обзывают в разных отрывках договора то ordering party, то client's party, то owner, то employer (!) и т.д. Строительство объекта - то construction of the building, то completion of the plant (!). Дело поправимое, однако не все из них кумекают добре по-аглицки. В средней части есть такие перлы, где на протяжении нескольких страниц - ни одной грамматически правильно построенной английской фразы, ни одного грамотно сформулированного положения контракта.
Все время приходиться гадать и угадывать, что этот парень имел ввиду, о чем он "одновременно подумал". И ведь это - настоящее и будущее английского (да и русского, горько сказать!).
Это надо быть в курсе общей ситуации в компании, конкретных фактов, упоминаемых в контракте, включить весь свой здравый смысл, весь свой жизненный опыт, перевести весь контракт (по мере продвижения по тексту вперед, как всегда, проясняются некоторые непонятные прежде места) и т.д.
Далее, в подразделе "Многокомпонентные термины" этой же книги Бориса Климзо, читаем о терминах, составленных из нескольких слов (компонентов) без каких-либо грамматических связей между ними:
...как правило, главное слово находится в самом конце:
"an upstream one D static pressure tap" = Отбор статического давления перед измерительной диафрагмой на расстоянии, равном одному диаметру трубопровода.
Исключение 1: главное определяемое слово не всегда находится в конце.
Исключение 2: такие определения, как every, single, simple, full, total, conventional, ideal, normal, usual, uniform, separate, minimum, далеко не всегда относятся к главному определяемому слову.
A vibration switch will be provided on every fan drive system. "Спрашивается, к чему относится местоимение every (каждый) - к вентилятору или к системе? Переводчик рассуждает: drive system - приводная система, или привод (например, ременный или непосредственно от электродвигателя). Понятно, что у вентилятора может быть только один привод. Следовательно, местоимение every относится к вентилятору. Отсюда перевод:
"На приводе каждого вентилятора предусматривается вибрационное реле".
Мои замечания:
1) переводчик - рассуждает!
2) "Понятно, что у вентилятора может быть только один привод" - это и человеку-то далеко не каждому понятно! Тем менее - машине или программе!
Ключевое слово здесь, по-моему, "понять". Невозможно обеспечить качественный перевод только выполнением некоторого подстановочного алгоритма, не поняв текста, то есть, без выхода на метатекстовый уровень. Ричард Фейнман, Нобелевский лауреат по физике, дал такое определение: я "понимаю" некоторую физическую формулу, если я могу грубо прикинуть ее результат, не производя, собственно, вычислений.
По моим ощущениям, понимать что-либо программа научится нескоро.
Комментариев нет :
Отправить комментарий