Оглавление блога

суббота, 28 ноября 2009 г.

Выбранные места из переписки с друзьями

Выбранные места из переписки с друзьями

На сайте Мозгорилла прочитал новость:

IBM сделает самообучающийся переводчик

"Самообучающаяся программа автоматического перевода n.Fluent в фоновом режиме позволит переводить документы, веб-страницы и даже реплики в IM-приложениях".

Про подобную самообучающуюся программу перевода один знакомый по переписке прислал мне аж в 2006 году статью How to build a Babel Fish из обзора Science Technology Review журнала The Economist.

[Картинка из оригинальной статьи в "Экòномисте"]
Вот выдержки из моего тогдашнего развернутого ответа:

Очень давно, в начале 1970-х, читал в "Науке и жизни" статью прямо-таки с дословным (!) изложением "принципа действия" этой "новейшей" (!) самообучающейся машинки.

Что-то навроде "Как самому построить самообучающуюся кибернетическую машину по игре в крестики-нолики". Не шучу. Предлагалось из нескольких десятков спичечных коробок склеить "стеллаж", в каждую коробочку первого уровня положить бумажку с одним из возможных вариантов первого хода, затем в коробочки последующих, более низких уровней, положить бумажки со всеми возможными ответными ходàми на каждый из предыдущих, и т.д.

После чего - начинать играть, случайно вытягивая, в ответ на каждый свой ход бумажку с ответным ходом "машины-соперника". Способность "машины" к самообучению заключалось в том, что каждый раз, когда она проигрывала, человек должен был выбросить из соответствующей коробочки бумажку с ходом машины, непосредственно предшествовавшим ее поражению.

После всего нескольких десятков таких "человеко-машинных" партий, та научалась играть беспроигрышно, поскольку число комбинаций ходòв в этой игре конечно и невелико, а все проигрышные ходы отбраковывались в процессе обучения этой умницы.

То есть классическая древовидная схема, с обрезкой "неплодоносных" ветвей.

Только вот в шахматах, игре с заведомо конечным, хотя и очень большим числом комбинаций, то же самое не получается. Пара проигрышей Каспарова - не в счет. Если теоретически представить себе шахматного Маугли, который с детства играл бы в шахматы не с людьми, а только с машинами... А так, среди сыгранных Каспаровым партий только 0,01% (условно) - с машиной, то есть она для него заведомо незнакомый соперник. А машина все 100% своих партий сыграла с людьми, а уж каспаровские - знает и помнит все, поскольку изначально именно на него и натаскана.

А теперь - к конкретике. Известный литературный персонаж, Козьма Прутков, имел обыкновение утверждать, что "нельзя объять необъятное" (или может, ровно наоборот, "нельзя впихнуть невпихуемое", что-то в этом роде...)

В книге Бориса Климзо "Ремесло технического переводчика" есть глава "Логика на службе переводчика", где, в частности, говорится:

At the maximum Pd setting, the mixing zone is located near the throat inlet; further increase of Pd will cause backflow into the air suction port.

Нелогично говорить о "дальнейшем увеличении" некой максимальной величины Pd. Автор несомненно имел ввиду не maximum Pd, но maximum allowable Pd. При переводе нелогичность легко устраняется:

При установлении [с помощью вентиля] максимально допустимого давления Pd зона смешения располагается вблизи входа в горловину; дальнейшее повышении Pd вызывает обычно заливание воздушного всасывающего патрубка.

Теперь пример посложнее:

It appears, however, that the scratches of grooves that are formed during abrasion by the abrading media are large enough in many cases to "plow" out of small carbides in a single pass, while larger carbides will withstand several passes before being worn down and pulled out.

Здесь автор одновременно думал о

- абразивном материале (abrading medium);

- абразивных частицах, содержащихся в абразивном материале (abrading media, хотя точнее было бы abrading particles или abrading grains);

- царапинах и канавках, вырезаемых в обрабатываемой детали абразивными частицами (scratches, grooves);

- частицах карбида, присутствующих в металле обрабатываемой детали (carbides, хотя точнее было бы carbide particles).

Немудрено, что он допустил анаколуф и породил текст, "добросовестный" перевод которого недопустим. Ведь согласно автору, получается, что частицы карбида выбиваются из тела обрабатываемой детали царапинами и канавками, хотя на самом деле, царапины - следствие, а не причина выдирания частиц карбида. Вариант перевода после восстановления нарушенных логических связей выглядит так:

Однако, по-видимому, абразивные частицы, приводящие в процессе шлифования к появлению царапин и канавок, во многих случаях достаточно крупны и поэтому "выпахивают" мелкие частицы карбида за один проход, тогда как более крупные частицы карбида выдерживают несколько проходов, прежде чем они истираются и выдираются.

И т.д. Глава длинная, а в книге - 286 страниц.

Короче, где там машине с нами тягаться! Ну куда ей угадать, о чем одновременно думал автор! Где ей сдюжить "восстановить нарушенные логические связи"! И ведь эти случаи вовсе не редкие и не исключительные, как может по первоначалу-то показаться. Это каждодневная переводческая практика!

Австрийские партнеры российской компании, в которой я тогда работал, писали нам по-английски. Приложение к контракту, 86 тысяч знаков, то ли писали, то ли переводили с немецкого на английский минимум четыре человека (или пять).

Заказчика [строительства] они обзывают в разных отрывках договора то ordering party, то client's party, то owner, то employer (!) и т.д. Строительство объекта - то construction of the building, то completion of the plant (!). Дело поправимое, однако не все из них кумекают добре по-аглицки. В средней части есть такие перлы, где на протяжении нескольких страниц - ни одной грамматически правильно построенной английской фразы, ни одного грамотно сформулированного положения контракта.

Все время приходиться гадать и угадывать, что этот парень имел ввиду, о чем он "одновременно подумал". И ведь это - настоящее и будущее английского (да и русского, горько сказать!).

Это надо быть в курсе общей ситуации в компании, конкретных фактов, упоминаемых в контракте, включить весь свой здравый смысл, весь свой жизненный опыт, перевести весь контракт (по мере продвижения по тексту вперед, как всегда, проясняются некоторые непонятные прежде места) и т.д.

Далее, в подразделе "Многокомпонентные термины" этой же книги Бориса Климзо, читаем о терминах, составленных из нескольких слов (компонентов) без каких-либо грамматических связей между ними:

...как правило, главное слово находится в самом конце:

"an upstream one D static pressure tap" = Отбор статического давления перед измерительной диафрагмой на расстоянии, равном одному диаметру трубопровода.

Исключение 1: главное определяемое слово не всегда находится в конце.

Исключение 2: такие определения, как every, single, simple, full, total, conventional, ideal, normal, usual, uniform, separate, minimum, далеко не всегда относятся к главному определяемому слову.

A vibration switch will be provided on every fan drive system. "Спрашивается, к чему относится местоимение every (каждый) - к вентилятору или к системе? Переводчик рассуждает: drive system - приводная система, или привод (например, ременный или непосредственно от электродвигателя). Понятно, что у вентилятора может быть только один привод. Следовательно, местоимение every относится к вентилятору. Отсюда перевод:

"На приводе каждого вентилятора предусматривается вибрационное реле".

Мои замечания:

1) переводчик - рассуждает!

2) "Понятно, что у вентилятора может быть только один привод" - это и человеку-то далеко не каждому понятно! Тем менее - машине или программе!

Ключевое слово здесь, по-моему, "понять". Невозможно обеспечить качественный перевод только выполнением некоторого подстановочного алгоритма, не поняв текста, то есть, без выхода на метатекстовый уровень. Ричард Фейнман, Нобелевский лауреат по физике, дал такое определение: я "понимаю" некоторую физическую формулу, если я могу грубо прикинуть ее результат, не производя, собственно, вычислений.

По моим ощущениям, понимать что-либо программа научится нескоро.

Комментариев нет :