Оглавление блога

четверг, 28 октября 2010 г.

Лучезарное будущее машинного перевода

Полгода назад скачал я по какому-то забытому поводу довольно стрёмный файл, мало- или вовсе бесполезный (жуткого веса, для .txt - под 5 мега!), но наводящий на некоторые мысли, которыми и охота поделиться с аудиторией.

THE OPEN ENGLISH - RUSSIAN DICTIONARY V.04.2009

ОТКРЫТЫЙ АНГЛИЙСКО - РУССКИЙ СЛОВАРЬ V.04.2009

139997 ENTRIES

(C) JERZY KAZOJC 2009

GNU GENERAL PUBLIC LICENSEVersion 3, 29 June 2007

Copyright © 2007 Free Software Foundation, Inc. <http://fsf.org/>

Everyone is permitted to copy and distribute verbatim copies of this license document, but changing it is not allowed.

(Ну грамматика хромает, простительно для поляка, я сам там (в английской грамматике) - хромаю!)

decline [ rzeczownik ] = депрессия

decline [ rzeczownik ] = закат

decline [ rzeczownik ] = конец

decline [ rzeczownik ] = оскуделый

decline [ rzeczownik ] = падение

decline [ rzeczownik ] = пасть

decline [ rzeczownik ] = понижение

decline [ rzeczownik ] = скат

decline [ rzeczownik ] = склон

decline [ rzeczownik ] = снижение

decline [ rzeczownik ] = спад

decline [ rzeczownik ] = уклон

decline [ rzeczownik ] = упадок

decline [ rzeczownik ] = ухудшение

rzeczownik по-польску, по нейтивспикерску автора этого файла словаря - существительное

а ведь есть еще и глаголы [ czasownik ] :

decline [ czasownik ] = вечереть

decline [ czasownik ] = клониться

decline [ czasownik ] = отвергать

decline [ czasownik ] = отказать

decline [ czasownik ] = отказаться

decline [ czasownik ] = отказывать

decline [ czasownik ] = отказываться

decline [ czasownik ] = отклонить

decline [ czasownik ] = отклонять

decline [ czasownik ] = отнекиваться

decline [ czasownik ] = пасть

decline [ czasownik ] = понижаться

decline [ czasownik ] = просклонять

decline [ czasownik ] = склонять

А мысли - о программах машинного (!!!) перевода. Ну и как они распознàют -отличат "вечереть" от "пасть", от "отклонять", от "склонять", от "понижаться"?

Так этот файл просто в более наглядной (чем словари!) форме представляет весь ужас (!!!) машинного перевода:

Возьмите любой русский текст и ПРОСТО (!!!) замените в нем "вечереть" на "понижаться", или на "просклонять", "отвергать" на "понижаться", "независимый" на "неприкрепленный" и т.д.

Допустим, даже она (эта программа эдакая!) умеет отличать (а как? а всегда?) существительное от глагола:

free [ czasownik ] = вызволить

free [ czasownik ] = вызволять

free [ czasownik ] = высвободить

free [ czasownik ] = высвобождать

free [ czasownik ] = освободить

free [ czasownik ] = освобождать

free [ czasownik ] = уволить

free [ czasownik ] = увольнять

free [ przymiotnik ] = безвозмездный

free [ przymiotnik ] = бесплатный

free [ przymiotnik ] = вольготный

free [ przymiotnik ] = вольный

free [ przymiotnik ] = даровой

free [ przymiotnik ] = невозбранный

free [ przymiotnik ] = независимый

free [ przymiotnik ] = незакрепленный

free [ przymiotnik ] = незанятый

free [ przymiotnik ] = неприкрепленный

free [ przymiotnik ] = раздольный

free [ przymiotnik ] = свободный

free [ przyslowek ] = безвозмездно

free [ przyslowek ] = бесплатно

Не-полякам напоминаю: czasownik - глагол, przymiotnik - прилагательное, przyslowek - наречие.

Ну и как она, сука, отличит, своими компьютерными мозгами "вызволить" от "уволить"? А независимый от бесплатного?

А вот скачайте этот файл, и понавигируйте внутрé: это же так с каждым, буквально (!!!) словом, простите за громкий крик...

Вот и получается, что перевести фразу: "Где здесь туалет?", "Как доехать до вокзала?" - может (и уже с незапамятных времен!) каждый компьютерный переводчик, но это же всё и в бумажном разговорнике есть!

Комментариев нет :