Машинный перевод
Материал из Википедии — свободной энциклопедии
Машинный перевод:
- перевод текстов (письменных и устных) с одного естественного языка на другой при помощи компьютера;
- направление научных исследований, связанных с построением переводческих систем.
Содержание |
[править] Формы организации взаимодействия ЭВМ и человека при машинном переводе
- С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.
- С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.
- С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.
- Смешанные системы (например, одновременно с пред- и постредактированием).
- Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.
- Системы с разделением труда: компьютер обучен переводить только фразы жестко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.
В англоязычной терминологии различаются термины machine translation (MT, полностью автоматический перевод) и machine-aided или machine-assisted translation (MAT, автоматизированный перевод); если же надо обозначить и то, и другое, пишут M(A)T.
[править] История машинного перевода
Мысль использовать ЭВМ для перевода была высказана в 1946 году, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.
К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:
- MARK (в Департаменте иностранной техники ВВС США);
- GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).
Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведенных текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом ее выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.
Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественноязыковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъему этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.
Впрочем, мечты, с которыми род людской взялся полвека назад за задачу машинного перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.
В настоящее время существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством профессора Пиотровского (Российский государственный педагогический университет им. Герцена, Санкт-Петербург).
[править] Качество перевода
Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод произвольных художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей по определённой тематике и незначительной настройке системы на особенности того или иного типа текстов возможно получение перевода вполне приемлемого качества. Результат машинного перевода в этом случае нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем качественнее возможен перевод. Наилучших результатов можно достичь при использовании машинного перевода для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.
Пример машинного перевода: [1]
en: My cat has given birth to four kittens, two yellow, one white and one black.
ru: Мой кот родил четырех котят, два желтых цвета, одно белое и одного афроамериканца.
Поскольку машина не понимает контекста текста, то иногда при машинном переводе научных текстов [2] можно встретить следующие словосочетания:
en: Bra-ket notation ru: Примечание Кети лифчика;
en: Lie algebra ru: алгебра Лжи;
en: eccentricity vector ru: вектор оригинальности.
[править] Интересные факты
- Чальз Э. Р. Хоар разработал метод сортировки Quicksort именно применительно к машинному переводу. Дело в том, что в те времена словарь хранился на магнитной ленте, и если отсортировать слова в исходном тексте, их переводы можно получить за один прогон ленты.
[править] См. также
[править] Ссылки
- О. С. Кулагина. О современном состоянии машинного перевода // Математические вопросы кибернетики, вып. 3, М.: Наука, 1991, стр. 5—50. Библиография из 140 названий. ISBN 5-02-014323-5.
- История машинного перевода
- Система машинного перевода Babel Fish (Systran) на портале Altavista
- Online-переводчик компании ПРОМТ