
Машинный перевод
В начале 40-х годов ХХ века появилась теоретическая основа машинного перевода – идея о кодовой системе языка. Возможность осуществления перевода с использованием машины неразрывно связана с осознанием языка как некого кода. Именно для расшифровки этого кода (криптография) и создаются электронные переводчики.
Разработки в области машинного перевода велись в интересах разведки во времена холодной войны на территории США и СССР.
В марте 1947 года Уорен Уивер, директор отделения естественных наук Рокфеллеровского фонда, специалист по криптографии, впервые сформулировал концепцию машинного перевода под названием «интерлингва». Согласно этой концепции текст на иностранном языке рассматривался как набор зашифрованных знаков. Задача электронного переводчика – раскодировать заложенную в знаках информацию.
Процесс перевода и передачи информации разделен на два этапа:
- исходный текст на иностранном языке переводится на язык-посредник, созданный на базе упрощенного языка;
- полученный текст переводится на выходной язык.
Теория интерлингвы вызвала всплеск исследований в области машинного перевода. Целые штаты инженеров, операторов и программистов проводили эксперименты с первыми ЭВМ, которые использовались в Военно-промышленном комплексе. Так, в США особое внимание уделялось русско-английскому направлению перевода, в СССР – наоборот.
Во времена холодной войны идея о том, что при переводе можно обойтись без человека-переводчика, была очень заманчивой, так как военные не испытывали желания делиться с «чужаком» государственными тайнами. Электронные переводчики избавили бы ВПК от «лишних ушей». Этим-то и объясняется интенсивное финансирование разработок в данной области.
Первая конференция по машинному переводу состоялась в 1952 году в Масачуссетском технологическом университете, а уже в 1954 году в Нью-Йорке была выпущена первая система машинного перевода – IBM Mark II. Она была снабжена словарем из 250 единиц и 6 грамматическими правилами и осуществляла перевод с русского языка на английский.
В целом же за 50-е годы ученые-разработчики не достигли особых успехов в создании электронных переводчиков, и государственное финансирование постепенно сошло на нет. Да и компьютеры того времени были недостаточно развиты. Они имели слишком маленький объем памяти, как следствие – невозможность полноценного использования языков программирования высокого уровня. Кроме того, в 50-е годы отсутствовала должная теоретическая база в области машинного перевода.
Как бы то ни было, первый шаг на пути к осуществлению мечты многих ученых и военных был сделан.
Начав свой путь в 1947 году, теория машинного перевода бурно развивалась вплоть до конца 50-х годов. В 1959 философ Барр Хиллвел высказал мысль о том, что высококачественный машинный перевод невозможен в принципе. Он объяснял это многозначностью многих слов и говорил, что электронные переводчики должны служить лишь помощью в работе переводчиков-людей.
В середине 60-х годов разработчики вынуждены были согласиться с мнением о том, что машинный перевод не рентабелен, соотношение выделяемых на исследования в данной области не идут ни в какое сравнение с качеством получаемых программ.
Однако десять лет спустя наметился новый всплеск в разработке вычислительной техники, а с ней и в области машинного перевода. Появились микрокомпьютеры, увеличился объем оперативной памяти, активно развивались электронные сети. Ученые получили новые возможности и готовы были добиваться новых вершин в изучении электронного перевода.
За период с 1978 по 1993 год на развитие данной области науки в США было потрачено 20 млн долларов, в Европе 70 млн, а в Японии – 200 млн! Это говорит о стремительном возрождении интереса к подобным разработкам.
На свет появилась технология Translation Memory, совершив переворот в понимании электронного перевода. Она работала по принципу накопления информации: в процессе перевода сохранялся исходный сегмент и его перевод; таким образом, формировалась лингвистическая база данных, из которой впоследствии вызывалась информация, встреченная в тексте повторно. Технология Translation Memory используется во всех современных электронных переводчиках.
1990-е годы – эпоха бурного развития сети Интернет, длящаяся до сих пор. Сейчас у нас есть возможность переводить тексты, даже не имея электронного переводчика на своем компьютере – мы можем делать это через Интернет в режиме on-line.
Современные программы по машинному переводу достигли такого уровня, что они способны автоматически определять тематику текста по ключевым словам, учитывать зарезервированные слова (имена и термины, которые отображаются в виде транслитерации), дают возможность пользователю подключать препроцессоры (оставлять некоторые элементы без перевода: адреса сайтов и т.п.). Пользователь может сам отредактировать словарную статью и определить иерархию подключенных словарей.
Однако необходимо всегда помнить, что любой, даже самый высококачественный электронный переводчик не в силах заменить человека. Чтобы получить понятный, красивый художественный перевод, мы все равно вынуждены исправлять работу машины. Не стоит забывать, что электронный переводчик – всего лишь маленькая помощь человеку.
