Компьютерные переводческие программы

Компьютерный перевод — процесс перевода текстов с одного естественного языка на другой при помощи специальных компьютерных программ. Так же называется направление научных исследований, связанных с построением подобных систем.

Термины «машинный» и «автоматизированный» перевод первоначально соответствовали процессам создания универсальных переводческих программ, однако в ходе развития этой области и осознания проблем, связанных с реализацией данной цели, они обрели совсем другое значение — программа является чисто инструментальной - помогает человеку переводить тексты. Отсюда и новое название данных программ CAT - computer-aided/assisted translation.

Компьютерный перевод предполагает такие формы взаимодействия:

· Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

· Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.

Компьютерный перевод технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в определенной редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать.

Большинство средств компьютерного перевода построены на основе концепции памяти перевода (translation memory) — простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому.

Несмотря на то, что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) — память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Примерами таких программ компьютерного переводу могут послужить:

· ABBY Lingvo — семейство электронных словарей. Объём словарных статей составляет более 8,7 млн. В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка. Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте ассоциации лексикографов Lingvo. [https://ru.wikipedia.org/wiki/ABBYY_Lingvo]

· Trados — система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, Память переводов). Система Trados состоит из модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT).

Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае различного рода инструкций для пользователей, технических описаний и т. п. [https://ru.wikipedia.org/wiki/Trados]

На основе новой технологии компания ПРОМТ выпускает линейку программных продуктов PROMT XT:

1. PROMT XT Office — полное решение решение для обработки мультиязычных документов в современном офисе. Стоимость продукта в базовой комплектации составляет 300 долларов.

2. PROMT XT Standard — система для оперативного перевода документов и электронной почты. Стоимость продукта в базовой комплектации составляет 99 долларов.

3. PROMT Internet XT — программа для онлайнового перевода веб-сайтов и поисковых запросов в Интернете. Стоимость продукта в комплектации Premium составляет 49 долларов.

«Выпуск новой линейки продуктов PROMT XT — это большая радость для нас. Нам удалось сделать серьезный рывок в развитии технологии автоматизированного перевода. Новая технология PROMT XT — предмет нашей гордости, является на сегодняшний день абсолютным мировым лидером по качеству перевода» — заявила Светлана Соколова, президент компании ПРОМТ. «На основе новой технологии работают все три продукта новой линейки PROMT XT. Хотелось бы подчеркнуть, что данная линейка продуктов ориентирована на российский рынок. Мы планируем также выпустить всю линейку PROMT XT в иностранной локализации для всех 17 направлений перевода, которые предлагает на сегодняшний день наша компания. Кроме того, в наших ближайших планах — выпуск профессиональной версии PROMT XT Professional и модернизация на основе новой технологии продуктов корпоративной линейки, включая сетевую версию.»

О компании ПРОМТ

Компания ПРОМТ основана в 1991 году. Компания занимается исследованиями в области прикладной лингвистики, разработкой технологий и систем машинного перевода для европейских языков. ПРОМТ ставит своей целью создание программных средств, позволяющих свободно общаться на разных языках. Программные продукты компании распространяются по всему миру под торговыми марками PROMT, REVERSO, PROMT Internet, WebView.
Интернет-решения компании ПРОМТ работают на крупнейших мировых и российских порталах: Lycos (Lycos.ru, Lycos.es, Lycos.de), Voila, Caramail, e-lingo, Transparent Language, InfiniT. Стратегическим партнером компании ПРОМТ является компания Softissimo, SARL (Франция).

Оцените качество перевода на сайте бесплатного переводчика Translate.ru.

Получите скидку в Интернет-магазине компании ПРОМТ: http://www.e-promt.ru/

 

--------------------------------------------------------------------------------

ПРОДУКТ ПРОИЗВОДИТЕЛЬ ПРИМЕЧАНИЕ

Deja vu Atril Это сравнительно недорогой и самый многофункциональный продукт. Использующие его переводчики подают заявки на включение в него тех или иных полезных функций и эти заявки оперативно выполняются.

Translation Manager IBM По отзывам специалистов, это самая эффективная, хотя и не очень дружественная к пользователю программа.

SDLX SDL Недавно появившийся продукт, который быстро совершенствуется.

Transit Star Лучше других продуктов приспособлен к работе с кириллицей. Немаловажное достоинство — наличие российского дистрибьютора.

Translation’s Workbench Trados В этой программе в качестве служебного редактора используется MS Word. Учитывая так же, что Microsoft приобрела акции компании Trados и планирует использовать ее программное обеспечение в качестве внутреннего хранилища локализованных компонентов, у программы Translation’s Workbench (именуемой в просторечии Trados) есть хорошие шансы стать международным стандартом.

 

--------------------------------------------------------------------------------

Разумеется, у переводческих накопителей есть и свои недостатки. Помимо уже упоминавшихся ограничений на переводимые тексты, это прежде всего высокая цена большинства TM-продуктов (тысяча и более долларов), а также отсутствие стандарта. Все чаще, приглашая на работу переводчиков, заграничные заказчики оговаривают в качестве обязательного условия наличие у претендента той или иной TM-программы. Однако в объявлениях встречаются разные названия, поэтому, купив продукт, ориентированный на одного работодателя, вы можете не удовлетворять требованиям другого. Причем на овладение каждым из продуктов требуется потратить не только деньги, но и время.

 

При оценке затрат на эти программы следует учитывать, что переводческие пакеты продаются в виде набора модулей (утилиты создания и ведения базы данных, редактор, фильтры для работы с различными текстовыми процессорами и т.п.), часть из которых могут быть лично вам не нужны. Поэтому нужно внимательно следить за тем, что включено в базовый комплект, а за что вам придется платить отдельно.

 

Аппаратные аппетиты рассматриваемого класса продуктов вполне предсказуемы (чем всего больше, тем — как всегда — лучше). Причем, кроме всего прочего, TM-продукты предъявляют повышенные требования и к монитору. Поскольку друзья переводчика являются многооконными программами, для работы с ними желательно иметь большой монитор. Специалисты советуют не жалеть день-ги хотя бы на 17-дюймовый.

 

В мою задачу не входит подробное сравнение продуктов различных фирм — я только хотела обратить внимание читателей на новый пласт программного обеспечения. Те же, кто хотят подробнее ознакомиться со спецификой различных программ, могут посетить сайты ведущих производителей TM-продуктов.

 

Не могу удержаться и не упомянуть еще один продукт — WordFisher. Его нельзя отнести к категории широко распространенных, и я ни разу не видела, чтобы заказчики требовали его наличия. Однако у этой программы, составленной венгерским переводчиком Тибором Кёрнеи, есть два существенных достоинства: простота и дешевизна. WordFisher является комплектом макрокоманд для перевода документов в MS Word и распространяется как shareware по цене всего 30 долларов.

 

И последняя «информация к размышлению»:

Опрос, проведенный Международным институтом переводчиков, показал, что пока только около 15% переводчиков используют в своей работе переводческие накопители; однако среди переводчиков с высокими доходами доля пользователей TM-продуктов составляет 40–50%.

НЕДАВНО (см. Результат меняется от перестановки, или Что такое хорошо и что такое плохо?) была опубликована статья Н. Шаховой, посвященная TM-программам, или "накопителям переводчика" (возможно, более удачным является вариант "накопители переводов"), — теме, очень редко затрагиваемой на страницах компьютерных изданий. Продолжая эту тему, предлагаем вам обзор TM-программ, доступных в настоящее время на рынке. Напомним, что речь идет об интерактивных инструментах, позволяющих переводчику накапливать в специальной базе данных (БД) эквивалентные текстовые фрагменты на двух языках, чтобы в дальнейшем быстро находить образцы для перевода новых текстов. В качестве фрагментов могут выступать слова, словосочетания и целые фразы. При работе над текстами, близкими по жанру и тематике, такие инструменты по мере пополнения БД все больше упрощают и ускоряют перевод.

Мастер сопоставления параллельных текстов в DejaVu

 

Итак, основные функции TM-программы — пополнение БД парных фрагментов и анализ новых текстов для их поблочного перевода. Программа сегментирует переводимый текст (выделяет фразы или обособленные обороты) и сличает полученные сочетания с элементами БД, в случае совпадения предлагая переводчику подставить готовый перевод фрагмента в конечный текст (или же подставляя его автоматически). Во многих программах предусмотрен "нечеткий" (fuzzy) поиск.

Стандартной для этого класса продуктов стала возможность вести словари терминов и непереводимых имен, что очень важно для работы с текстами из узкой предметной области. Обычно ассортимент поддерживаемых TM-системами языковых пар довольно обширен; в последнее время все большее число разработчиков декларируют поддержку "двунаправленных языков" (bi-directional languages). Термин этот представляется не совсем корректным. Правильнее было бы в данном случае говорить не о языках, а скорее о текстах, содержащих фрагменты на языках с разным направлением письма (например, о смеси английского с арабским или ивритом).

Сама по себе идеология накопителей переводов не подразумевает использования развитых лингвистических технологий, однако в наиболее совершенных TM-программах имеются встроенные морфологические модули и средства проверки орфографии для нескольких языков, а также относительно интеллектуальные средства сопоставления (aligning) параллельных текстов с целью автоматического формирования парных фрагментов на двух языках. Процедуры сопоставления в разных программах различны, но, как правило, они включают элементы диалога и иногда требуют модификации одного из параллельных текстов (особенно если имеет место вольный перевод).

Большинство программ совместимы с популярными текстовыми процессорами и издательскими пакетами, с распространенными форматами типа RTF, PDF и HTML. Почти все TM-системы позволяют для удобства группировать рабочие файлы, БД и терминологические словари в отдельные "проекты".

Накопители переводов — дорогое профессиональное средство. Как правило, разработчики предлагают как корпоративные, сетевые, так и индивидуальные (freelance) версии своих TM-систем. В первом случае (особенно при поставке многофункциональных инструментальных комплексов) цена может превышать 1000 долл., во втором она составляет несколько сот долларов. Программы нередко защищаются с помощью аппаратных ключей.

Панель SDLX обеспечивает удобный доступ ко всем функциям

 

Trados 3.0

Одним из пионеров и лидеров рынка TM-программ является многонациональная компания Trados (http://www.trados.com/), предлагающая пакет Trados Translation Solution — линейку инструментов автоматизации перевода. Пакет поставляется в корпоративном (Team Edition) и однопользовательском (Freelance Edition, цена около 1 тыс. долл.) вариантах. Основной модуль пакета, Translator’s Workbench, предназначен для работы с базой данных TM, а также обеспечивает функции преобразования дат и единиц измерения, а при работе со сложными документами — еще и манипуляции со сносками, указателями и т. п. Модуль MultiTerm служит для ведения многоязычной БД терминов. Модуль WinAlign позволяет в полуавтоматическом режиме пополнять БД накопителя путем анализа параллельных текстов на двух языках. Кроме того, в пакет входит средство для перевода документов, содержащих разметку SGML и HTML, — TagEditor.

Версия Trados 3.0 совместима с Windows 2000, Office 2000 (Word 2000, PowerPoint 2000), издательскими пакетами FrameMaker, Interleaf, PageMaker, QuarkXPress и Ventura, языками XML, SGML и HTML. При инсталляции Trados встраивает свой инструментарий в панель инструментов и меню Word. Тесная интеграция с Office позволяет при переводе текстов в Word автоматически пополнять базу данных TM.

Программа автоматически анализирует тексты, разбивая их на сегменты, которые можно затем экспортировать в базу данных TM. Ограничителями сегментов по умолчанию служат табуляторы, маркеры абзацев и некоторые знаки препинания. Сегменты, не имеющие аналогов в БД, можно либо включить туда, снабдив переводом, либо поместить в словарь терминов. После сегментации текста функция автоматизированного перевода предлагает пользователю фрагменты для поблочного формирования перевода.








Дата добавления: 2016-01-26; просмотров: 2334;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.012 сек.