Автоматизированный перевод

Помимо автоматизированного информационного обслуживания, ЭВМ предоставляет в распоряжение абонентов системы искусственного интеллекта. Системы искусственного интеллекта разрабатывают в целях автоматизации деятельности человека при создании и осмыслении письменных текстов. Они делятся на: 1) системы синтеза и анализа устной речи; 2) системы записи, редактирования и автоматизированного составления текстов; 3) системы автоматического проектирования (САПР) и системы записи музыки и изображений; 4) калькуляции; 5) моделирующие системы; 6) экспертные системы; 7) игровые и обучающие системы; 8) системы автоматизированного, или машинного, перевода. Автоматизированный перевод является центральной системой искусственного интеллекта.

Машинный перевод сочетает в себе теорию перевода как особую филологическую теорию и собственно лингвистическую теорию языковых соответствий двух и более языков. По соотношению систематологических и математических средств машинный перевод близок к АСУ. Машинный перевод - это перевод текста с одного языка на другой, выполняемый с помощью ЭВМ по заранее составленному алгоритму. Под алгоритмом понимается определенная последовательность формальных операций, выполнение которых идет от фразы на исходном языке к ее переводному эквиваленту на выходном языке... Алгоритмы представляются в ЭВМ в виде программы, а вспомогательная информация - в форме машинных словарей, таблиц, списков*.

*(См.: Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский. М., 1976. Ч. 1.)

При машинном переводе анализируется исходный текст, определяются роль слова в предложении, его значение, а затем подбирается соответствующий эквивалент в языке перевода и формулируется фраза на языке перевода. Грамматический анализ и синтез, достаточно сложные сами по себе, занимают в машинном переводе относительно небольшое место. Основной объем информации содержит словарь (названный контекстологическим словарем), который по принципам составления и характеру информации о слове не похож на другие словари.

Автоматизированный перевод используется только в некоторых видах словесности. Он целесообразен для оперативного перевода документов, текстов массовой информации, научной и особенно технической литературы. В этих областях необходимо делать перевод оперативно, терминологически строго, с высокими требованиями к стандартизации приемов перевода. (Разумеется, процесс перевода не может вестись без контроля редактора, что является общим требованием к любому переводу.)

Перевод только некоторых текстов предъявляет особые требования к словарю. Дело в том, что в толковых словарях дается общее языковое значение слова, в отраслевых словарях представлены только термины, в словарях информатики - также термины, и притом в особой систематизации, пригодной для данной системы информационного поиска или автоматизированного управления. Реальные же тексты документов, научно-технической литературы и массовой информации составлены преимущественно из общелитературных слов и лишь в небольшой части из терминов; причем значение слов связано с употреблением их именно в данном виде словесности. Это значение оказывается вообще не описанным никакими словарями, кроме контекстологического.

Контекстологический словарь, таким образом, есть словарь текстов определенного вида. Он дву- или многоязычен. Главным предметом такого словаря фактически оказывается межъязыковая омонимия или полисемия слов определенного вида словесности. Словарь составляется на основе материала переводимых текстов (изучаются слова-оригиналы и переводы), значения слов определяются формальными приметами контекста.

"Теоретической основой контекстологического словаря является теория детерминант. Согласно этой теории каждое значение (перевод) многозначного слова... детерминируется в контексте другими словами, с которыми данное слово сочетается, или определенными грамматическими признаками. Эти слова, а также классы или группы слов и грамматические признаки называются детерминантами"*. Такой словарь представляет собой собрание слов, информация о значении которых дается в терминах тех алгоритмов, которые к данному слову будут применены в автоматическом переводе.

*(Марчук Ю.Н. Контекстологический и словарь... С. 4-5.)

Оставляя в стороне характер алгоритмов, необходимо указать на следующие особенности контекстологичекого словаря. Словарь дает максимально полные сведения о применении слов в данном виде словесности:

1) варианты перевода в данном виде словесности;

2) возможные грамматические связи слов в предложении; 3) детализации значения применительно к данному виду словесности; 4) смысловые связи слов по смысловым группам; 5) вхождение во фразеологизмы; 6) сведения о валентностях слов, характерных для данного вида словесности.

Для того, чтобы эти стороны значения и употребления слов можно было отразить в словаре, потребовалась классификация слов по частным лексико-грамматическим группам внутри частей речи (как в античной грамматике: имя собственное, соименное, наименное, родовое, отчество и т.д.). Разумеется, в каждом виде словесности частные лексико-грамматические группы слов будут свои. Так, для общественно-политической лексики в текстах массовой коммуникации пришлось определить, исходя из значения и сочетаемости слов, следующие группы существительных: одушевленные, личные имена, географические названия, местоимения-существительные, денежные единицы, названия организаций, названия партий, названия документов, названия стран, названия воинских единиц, названия должностей, названия изданий, названия металлов, названия собраний людей, названия пищи, количественные числительные и единицы измерения. Лексико-грамматические группы слов, различаемые по значению и сочетаемости, оказались тематически ориентированными.

Особенно трудно группировать глаголы, так как эта часть речи семантически дифференцируется особым образом; причем различия мало заметны в отдельном слове, но весьма значимы для смысла целого текста. Например, в научном тексте отмечено шесть смысловых лексико-грамматических разрядов глаголов.

Разработка контекстологических словарей выходит за пределы интересов одного машинного перевода. Они могут использоваться при изучении языка специальности, в неавтоматическом переводе и в исследованиях по динамике языка и стиля.

<== предыдущая лекция | следующая лекция ==>
Автоматизированные системы управления | Некоторые языковедческие проблемы, связанные с информационным обслуживанием


Дата добавления: 2017-11-04; просмотров: 14; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию, введите в поисковое поле ключевые слова и изучайте нужную вам информацию.

Поделитесь с друзьями:

Если вам понравился данный ресурс вы можете рассказать о нем друзьям. Сделать это можно через соц. кнопки выше.
helpiks.org - Хелпикс.Орг - 2014-2017 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.