Автоматизированный перевод
Помимо автоматизированного информационного обслуживания, ЭВМ предоставляет в распоряжение абонентов системы искусственного интеллекта. Системы искусственного интеллекта разрабатывают в целях автоматизации деятельности человека при создании и осмыслении письменных текстов. Они делятся на: 1) системы синтеза и анализа устной речи; 2) системы записи, редактирования и автоматизированного составления текстов; 3) системы автоматического проектирования (САПР) и системы записи музыки и изображений; 4) калькуляции; 5) моделирующие системы; 6) экспертные системы; 7) игровые и обучающие системы; 8) системы автоматизированного, или машинного, перевода. Автоматизированный перевод является центральной системой искусственного интеллекта.
Машинный перевод сочетает в себе теорию перевода как особую филологическую теорию и собственно лингвистическую теорию языковых соответствий двух и более языков. По соотношению систематологических и математических средств машинный перевод близок к АСУ. Машинный перевод - это перевод текста с одного языка на другой, выполняемый с помощью ЭВМ по заранее составленному алгоритму. Под алгоритмом понимается определенная последовательность формальных операций, выполнение которых идет от фразы на исходном языке к ее переводному эквиваленту на выходном языке... Алгоритмы представляются в ЭВМ в виде программы, а вспомогательная информация - в форме машинных словарей, таблиц, списков*.
*(См.: Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский. М., 1976. Ч. 1.)
При машинном переводе анализируется исходный текст, определяются роль слова в предложении, его значение, а затем подбирается соответствующий эквивалент в языке перевода и формулируется фраза на языке перевода. Грамматический анализ и синтез, достаточно сложные сами по себе, занимают в машинном переводе относительно небольшое место. Основной объем информации содержит словарь (названный контекстологическим словарем), который по принципам составления и характеру информации о слове не похож на другие словари.
Автоматизированный перевод используется только в некоторых видах словесности. Он целесообразен для оперативного перевода документов, текстов массовой информации, научной и особенно технической литературы. В этих областях необходимо делать перевод оперативно, терминологически строго, с высокими требованиями к стандартизации приемов перевода. (Разумеется, процесс перевода не может вестись без контроля редактора, что является общим требованием к любому переводу.)
Перевод только некоторых текстов предъявляет особые требования к словарю. Дело в том, что в толковых словарях дается общее языковое значение слова, в отраслевых словарях представлены только термины, в словарях информатики - также термины, и притом в особой систематизации, пригодной для данной системы информационного поиска или автоматизированного управления. Реальные же тексты документов, научно-технической литературы и массовой информации составлены преимущественно из общелитературных слов и лишь в небольшой части из терминов; причем значение слов связано с употреблением их именно в данном виде словесности. Это значение оказывается вообще не описанным никакими словарями, кроме контекстологического.
Контекстологический словарь, таким образом, есть словарь текстов определенного вида. Он дву- или многоязычен. Главным предметом такого словаря фактически оказывается межъязыковая омонимия или полисемия слов определенного вида словесности. Словарь составляется на основе материала переводимых текстов (изучаются слова-оригиналы и переводы), значения слов определяются формальными приметами контекста.
"Теоретической основой контекстологического словаря является теория детерминант. Согласно этой теории каждое значение (перевод) многозначного слова... детерминируется в контексте другими словами, с которыми данное слово сочетается, или определенными грамматическими признаками. Эти слова, а также классы или группы слов и грамматические признаки называются детерминантами"*. Такой словарь представляет собой собрание слов, информация о значении которых дается в терминах тех алгоритмов, которые к данному слову будут применены в автоматическом переводе.
*(Марчук Ю.Н. Контекстологический и словарь... С. 4-5.)
Оставляя в стороне характер алгоритмов, необходимо указать на следующие особенности контекстологичекого словаря. Словарь дает максимально полные сведения о применении слов в данном виде словесности:
1) варианты перевода в данном виде словесности;
2) возможные грамматические связи слов в предложении; 3) детализации значения применительно к данному виду словесности; 4) смысловые связи слов по смысловым группам; 5) вхождение во фразеологизмы; 6) сведения о валентностях слов, характерных для данного вида словесности.
Для того, чтобы эти стороны значения и употребления слов можно было отразить в словаре, потребовалась классификация слов по частным лексико-грамматическим группам внутри частей речи (как в античной грамматике: имя собственное, соименное, наименное, родовое, отчество и т.д.). Разумеется, в каждом виде словесности частные лексико-грамматические группы слов будут свои. Так, для общественно-политической лексики в текстах массовой коммуникации пришлось определить, исходя из значения и сочетаемости слов, следующие группы существительных: одушевленные, личные имена, географические названия, местоимения-существительные, денежные единицы, названия организаций, названия партий, названия документов, названия стран, названия воинских единиц, названия должностей, названия изданий, названия металлов, названия собраний людей, названия пищи, количественные числительные и единицы измерения. Лексико-грамматические группы слов, различаемые по значению и сочетаемости, оказались тематически ориентированными.
Особенно трудно группировать глаголы, так как эта часть речи семантически дифференцируется особым образом; причем различия мало заметны в отдельном слове, но весьма значимы для смысла целого текста. Например, в научном тексте отмечено шесть смысловых лексико-грамматических разрядов глаголов.
Разработка контекстологических словарей выходит за пределы интересов одного машинного перевода. Они могут использоваться при изучении языка специальности, в неавтоматическом переводе и в исследованиях по динамике языка и стиля.
Дата добавления: 2017-11-04; просмотров: 496;