Гипертекстовые системы
Гипертекст – это форма организации текстового материала, при которой его элементы представлены не в линейной последовательности, а как система явно указанных возможных переходов, связей между ними. Следуя по этим связям, можно читать материал в любом порядке, образуя разные линейные тексты. Термин предложен в 1965 г. Тедом Нельсоном. Общеизвестным и ярко выраженным примером гипертекста служат веб-страницы – документы HTML, размещённые в Сети. В более широком понимании термина, гипертекстом является любая повесть, словарь или энциклопедия, где встречаются отсылки к другим частям данного текста, имеющие отношение к данному термину. В компьютерной терминологии гипертекст – текст, сформированный с помощью языка разметки, потенциально содержащий в себе гиперссылки.
Одним из примеров гипертекстовых систем являются системы машинного перевода.
Системы машинного перевода – программы, осуществляющие перевод текста с одного естественного языка на другой. Можно выделить:
– электронные словари, позволяют быстро найти нужное слово, часто с учётом морфологии и возможностью поиска словосочетаний, а также с возможностью изменения направления перевода (например, англо-русский или русско-английский). Как таковые представляют собой базу данных со словарными статьями, снабженную алгоритмом морфологического анализа;
– системы автоматизированного (полумашинного) перевода, при использовании такой системы сам процесс перевода осуществляется человеком, а программа контекстно предлагает переводы соответствующих слов, словосочетаний, а также производит анализ получаемого перевода на уровне доступных ей алгоритмов с целью недопущения явно некорректных синтаксических конструкций;
– системы контролируемого перевода построены на основе контролируемого языка на основе базы знаний. Они предусматривают определённые ограничения лексики, грамматики, семантики. Контролируемый входной язык используется для упрощения выражений исходного текста, чтобы повысить качество перевода. Такие системы приводят к наиболее качественному результату, однако требуют работы специалиста;
– системы машинного (автоматического) перевода полностью переводят текст с одного языка на другой без участия человека.
Существуют два принципиально разных подхода к построению алгоритмов машинного перевода:
– алгоритмический, основанный на формальных правилах построения предложений в разных языках. Сложность состоит в том, что для естественного языка такие правила формулируются с очень широкими допущениями, зачастую приводящими к большой трудности логического опознания смысла текста. При этом чем больше текст, тем большую сложность для перевода он представляет;
– статистический, основанный на сравнении больших объёмов языковых пар. Языковые пары – небольшие тексты, содержащие завершенные предложения на одном языке и соответствующие им предложения на втором. Чем больше языковых пар имеется в распоряжении и чем точнее они соответствуют друг другу, тем лучше результат перевода. Сегодня использование систем, реализующих такой подход, неразрывно связано с постоянным доступом к интернет-ресурсам, на которых имеются базы данных с языковыми парами.
Следует отметить, что в большинстве случаев прямой автоматический перевод между двумя произвольными языками недоступен. Однако он реализуется двухэтапно: перевод с исходного языка на английский, перевод с английского языка на целевой. Очевидно, что результат подобного перевода должен быть рассмотрен крайне критически.
Дата добавления: 2019-10-16; просмотров: 883;