Синтаксический и семантический анализ
Синтаксический анализ устанавливает важнейшие параметры информационных потоков, включая необходимые количественные характеристики, для выбора комплекса технических и программных средств сбора, регистрации, передачи, обработки, накопления и хранения информации. Семантический анализ позволяет изучить информацию с точки зрения смыслового содержания ее отдельных элементов, находить способы языкового соответствия (язык человека, язык ЭВМ) при однозначном распознавании вводимых в систему сообщений.
Анализ зарегистрированной в цифровой форме информации естественного языка с семантической точки зрения является вопросом значительной сложности, и он лежит в основе таких приложений, как автоматические ответы на вопросы из базы данных или восстановление информации посредством неограниченных запросов естественного языка.
Семантический анализ призван проводить смысловой анализ информации на основе изучения значений единиц языка: выявление синонимов, омонимов, антонимов, многозначных слов, анализ изменения значений единиц языка при их различных сочетаниях.
С середины 1960-х г. проводились эксперименты с методикой, которая назначала каждому документу одну или большее количество «ролей» (функций) и одну или большее количество «связей» (указатели на другие документы, имеющие ту же самую или подобную роль). Методика показала потенциальную способность для оценки прагматической меры подобия. Приблизительно через 20 лет подобная техника стала популярной под именем «гипертекст». В этой методике документы, которые человек или группа людей рассматривает как связанные (через понятия, иерархию, опыт, повод или другие характеристики), соотносятся через «гиперссылки» (hyperlinks), намечая пути ассоциации человеческих идей. Объекты, связанные таким образом, могут быть не только текстом; речь и музыка, графика и изображения, мультипликация и видео могут быть связаны в гипермедийные базы данных. Объекты хранятся с их гиперссылками, и пользователь может легко путешествовать по сети ассоциаций, щелкая мышью на ряде входов на компьютерном экране.
Дата добавления: 2014-11-30; просмотров: 1024;