Основные задачи технологии текстового поиска
Современные технологии текстового поиска охватывают большой спектр проблем:
• теория информационного поиска;
• методы удовлетворения потребностей пользователей в:
-сборе информации;
-организации информации;
-хранении информации;
-поиске информации;
-распространении информации;
· обеспечение интерфейсов между пользователем и средствами управления ресурсами неструктурированной или слабоструктурированной информации, поддерживаемой в компьютерной среде.
Значительное место в технологиях текстового поиска занимает обработка естественного языка. Под ней понимается компьютерное решение задач, связанных с пониманием, анализом, выполнением различных операций над текстами на естественном языке, а также с их генерацией. Этот класс задач относится к области искусственного интеллекта.
В середине 1990-х гг. во многих странах мира развернулись работы, связанные с созданием электронных библиотек. Они в значительной мере оживили интерес к проблемам текстового поиска. Возникли такие совершенно новые направления, как:
• обнаружение информации в глобальной компьютерной сети;
• текстовый поиск в Web;
• мультиязыковой поиск.
Активное развитие технологий текстового поиска стимулировало создание поисковых систем более общего класса, которые имеют дело не только с текстовыми документами, но и с информацией, представленной в различных иных средах. В таких мультимедийных системах содержание объектов поиска - документов - представляет собой сочетание:
• текстовых элементов;
• статических изображений;
• музыкальных произведений;
• мультфильмов;
• видеоклипов и т. п.
Системы текстового поиска оказали значительное влияние на формирование специфического класса информационных систем, называемых системами управления документами, которые широко используются в настоящее время во многих крупных коммерческих компаниях и в других организациях.
В таких системах важная роль отводится не только методам обработки естественного языка, созданным для работы с текстовыми документами, но и организации групповой разработки документов, их хранения, распространения, а также технологиям текстового поиска.
Дата добавления: 2015-05-08; просмотров: 874;