Информационно-поисковые системы.
Информационно-поисковые системы.
Введение.
Последние три десятилетия в области разработки информационных систем сформировалась новая информационная технология - технология БД. Она включает в себя методы, средства, способы и практические рекомендации применения БД в качестве основного компонента в различных информационных системах (ИС). Существуют разновидности информационных систем, использующие технологию БД: документальные (ДС) и фактографические (ФС).
Документальные системы предназначены для работы с документами на естественном языке: книги, тезисы, статьи... Наиболее распространенным видом ДС явлюется информационно-поисковые системы (ИПС), которые предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят: программные средства, поисковый массив документов и средства поддержки информационного языка этой системы.
Программные средства ИПС служат для организации ввода и хранения информации, а также обр аботки пользовательских запросов на поиск документов. Поисковый массив документов обычно называютБД, и он не содержит текстов, а включает только библиографические сведения: рефераты и аннотации. При выполнении поиска документа используютпоисковые образы, отражающие содержание документа. Эти образы строятся путем индексирования документов и являются ключевыми словами поискового документа.
Информационные языки (ИЯ) в ИПС строятся на базе ограниченных естественных языков. Это приводит к неоднозначной интерпретации смысла запросов. Для решения этой проблемы вводятся словари - тезаурусы. Они описывают лексические единицы языка и смысловые связи между ними. Наибольшим распространением для реализации таких ИЯ получили языкидескрипторного типа, которые в качестве лексических единиц или дескрипторов используют слова или словосочетания, соответствующие основным понятиям предметной области. Дескрипторы заносятся в тезаурус ИПС.
Информационный запрос формируется на таком ИЯ, затем преобразуется впоисковый образ запроса (ПОЗ), ПОЗ сопоставляется с поисковыми образами документов по критерию смыслового соответствия, и в результате выдаются все документы, которые оказались релевантными этому запросу.
Характерной особенностью фактографических систем является то, что они работают не с текстом, а с фактическими сведениями, которые представлены в виде записей.Основные компоненты ФС - это сами БД и системы управления БД (СУБД). На базе ФС создаются справочники, системы анализа и управления предприятиями, бухгалтерские системы.
В дальнейшем будем рассматривать фактографические системы.
СУБД должна предоставлять доступ к данным любым категориям пользователей, включая и тех, которые практически не имеют или не хотят иметь представления:
- о физическом размещении в памяти данных и их описаний;
- о механизмах поиска запрашиваемых данных;
- о проблемах, возникающих при одновременном запросе одних и тех же данных многими пользователями (прикладными программами);
- о способах обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа;
- о поддержании баз данных в актуальном состоянии и множестве других функций СУБД.
Информационно-поисковые системы.
Поиск информации является одной из основных составляющих человеческой деятельности, с ним мы сталкиваемся ежедневно: изучая театральную афишу, чтобы выбрать интересный спектакль, подбирая в расписании поездов удобную электричку, листая телефонную книгу. Человеку, в силу своей профессии или увлечений часто сталкивающемуся с подбором и поиском какой-либо тематической информации, рано или поздно (с возрастанием ее объема) приходится применять некоторые принципы систематизации и классификации имеющихся данных, обеспечивающие более удобный и эффективный поиск. Так, в библиотеках составляют картотеку: сведения о книге по определенной схеме записываются на карточку, туда же помещается шифр - несколько букв и цифр, по которым можно определить местоположение книги (хранилище, стеллаж, полку); карточки расставляются в алфавитном или тематическом порядке. Применение ЭВМ дает более широкие возможности для работы с большими массивами информации.
Дата добавления: 2016-11-02; просмотров: 953;