Посткоординированные ИПЯ
Посткоординированные ИПЯ — ИПЯ, словарный состав которых не связан грамматикой заранее и такая связь осуществляется в процессе индексирования и (или) поиска. Типичными представителями ИПЯ данного типа являются дескрипторные ИПЯ. В основе их создания лежит гипотеза о том, что основным носителем содержания в любом тексте являются ключевые слова. Под ключевыми словами понимают все члены предложения и части речи, не являющиеся предлогами, союзами, междометиями и служащие для обозначений объектов и действий над ними. Ключевые слова, на множестве которых устранена синонимия, называют дескрипторами. Поисковый образ документа/запроса представляет собой, в простейшем виде, перечень дескрипторов (связанных или в простейшем случае несвязанных грамматическими средствами), отражающих наиболее существенные аспекты его темы. Перечень всех дескрипторов ИПЯ, т. е. его лексика, обычно представлена в словаре. Простейшим слова рем является алфавитный дескрипторный словарь, где лексические единицы упорядочены по алфавиту. Наиболее совершенным является словарь типа информационно-поисковый тезаурус. Он содержит не только упорядоченный перечень дескрипторов; в нем зафиксированы парадигматические связи между терминами, приведены ключевые слова-синонимы. Поэтому каждый дескриптор представлен отдельной статьей, включающей собственно дескриптор (заглавный дескриптор), а также дескрипторы и ключевые слова, связанные с заглавным дескриптором по смыслу.
В дескрипторной статье лексические единицы располагаются в определенном порядке:
— заглавный дескриптор;
— ключевые слова-синонимы;
— вышестоящие дескрипторы (родовые понятия);
— нижестоящие дескрипторы (видовые понятия);
— дескрипторы, связанные с заглавными ассоциативными отношениями.
Ниже приведен пример дескрипторной статьи (дескрипторы выделены прописными буквами, а ключевые слова — строчными):
ДОКУМЕНТАЛЬНЫЕ ИПС с документальные информационно-поисковые системы в ИПС н БИБЛИОГРАФИЧЕСКИЕ ИПС
ДОКУМЕНТАЛЬНЫЕ АИПС а ДОКУМЕНТАЛЬНАЯ ИНФОРМАЦИЯ
ДОКУМЕНТАЛЬНЫЙ ПОИСК
Наличие указанной информации в словаре позволяет более полно и более точно передать содержание темы, т. е. повысить качество индексирования.
В структуру тезауруса обычно входит, помимо основной лексико-семантической части, ряд дополнительных указателей, которые упрощают работу с основной частью, делают ее более эффективной.
Достоинством посткоординированных ИПЯ является то, что они обеспечивают возможность поиска документов по любому, заранее не заданному сочетанию признаков.
Объем и форма представления данных о документах могут быть различными.
Наиболее лаконичная форма присуща библиографическим БД, в которых документ представлен только его описанием, содержащим некоторый необходимый минимум сведений о нем. Заметим, что состав библиографических данных существенно зависит от вида документа. Так, например, для управленческого документа в состав такого описания должны быть включены те реквизиты заголовочной части документа, которые обеспечивают безошибочную и быструю его идентификацию
Дата добавления: 2017-10-09; просмотров: 915;