Нормирование в языках библиографического описания
Как уже говорилось, тезаурус представляет собой средство нормирования лексики и объединяет в себе два инструмента: словарь индексирования (дескрипторный словарь) и словарь базисных отношений между лексемами. Применение этих инструментов называют лексическим контролем. В информационно-библиотечных системах для этого используются термины “авторитетный файл” (как словарь индексирования) и “авторитетный контроль” (в качестве аналога понятия “лексический контроль”). Эти термины представляют собой кальку с английского (authority file, authority control). В русской научной литературе также можно встретить термины “файл нормативных/справочных записей” и “нормирование”, что используется реже, хотя и лучше отражает существо дела. Суть же дела всегда одна и та же: при описании документа и его индексировании встают проблемы нормализации лексических единиц ИПЯ и элементов библиографических данных, проблемы написания собственных имен, названий, аббревиатур, и т.д. Решение этих проблем и составляет суть авторитетного контроля. Лингвистическое обеспечение любой системы должно обеспечивать унификацию языковых средств, т. е. ограничение или учет вариаций выражения при описании и индексировании документов и формулировке запросов пользователей. Это и есть основная задача лексического (авторитетного) контроля.
Авторитетный контроль как отдельная технология стал развиваться с появлением автоматизированных систем, поэтому его основные понятия и сфера применения связаны с машинными библиографическими форматами и автоматизированными библиотечными системами. Основная единица авторитетного файла – «авторитетная запись». Это запись, основной (заглавный) элемент которой представляет собой унифицированную формулировку написания собственного имени, названия постоянного или временного коллектива, названия произведения или предмета (темы), используемых в качестве предметной рубрики в электронном каталоге.
Помимо основного элемента авторитетная запись может содержать:
методические замечания по использованию авторитетной записи
другие варианты написаний основного элемента
систему ссылок, фиксирующую связи данной записи с другими записями
номер авторитетной записи
указание источников, использовавшихся для создания авторитетной записи.
Фактически, это статья дескрипторного словаря (с некоторыми дополнительными пометами) для элементов данных ЯБО. В информационно-библиотечных системах для различных элементов данных создаются отдельные авторитетные файлы –имен авторов, названий постоянных и временных коллективов и организаций, географических названий, издательств и др. Можно сказать, что каждый из них представляет собой отдельный тезаурус.
Единство понятий «тезаурус» и «авторитетный файл» лучше всего видны на примере авторитетного файла предметных рубрик (ПР). В литературе язык предметных рубрик часто выделяется как предкоординированный язык иерархического типа. Однако его лексическая природа и практика его использования сближает его с дескрипторными языками. Изучение опыта создания авторитетных (нормативных) записей для ПР показывает, что фактически речь идет о создании предметного тезауруса. Авторитетный файл ПР представляет собой базу данных, содержащую массив записей, используемых для индексирования библиографических записей в электронном каталоге и поисковых выражений запроса при поиске.
Авторитетные записи обычно классифицируются и оформляются в соответствии с требованиями коммуникативного формата UNIMARC/Authorities. Описание этого формата и структура его записей во многом сходны с самим форматом UNIMARC.
Приведем примеры авторитетных записей авторов и учреждений.
100 ##$a19960316arusy0102####ca
200 #0$aКукрыниксы$cхудожники
305 1#Коллективный псевдоним художников Куприянов Михаил Васильевич$bКрылов Порфирий Никитич$bСоколов Николай Александрович
500 #1$5f0$aКуприянов$bМ.В.$gМихаил Васильевич$f1903–
500 #1$5f0$aКрылов$bП.Н.$gПорфирий Никитич$f1902–
500 #1$5f0$aСоколов$bН.А.$gНиколай Александрович$f1903–
100 ##$a19960316arusy0102####ca
210 02$aКавказские минеральные воды, курортная группа
305 1#$aЛитературу о конкретных курортах этой группы см. также под частными названиями $bЖелезноводск, курорт$bКумогорск, курорт$bКисловодск, курорт$b Теплый Нарзан, источник (Пятигорск)
330 1#$aИмеется в виду группа курортов в России (Ставропольский край). Включает Пятигорск, Кисловодск, Ессентуки, Железноводск
510 02$5|0$aЖелезноводск, курорт
510 02$5|0$aКумогорск, курорт
510 02$5|0$aКисловодск, курорт
510 02$5|0$aТеплый Нарзан, источник$c(Пятигорск)
При разработке автоматизированных ИПС также стоит задача проектирования машинной структуры тезаурусов и авторитетных файлов. Обычно эта задача рассматривается как составная часть разработки программного обеспечения, хотя на самом деле мы имеем дело с двумя структурами – физической и логической. И логическая структура тезауруса и авторитетного файла относится к комплексу языковых средств. Эта структура должна определяться как типом и задачами конкретной системы, так и имеющимися стандартами, обеспечивающими межсистемную совместимость, как приведенными здесь, так и другими.
Дата добавления: 2015-03-03; просмотров: 1045;