Сравнение моделей знаний

Модели знаний - продукционная, фреймовая и модель се­мантических сетей - обладают практически равными возмож­ностями представления знаний, использующих отношения "есть-нек" и "есть-часть". Дополнительно каждая модель зна­ний содержит средства усиления этой "базовой" конфигурации:

- продукционная модель позволяет легко расширять и ус­ложнять множество правил вывода;

- фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множе­ства присоединенных процедур;

- модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественно­го языка.

 

4.9 Тезаурусы экономической информации

Первоначально идея разработки тезаурусов возникла в словарной практике в связи с составлением толковых слова­рей, как средство описания се­мантической структуры естественного языка. Затем они были применены в практике автоматизированных информационно-поисковых систем для обеспечения избыточ­ного индексирования документов и информационных запросов. Под избыточным индексированием понимается дополнение поискового образа документов дополнительными дескрипторами, которые связаны по смыс­лу с основными дескрипторами.

Тезаурус - это словарь-справочник, в котором перечисле­ны все лексические единицы ИМЯ с синонимичными им сло­вами, а также выражены все важнейшие смысловые (парадигматические) отноше­ния между лексическими единицами.

Тезаурус, как элемент информацион­ного языка, выполняет следующие функции:

- средство формализации лексики;

- средство терминологического контроля;

- средство избыточного индексирования информа­ционных запросов;

- средство выражения парадигматических отноше­ний языка.

Основные этапы разработки тезауруса сле­дующие:

а) Выбор источников лексики и отбор терминов.

б) Составление терминологического словаря.

в) Группировка терминов в тематические классы.

г) Формирование классов условной эквивалентности.

д) Установление парадигматических отношений.

е) Определение структуры тезауруса.

а) Для отбора лексического материала необходимо использо­вать экономические документы, отражающие характеристики экономического объекта. Кро­ме того, надо пользоваться такими вспомогательными средства­ми, как толковые и терминологические словари, справочники по исследуемой тематике, общесоюзные классификаторы.

Отбор терминов определяется специальными правилами. Перечислим некоторые из них:

- узкие термины применять, если в словаре отсут­ствуют подходящие общие термины;

- многословный термин вводить в том случае, если встречается довольно часто;

- прилагательное следует употреблять в сочетании с суще­ствительным.

б) В терминологическом словаре каждому отобранному тер­мину дается определение, соответствующее его экономичес­кому смыслу. Терминологический словарь служит в качестве пособия при формировании запросов конечными пользовате­лями.

в) Все термины классифицируются в зависимости от функци­онального назначения в тематические классы. Ниже приведен перечень тематических клас­сов экономической лексики:

1) Экономические категории, действия, события

2) Субъекты действия

3) Объекты действия

4) Назначение действия

5) Место действия

6) Источник поступления (финансирования)

7) Время действия

8) Функция управления

9) Единица измерения

10)Атрибутивные характеристики действия (разряд работ и т. п.)

11) Обоснование действия

12) Причина отклонения.

г) Дальнейшая работа по составлению тезауруса заключается в устранении многозначности (омонимия, полисемия) и сино­нимии терминов.

Омонимия - это совпадение в звучании и написании раз­ных слов. Например: лук (растение) и лук (оружие).

Полисемия - это перенос названия одного предмета на дру­гие предметы. Например: звезда (геометричес­кая фигура) и звезда (небесное тело), матрица (математическая) и матрица (техническая).

Омонимия и полисемия устраняются лексикографически при редактировании терминологического словаря.

Синонимия заключается в том, что одному "означаемому" (предмету, явлению) соответ­ствует одно и более "означающих" (слов, словосочетаний). Например: алфавит - азбука, студенты - студенчество.

При построении тезауруса устранение синонимии произво­дится путем группировки терминов в классы условной эквива­лентности (КУЭ).

В КУЭ объединяются термины, между объемами понятий которых существуют отношения:

- равнозначности (геомагнетизм - земной магнетизм);

- перекрещивания, когда часть объема одного поня­тия входит в объем другого(книга - монография);

- подчинения, когда объем одного понятия составляет часть объема другого понятия (стол - мебель);

- внеположенности, когда объемы понятий полностью ис­ключают друг друга и при этом не исчерпывают области предметов, о которых ведется рассуждение (стол - стул: общий класс - мебель).

В результате формирования классов условной экви­валентности термины тезауруса группируются в синонимичес­кие ряды. В каждом синонимическом ряду выделяется доминанта, то есть такой термин, который может заменить любое слово клас­са. Доминанту принято называть дескриптором. Однако фак­тически дескриптором является не имя КУЭ, а сам этот класс.

д) Парадигматические отношения в тезаурусах могут выражаться четырьмя способами:

- лексикографически;

- при помощи таблиц;

- аналитически;

- графически.

Лексикографический способ предполагает наличие специаль­ных помет, которые указывают, в каких парадигматических отношениях находится данный дескриптор с заглавным. При этом используются условные обозначения, рекомендуемые ГОСТом, а именно:

н - нижестоящий видовой дескриптор по отношению к заг­лавному дескриптору;

в - вышестоящий родовой дескриптор по отношению к заглавному дескриптору;

ц - дескриптор находится в отношении - целое к заглавно­му дескриптору;

ч - дескриптор находится в отношении - часть к заглавно­му дескриптору;

с - ключевое слово находится в отношении синонимии к заглавному дескриптору;

см - отсылка от ключевого слова к дескриптору.

Табличный способ заключается в том, что под заглавным дескриптором записываются со сдвигом на несколько знаков вправо дескрипторы, находящиеся с ним в определенном отношении. Такой способ применяется в библиотечно-библиографических классификациях.

При аналитическом способе парадигматические отношения выражаются при помощи структуры кодов дескрипторов. Примером применения аналитического способа может слу­жить универсальная десятичная классификация.

Графический способ предполагает применение различных графических схем.

Терминам экономических документов присущи отношения "вид-род", обозна­чающие смысловую соподчиненность терминов, и "целое-часть", дающие математичес­кую взаимосвязь экономических категорий. Поэтому наиболее удобным будет сочетание лексикогра­фического и табличного способов выражения парадигматичес­ких отношений.

е) Структура тезауруса влияет на результаты поиска и со­ответственно на эффективность работы всей системы.

Как правило, тезаурус представляется в виде совокупнос­ти расположенных в алфавитном порядке дескрипторных статей (семантических сегментов). Они пред­ставляет собой совокупность заглавного дескриптора и всех дес­крипторов, связанных с ним какими-либо парадигматичес­кими отношениями, а также ключевых слов-синонимов. Например:

Выпуск

с выпущено

с выработано

с произведено

с производство

Кольца уплотнительные круглого сечения

в Кольца уплотнительные

н Кольца резиновые уплотнительные круглого сечения, рези­на группы О

н Кольца резиновые уплотнительные круглого сечения, рези­на группы 1

 








Дата добавления: 2015-03-09; просмотров: 1092;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.009 сек.