Булевы классификации

Другим видом классификационной схемы является ситуация, когда таксоны образуют структуру булевой алгебры. В этом случае на выделенной системе классов Ki задаются теоретико-множественные операции объединения (È), пересечения (Ç) и разности ( / ). Тогда исходная система классов превращается в булеву алгебру

Данный тип классификационной схемы возникает, например, в случае использования дескрипторов для классификации текстов документов. В качестве примера рассмотрим множество терминов, состоящее из четырех дескрипторов: d1, d2, d3, d4. Тогда структура таксонов может состоять (рис. 4) из одного таксона Т0, включающего все наличные тексты; четырех таксонов первого уровня Т11, Т21, Т31, Т41, включающих тексты, содержащие по одному дескриптору d1, d2, d3 или d4; шести таксонов второго уровня T12, Т22, Т32, Т42, T52, Т62, включающих тексты, содержащие по одной из пар дескрипторов (d1, d2), (d1, d3), (d1, d4), (d2, d3), (d2, d4), (d3, d4); четырех таксонов третьего уровня T13, Т23, Т33, Т43, включающих тексты, содержащие тройки дескрипторов (d1, d2, d3), (d1, d2, d4), (d1, d3, d4), (d2, d3, d4), и одного таксона четвертого уровня, включающего тексты, содержащие все четыре дескриптора (d1, d2, d3, d4).

Рис. 4. Булева классификационная структура таксонов документов

 

Архетипами соответствующих классов документов будут выступать множества значений дескрипторов:

arhK11 = {d1}, arhK21 = {d2}, arhK31 = {d3}, аrhK41 = {d4};

arhK12 = {d1, d2}, arhK22 = {d1, d3}, arhK32 = {d1, d4},

arhK42 = {d2, d3}, arhK52 = {d2, d4}, arhK62 = {d3, d4};

arhK13 = {d1, d2, d3}, arhK23 = {d1, d2, d4}, arhK33 = {d1, d3, d4}, arhK43 = {d2, d3, d4};

arhK14 = {d1, d2, d3, d4}.

Если изучать данную классификационную структуру с точки зрения внутреннего строения ее архетипов, т.е. исходя из наличия в тексте совокупности тех или иных дескрипторов, то получим антиизоморфную картину (рис. 5).

Сопоставление таксономической структуры текстов и их внутреннего строения на основе входящих в них дескрипторов показывает, что объединению таксонов текстов соответствует пересечение множеств дескрипторов, входящих в соответствующие архетипы, а пересечению таксонов текстов – объединение множеств дескрипторов архетипов.

Структура таксонов по включению антиизоморфна структуре всех подмножеств множества дескрипторов {d1, d2, d3, d4}, т.е. булевой решетке. Действительно, включение таксона Тi Ì Tj означает, что таксон Тi определяется какими-то дополнительными дескрипторами, т.е. если таксону Тi сопоставить архетип arh Кi, а таксону Tj - архетип arh Kj, то будет выполняться соотношение arh Кi É arh Kj.

Рис. 5. Антиизоморфная структура архетипов поисковых образов документов








Дата добавления: 2016-03-05; просмотров: 1180;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.