Булевы классификации
Другим видом классификационной схемы является ситуация, когда таксоны образуют структуру булевой алгебры. В этом случае на выделенной системе классов Ki задаются теоретико-множественные операции объединения (È), пересечения (Ç) и разности ( / ). Тогда исходная система классов превращается в булеву алгебру
Данный тип классификационной схемы возникает, например, в случае использования дескрипторов для классификации текстов документов. В качестве примера рассмотрим множество терминов, состоящее из четырех дескрипторов: d1, d2, d3, d4. Тогда структура таксонов может состоять (рис. 4) из одного таксона Т0, включающего все наличные тексты; четырех таксонов первого уровня Т11, Т21, Т31, Т41, включающих тексты, содержащие по одному дескриптору d1, d2, d3 или d4; шести таксонов второго уровня T12, Т22, Т32, Т42, T52, Т62, включающих тексты, содержащие по одной из пар дескрипторов (d1, d2), (d1, d3), (d1, d4), (d2, d3), (d2, d4), (d3, d4); четырех таксонов третьего уровня T13, Т23, Т33, Т43, включающих тексты, содержащие тройки дескрипторов (d1, d2, d3), (d1, d2, d4), (d1, d3, d4), (d2, d3, d4), и одного таксона четвертого уровня, включающего тексты, содержащие все четыре дескриптора (d1, d2, d3, d4).
Рис. 4. Булева классификационная структура таксонов документов
Архетипами соответствующих классов документов будут выступать множества значений дескрипторов:
arhK11 = {d1}, arhK21 = {d2}, arhK31 = {d3}, аrhK41 = {d4};
arhK12 = {d1, d2}, arhK22 = {d1, d3}, arhK32 = {d1, d4},
arhK42 = {d2, d3}, arhK52 = {d2, d4}, arhK62 = {d3, d4};
arhK13 = {d1, d2, d3}, arhK23 = {d1, d2, d4}, arhK33 = {d1, d3, d4}, arhK43 = {d2, d3, d4};
arhK14 = {d1, d2, d3, d4}.
Если изучать данную классификационную структуру с точки зрения внутреннего строения ее архетипов, т.е. исходя из наличия в тексте совокупности тех или иных дескрипторов, то получим антиизоморфную картину (рис. 5).
Сопоставление таксономической структуры текстов и их внутреннего строения на основе входящих в них дескрипторов показывает, что объединению таксонов текстов соответствует пересечение множеств дескрипторов, входящих в соответствующие архетипы, а пересечению таксонов текстов – объединение множеств дескрипторов архетипов.
Структура таксонов по включению антиизоморфна структуре всех подмножеств множества дескрипторов {d1, d2, d3, d4}, т.е. булевой решетке. Действительно, включение таксона Тi Ì Tj означает, что таксон Тi определяется какими-то дополнительными дескрипторами, т.е. если таксону Тi сопоставить архетип arh Кi, а таксону Tj - архетип arh Kj, то будет выполняться соотношение arh Кi É arh Kj.
Рис. 5. Антиизоморфная структура архетипов поисковых образов документов
Дата добавления: 2016-03-05; просмотров: 1183;