Комбинативные классификации
Комбинативные (фасетные) классификации возникают как результат классификации понятий по совокупности имен и значений их признаков.
Фасеты такой классификации определяются булевыми операциями над именами признаков и образуют булеву алгебру. Очевидно, что классификацию текстов на основании содержащихся в них дескрипторов с этой точки зрения можно рассматривать как однофасетную, так как мы имеем только один признак ДЕСКРИПТОР для всех терминов, используемых при классификации текстов. Но в комбинативных классификациях, как правило, полагают, что классификационные признаки сущностей не являются множественными.
Для выделения таксонов каждый фасет в свою очередь подвергается дополнительному делению на основе использования значений признаков. Так, если имеются признаки А, В, С, то в комбинативной классификации можно выделить три фасета первого уровня – FA, FB, FC; три фасета второго уровня – FAB, FAC, FBC и один фасет третьего уровня FABC. Таксоны первого уровня Т1A, T2A,…,TnA, T1B,..., ТmB, Т1C,... образуются путем деления каждой из фасет FA, FB, FC на основе значений признаков. Таксоны второго уровня могут быть получены путем попарных пересечений таксонов первого уровня и т.д. Количество таксонов на первом уровне определяется суммарной мощностью доменов значений признаков
Общее число уровней в комбинативной классификации равно количеству признаков.
Как видно из рис. 6, структура таксонов комбинативной классификации по отношению включения не является иерархической. Если рассматривать структуру связей между отдельными фасетами, то получим булеву алгебру.
|
Рис. 6. Фасетная классификационная система
Архетипы классов комбинативной классификации представляют собой подмножество множества пар {(Аi, аji)} имен и значений признаков. Для рассмотренного выше примера архетипами классов второго уровня будут множества:
В качестве примера рассмотрим комбинативную классификацию множества сущностей {e1, e2, е3, e4, e5, e6, e7, e8}, содержащих признаки с именами А, В, С, D и значениями dom А = {a1, а2, а3}, dom В = {b1, b2}, dom С = {c1, c2, c3} и dom D = {d1, d2, d3, d4}.
Пусть значения признаков по сущностям распределены следующим образом:
e1 = (a1, b1, c1, d1), е2 = (a1, b1, c2, d1),
е3 = (a1, b2, c1, d3), е4 = (a1, b3, c2, d3),
e5 = (а2, b2, c1, d4), е6 = (а2, b3, c1, d4),
е7 = (а2, b3, c2, d4), e8 = (а2, b3, c1, d2).
Тогда классификационная решетка рассматриваемой предметной области может быть представлена в виде рис. 7. На первом уровне решетки находятся таксоны, которые определяются одиночными значениями признаков, на втором - они определяются парными комбинациями признаков, на третьем - тройками значений признаков.
Таксон Т0 содержит сущности, принадлежащие всей ПО, так как на него не накладывается никаких ограничений, а таксон TABCD пуст вследствие того, что в ПО отсутствуют сущности, обладающие всеми допустимыми значениями признаков одновременно. Отметим также, что в классификационной решетке отсутствуют классы сущностей первого уровня со значениями свойств b1 и b2, так как о множествах объектов {e1, e2} и {е3, e5} можно сделать более точное утвержцение, чем то, что эти классы сущностей обладают свойствами b1 и b2. Действительно, таксон T1 содержит сущности, обладающие как признаком b1, так и признаком a1, а таксон T1 – сущности, имеющие признаки b2 и C1. Множества {e1, e2} и {е3, е5}, выделенные на основании только одного признака b1 или b2, являются не классами, а предклассами. При свершении некоторых событий предклассы могут переходить в класс и, наоборот, классы могут превращаться в предклассы.
Отметим, что третий уровень классификационной решетки фактически содержит информацию, совпадающую с признаками ПО, за исключением таксона Т6, в который попали сущности e6 и e8, не различимые на основании классификационных признаков с именами А, В и С, но имеющие различные характеристические признаки: сущность e6 имеет свойство d4, а сущность e8 – признак d2.
В работе показано, что для рассматриваемого множества таксонов классификационной решетки могут быть выделены таксоны - образующие, позволяющие путем выполнения над ними теоретико-множественной операции пересечения получить все остальные таксоны решетки.
Рис. 7. Пример классификационной решетки гипотетической ПО
Из рис. 7 видно, что в качестве классов-образующих для классификационной решетки необходимо взять таксоны T1A, T1C, Т2C, T1B, Т2A, T1AB, T1BC.
Очевиден и общий алгоритм выделения классов-образующих. Для этого достаточно к классам первого уровня решетки присоединить те классы более низких уровней, которые получены из предклассов первого уровня, чтобы получить искомый класс.
Комбинативные классификации имеют ряд преимуществ перед иерархическими классификациями, обеспечивая многоаспектное классифицирование информации, возможность произвольного комбинирования классификационных признаков, большую глубину понятий и возможность гибкого включения новых признаков.
СОБЫТИЯ И ПРОЦЕССЫ
Дата добавления: 2016-03-05; просмотров: 941;