Фасетная классификация
Признаки классификации выбираются независимо друг от друга, например, при построении классификатора этим способом не имеет значения, как различается состав экзаменов в зависимости от специальностей. Признаки классификации называют фасетами. Каждый фасет содержит совокупность однородных значений данного классификационного признака.
Пример 1. Построить фасетный классификатор для задачи из примера 1 раздела Иерархическая классификация.
В соответствии с выявленными классификационными признаками и их значениями имеем:
Шифр учебной группы | Название дисциплины | Оценка за экзамен |
ВС | информатика | |
АС | математика | |
физика | ||
культурология | ||
Полученная таблица и есть классификатор. При этом данные, находящиеся в одной строке, никак не связаны.
Методы кодирования
Цель кодирования, которое выполняется при сборе информации, – замена названия объекта на условное обозначение. Выполняется для уменьшения объема регистрируемой информации и, возможно, для защиты от несанкционированного доступа. Как правило, это кодирование выполняется человеком в отличие от тех видов, которые рассматривались в разделе Информация.
Различают следующие методы кодирования: регистрационные и классификационные.
Регистрационные методы
Эти методы не требуют предварительной классификации объектов. Включают следующие 2 вида:
· порядковое кодирование. Объекты обозначаются числами натурального ряда или другими символами. Применяется, когда количество объектов невелико.
Пример 1. Выполнить порядковое кодирование для значений классификационных признаков из примера 1 раздела Иерархическая классификация.
При решении этой задачи преследуем две цели – уменьшение объема информации (для шифров учебных групп и названий дисциплин) и шифрование для защиты от несанкционированного доступа (для оценок за экзамен). Примерная система кодирования будет иметь вид:
Значения признака «шифр учебной группы» | Коды | Значения признака «название дисциплины» | Коды | Значения признака «оценка за экзамен» | Коды |
ВС | информатика | # | |||
АС | математика | $ | |||
физика | % | ||||
культурология | ? | ||||
* |
· серийно-порядковое кодирование. Предварительно выделяются группы объектов, которые составляют серию, затем в каждой серии производится порядковое кодирование. Сами серии также кодируются с помощью порядкового кодирования. Между кодами серии и ее элементов ставится разделитель. Применяется, когда число объектов сравнительно велико, но классификация не применяется.
Пример 2. Выполнить серийно-порядковое кодирование для значений признака «название дисциплины», условно предположив, что число его значений велико.
Для кодирования упорядочим значения по алфавиту и разобьем список на две равные части - серии. Первой серии присвоим код А, второй – В. Элементы в каждой серии пронумеруем по порядку. Получим:
Серия А Серия В
1 информатика 1 математика
2 культурология 2 физика.
Тогда коды имеют вид:
Значения признака "название дисциплины" | Коды |
информатика | A.1 |
математика | B.1 |
физика | B.2 |
культурология | A.2 |
Дата добавления: 2015-03-03; просмотров: 1061;