Кодирование
Кодирование - образование по определенным правилам и присвоение кодов объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. Код — знак или совокупность знаков, присваиваемых объекту с целью его идентификации.
Коды должны удовлетворять следующим основным требованиям:
· однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;
· иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;
· иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;
· быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;
· обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.
Кодовое обозначение характеризуется:
· алфавитом кода;
· структурой кода;
· числом знаков — длиной кода;
· методом кодирования.
Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатающего устройства. В этой связи коды бывают цифровые, буквенные и буквенно-цифровые.
Наиболее широкое применение в отечественной, зарубежной и международной практике кодирования информации находят цифровые коды. При этом, как правило, используются десятичные коды. В таком случае, когда подмножество не превышает 10 объектов, код состоит из одной цифры — от 0 до 9 включительно, а когда в подмножество входит не более 100 объектов - две цифры (от 00 до 99 включительно) и т.д. Установлено, что наибольшая эффективность в процессе обработки информации обеспечивается при применении цифровых кодов из пяти и менее цифр.
Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления (рис. 2.4).
Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные коды.
Методы кодирования в значительной степени связаны с методами разделения множества на подмножества.
Наиболее прост метод присвоения объектам порядковых цифровых номеров. В этом случае код представляет собой натуральное число, которое является не чем иным как порядковым номером данного объекта в пределах некоторого множества. В принципе, такой код обеспечивает идентификацию, но не является информативным, так как не отражает признаков, присущих множеству.
Указанный недостаток может быть преодолен при использовании классификационных методов кодирования. Получаемый при этом код некоторого объекта включает в себя коды отдельных признаков, характеризующих этот объект. Классификационные методы кодирования подразделяют на два типа: последовательный и параллельный.
Последовательный метод основан на иерархической классификации. Кодовое обозначение имеет структуру, соответствующую последовательности и количественному составу признаков объекта на каждом уровне деления. Недостатки метода: зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков объекта.
Параллельный (независимый) метод основан на фасетной классификации. При таком подходе коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кодового обозначения определяется фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется, и для тех случаев, когда необходимо анализировать различные множества объектов. Он обеспечивает возможность независимого изменения и дополнения характеристик объектов и их различных сочетаний, необходимых для решения конкретных задач. Недостатки: громоздкость фасетных формул избыточная емкость кодов.
При использовании обоих классификационных методов кодирование осуществляется присвоением порядковых номеров, причем фасетный метод может успешно применяться в сочетании с иерархическим. В этом случае одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах. Такой подход применен, например, в Общероссийском классификаторе видов экономической деятельности, продукции и услуг (ОКДП).
В ОКДП интегрированы одновременно три объекта классификации: виды экономической деятельности, виды продукции, виды услуг. Виды экономической деятельности отображаются четырехзначным цифровым кодом, образуемым по иерархическому методу. Виды продукции и услуг - семиразрядным цифровым кодом, в котором классы и подклассы кодируются по иерархической схеме, а виды – по фасетной. Однако в последнем случае первые четыре разряда, кодирующие класс продукции или услуг, полностью идентичны первым четырем разрядам кода, соответствующего виду экономической деятельности, результатом которой эта продукция или услуга являются.
Например, прокат черных металлов как класс продукции имеет код 2712000. Здесь «27» – подраздел «Производство металлургическое» раздела «Обрабатывающая промышленность», «1» – группа «Черные металлы (чугун и сталь)», «2» – подгруппа «Прокатка».
Основным классификационным признаком для видов продукции и услуг является функциональный. При необходимости функциональный признак дополняется конструктивно-технологическими признаками, присущими объектам классификации.
Дата добавления: 2014-12-24; просмотров: 1024;