Выборочность обработки данных.
Коэффициент выборочности данных - это отношение количества обработанных записей (Na) к числу всех записей (N).
Кв = Na/N
Если коэффициент выборочности близок к 0, низкий, то используют прямые методы доступа, если к 1, то последовательные методы доступа (сплошная выборка).
Изменчивость данных.
Изменчивость данных - это характеристика количества изменений базы данных (файла) за некоторый интервал времени.
Изменчивые (динамичные) файлы - это файлы, данные в которых часто меняются.
Статичные (постоянные, условно-постоянные) файлы - это файлы, данные в которых редко меняются.
Примером постоянных файлов могут служить: классификаторы, номенклаторы, справочники различных коэффициентов и некоторые другие файлы нормативно-справочной информации (НСИ).
Избыточность данных.
Избыточность (дублирование) - это характеристика, определяемая отношением количества дублированных (повторившихся) данных (Vd) ко всему объему данных (V).
Kd = Vd/V
Чем ближе Kd к 0, тем лучше.
В рассмотренном выше примере данных об узлах и деталях, представленных двумя структурами данных - линейной и иерархической, хорошо иллюстрируется дублирование данных в линейной структуре (дублируются значения поля “узел” для разных деталей, входящих в один узел). В иерархической структуре дублирование полей отсутствует.
Банк данных.
Определение банка данных из ОРММ ГКНТ (1982г):
“Банк данных - это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных”.
Принципы банка данных.
- независимость данных;
- неизбыточность данных;
- универсальность;
- совместимость;
- защита данных;
- управление одновременной работой;
- поддержка распределенной системы баз данных.
Не рассматривая подробно, приведем определение указанных выше принципов.
Под независимостью данных понимается такой принцип построения структуры данных и их размещения в системе, реализации программных, технических, организационных элементов информационной системы, который обеспечивает минимум затрат при внесении различных изменений в систему в течение ее жизненного цикла. Одним из основных средств обеспечения независимости данных является применение систем управления базами данных (СУБД) при разработке ИС.
Обычно выделяют два вида независимости данных - логическую и физическую. Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения действующих прикладных программ. Например, могут быть добавлены в логическую структуру новые группы данных (сегменты, агрегаты), установлены дополнительные связи между данными и т.п. Физическая независимость данных означает, что физическое расположение и организация данных могут изменяться, но при этом логическая структура данных, программы не изменяются. Например, может быть изменен тип носителя информации (физическое устройство), метод доступа (индексно-последовательный на прямой и т.п.), размещение информации на носителе и так далее. Независимость данных обеспечивает эволюцию информационной системы при совершенствовании технических, программных, информационных средств.
Другими словами, независимость данных - это свойство системы, дающее возможность изменять логическую и физическую структуру данных без изменения при этом прикладных программ.
Неизбыточность данных - это свойство системы, позволяющее вводить и хранить данные один раз с оптимальным использованием в различных приложениях. Под избыточностью понимается использование одного и того же экземпляра данного в разных структурах данных (файлах, базах), что при изменении данного приведет к необходимости изменять экземпляры данных во всех структурах, где эти данные встречаются, и что приводит к дополнительным затратам. При этом дублирование (копирование) информации для сохранения и восстановления данных не относится к понятию избыточности данных. При разработке ИС в ряде случаев, обусловленных техническими или экономическими причинами, приходится идти на определенный компромисс и допускать избыточность данных в некоторой минимальной степени.
Универсальность - это свойство системы поддерживать и отображать в структуре данных возможно максимальный круг объектов, процессов, явлений.
Совместимость - это свойство системы обеспечивать преемственность более поздних версий системы по отношению к ранее созданным информационным фондам, а также наличие интерфейсов для приема/передачи данных в другие информационные системы.
Защита данных - это свойство системы, обеспечивающее защиту данных от разрушений (аппаратных и программных сбоев, физического разрушения и т.д.) и несанкционированного доступа.
Управление одновременной работой - это свойство системы обеспечить согласованное параллельное выполнение нескольких процессов обработки данных для различных пользователей.
Поддержка распределенной системы баз данных - это способность системы обрабатывать территориально разнесенную информацию (в разных местах и в различных вычислительных системах) как единую взаимосвязанную совокупность данных.
Дата добавления: 2016-06-13; просмотров: 733;