Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении
Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных и склада (хранилища) данных.
База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.
Банк данных – система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.
Система баз данных – совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.
Хранилище данных (используют также термины Data Warehouse, «склад данных», «информационное хранилище») – это база, хранящая данные, агрегированные по многим измерениям. Основные отличия хранилища данных от базы: агрегирование данных; данные из хранилища никогда не удаляются; пополнение хранилища происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых, – автоматическое.
Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных – множество тематических баз данных, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.
По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое) (рисунок).
СУБД – система управления базами данных; МБД – машина баз данных (вспомогательный периферийный процессор, выполняющий функции СУБД и необходимый вследствие возросших объемов информации и требований к скорости доступа)
Рисунок – Описание предметной области
Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью базы данных и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность–связь» (ER-модель (диаграмма), модель Чена), инфологические модели, семантические сети). На рисунке представлена концептуальная модель (модель «сущность–связь») для описания данных химико-технологического процесса (процесса спекания керамических материалов).
Рисунок – Модель «сущность–связь» для описания данных химико-технологического процесса
Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются следующие виды даталогических моделей: иерархические, сетевые, реляционные, объектно-ориентированные, объектно-реляционные.
Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие-к-одному» и использует для описания модель ориентированных графов.
Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).
Реляционная модель использует представление данных в виде таблиц (реляций), она базируется на реляционной алгебре и теории отношений. В ней сущность предметной области примерно соответствует таблице, а атрибут сущности – полю (столбцу) таблицы.
На рисунке представлена реляционная модель базы данных химико-технологического процесса (процесса спекания керамических материалов).
Рисунок – Реляционная модель базы данных химико-технологического процесса
В объектно-ориентированной модели используются понятия класса, объекта, метода. Данные называются свойствами класса, а алгоритмы – методами. Начало работы класса задается с помощью специальных внутренних (например, нажатие кнопки) или внешних (вызов из другой программы) сигналов, называемых событиями. Для построения объектно-ориентированной модели необходимо: провести инкапсуляцию данных, т.е. выделить классы и объекты; определить возможные виды структуры таблиц; создать наследование классов данных (трансформацию классов путем изменения свойств и методов); обеспечить полиморфизм (возможность использования метода с одним именем как в базовом, так и в производных классах).
Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.
Конкретная реализация системы баз данных, с одной стороны, определяется спецификой данных предметной области, отраженной в концептуальной модели, а, с другой стороны, – типом конкретной СУБД, устанавливающей логическую и физическую организацию.
Основные стандарты СУБД:
• независимость данных на концептуальном, логическом, физическом уровнях;
• универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
• совместимость, неизбыточность данных;
• безопасность и целостность данных;
• актуальность и управляемость.
Критерии оценки баз данных принято делить на количественные и качественные. Количественные критерии: время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию. Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.
Трудность в оценке проектов баз данных связана с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимыми изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.
Основные направления научных исследований в области баз данных:
• развитие теории реляционных баз данных;
• моделирование данных и разработка конкретных моделей разнообразного назначения;
• создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
• разработка, выбор и оценка методов доступа;
• создание самоописываемых баз данных, позволяющих применять единые методы доступа для данных и метаданных;
• управление конкурентным доступом;
• развитие системы программирования баз данных, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
• совершенствование машин баз данных;
• разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;
• интеграция неоднородных информационных ресурсов.
Дата добавления: 2015-06-05; просмотров: 2325;