Классификация БД
По модели представления данных БД классифицируются как:
• картотеки;
• сетевые БД;
• иерархические БД;
• реляционные БД;
• многомерные БД;
• объектно-ориентированные БД;
• дедуктивные БД.
Тема 1.2. Ранние подходы к организации СУБД
Рассматриваемые вопросы: Системы, основанные на инвертированных списках, иерархические и сетевые СУБД. Сравнительный анализ. Достоинства. Недостатки.
Известные иерархические СУБД:
• Иерархической базой данных является файловая система.
• Типичным представителем (наиболее известным и распространённым) является Information Management System (IMS) фирмы IBM. Первая версия появилась в 1968 г.
• Time-Shared Date Management System (TDMS) компании Development Corporation.
• Mark IV Multi - Access Retrieval System компании Control Data Corporation.
• System - 2000 разработки SAS-Institute.
• Серверы каталогов, такие, как LDAP и Active Directory (допускают чёткое представление в виде дерева).
• По принципу иерархической БД построен и реестр Windows.
Реляционная БД – БД, основанная на реляционной модели. Теория реляционных баз данных была разработана доктором Коддом из компании IBM в 1970 году.
В реляционных БД все данные представлены в виде простых таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные.
Запросы к таким таблицам возвращают таблицы, которые сами могут становиться предметом дальнейших запросов. Каждая база данных может включать несколько таблиц.
Кратко особенности реляционных БД можно сформулировать следующим образом:
• Данные хранятся в таблицах, состоящих из столбцов («атрибутов») и строк («записей», «кортежей»).
• На пересечении каждого столбца и строчки стоит в точности одно значение.
• У каждого столбца есть своё имя, которое служит его названием, и все значения в одном столбце имеют один тип.
• Запросы к базе данных возвращают результат в виде таблиц, которые тоже могут выступать как объект запросов.
• Строки в реляционной базе данных неупорядочены – упорядочивание производится в момент формирования ответа на запрос.
Общепринятым стандартом языка работы с реляционными базами данных является язык SQL.
Тема 1.3. Общие понятия реляционного подхода к организации БД. Основные концепции и термины
Рассматриваемые вопросы: Общая характеристика. Базовые понятия реляционных БД. Домен. Схема отношения, схема БД. Кортеж, отношение. Первичный и внешний ключи.
Реляционная БД (relational database) – БД, основанная на реляционной модели.
Реляционная модель данных (relational data model) – логическая модель данных, строгая математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в реляционных базах данных.
Структурный аспект (structure aspect) – данные в базе данных представляют собой набор отношений.
Аспект целостности (integrity aspect) – отношения отвечают определённым условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.
Аспект обработки (манипулирования) (manipulation aspect) – РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).
Кроме того, в состав реляционной модели данных обычно включают теорию нормализации.
Реляционная модель данных является приложением к задачам обработки данных таких разделов математики как теория множеств и формальная логика.
Термин «реляционный» означает, что теория основана на математическом понятии отношение (relation).
Для лучшего понимания РМД следует отметить следующие факты:
• модель является логической, т.е. отношения являются логическими (абстрактными), а не физическими (хранимыми) структурами;
• для реляционных баз данных верен информационный принцип «всё информационное наполнение базы данных представлено одним и только одним способом», а именно – явным заданием значений атрибутов в кортежах отношений (в частности, нет никаких указателей (адресов), связывающих одно значение с другим);
• наличие реляционной алгебры позволяет реализовать декларативное программирование и декларативное описаний ограничений целостности, в дополнение к навигационному (процедурному) программированию и процедурной проверке условий.
Достоинства реляционной модели
• Простота и доступность понимания конечным пользователем, т.к. единственной информационной конструкцией является отношение.
• При проектировании реляционной БД применяются строгие правила, базирующие на математическом аппарате.
• РМД обеспечивает полную независимость данных, т.е. при изменении структуры реляционной БД изменения, которые требуется произвести в прикладных программах, – минимальны.
• При построении запросов и написании прикладных программ отсутствует необходимость в знании конкретной организации БД во внешней памяти.
Недостатки реляционной модели
• Относительно низкая скорость доступа к данным и использование большого объёма внешней памяти.
• Трудность понимания структуры данных из-за появления большого количества таблиц в результате логического проектирования.
• Невозможность или крайне высокая сложность представления в виде таблиц некоторых предметных областей.
Кортеж (tuple) – элемент отношения («строка таблицы»).
Заголовок (схема) отношения r (Hr) – конечное множество упорядоченных пар вида <A, T>, где A называется именем атрибута, а T обозначает имя некоторого базового типа или ранее определённого домена, то есть множества допустимых значений.
SQL-пример: uid int(11)
По определению требуется, чтобы все имена атрибутов в заголовке отношения были различны.
Кортеж tr, соответствующий заголовку Hr – множество упорядоченных триплетов вида <A, T, v>, по одному такому триплету для каждого атрибута в Hr.
Третий элемент – v – триплета <A, T, v> должен являться допустимым значением типа данных или домена T.
Т.к. имена атрибутов уникальны, в кортеже не указываются домены (типы данных).
Тема 1.4. Базисные средства манипулирования реляционными данными
Рассматриваемые вопросы: Реляционная алгебра. Основные операции реляционной алгебры: объединение, пересечение, разность, произведение, выбор, создание проекций, соединение, присвоение, деление. Реляционное исчисление.
Основная идея реляционной алгебры состоит в том, что коль скоро отношения являются множествами, то средства манипулирования отношениями могут базироваться на традиционных теоретико-множественных операциях, дополненных некоторыми специальными операциями, специфичными для баз данных.
Существует много подходов к определению реляционной алгебры, которые различаются набором операций и способами их интерпретации, но в принципе, более или менее равносильны. Мы опишем немного расширенный начальный вариант алгебры, который был предложен Коддом. В этом варианте набор основных алгебраических операций состоит из восьми операций, которые делятся на два класса - теоретико-множественные операции и специальные реляционные операции. В состав теоретико-множественных операций входят операции:
- объединения отношений;
- пересечения отношений;
- взятия разности отношений;
- прямого произведения отношений.
Специальные реляционные операции включают:
- ограничение отношения;
- проекцию отношения;
- соединение отношений;
- деление отношений.
Кроме того, в состав алгебры включается операция присваивания, позволяющая сохранить в базе данных результаты вычисления алгебраических выражений, и операция переименования атрибутов, дающая возможность корректно сформировать заголовок (схему) результирующего отношения.
Дата добавления: 2015-04-19; просмотров: 1101;