Системы управления базами данных
Базы данных и системы управления базами данных
Основные понятия и определения
Базы данных
В литературе можно встретить два, отличающихся друг от друга определения базы данных (БД). Одни авторы, например, С.В. Симонович, рассматривают базу данных как организованную структуру, предназначенную для хранения информации [6]. Другие авторы рассматривают базу данных как организованную на машинном носителе интегрированную совокупность взаимосвязанных данных (Ю. Бекаревич, Н. Пушкина [11]).
Оба определения имеют право на существование. Все зависит от того, с каких позиций рассматривать базу данных. Дело в том, что при создании новой базы данных сначала создается ее структура и только затем база данных заполняется соответствующими данными. При этом часто структуру базы данных создает одна организация (разработчик), а заполнением базы данных занимается другая организация (заказчик), для нужд которой и создается конкретная база данных, т.е. разработчик передает заказчику пустую БД.
С точки зрения разработчика база данныхэто, прежде всего организованная структура, предназначенная для хранения информации. Разработчик создает именно структуру базы данных. Хотя в такую базу еще не внесено никаких данных, она, тем не менее, является полноценной базой данных. Это утверждение объясняется тем, что хотя данных в базе и нет, но информация в ней все-таки есть — это структура базы. Именно структура БД определяет методы занесения данных и хранения их в базе. Для понимания этого факта можно провести аналогию с деловым ежедневником, в котором каждому календарному дню выделено по странице. Даже если в ежедневнике не записано ни слова, он не перестает быть ежедневником, поскольку имеет структуру, четко отличающую его от записных книжек или рабочих тетрадей.
С точки зрения пользователя (заказчика) база данных это, прежде всего интегрированная совокупность взаимосвязанных данных, организованных на машинном носителе. Именно эта сторона базы данных для пользователя является главной, структура же базы данных для него остается как бы «за кадром».
Таким образом, на определенном этапе своей жизни база данных может не содержать данных, а иметь только структуру, но не может быть базы данных без структуры. В то же время создание структуры базы данных не является самоцелью. База данных всегда создается для хранения некоторых данных и выполнения с ними различных операций.
Исходя из выше сказанного, дадим следующее определение базы данных.
База данных это организованная на машинном носителе структура, в которой обеспечивается хранение и обработка совокупности взаимосвязанных данных.
Обычно база данных создается для одной конкретной предметной области, организации или прикладной задачи. Предметной областью базы данных называется часть реального мира, представляющая интерес для данного исследования. Для того чтобы спроектировать структуру БД, необходима исходная информация о предметной области. Эта информация может включать сведения о людях, местах, предметах, событиях и понятиях. Например, в базе данных предприятия может храниться: вся информация о штатном расписании, о рабочих и служащих предприятия; сведения о материальных ценностях; данные о поступлении сырья и комплектующих; сведения о запасах на складах; данные о выпуске готовой продукции; приказы и распоряжения дирекции и т.п.
Элемент базы данных называется объектом. Объект может быть реальным (например, человек или организация) или абстрактным (например, лицевой счет). Каждый объект обладает определенным набором свойств, которые должны храниться в базе данных. Класс объектов – это совокупность объектов, обладающих однотипными свойствами.
Объекты и их свойства являются понятиями реального мира. Информационным отражением свойств объекта служит атрибут. Любой объект характеризуется рядом атрибутов. Каждый атрибут в БД должен иметь уникальное имя – идентификатор.
Любая база данных должна удовлетворять следующим требованиям:
1. БД должна удовлетворять информационным требованиям организации.
2. БД должна обеспечивать получение требуемых данных за определенное время
3. БД должна легко расширяться и изменяться.
4. Доступ к данным должен быть ограничен. Необходимо защитить данные от несанкционированного использования или изменения.
Системы управления базами данных
С понятием базы данных тесно связано понятие системы управления базой данных (СУБД).
СУБД- это комплекс программных средств, предназначенных для создания структуры новой базы, наполнения ее содержимым, редактирования содержимого и визуализации информации.
Под визуализацией информации базы понимается отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующую выдачу на устройство вывода.
Система управления базой данных является универсальным программным инструментом создания и обслуживания баз данных в самых разных предметных областях.
Существуют различные СУБД. Прежде всего, они отличаются между собой по тому, какую модель данных поддерживает та или иная СУБД.
В экономике существуют объекты, предметы, информацию о которых необходимо хранить, и эти объекты связаны между собой самыми разными способами. Чтобы область хранения данных рассматривалась в качестве базы данных, в ней должны содержаться не только данные, но и сведения о взаимоотношениях между этими данными.
Различают логический и физический уровни организации данных. Физический уровень отражает организацию хранения БД на машинных носителях, а логический уровень - внешнее представление данных пользователю.
Модель данных – это метод (принцип) логической организации данных, используемый СУБД. Наиболее известными являются иерархическая, сетевая и реляционная модели.
Почти все современные СУБД хранят и обрабатывают информацию на основе реляционной модели управления данными. Слово "реляционная" происходит от английского relation - отношение.
В мире существует большое количество реляционных СУБД. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБДопираются на единый устоявшийся комплекс основных понятий. В данном учебно-методическом пособии рассматривается СУБД Microsoft Access, входящая в пакет Microsoft Office. Понятия, приемы и методы, рассмотренные на примере Access, могут быть успешно применены при работе с другими СУБД
Концепция реляционной (табличной) модели данных была впервые выдвинута во второй половине двадцатого века. Реляционная модель характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Логическую структуру реляционной базы данных образует совокупность реляционных таблиц, между которыми установлены логические связи. При этом как таблицы, так и связи между ними рассматриваются как объекты.
В реляционной СУБД все данные, необходимые для решения задач предметной области, хранятся исключительно в таблицах (как правило, в базе данных несколько таблиц).
Каждая таблица содержит сведения об одной предметной сущности (например, о студентах или изучаемых предметах; о товарах или поставщиках и т.п.). Столбцы таблицы БД называются полями. Каждое из полей таблицы содержит какой-то один тип сведений о данной предметной сущности (например, фамилии студентов или даты их рождения). Поэтому каждая таблица содержит столько полей, сколько атрибутов предметной сущности требуется описать в таблице (рис. 1). Количество полей в таблице определяется на стадии создания структуры таблицы и в последующем, как правило, не меняется.
Рис. 1 . Таблица, содержащая четыре типа данных о студентах и имеющая соответственно четыре поля.
Содержание таблицы заключено в ее строках, однотипных по структуре. Каждая строка таблицы содержит данные о конкретном экземпляре сущности и называется записью. Структура записи определяется составом входящих в нее полей. Совокупность полей записи соответствует логически связанным реквизитам, характеризующим некоторую сущность предметной области. Запись является основной логической структурной единицей манипулирования данными.
Количество записей соответствует количеству описываемых экземпляров предметной сущности, например, в таблице Студенты количество записей будет соответствовать количеству студентов в вузе. Пустая таблица не содержит ни одной записи.
Для однозначного определения (идентификации) каждой записи таблица должна иметь уникальный (первичный) ключ. По значению ключа таблицы отыскивается единственная запись в таблице. Ключ может состоять из одного или нескольких полей таблицы. Значение уникального ключа не может повторяться в нескольких записях.
Поля образуют структуру базы данных - ее основу и создаются на первом этапе создания базы данных (при ее разработке). Каждое поле обладает определенным набором свойств, которые задаются в обязательном порядке при создании структуры таблицы (задание свойств поля может быть выполнено в неявной форме, т.е. «по умолчанию»). От свойств поля зависит, какие данные в него можно вносить и какие операции, затем можно производить с содержимым поля (и соответственно, какие операции производить нельзя). Например, данные в поле Группа, можно отсортировать по возрастанию или убыванию, но вот суммировать их совершенно бессмысленно. В то же время, если таблица содержит данные о зарплате сотрудников, то данные в поле Зарплата, можно суммировать для получения значения Итого. Это значит, что указанные выше поля обладают разными свойствами и относятся к разным типам.
Создание записей происходит на втором этапе создания базы данных путем внесения соответствующих данных (указания значений всех полей таблицы).
Каждый элемент данных должен храниться в базе только в одном экземпляре. Для создания таблиц, соответствующих реляционной модели данных, используется процесс, называемый нормализацией данных. Нормализация — это удаление из таблиц повторяющихся данных путем их переноса в новые таблицы, записи которых не содержат повторяющихся значений. Теория нормализации основана на том, что определенный набор таблиц обладает лучшими свойствами при работе с данными, чем все другие возможные наборы таблиц, с помощью которых могут быть представлены те же данные.
Минимальное дублирование данных в реляционной базе обеспечивает высокую эффективность поддержания базы данных в актуальном и непротиворечивом состоянии, однократный ввод и корректировку данных.
Реляционная модель обеспечивает возможность использования в разных СУБД операций обработки данных, имеющих единую основу – алгебру отношений (реляционную алгебру), и универсального языка структурированных запросов SQL (Seguential Query Language).
Логические связи между таблицами дают возможность объединять данные из разных таблиц. Связь каждой пары таблиц обеспечивается одинаковыми полями в них — ключом связи. Так обеспечивается рациональное хранение не дублированных данных и их объединение в соответствии с требованиями решаемых задач.
В нормализованной реляционной базе данных связь двух таблиц характеризуется отношениями записей типа один-к-одному (1:1) или один-ко-многим (1:М). Отношение 1:1 предполагает, что каждой записи одной таблицы соответствует одна запись в другой. Отношение 1:М предполагает, что каждой записи первой таблицы соответствует много записей во второй, но каждой записи второй таблицы соответствует только одна запись в первой.
Для двух таблиц, находящихся в отношении типа 1:М, устанавливается связь по уникальному ключу таблицы, представляющей в отношении сторону "один" — главной таблицы в связи. Во второй таблице, представляющей в отношении сторону "многие" и именуемой подчиненной, этот ключ связи может быть либо частью уникального ключа, либо не входить в состав ключа. В подчиненной таблице ключ связи называется еще внешним ключом.
На рис.2 показаны две таблицы с перечнем кафедр и списком преподавателей, которые находятся в отношении типа 1:М и логически связаны с помощью общего поля (столбца) Код кафедры — ключа связи. Это поле является уникальным ключом в главной таблице кафедра, и не ключевым полем в подчиненной таблице — преподаватель.
Размещение сведений о каждой сущности в отдельной таблице и связывание таблиц позволяет избежать повторения значений данных в разных таблицах. При этом обеспечивается однократный ввод данных при загрузке и корректировке базы данных. Если данные двух таблиц в приведенном примере разместить в одной таблице, то каждая запись должна соответствовать одному преподавателю. Причем данные о кафедре (наименование, телефон и др.) будут повторяться во всех записях о преподавателях одной кафедры, что усложняет ввод данных, их корректировку и обеспечение актуального состояния базы данных. При хранении данных в двух таблицах повторяются только значения ключевых полей.
Рис. 2. Две взаимосвязанные таблицы реляционной базы данных
Нормализация отношений - это процесс построения оптимальной структуры таблиц и связей в реляционной БД (процесс уменьшения избыточности информации).
В процессе нормализации данные группируются в таблицы, представляющие классы объектов и их взаимодействие.
Цели, которые преследуются при построении наиболее эффективной структуры данных:
1) обеспечить быстрый доступ к данным;
2) исключить ненужное повторение данных, которое может являться причиной ошибок при вводе, а также привести к нерациональному использованию дискового пространства;
3) обеспечить целостность данных, т.е. чтобы при изменении одних объектов автоматически происходило соответствующее изменение связанных с ними объектов
Одно из важнейших достоинств реляционной базы данных заключается в том, что она позволяет хранить логически сгруппированные данные в разных таблицах и путем установления связи между ними, обеспечивать единство данных в базе.
Схема данных
Если в реляционной базе данных более одной таблицы, то создание схемы данных обязательно. Схема данных наглядно отображает логическую структуру базы данных, а именно таблицы и связи между ними, а также обеспечивает использование установленных в ней связей при обработке данных.
Схема данных в СУБД Access является не только средством графического отображения логической структуры базы данных, но она используется системой в процессе работы с базой данных. При любой обработке данных из нескольких взаимосвязанных таблиц система использует сохраненные в схеме данных связи между таблицами. Однажды указанные в схеме данных связи используются системой автоматически.
Реляционная база данных, созданная в соответствии с проектом канонической модели данных, состоит из нормализованных таблиц. В такой базе данных обеспечивается отсутствие дублирования данных во взаимосвязанных таблицах и, соответственно минимизируется объем сохраняемых данных. В процессе загрузки и корректировки базы данных, для получения информации по запросам и вывода отчетов, а также для решения большинства задач необходим одновременный доступ к нескольким взаимосвязанным таблицам. Создание схемы данных позволяет упростить конструирование многотабличных форм, запросов, отчетов и страниц доступа к данным и обеспечить поддержание целостности взаимосвязанных данных при корректировке таблиц.
При построении схемы данных Access автоматически определяет по выбранному полю связи тип отношения между таблицами. Если поле, по которому нужно установить связь, является уникальным ключом как в одной, так и в другой таблице, то Access выявляет отношение один-к-одному. Если поле связи является уникальным ключом одной таблицы (главной таблицы в данной связи), а в другой таблице (подчиненной таблице) оно является не ключевым или входит в составной ключ, то Access выявляет отношение один-ко-многим между записями главной и подчиненной таблицы.
Для нормализованной базы данных, основанной на одно-многозначных и одно-однозначных отношениях между таблицами, в схеме данных для связей таких таблиц могут устанавливаться параметры обеспечения связной целостности.
При поддержании целостности взаимосвязанных данных не допускается наличия записи в подчиненной таблице, если в главной таблице отсутствует связанная с ней запись. Соответственно при первоначальной загрузке базы данных, а также корректировке, добавлении и удалении записей система допускает выполнение только таких операций, которые не приводят к нарушению целостности данных.
В схеме данных связи могут устанавливаться для любой пары таблиц, имеющих одинаковое поле, позволяющее объединять эти таблицы.
Дата добавления: 2015-12-22; просмотров: 1865;