Базы данных
Основные понятия:
· Данные(data): Meaningful facts, text, graphics, images, sound, video segments. Имеющие смысловое значение факты, тексты, графика, изображения, звук, видео сегменты.
· Метаданные (Metadata): Data about the data. Данные о данных. – Структура данных, индексы и т.д.
· База данных (Database): An organized collection of logically related data. Организованное собрание (коллекция) логически связанных данных.
· Информация (Information): Data processed to be useful in decision making. Данные несут информацию, но они не тождественны. Информация – это результат взаимодействия данных и адекватных им методов. Пример – иностранный текст и его перевод (человек, словарь, система перевода).
. Преимущества использования баз данных:
· Data Independence/Reduced Program Maintenance. Независимость данных
– сокращение размеров программной поддержки (внутри отдельных программ)
o Increased Application Development Productivity. Увеличение эффективности разработки приложений
o Enforcement of Standards. Возможность создания и использования стандартов.
· · Minimal Data Redundancy. Минимальная избыточность хранения данных.
– Improved Data Consistency and Sharing. Увеличение плотности данных и совместного доступа к данным.
– Better Data Accessibility/ Responsiveness. Улучшенный доступ к данным и их соответствие конкретным решаемым задачам.
– Improved Data Quality (Constraints - стеснение). Увеличение качества данных.
· · Security, Backup/Recovery, Concurrency. Безопасность, сохранение и восстановление.
Области применения современных БД
Традиционный подход – выборка по ключевым параметрам – отчет, форма.(80-ые годы). Например – прикладная информационная база данных организации, предприятия по определенной тематике.
Возрастание сложности задач:
· СУБД – терабайты, десятки тысяч пользователей
· Извлечение знаний (различные области деятельности
Современные области применения:
· Data Mining:
– Decision-Support Systems. Системы принятия решений.
– Data Analysis. Анализ данных.
– Data Warehousing. Организация хранилищ данных.
· Новые области:
– Spatial and Geographic Databases. Географические базы данных.
– Multimedia Databases. Мультимедиа базы данных.
– Mobility and Personal Databases. Мобильные и персональные БД.
– Information-Retrieval Systems.
– Distributed Information Systems. Распределенные информационные системы.
– The World Wide Web (WWW). Система World Wide Web.
. Эволюция современных баз данных
а) Файловые системы (1960-1965) à
б) Инвертированные списки – простейшие базы данных (1966-69… 1999) à
в) Иерархические СУБД (1969-1973) à
г) Сетевые СУБД (1973-1980) à
В настоящее время:
Реляционные СУБД (1980-1990)à
Объектно-ориентированные и объектно-реляционные СУБД (1990-2000)
(2001…) à ??? (новое поколение – с учетом новых задач и требований – Data Mining, терабайты, сотни тысяч пользователей)
. Основные особенности ранних СУБД.
1) Эти системы активно использовались в течение многих лет, дольше, чем используется какая-либо из реляционных СУБД. На самом деле некоторые из ранних систем используются даже в наше время, накоплены громадные базы данных, и одной из актуальных проблем информационных систем является использование этих систем совместно с современными системами. Clipper!!!
2)Все ранние системы не основывались на каких-либо абстрактных моделях. Как мы упоминали, понятие модели данных фактически вошло в обиход специалистов в области БД только вместе с реляционным подходом. Абстрактные представления ранних систем появились позже на основе анализа и выявления общих признаков у конкретных различных систем (бухгалтерские системы, склад, магазин, тесты, банковские системы и т.д. –).
3) В ранних системах доступ к БД производился на уровне записей. Пользователи этих систем осуществляли явную навигацию в БД, используя языки программирования, расширенные функциями СУБД. Сейчас – запрос, представление.
Можно считать, что уровень инструментальных средств ранних СУБД соотносится с уровнем файловых систем примерно так же, как уровень языка высокого уровня Кобол, Visual C соотносится с уровнем языка Ассемблера.
4) Интерактивный доступ к БД поддерживался только путем создания соответствующих прикладных программ с собственным интерфейсом.
Навигационная природа ранних систем и доступ к данным на уровне записей заставляли пользователя самого производить всю оптимизацию доступа к БД, без какой-либо поддержки системы. (+) Для специалистов-программистов
5) После появления реляционных систем большинство ранних систем было оснащено "реляционными" интерфейсами. Например, Clipper – Visual Objects компании Computer Associates. Однако в большинстве случаев это не сделало их по-настоящему реляционными системами, поскольку оставалась возможность манипулировать данными в естественном для них режиме.
. Инвертированные списки.
Один из первых образцов - ADABAS. Применялся на больших, малых ЭВМ (в частности СМ ЭВМ – ГПС механообработки). Новый период расцвета – 80-е годы – применение в персональных компьютерах (1986-1993). Из наиболее известных БД в России: dBase, Clipper, FoxPro, Paradox.
Основные особенности:
- данные хранятся в таблицах. Записи таблиц фиксированной длины, состоящие из множества различных типов полей, упорядочены в некоторой последовательности.
- для каждой таблицы произвольное число индексов (инвертированных списков), хранимых в отдельных файлах. Индексы автоматически поддерживаются системой.
- пути доступа к таблицам и спискам видны пользователям.
- общие определения целостности базы данных отсутствуют.
Типовые операторы манипулирования: НАЙТИ ПЕРВУЮ ЗАПИСЬ, НАЙТИ ПЕРВУЮ ПО КЛЮЧУ, НАЙТИ СЛЕДУЮЩУЮ, ОБНОВИТЬ, УДАЛИТЬ, ДОБАВИТЬ ПУСТУЮ ЗАПИСЬ, ИЗМЕНИТЬ ПОЛЕ ЗАПИСИ.
Иерархические БД
Типичный пример: Information Management System фирмы IBM (1969). Существует до сих пор, что создает сложности перехода.
Основные особенности:
- Строится иерархия таблиц (предки, потомки). Организация à Отдел à начальник + сотрудники.
- Предки и потомки. Один предок – множество потомков.
- Частичная поддержка целостности в переделах дерева. Основное правило: никакой потомок не может существовать без своего родителя.
Сетевые БД
Типичным представителем является Integrated Database Management System (IDMS).
Сетевой подход к организации данных является расширением иерархического подхода. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков.
. Достоинства и недостатки ранних систем баз данных
+:
- Развитые средства управления данными во внешней памяти на низком уровне (главный недостаток – ранних файловых систем);
- Возможность построения вручную эффективных прикладных систем (Clipper);
- Возможность экономии памяти за счет разделения подобъектов (оверлейные структуры). Это было очень актуально в ранних системах.
-:
- Слишком сложно пользоваться;
- Фактически необходимы знания о физической организации;
- Прикладные системы зависят от этой организации;
- Их логика перегружена деталями организации доступа к БД.
СУБД Microsoft Access 97
Традиционная СУБД + реляционный интерфейс. Объектами в MICROSOFT ACCESS называют все, что может иметь имя. Это таблицы, запросы, формы, отчеты, макросы и модули. Определим эти объекты:
Таблица - объект, который вы определяете и используете для хранения данных. Каждая таблица включает информацию об объекте определенного типа, например о клиентах. Таблица содержит поля (столбцы), в которых хранятся определенного типа данные, например, фамилия или адрес клиента и записи, которые называются также строками. В записи собрана вся информация о данном предмете, например, информация о клиенте Петрове Александре Степановиче. Для каждой таблицы Вы можете определить первичный ключ (одно или несколько полей, которые имеют уникальное значение для каждой записи) и один или несколько индексов с целью увеличения скорости доступа к данным.
Первичный ключ - это одно или несколько полей, которые имеют уникальное значение для каждой записи.
Устанавливается так же один или несколько индексов с целью увеличения скорости доступа к данным.
Индекс - это внутренняя таблица, имеющая два столбца: значение выражения, содержащего все поля, включенные в индекс и местоположение каждой записи таблицы с данным значением выражения. Индекс может быть составным. Составные индексы - это индексы, выражение которых содержит более одного поля. Если Вы часто ведете поиск в больших таблицах одновременно по нескольким полям, то для ускорения поиска создаются составные индексы. Предположим, Вам часто требуется осуществлять поиск клиентов, проживающих в определенном городе и работающих в определенной компании или товары по определенной цене. Можно создать индекс, содержащий эти два поля, и поиск резко ускорится.
Запрос - объект, который позволяет пользователю получить нужные данные из одной или нескольких таблиц. Для создания запроса Вы можете использовать QBE (запрос по образцу) или инструкции SQL. Вы можете создавать запросы на выбор, обновление, добавление или удаление данных. С помощью запросов Вы можете создавать новые таблицы, используя данные из одной или нескольких таблиц, которые уже существуют.
Форма- объект, предназначенный в основном для ввода данных, отображения их на экране или управления работой приложения. Вы можете использовать формы для того, чтобы реализовать требования заказчика к представлению данных из запросов или таблиц. Формы можно распечатать. С помощью формы Вы можете в ответ на некоторое событие запустить макрос или процедуру, например, запустить макрос, когда изменяется значение определенных данных.
Отчет - объект, предназначен для создания документа, который потом может быть распечатан или включен в документ другого приложения. Перед выводом на принтер предусмотрен предварительный просмотр.
Макрос - объект, представляющий собой структурированное описание одного или нескольких действий, которые, по Вашему мнению, должен выполнить Access в ответ на определенное событие. Например, Вы можете определить макрос, который в ответ на выбор некоторого элемента в основной форме открывает другую форму. С помощью другого макроса можно осуществлять проверку значений некоторого поля при изменении его содержания. Вы можете также из одного макроса запустить другой макрос или функцию модуля.
Модуль- объект, содержащий программы (процедуры или функции) на языке Access VBA (Visual Basic for Applications). Эти процедуры или функции можно использовать для сложных вычислений, которые не могут быть представлены последовательностью простых математических вычислений, т.е. используются для выполнения действий, которые превышают возможности стандартных макросов. Обычно процедура или функция связывается с некоторым событием, таким как нажатие кнопки в активной форме или отчете. Модули могут быть независимыми объектами, содержащими функции, которые можно вызывать из любого места приложения, но они могут быть и непосредственно привязаны к отдельным формам или отчетам для реакции на проходящие в них те или иные изменения. Желательно использование модулей сократить до минимума, ограничиться вычислениями или событиями, которые не удается выполнить при помощи макросов. В Word и Excel для создания макросов предусмотрен специальный макрорекодер, а в Access типа специализированного конструктора, которые благополучно справляются с построением необходимых модулей, корректировать которые при необходимости проще, чем писать новые, в прочем это дело вкуса либо это продиктовано необходимостью.
Взаимосвязи основных объектов в Microsoft Access.
В Microsoft Access база данных включает в себя все объекты, связанные с хранимыми данными. Ниже приведен рисунок взаимосвязи основных объектов базы данных: таблиц, запросов, форм, отчетов, макросов и модулей. В таблице хранятся данные, которые вы можете извлекать с помощью запросов. Используя формы можно выводить данные на экран и изменять их. Формы и отчеты могут использовать данные непосредственно из таблиц или через запросы. Для выполнения необходимых вычислений и преобразования данных, запросы могут использовать встроенные функции или функции, написанные на языке VBA (Visual Basic for Application), например, делая запрос на выборку, в качестве условий отбора можно через построитель выбрать функцию (как встроенную, так и свою пользовательскую), т.е. запросы могут вызывать модули. События, связанные с формами или отчетами могут запускать макросы или функции и процедуры, написанные на VBA. Событие – это любое изменение состояния объекта. Например, событием является открытие/закрытие формы, изменение состояния элемента управления (например, нажатие кнопки) и т.п. Для обработки события вы можете создать макрос или процедуру VBA(модуль). При помощи макросов и модулей можно изменять ход выполнения приложения, открывать, фильтровать и изменять данные в формах и отчетах, выполнять запросы и создавать новые таблицы.
Дата добавления: 2015-10-13; просмотров: 705;