ГЛАВА 7. БАЗЫ ДАННЫХ
Общие сведения
База данных (БД) - это система хранения информации, обращение к которой осуществляется через систему управления (СУБД). На практике представляет собой данные, рассортированные по идентификаторам и организованные в виде таблиц. Основное назначение БД - предоставить пользователю нужную информацию в нужном месте и в нужное время.
История развития
Путь развития БД - это путь отстранения программного обеспечения от физических структур данных. До появления БД информация хранилась в отдельных файлах. Самые первые системы управления файлами позволяли программистам создавать, записывать, обновлять и читать эти файлы. Недостаток: Для определения адресов необходимо применение довольно сложных, трудно оптимизируемых и модифицируемых алгоритмов.
1) Индексные файлы, обеспечивающие доступ к информации посредством индексных ключей, т. е. для поиска записей в файле использовалась совокупность указателей. Недостатки: неоптимальное хранение информации (дублирование, недостаточное структурирование), и значительное время поиска в больших файлах.
2) Иерархические БД. В таких базах элементы данных строго упорядочены, причем так, что данные одного уровня подчиняются (является подмножеством) данным другого, более высокого уровня. Связи данных могут быть отражены в виде дерева-графа, где допускаются только односторонние связи от старших вершин к младшим. Недостаток: взаимосвязи в реальном мире как правило не являются иерархическим.
3) Сетевые СУБД, учитывали более сложные взаимосвязи между элементами. Управляющие программы для таких СУБД становились все более и более независимыми от физических структур данных. Недостатки: сложность реализации СУБД, чувствительность к модификации программ. Так как каждый элемент данных должен содержать ссылки на другие элементы, требуются значительные объемы памяти, что приводит к снижению быстродействия.
4) Реляционные базы данных (РБД). В РБД все данные представлены в формате таблиц или, по терминологии реляционной алгебры, отношений (relation). Таблица в реляционной алгебре - это неупорядоченное множество записей (строк), состоящих из одинакового набора полей (столбцов). Каждая строка характеризует некий объект, каждый столбец - одну из его характеристик. Совокупность таких связанных таблиц и составляет БД, при этом таблицы полностью равноправны - между ними не существует никакой иерархии. Реляционная модель является простейшей и наиболее привычной формой представления данных. Достоинства:
1) Модель данных являются интуитивно понятной конечному пользователю.
2) Реорганизация данных на физическом уровне не влияет на выполнение прикладных программ. Одним из важнейших побочных эффектов данного преимущества является появление клиент-серверных архитектур.
3) Практически отсутствует дублирования данных.
В настоящее время сущствует пять основных производителей СУБД: IBM, Informix, Microsoft, Oracle и Sybase.
Открытые системы используют обращение к СУБД через драйвер ODBC (Open Database Connectivity – подключение к открытой БД). ODBC используется для обеспечения независимости прикладной программы от типа СУБД или типа ОС и требуется подключиться одновременно к нескольким СУБД, например к SQL Server, Excel, Access и т.д.
Существует две категории приложений БД:
1) OLTP (Online Transaction Processing - оперативная обработка транзакций). Используются при оперативном управлении. Обычно это критические для деятельности приложения, требующие быстроты отклика и жесткого контроля над безопасностью и целостностью данных.
2) DSS (Decision Support System - системы поддержки принятия решений). Как правило, крупнее, чем OLTP-системы. Обычно они используются при анализе и планировании с выдачи отчетов и рекомендаций.
Критерии оценки БД
1) Возможность доступа конечных пользователей к нужной информации в нужном месте и в нужное время
2) Открытость и гибкость запросов информации
3) Надежность БД
4) Распространенность и поддержка ее технологии большим числом независимых производителей ПО
5) Интеграция с ПО
6) Стоимость БД и аппаратной платформы для ее поддержки
Модель "клиент-сервер" в настоящее время является доминирующей компьютерной архитектурой, возникшей в результате объединения ПК с централизованными, надежными и отказоустойчивыми мэйнфреймами. Клиент-серверные системы одновременно используют вычислительную мощь как клиента, так и сервера, возлагая интенсивную обработку данных на сервер и оптимизируя сетевой трафик так, чтобы повысить общую эффективность работы.
В качестве интерфейса в клиент-серверных системах используется язык структурированных запросов SQL (Structured Query Language). Он представляет собой средство организации, управления и поиска информации в РБД.
Достоинства SQL:
1) независимость от поставщика;
2) переносимость на разные платформы;
3) опора на реляционные принципы хранения информации;
4) высокоуровневая структура;
5) возможность интерактивного выполнения запросов;
6) поддержка со стороны крупных производителей
Дата добавления: 2016-11-28; просмотров: 815;