Определение, виды баз данных.
База данных (БД) – это организованная структура для хранения данных, в которой благодаря упорядоченности можно проводить поиск информации по заданным критериям и выводить ее в требуемой форме. Данные становятся доступными для эффективного поиска и представления лишь после того, как будут упорядочены каким-либо разумным способом. Без упорядочения работать с информацией трудно – большая часть времени будет уходить на поиск нужных данных[14].
Система управления базами данных (СУБД)– это приложение, компьютерная программа, позволяющая создавать базы данных определенного типа и работать с ними. Для использования базы данных требуется иметь СУБД, в которой создана эта база. Часто СУБД ошибочно называют просто базой данных.
В базах могут храниться разные типы данных: текст, числа, дата/время, графика, гиперссылки, звуки и пр. При этом в нормально спроектированной базе данных новые поступления не снижают ее эффективности, на поиск нужной информации затрачивается немного времени и при сотнях, и при миллионах единиц хранения.
В широком смысле к базам данных можно отнести докомпьютерные средства хранения информации: архивы, библиотеки, картотеки и т.д. Но на практике базами данных имеет смысл называть только компьютерные структуры хранения и обработки данных.
По структуре управления базы данных делятся на:
· пользовательские – данные хранятся на компьютере пользователя;
· сетевые – данные хранятся на сервере и выдаются по запросам клиентов (рабочих станций);
· распределенные – имеется много серверов хранения данных, образующих распределенную структуру, при которой серверы связаны между собой различными путями.
В базах данных всероссийских организаций, тем более транснациональных корпораций, поиск нужной информации по запросу может затрагивать цепочку из серверов, географически удаленных друг от друга.
Крупные корпоративные базы данных чаще всего имеют такую структуру, при которой каждому пользователю может быть предоставлена только часть информации. Например, в банке никто, даже директор банка, не имеет доступа ко всей имеющейся в базе данных информации. Это делается в целях безопасности.
По форме организации данных различают следующие виды БД.
Иерархические– данные группируются в директории, которые имеют связь с одной директорией более высокого уровня. В каждую директорию может входить произвольное количество данных и «подчиненных» ей директорий более низкого уровня. Пример иерархической структуры: логическая файловая структура компьютера, с которой знаком каждый пользователь. Первые базы данных, иерархические, появились в середине 50-х годов прошлого века.
Сетевые – здесь директории и отдельные данные имеют между собой связи, произвольно созданные разработчиками базы, с той или иной целью. По существу это структура с гиперссылками. Сетевые БД появились в середине 60-х годов. Гиперссылками можно снабдить различные документы и массивы документов, созданные в Word, Excel, Power Point и других программах. А самая мощная гипертекстовая структура: служба World Wide Web, занимает большую часть Интернета. Но сетевая структура превратится в базу данных, только если она обладает надежными и эффективными средствами поиска нужной информации. Такими как Google или Яндекс.
Реляционные (от слова relation, что значит отношение, или связь) – распространенные средства хранения больших массивов данных. Их отличает простота структуры, удобное табличное представление данных и наличие эффективного математического аппарата реляционной алгебры для обработки данных. Реляционные БД устанавливают логические связи между данными и позволяют одной командой обрабатывать большие массивы связанных данных. Вместе с тем, для их создания не требуется высокой квалификации программиста. Реляционные базы данных появились после публикации в начале 70-х годов революционных для того времени научных статей математика Эдгара Тодда. Их появление считают началом второго этапа эволюции СУБД.
Объектно-ориентированные – здесь ставится задача моделирования реального мира. Область, которую описывает безе данных (предметная область) представляется совокупностью сущностей или объектов. Каждый объект обладает собственным поведением и моделирует объект реального мира. Свойства объекта и его поведение делают неизменными. Но объект может менять свое состояние, управляться и вступать в различные соотношения с другими объектами. Возможны эволюция объектно-ориентированной модели, наследование свойств одних объектов другими, и другие действия, похожие на поведение объектов реального мира. Объектно-ориентированный подход применяется для разработки сложных, распределенных баз данных корпоративного уровня.
Базы данных первого поколения были иерархическими и сетевыми, они применялись на больших ЭВМ. Они обладают многими недостатками и сейчас не создаются. Однако в таких базах до сих пор хранится актуальная информация. Потому что в их создание были вложены огромные средства и, несмотря на морально устаревшую архитектуру, иногда удобнее использовать их, чем создавать и наполнять новые хранилища.
Из СУБД первого поколения выросли такие полезные вещи, как файловые системы компьютеров, гипертекстовые структуры на базе текстовых редакторов и электронных таблиц, интернет-порталы и др. Все эти технологии обладают определенными признаками баз данных, но полноценными базами данных не считаются.
Сейчас для создания простых баз данных обычно используют реляционные СУБД. Они могут работать без проблем на логическом уровне и не требует больших затрат на создание. Для корпоративных систем применяют объектно-ориентированные СУБД. При этом используются распределенность данных, высокоуровневые языки программирования, фрагментация и параллельная обработка запросов, тиражирование и многопоточность данных, другие революционные достижения. А наиболее перспективными считаются гибридные, объектно-реляционные СУБД.
Далее будут рассмотрены реляционные БД, широко распространенные и не требующие при создании высокой квалификации в области программирования.
[1]Чем различаются выражения ЭВМ и компьютер? Ничем, это синонимы. ЭВМ – это сокращение слов «электронно-вычислительная машина», а «computer» переводится как «вычислитель».
[2] Понятие «дискретный» противоположно понятию «непрерывный». Дискретный сигнал имеет резкий, практически неразличимый в пространстве/времени переход из одного состояния в другое. Например, текст представляет собой набор из дискретных сигналов – букв.
[3] Машинные протоколы можно уподобить языкам человеческого общения, которые тоже представляют собой набор стандартов и правил, позволяющих таким «устройствам» как люди правильно обмениваться информацией, закодированной в словах. Так что, орфографию грамматику, словарный запас русского языка можно тоже считать протоколом. Современные машинные протоколы отличаются внушительным объемом. Например, полное описание протокола GPRS, применяемого в мобильной телефонной связи, занимает 11 тысяч машинописных станиц.
[4] Массив данных – совокупность однородных по структуре параметров, приведенная в систему.
[5] Правда есть одно исключение: созданный в 2008 году в Канадесервис TinEye.com. Эта система действительно ищет в Сети картинки, похожие на ту, что загружена посетителем. За прошедшие годы сервис сильно улучшил свою работу, и теперь там вполне можно отыскать фотографию, похожую на загруженную. Например, выявить на сайтах знакомств человека, выступающего под разными именами.
[6]Например, термин «троянский конь» может относиться и к поэме Гомера «Илиада», и к компьютерным вирусам, и к другим ситуациям, когда под видом подарка преподносится некая крупная неприятность.
[7] Для полного понимания логических операторов см. раздел данного курса лекций: «Логические основы построения ЭВМ».
[8]Говорить о том, что сервер – «главный компьютер в сети», что он «управляет сетью» - не совсем правильно. В конечном счете, миром информационных технологий управляет человек, в том числе пользователь. Также неверно утверждать, что через сервер проходит все данные, имеющиеся в сети. Все данные проходят не через сервер, а через так называемый концентратор, или switch, соединяющий воедино все коммуникации от всех компьютеров. В том числе и от сервера.
[9] Согласно теории соединений (раздел математики) эта формула соответствует размещению элементов (один из видов соединения), если допускается повторение элементов.
[10] Как известная героиня Эллочка Людоедка, у которой в словаре было только 32 слова.
[11]Объединению битов в байты придается такое значение, что характеристики вычислительной техники, размер файлов измеряется не в битах, а в байтах. Получается, что в компьютере битов, не объединенных в байты нет.
А вот количество данных, переданных по сети, измеряется в битах, скорость в бит/сек. Это объясняется тем, что при передаче данных по каналам связи (проводам, радиоканалам и пр.) не имеет никакого значения содержание передаваемой информации. Канал связи просто передает двоичные сигналы, которые на приеме обрабатываются. В результате получается сообщение, несущее ту или иную информацию.
[12] См главу 2.3. «Кодировка текстовых данных».
[13] Подробно компьютерная графика, в том числе цветовые модели будет изучаться позднее.
[14] Подобно тому, как если у вас имеется множество хаотично разбросанных предметов, то при работе с ними свыше 90% рабочего времени будет уходить на поиск нужной вещи.
Дата добавления: 2016-04-22; просмотров: 1020;