Физическая и логическая независимость данных
Физическая и логическая независимость данных. Модели данных
В процессе исследований посвященных устройству СУБД, предлагались различные способы ее реализации. Наиболее жизнеспособной оказалась трехуровневая модель, определяющая следующие уровни абстракций для определения структуры СУБД (рисунок 2.1): внутренний (физический), концептуальный и внешний (логический).
1. Внешний уровень, отражает представления прикладного программиста или конечного пользователя и связан с тем, как отдельные пользователи представляют себе эти данные или «видение» собственных данных каждым отдельным приложением.
2. Концептуальный уровень отражает обобщенную модель предметной области (объектов реального мира). Концептуальный уровень дает наиболее полное представление о структурах данных. Концептуальная модель состоит из множества экземпляров различных типов объектов и связей (концептуальных записей).
3. Внутренний уровень близок к физической памяти и связан со способом физического хранения данных, например, каким способом данные располагаются на носителях.
Рисунок 2.1- Трехуровневая модель СУБД (ANSI)
Эта архитектура была предложена ANSI (American National Standards Institute), ее основным достоинством является то, что она позволяет обеспечить логическую и физическую независимость при работе с данными.
Логическая независимость предполагает возможность изменения одного приложения без корректировки других приложений, работающих с этой БД.
Физическая независимость предполагает возможность изменения способа хранения, расположения или переноса данных на носителях (на физическом уровне) без влияния на работоспособность всех приложений работающих с БД.
Другими словами, если происходит какое-либо изменение в расположении данных на носителях, это никак не отражается на работе приложений внешнего уровня. И наоборот, если происходит какое-либо дополнение приложений внешнего уровня, то изменений на физическом уровне не происходит.
Модели данных
Одними из основополагающих в концепции БД являются обобщенные категории «данные и модель данных». Данные - это набор конкретных значений, параметров, характеризующих объект.
Модель данных – это некоторая абстракция, прикладываемая к конкретным данным, позволяет пользователям трактовать их как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними.
В соответствии с изложенной ранее трехуровневой архитектурой мы сталкиваемся с понятием модели данных по отношению к каждому уровню (Рисунок 2.2).
Рисунок 2.2 - Классификация моделей данных
Физическая модель данных оперирует категориями касающаяся организации внешней памяти и структур хранения, используемых в данной операционной среде. В настоящий момент в качестве физических моделей используются различные методы размещения данных, основанные на файловых структурах: это организация файлов прямого и последовательного доступа, индексных файлов, файлов, использующих различные методы кэширования, взаимосвязанных файлов. Кроме того, в современных СУБД широко используют страничную организацию данных. Физические модели данных, основанные на страничной организации, являются наиболее перспективными.
Наибольший интерес вызывают модели данных, используемые на концептуальном уровне. По отношению к ним внешние модели называются подсхемами и используют те же абстрактные модели, что и концептуальные модели данных.
Кроме трех рассмотренных уровней абстракций при проектировании БД существует еще один уровень, предшествующий им. Модель этого уровня должна выражать информацию о предметной области в виде, независимом от используемой СУБД. Эти модели называют инфологическими или семантическими, и отражают естественный и удобный для разработчиков и других пользователей форме, связанной с описанием объектов предметной области, их свойств и взаимосвязей. Инфологические модели используются на этапе проектирования БД.
Документальные модели данных соответствуют представлению о слабоструктурированной информации, ориентированной в основном на свободные форматы документов, текстов на естественном языке.
Модели, основанные на языках разметки документов, связаны, прежде всего, со стандартным общим языком разметки — SGML (Standart Generalised Markup Language), который был утвержден ISO в качестве стандарта еще в 80-х годах. Этот язык предназначен для создания других языков разметки, он определяет допустимый набор тегов (ссылок), их атрибуты и внутреннюю структуру документа. Контроль за правильностью использования тегов осуществляется при помощи специального набора правил. С помощью SGML можно описывать структурированные данные, организовывать информацию, содержащуюся в документах, представлять эту информацию в некотором стандартизованном формате. Но ввиду некоторой своей сложности SGML использовался в основном для описания синтаксиса других языков (наиболее известным из которых является HTML), и немногие приложения работали с SGML-документами напрямую.
Язык HTML позволяет определять оформление элементов документа и имеет некий ограниченный набор инструкций - тегов, при помощи которых осуществляется процесс разметки. Инструкции HTML в первую очередь предназначены для управления процессом вывода содержимого документа на экране программы-клиента и определяют этим самым способ представления документа, но не его структуру. В качестве элемента гипертекстовой базы данных, описываемой HTML, используется текстовый файл, который может легко передаваться по сети с использованием протокола HTTP. Эта особенность, а также то, что HTML является открытым стандартом и огромное количество пользователей имеет возможность применять возможности этого языка для оформления своих документов, безусловно, повлияли на рост популярности HTML и сделали его сегодня главным механизмом представления информации в Интернете. Однако HTML сегодня уже не удовлетворяет в полной мере требованиям, предъявляемым современными разработчиками к языкам подобного рода. И ему на смену был предложен новый язык гипертекстовой разметки, мощный, гибкий и, одновременно с этим, удобный язык XML.
XML (Extensible Markup Language) — это язык разметки, описывающий целый класс объектов данных, называемых XML-документами. Он используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов. То есть сам по себе XML не содержит никаких тегов, предназначенных для разметки, он просто определяет порядок их создания.
Тезаурусные модели основаны на принципе организации словарей, содержат определенные языковые конструкции и принципы их взаимодействия в заданной грамматике. Эти модели эффективно используются в системах-переводчиках, особенно многоязыковых переводчиках. Принцип хранения информации в этих системах и подчиняется тезаурусным моделям.
Дескрипторные модели - самые простые из документальных моделей, они широко использовались на ранних стадиях использования документальных баз данных. В этих моделях каждому документу соответствовал дескриптор — описатель. Этот дескриптор имел жесткую структуру и описывал документ в соответствии с теми характеристиками, которые требуются для работы с документами в разрабатываемой документальной БД. Например, для БД, содержащей описание патентов, дескриптор содержал название области, к которой относился патент, номер патента, дату выдачи патента и еще ряд ключевых параметров, которые заполнялись для каждого патента. Обработка информации в таких базах данных велась исключительно по дескрипторам, то есть по тем параметрам, которые характеризовали патент, а не по самому тексту патента.
Дата добавления: 2015-11-18; просмотров: 1190;