Хранение данных

Хранение данных - это перенос данных во времени путем организации долговременного размещения данных в виде информационных массивов. В случае электронных носителей, если информационный процесс автоматизирован, в роли информационных массивов выступают файлы или базы данных (БД). При хранении данные организуются таким образом, чтобы достаточно просто и оперативно выполнить поиск нужной информации, который осуществляется по специальным ключевым реквизитам. Методика поиска определяется организацией информационных массивов. Для минимизации времени поиска часто при использовании электронных носителей вводятся дополнительные служебные массивы. При этом имеет значение экономический аспект хранения: стоимость хранения должна быть соизмерима с ценностью данных.

При хранении различают структурированные и неструктурированные данные. В структурированных данных отражаются отдельные факты предметной области. Эта форма наиболее распространена в современных БД. Неструктурированные данные произвольны по формату и содержат тексты, графику и другие форматы. Данная форма широко используется, например, в Интернет-технологиях, а сами данные предоставляются пользователю в виде отклика поисковыми системами Интернета.

Для структурированных данных файл -это совокупность однотипно построенных записей, где под записью понимают элемент линейного списка, в состав которого входит группа взаимосвязанных полей [31]. Эта группа конструируется на основе какой-то реальной задачи и может повторяться как конструкция с изменением лишь значений отдельных полей записей.

Особенности файловой организации структурированных данных, связанные с ее недостатками:

1) по мере возникновения новых задач в предметной области создаются новые файлы;

2) организация файлов независима, поэтому нельзя представить информацию, отражающую взаимодействие файлов между собой;

3) использование файлов зачастую требует знания их принципа организации и языков программирования;

4) большое время затрачивается на получение ответа на запрос, качество решений бывает невысоким из-за отсутствия целостного представления данных;

5) имеет место дублирование данных;

6) усложнены процедуры модификации данных.

 

Для неструктурированных данных файл– это собственно информационный элемент, произвольный по структуре и содержанию, например, некоторый документ, подготовленный в Ms Word.

 

С увеличением сложности решаемых задач и расширением возможностей используемых средств вычислительной техники с начала 60-х г.г. 20-го века получает развитие концепция БД. Первоначально они были ориентированы на структурированные данные. Отличительные особенности БД:

1) взаимная связь данных, что упрощает их модификацию;

2) возможность разделения данных на данные общего пользования (формируют глобальные БД) и данные для конкретных прикладных задач (составляют локальные БД). Такая технология называется распределенной. Она может привести к некоторой избыточности в данных. Распределенная технология вызывает проблему защиты данных и управления правами доступа;

3) для поддержания глобальных БД и разработки общей структуры БД вводится должность администратора БД.

Для управления данными в БД разрабатывались специальные языковые средства: языки описания структур данных и языки манипулирования данными, которые составляли системы управления базами данных - СУБД. Современные СУБД, в основном, ориентированы на структурированные данные. Они характеризуются направленностью на распределенную обработку и имеют графический интерфейс для описания данных и манипулирования ими. Тем не менее, остаются встроенные языки программирования, которые позволяют решать задачи, не укладывающиеся в принятые интерфейсные средства.

В настоящее время разрабатываются СУБД и для неструктурированных данных.

 


Хранение включает следующие функции:

1) актуализацию данных – поддержание их на уровне, соответствующем информационным потребностям решаемых задач. Осуществляется с помощью добавления новых данных и изменения уже имеющихся;

2) уничтожение данных – логическое или физическое удаление данных из информационных массивов. В первом случае данные помечаются как неактуальные, что обеспечивает их интерпретацию как уничтоженных, хотя физически они остаются на носителе. Во втором случае данные физически удаляются (стираются), что исключает их восстановление, но высвобождает реальную память для хранения других данных.

3) оценку данных – их анализ, который выполняется в связи со старением данных. Устаревшие данные, утратившие ценность, должны исключаться из информационных массивов - уничтожаться;

4) защиту данных – предотвращение предумышленного или случайного искажения, уничтожения или утечки данных.

Подробно вопросы хранения данных для первых двух функций рассмотрены в [31]. Оценка и защита данных включены в настоящее учебное пособие.








Дата добавления: 2015-02-05; просмотров: 922;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.006 сек.