Операции над данными
В структуре возможных операций с данными можно выделить следующие основные понятия:
1. Сбор данных – накопление данных с целью обеспечения достаточной полноты информации для принятия решений;
2. Формализация данных – приведение данных, поступивших из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, т.е. повысить уровень доступности;
3. Фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшить уровень «шума», а достоверность и адекватность должны возрастать;
4. Сортировка данных – упорядочение данных по заданному признаку с целью удобства использования;
5. Группировка данных – объединение данных по заданному признаку с целью повышения удобства использования
6. Архивация данных – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат;
7. Защита данных – это комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;
8. Транспортировка данных (источник данных – сервер, а потребитель – клиент)
9. Преобразование данных – перевод из одной формы в другую.
2. Кодирование данных.
Для автоматизации работы с данными различного типа используется кодирование. Кодирование – это выражение данных одного типа через данные другого типа.
В вычислительной системе используется двоичное кодирование, т. е. представление данных последовательностью всего двух символов 0 и 1.
Целые числа кодируются двоичным кодом достаточно просто. Для кодирования действительных чисел используется 80-разрядное кодирование. При этом число предварительно преобразуется в нормализованную форму.
R =
Первая часть m называется мантиссой, а вторая e – экспонентой. Большая часть бит отводиться для хранения мантиссы (вместе со знаком), и некоторое фиксированное количество для хранения экспоненты.
Для кодирования текстовых данных каждому символу сопоставляется целое число. С помощью восьми двоичных разрядов можно закодировать 256 различных символов. Этого достаточно для кодировки символов английского и русского языков, как строчных, так и прописных, а также знаков препинания, символов арифметических операций и некоторых общепринятых специальных символов.
Институт стандартизации США ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange). В системе ASCII закреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.
Другая система, основанная на 16-разрядном кодировании, является универсальной и называется UNICODE. Шестнадцать разрядов позволяют кодировать до 65 536 различных символов, что достаточно для размещения в одной таблице символом большинства языков планеты.
Любое графическое изображение представляет собой совокупность точек, имеющих различные цвета. Для представления изображения также используется двоичное кодирование, так как линейные координаты и индивидуальные свойства каждой точки можно выразить с помощью целых чисел.
Для кодирования звуковых данных используется FM метод, основанный на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот. каждый из таких сигналов представляет собой правильную синусоиду, а следовательно может быть числовыми параметрами, т. е. кодом.
3. Основные структуры данных.
Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, т. е. образуют заданную структуру. Структурирование – это введение соглашений о способах представления данных.
Существует три основных типа структур данных: линейная, иерархическая и табличная.
Линейные структуры – это списки. Список – это простейшая структура данных, отличающихся тем, что адрес каждого элемента данных определяется его номером. Обычный журнал посещаемости занятий имеет структуру списка, поскольку студенты зарегистрированы в нем под своими уникальными номерами.
Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра как в списках, а из нескольких.
Реляционная модель ориентированна на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив. Отношения представлены в виде таблиц, строки которых соответствуют записям, а столбцы полям.
Содержит перечень объектов одного типа. А каждой строке таблицы последовательно размещаются значение свойств одного из объектов; каждое значение свойства – в своем столбце, озаглавленное именем свойства.
Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом или ключевым полем.
Ф.И.О | дата | адрес | телефон | оклад |
Система управления базами данных (СУБД) – программа, которая позволяет создавать базы данных и обеспечивает обработку, сортировку и поиск данных.
Примером такой СУБД является офисное приложение Access . В отличие от других приложений Windows, Access может единовременно обрабатывать только одну базу данных.
Окно базы данных – один из главных элементов Access. В нем представлены все объекты БД.
Таблицы – базовый объект БД. Все остальные объекты создаются на основе таблиц. Столбцы в такой таблице называют полями, строки – записями.
Запросы – являются основным инструментом БД. С их помощью осуществляется отбор данных, исходя из заданных условий;
Отчеты – предназначены для печати данных, выбранных согласно запросу;
Формы – позволяют добавлять в таблицы новые данные, корректировать существующие. Форма может содержать графики, рисунки и другие внедренные объекты;
Макросы – как и в других приложениях, служат для автоматизации часто повторяющихся операций.
Дата добавления: 2019-10-16; просмотров: 1179;