Модель данных в Windows Azure Table
Лекция 8. Структурированное хранилище данных Windows Azure Table
План:
1. Модель данных в Windows Azure Table
2. Секционирование данных в Windows Azure Table
3. Базовые операции таблиц и сущностей
4. Класс сущностей
5. Создание таблиц в Windows Azure Table
Модель данных в Windows Azure Table
Любое приложение вне зависимости от способа его размещения должно где-то хранить данные. При этом данные могут хранить локально, либо удаленно. "Облачный" способ хранения данных предлагает несколько иной способ. Обратим внимание на следующие особенности, которые необходимо учитывать при переносе традиционной реляционной структуры данных в Table Storage в "облаке":
· Структура данных удаленного хранения должна быть предельно простой. Чем проще структура данных, тем выше производительность доступа к данным нескольких конкурирующих приложений.
· Table Storage подходит для хранения реляционных данных, но само по себе данное хранилище реляционным не является. Это значит, то при переносе реляционной структуры данных в "облако", управлять ограничениями между субъектами хранения нужно будет пользователю.
Windows Azure Table поддерживает:
· Language Integrated Query – LINQ
· ADO.Net Data Services
· REST
· неограниченное число таблиц и сущностей, без ограничения размеров
· целостность каждой сущности
· блокировку обновлений и удалений
· возможность возврата частичных результатов запросов прерванных по времени ожидания, при этом имеется возможность продолжить дальнейшее выполнение запроса.
Для доступа к Windows Azure Table у приложения должна быть учетная запись. После создания учетной записи, пользователю предоставляется секретный ключ, используемый для аутентификации.
Ключевыми понятиями Table Storage являются:
· Таблица – содержит набор сущностей.
· Сущность – логически является строкой в таблице, представляет собой основной элемент данных, хранящихся в таблице. Содержит набор свойств.
· Свойство – Значение, хранимое в сущности.
Проводя аналогии с реляционным подходом, получим следующее: под таблицей понимается коллекция сущностей (Entities), подобных кортежам в реляционном подходе. Сущность же представляет собой набор свойств (Properties). Свойство же является парой "имя (name) - типизированное значение (typed value)". Сущности можно соотнести с полями в таблице в реляционном хранилище.
· ключ секции - свойство ключа таблицы. Используется для распределения по узлам хранения сущностей таблицы.
· ключ строки - свойство ключа таблицы, уникальный идентификатор сущности.
· временная метка - система хранит различные версии одной и той же сущности, для их различения используется временна метка.
· секция - набор сущностей с одинаковыми ключами секции.
Таблица 8.1. Пример: | |||||
Ключ секции | Ключ строки | Свойство 1 | ... | Свойство k | |
Отчетность1 | Значение свойства | ... | Значение свойства | Секция 1 | |
Отчетность1 | Значение свойства | ... | Значение свойства | Секция 1 | |
Документ1 | Значение свойства | ... | Значение свойства | Секция 2 | |
Документ1 | Значение свойства | ... | Значение свойства | Секция 2 | |
Документ1 | Значение свойства | ... | Значение свойства | Секция 2 |
· порядок сортировки осуществляется сначала по ключу секции, затем - по ключу строки.
Ограничения таблиц, сущностей и их свойств:
1. Имена свойств таблиц должны состоять только из букв и цифр.
2. Имя таблицы не должно начинаться с цифры.
3. Имена таблиц различают регистры.
4. Длина имени таблицы должна быть в пределах от 3 до 63 символов
5. Сущность может иметь не более 255 свойств
6. Свойства "ключ секции" и "ключ строки" не могут быть больше 1Кб размером.
7. Свойство "временная метка" является ReadOnly.
8. Windows Azure Table не хранит схем, т.е. значения свойств сущностей одной таблицы могут относиться к разным типам данных.
9. Суммарный объем всех данных не может превышать 1Мб
Таблица 8.2. Поддерживаемые WAT типы данных: | |
Тип | Описание |
Binary | Массив байтов до 64Кб |
Bool | Булевское значение |
Datetime | 64-битное значение временного UTC - формата, от 1.1.1600 до 12.31.9999 |
Double | 64-битное действительное число |
GUID | 128-битный уникальный идентификатор |
Int | 32-битное целочисленное значение |
Int64 | 64-битное целочисленное значение |
String | Значение кодировки UTF-16, размером до 64Кб |
Секционированиe
Главным образом от распределения секций по узлам хранения зависит масштабируемость системы хранения данных.
Система распределяет секции по узлам хранения по результатам истории использования секций, т.е. если ряд секций запрашивается чаще остальных, то система автоматически распределит их по нескольким узлам хранения, распределяя трафик между несколькими серверами. Важно помнить, что при этом объем секции не ограничен размерностью узла хранения.
Кроме того, хранение сущностей одной секции вместе позволяет повысить эффективность кэширования и других методов повышения производительности.
В случае, если операции осуществляются над сущностями одной таблицы и секции приложение может осуществлять несколько операций создания, обновления и удаления для набора сущностей в пределах одного пакетного запроса к системе. При выполнении операции происходит изоляция моментального снимка, вне зависимости от исхода самой операции. Таким образом, все последующие операции, выполняющиеся в это же время, осуществляются над снимком, сделанным до начала операции. Результат транзакции становится доступным только после ее успешного завершения.
Дата добавления: 2016-03-05; просмотров: 1332;