Архитектурные решения СВГ на основе применения отказоустойчивых вычислительных кластеров

Для повышения надежности бизнес критических систем, а именно устойчивости к воздействию различных внешних и внутренних факторов, а так же повышению производительности и масштабируемости применяется кластерный подход.

Сильными сторонами такого подхода является наличие потенциала для наращивания вычислительных мощностей и избыточности системы. Отказоустойчивость кластера обеспечивается дублированием всех жизненно важных компонент. Максимально отказоустойчивая система должна не иметь ни одной точки (то есть активного элемента), отказ которой может привести к потере функционирования системы. Такую характеристику называют NSPF (No Single Point of Failure) (рисунок 2.5).

Рис. 2.5. Кластерная система без точек отказов

Негативной характеристикой такого подхода является усложненное администрирование и техническое обслуживание, а так же обеспечение безопасности системы в целом.

В классификации вычислительных систем термин «кластер» впервые ввела компания Digital Equipment Corporation (DEC). По определению DEC, кластер – это группа вычислительных машин, которые связаны между собой и функционируют как один узел обработки информации. Кластер функционирует как единая система. Для пользователя или прикладной задачи вся совокупность вычислительной техники выглядит как один компьютер. Именно это и является важнейшим при построении кластерной системы. Первые кластеры компании Digital были построены на машинах VAX. Их уже никто не использует, но общие принципы, заложенные при проектировании, остаются основой при построении кластерных систем и сегодня.

Кластерные системы должны удовлетворять таким общим требованиям:

- высокая готовность;

- высокое быстродействие;

- масштабируемость;

- общий доступ к ресурсам.

При каждой конкретной реализации вычислительного кластера одни из требований становятся первоочередными, тогда как другие отходят на второй план. При реализации кластера, для которого важнейшим является быстродействие, ради экономии ресурсов меньшее внимание уделяется высокой готовности.

По функциональности кластеры можно разделить на скоростные (High Performance), системы высокой готовности (High Availability) и смешанные. Высокоскоростные кластеры используются для задач, в которых необходима значительная вычислительная мощность.

Кластеры, которые принадлежат к СВГ, используются всюду, где стоимость возможного простоя превышает стоимость расходов, необходимых для построения кластерной системы. Смешанные системы объединяют особенности первого и второго типов. Позиционируя их, следует отметить, что кластер с параметрами как High Performance, так и High Availability, обязательно проигрывает в быстродействии системе, ориентированной на высокоскоростные вычисления. В настоящее время существуют и активно развиваются четыре типа построения кластерных систем (рис. 2.6): локальный, кампусный, метро и континентальный.

Рис .2.6. Типы кластеров

Данная классификация типов кластеров была предложена фирмой HP. В ее основе лежит территориальное распределение вычислительных ресурсов.

Локальный кластер–базовое решение. Все узлы кластера расположены в одном центре обработки данных. Повышается время доступности бизнес-приложений путем минимизации простоев вызванных ошибками оператора, отказами оборудования, сбоями программного обеспечения или необходимостью проведения регламентных работ.

Используется сеть LAN (Local Area Network) (может быть дублированной), системы хранения данных, волоконно-оптическая сеть хранения данных SAN (Storage Area Network), сетевые устройства хранения NAS (Network Attached Storage).

High Availability кластеры можно разделить на: Shared Nothing Architecture (SNA) – кластеры с динамической архитектурой (без общих ресурсов), Shared Disk Architecture (SDA) –кластеры с общими ресурсами хранения данных.

В архитектуре без общих ресурсов не используется общая система сохранения данных, каждый узел имеет свои дисковые накопители. Распределяются коммуникационные каналы.

Архитектура с общими ресурсами хранения данных классически используется для построения кластерных систем высокой готовности, ориентированных на обработку больших объемов данных. Такая система состоит из общей системы хранения данных и узлов кластера, которые распределяют доступ к общим данным. При высокой мощности системы хранения данных, архитектура с общими дисками является наиболее эффективной. В этом случае не нужно держать несколько копий данных и в то же время, при выходе из строя узла, задачи могут быть мгновенно доступными для других узлов.

В случае, когда в задаче удается логично разделить данные и запрос, из некоторого подмножества запросов, можно обслужить с использованием части данных, то система без распределения ресурсов может оказаться более эффективной.

Двухузловые отказоустойчивые кластеры - самые популярные современные коммерческие системы. Относительно распределения программных ресурсов различают две модели реализации отказоустойчивых кластерных систем: активный-активный (Active Active) и активный-пассивный (Active Passive) кластеры.

В модели активный-активный кластер одна задача выполняется на нескольких серверах одновременно.

Такая модель обработки задач реализована в Oracle Pаrallel Server, MS SQL, IBM DB2. Эту модель можно реализовать лишь при наличии прикладного программного обеспечения, сориентированного на функционирование в кластерном режиме. В модели активный-активный кластер можно масштабировать скорость выполнения задачи путем добавления нового узла, если, конечно, программным обеспечением поддерживается необходимое количество узлов. Так Oracle Parallel Server поддерживает работу на кластере от 2 до 6 узлов.

Очень часто пользователи сталкиваются с проблемой, когда нужно обеспечить отказоустойчивое функционирование уже готовых программных решений. К сожалению, модель активный-активный кластер в таком случае не работает. Для подобных ситуаций используется модель, в которой обеспечивается миграция задач, выполняемых на узле, который вышел из строя, на другие узлы. Таким образом, получаем реализацию активный-пассивный кластер.

Учитывая, что во многих случаях одну задачу можно разбить на несколько путем распределения зон ответственности, а также то, что в общем случае на предприятии нужно выполнять много разных задач, реализуется так называемая модель кластерной системы псевдо активный-активный кластер.

Если нужно обеспечить отказоустойчивую работу нескольких программных ресурсов, достаточно добавить в систему новый узел и запустить на кластере нужные задачи, которые в случае отказа этого узла перейдут к выполнению на другом узле. Далее рассмотрим принципы построения более масштабных решений.

Кампусный кластер–система, построенная для защиты центра обработки данных. Узлы высокопроизводительного кластера разнесены по различным зданиям на территории одного предприятия (рис. 2.7). Сбой в одном узле не приводит к простою всей информационной системы. В типовом решении применяются:

1. дублированные внешние разделяемые системы хранения данных со средствами репликации данных, такими как: EMC CLARiiON, EMC Celerra, EMC Symmetrix, HP EVA, Oracle Sun Storage, HDS;

2. дублированные, проложенные по разным маршрутам, сети передачи данных LAN, SAN;

3. альтернативные источники питания для каждого узла.

Рис. 2.7. Схема кампусного кластера.

Каждый сервер имеет доступ ко всем дисковым массивам, отказ массива не приводит к остановке приложения, есть возможность использовать различные массивы. Система способна парировать следующие отказы: отказ узла, линии коммутации, коммутатора, дискового массива, недоступность сайта.

Метрокластер – это специальная архитектура для основного и резервного центров обработки данных. Она обеспечивает максимальную защиту данных. При этом состояние данных проверяется перед запуском приложения. Кроме того, такое решение обеспечивает высокую производительность благодаря репликации данных средствами дисковых массивов. Система может противостоять тем же видам отказов, что и кампусный кластер.

Континентальный кластер – это архитектура для защиты системы от региональных катастроф (землетрясения, наводнения), снимает ограничение на расстояние между ЦОД (рис. 2.8). Ко всем преимуществам вышеописанных архитектур добавляется полуавтоматическое переключение на резервный ЦОД.

Рис.2.8. Схема континентального и метрокластера.

Узлы кластера разнесены на большие расстояния, что уменьшает вероятность выхода из строя всей системы в случае катастрофы. Решение предусматривает средства синхронизации, для чего используется площадка-арбитр, содержащая дополнительный узел, синхронизирующий работу всех узлов кластера. Метрокластер и континентальный кластер используют технологии аппаратной репликации данных, с использованием возможностей различных дисковых массивов, типа: HP EVA, XP, Oracle Sun Storage, EMC Symmetrix, HDS. Также используются технологии программной репликации данных на базе решений ORACLE, EMC, Symantec/Veritas.

<16 17 181920 21 22 >

Дата добавления: 2015-08-11; просмотров: 1593;