Фактор высокой готовности и классификация СВГ
В литературных источниках [2,3] при рассмотрении методов и средств технологии высокой готовности употребляются термины "системы высокой готовности", "устойчивые и эластичные к сбоям и отказам системы", "системы непрерывной и постоянной готовности". Однако как и многие термины в области информационных технологий (ИТ), они трактуются по-разному отдельными поставщиками и потребителями. Прежде чем говорить о системах, при проектировании которых применяется технология высокой готовности, следует определить их место среди систем, к надежности функционирования которых предъявляются повышенные требования. Сегодня для определения различных типов систем используется та или иная форма снижения планового и непланового времени простоя.
Системы высокой готовности (High Availability System)- системы с высоким коэффициентом готовности, минимизирующие плановое и неплановое время простоя и использующие компьютерную технологию. При этом конфигурация системы обеспечивает ее быстрое восстановление после обнаружения неисправности, для чего в ряде мест используются избыточные аппаратные и программные средства [2]. Время, в течение которого программа, отдельный компонент или система простаивает, колеблется от нескольких секунд до нескольких часов, но чаще всего составляет от 2 до 20 минут. Обычно системы высокой готовности хорошо масштабируются. В контексте изложенного выше возможно использование термина отказоустойчивые компьютерные системы (СВГ).
Все системы высокой готовности обеспечивают устойчивость к отказам и сбоям в работе дисков и системы электропитания благодаря применению принципа избыточности: RAID, UPS и т.п. Следует отметить, что для современных систем высокой готовности характерно использование технологии "горячей" замены отказавшего узла.
Системы, эластичные к сбоям (Fault Resiliency Systems). Поставщики СВГ делят весь модельный ряд таких систем на две части, при этом в первой части оказываются системы, эластичные к сбоям. Эластичность к сбоям определяет более короткое время восстановления, которое позволяет системе быстро откатиться назад при обнаружении неисправности.
Отказоустойчивые системы (Fault Tolerance Systems). Устойчивые к сбоям системы имеют в своем составе избыточную аппаратуру для всех функциональных блоков, включая процессоры, источники питания, подсистемы ввода/вывода и подсистемы дисковой памяти. Если соответствующий функциональный блок неправильно работает, всегда имеется горячий резерв и неисправность в любом блоке не может вывести систему из строя. В ряде отказоустойчивых компьютерных систем избыточные аппаратные средства можно использовать для распараллеливания обычных работ. Время восстановления после обнаружения неисправности для переключения отказавших компонентов на избыточные в таких системах обычно меньше одной секунды.
Системы с непрерывной готовностью (Continuous Availability Systems). Лучшими среди отказоустойчивых систем являются системы, обеспечивающие непрерывную готовность. Продукт с непрерывной готовностью, если он работает корректно, позволяет ликвидировать как плановые, так и неплановые простои и проводить модернизацию (upgrade) и обслуживание системы в оперативном режиме (режиме on-line). Разработка подобной системы охватывает как аппаратные средства, так и программное обеспечение. Очень важным дополнительным требованием к таким системам является сохранение уровня производительности в случае отказа какого-либо компонента. Время восстановления после отказа не превышает одной секунды.
Следует отметить, что СВГ, спроектированные и изготовленные с применением технологий высокой готовности, допускают возможность сбоя в работе компьютера. Однако если типичное значение коэффициента готовности для обычной вычислительной системы составляет 99%, что эквивалентно примерно 80 часам простоя в год, то для СВГ непрерывной готовности этот параметр устанавливается на уровне 99.999% - 5 минут простоя в год.
Важно понимать, что системы высокой готовности вовсе не обязательно использовать для поддержки всех приложений сложных технических систем (СТС). Однако если работа оперативного приложения жизненно важна для функционирования СТС, именно непрерывная готовность обеспечивает наивысший возможный уровень гарантии того, что приложение будет спокойно поддерживаться в рабочем состоянии 24 часа в сутки, 365 дней в году. Помимо того, что технология высокой готовности является проверенной, она представляет собой прямое, простое в использовании, прозрачное для приложений и базирующееся на стандартах решение, которое позволяет обойти ряд трудностей, связанных с реализацией кластерных систем.
Системы с постоянной готовностью (Permanent Availability Systems). Это скорее теоретическое понятие. Коэффициент готовности для такого рода систем принимается равным 100%, т. е. предполагается отсутствие сбоев в работе, что практически недостижимо.
Все упомянутые типы СВГ предназначены для сокращения времени простоя. Существует два типа простоев: плановые и неплановые. Минимизация каждого из них требует различной стратегии и технологии. Плановое время простоя обычно включает время, отведенное на проведение работ по модернизации системы и на ее обслуживание. Неплановое время простоя является результатом отказа системы или компонента.
Высокая готовность не дается бесплатно и это иллюстрирует рис. 1.1. Общая стоимость подобных систем складывается из начальной стоимости системы, издержек планирования и реализации, а также системных накладных расходов. Выбор того или иного уровня готовности определяется также теми последствиями, которые будут иметь для конкретного предприятия простои информационной системы.
Рис. 1.1. Рост стоимости СВГ по мере повышения ее готовности
Оценка стоимости простоя системы остается достаточно сложной задачей, поскольку она связана не только с потерей работоспособности системы и местом проявления неисправности, но существенно зависит и от места СВГ в структуре конкретной СТС.
Дата добавления: 2015-08-11; просмотров: 753;