MSc and PhD Studies in Aerospace Critical Computing
Министерство образования и науки, молодежи и спорта Украины
Национальный аэрокосмический университет им. Н.Е. Жуковского «ХАИ»
В.С. Харченко, О.Н. Одарущенко, Ю.Л. Поночовный,
С.В. Живило, Е.Б. Одарущенко, А.В. Харыбин,
В.О. Одарущенко
Системы и технологии высокой готовности
High availability systems and technologies
Лекционный материал
Под редакцией В.С. Харченко
Проект
TEMPUS-SAFEGUARDE (158886-TEMPUS-1-2009-1-UK-TEMPUS-JPCR(2009-4697/001-001)
MSc and PhD Studies in Aerospace Critical Computing
УДК 681.3+004.73.052
Авторы:Харченко В.С., Одарущенко О.Н., Поночовный Ю.Л., ЖивилоС.В., Одарущенко Е.Б., Харыбин А.В., Одарущенко В.О. Системы и технологии высокой готовности. Лекционный материал / Под ред. Харченко В.С. Мистерство образования и науки, молодежи и спорта Украины, Национальный аэрокосмический университет им. Н.Е. Жуковского «ХАИ», 2012. – 249 с.
ISBN ………………
Изложены материалы лекционного курса, посвященного методам, инструментальным средствам (технологиям) и информационным технологиям построения современных систем высокой готовности (НАS&T), вычислительным ядром которых, являются отказоустойчивые компьютерные системы. Рассмотрены основные понятия и определения систем высокой готовности НАS&T, основные концепции их построения и области применения.
Изложены методы моделирования НАS&T с учетом интенсивностей потоков отказов и восстановлений программных и аппаратных средств. Приведены информационные технологии, позволящие оценивать готовность таких систем в условиях изменения надежности их программных средств, а также их обновления.
Лекционный материал составлен в соответствии с программой дисциплины «Системы и технологии высокой готовности» (High availability systems and technologies), подготовленной для магистров в рамках проекта TEMPUS-SAFEGUARDE. Этот проект, финансируемый Европейским Союзом по программе TEMPUS-JPCR(2009-4697/001-001) « MSc and PhD Studies in Aerospace Critical Computing», посвящен разработке и внедрению учебных курсов для подготовки по направлению аэрокосмического критического компьютинга.
Для специалистов в области разработки и моделирования систем высокой готовности, вычислительным ядром которых являются отказоустойчивые компьютерные системы. Лекционный материал может быть полезен аспирантам и докторантам университетов, обучающимся по направлениям компьютерных наук, компьютерной и программной инженерии, преподавателям и научным работникам, занимающимся проблемами надежности (готовности) компьютерных систем, сетей и сервисов.
Библиогр.: 124 наименований, рисунков - 88, таблиц - 28
Рецензенты:
- Заведующий кафедрой компьютерных и информационных технологий и систем Полтавского национального технического университета имени Юрия Кондратюка, доктор технических наук, профессор Ляхов Александр Логвинович (Полтава, Украина);
- главный инженер НТ СКБ «Полисвит» (Харьков, Украина), заслуженный изобретатель Украины, кандидат технических наук, доцент Сидоренко Николай Федорович.
Книга рекомендована к изданию ученым советом Национального аэрокосмического университета имени Н.Е.Жуковского «Харьковский авиационный институт» (протокол №… от ………. 2012г.)
© Национальный аэрокосмический университет им Н.Е.Жуковского«ХАИ»
список сокращений
АК – аппаратная компонента
АКМ – архитектурно-компонентная модель
АС – аппаратные средства
АУ – антенные устройства
АЭС – Атомная электростанция
БММ – базовая многофрагментная макромодель
ВБР – вероятность безотказной работы
ВМЦ – вложенная марковская цепь
ДВ – дефекты взаимодействия
ДP – дефекты разработки или проектирования
ДФ – физические дефекты
ИТ – информационная технология
ИТОЖ – информационная технология обеспечения жевучести
ИТОН – информационная технология обеспечения надежности
ККН – комплекс конкретного назначения
КОН – момплекс общего назначения
КП – мритические и бизнес-критические приложения
КС – мосмические системы
ЛВС – мокальная вычислительная сеть
МВС – многоверсионные системы
МВТ – многоверсионные технологии
МДА – многоканальная дублированная архитектура
МДС – многоканальная дублированная система
МН – модели оценивания надежности
МПК – межподсистемный контроль
ОВС – одноверсионные системы
ОЗУ – оперативное запоминающее устройство
СВГ – отказоустойчивые компьютерные системы
ОС – операционная система
ОФМ – однофрагментная модель
ПК – программная компонента
ПМП – полумарковский процесс
ПН – показатель надежности
ППТ – периодическое профилактическое тестирование
ПС – программные средства
ПТК СП – программно-технические комплексы систем
производства
ПТО – профилактическое техническое обслуживание
РМФМ – регулярная многофрагментная модель
РН – ракета-носитель
СВГ – системы высокой готовности
СВ – стратегия восстановления
СК – стартовый комплекс
СКМ – структурно-компонентная модель
СЛДУ – система линейных дифференциальных уравнений
СП – случайный процесс
ССН – структурная схема надежности
СТС – сложная техническая система
СУБД – система управления базой данных
СФМ – структурно-функциональная модель
ТО – техническое обслуживание
ТСППИ – технические средства приёма и передачи информации
ЦСК – цифровая система коммутации
ЦУ – целеуказание
ЦУП – центр управления полетами
ЭВМ – электронно-вычислительная машина
ЭУЭ – экстремальные условия эксплуатации
СА – Continuous Availability (Постоянная готовность)
DA – Dependable Availability
FR – Failure Rate (Интенсивность отказов)
НА – High Аvailability (Высокая готовность)
НАS&T– High Availability Systems and Technologies (системы и технологии высокой готовности)
HPC – High Performance Computing (высокопроизводительные рассчеты)
MTBF – Mean Time between Failures (среднее время наработки на отказ)
MTTR – Mean Time to Repair (среднее время восстановления)
OTS-components – Off-The-Shelf Components (готовые, произведенные ранее компоненты)
введение
0.1 задача – обеспечить высокую готовность
Ежедневно современный человек обращается к услугам вычислительной техники. Нам необходимо получить информацию из всемирной патутины, дозвониться до своего родственника или знакомого, оплатить свои счета и получить деньги из банкомата и многое-многое другое. Кто же те незримые и так нам необходимые помощники? Что стоит на страже наших все возрастающих интересов и потребностей? Что экономит наше время, а следовательно и деньги? В представлении большинства пользователей – это удобно разместившиеся на столе или в портфеле вычислительные устройства, которые мы назывем персональными электронными вычислительными машинами. А, что за машины, которые способны одновременно обслужить миллионы пользователей? Ответ - это суперкомпьютеры. У них много названий: мейнфреймы, суперсервера, системы высокой готовности, высокопроизводительные системы, вычислительные кластеры и т.д.
Естественно, что от системы, которая обслуживает большое количество пользователей мы в праве ожидать сверхнадежной работы. Например, средняя стоимость часа простоя вычислительных систем обслуживающих маклеровские операции в США, составляет 7,2 млн.долларов США, а систем авторизации кредитных карт 2,9 млн. долларов. Причем в условиях все возрастающей зависимости человека от вычислительных систем эти потери могут быть не только финансовыми. Если представить отказ вычислительных систем в отраслях промышленности, которые представляют наивысшую потенциальную угрозу человеческой жизни и окружающей среде, а это ядерная энергетика, химическая промышленность, военная и авиационная отрасли и транспорт, то негативные последствия даже трудно оценить. Современная наука и техника непрерывно решает проблему построения вычислительных систем, которые были бы высоконадежны, непрерывно готовы выполнять возложенные на них функции и были бы удобны в обслуживани. Работа в этих направлениях предполагает, в первую очередь, борьбу с сбоями и отказами, которые порождаются дефектами систем, имеющими различную природу. Повышение готовности таких систем основано на принципе предотвращения сбоев и отказов за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а так же за счет совершенствования методов проектирования и изготовления компонетов систем и систем в целом. Повышение готовности предполагает подавление в определенных пределах влияния сбоев и отказов на работу системы с помощью средств контроля и коррекции ошибок, а так же средств автоматического восстановления вычислительного процесса после проявления отказа, включая аппаратную и программную избыточность, на основе которой реализуется различные варианты архитектур систем высокой готовности.
Дата добавления: 2015-08-11; просмотров: 1187;