UDC____
Authors:Kharchenko V., Odarushchenko O., Ponochovny Y., Zhivilo S., Odarushchenko E., Kharibin O., Odarushchenko V. High availability systems and technologies. Lectures/ Kharchenko V. (editor) – Department of education and science, youth and sport of Ukraine, Poltava national technical university named after Yuri Kondratiuk, 2012. – 249 p.
Methods, tools and information technologies of nowadays high availability systems development, based on fault-tolerant computer systems, are expounded in the book. The HAS&T basic definitions, main concepts of their construction and application are considered.
Methods of modeling the HAS&T taking into account the failure and failure recovery rates of systems software and hardware parts. Information technologies, which allow to access the system availability in case of software reliability change taking into account the software renovation process, are discussed in this book.
Concept of HAS dependability control, based on the actual information-technical state, are also considered.
The given lecture course corresponds to the program of the discipline “High availability systems and technologies”, which was prepared for PhD-students within the framework of project TEMPUS-SAFEGUARDE. This project is financed by European Union based TEMPUS-JPCR(2009-4697/001-001) « MSc and PhD Studies in Aerospace Critical Computing» program, is devoted to development and implementation of study course in the training area of aerospace critical computing.
The book is intended for specialists in HAS modeling and development area with fault-tolerant computer systems as the computation core. The lection material can be helpful for MS-students, PhD-students in area of computer science, computer and program engineering and researchers who deal with computer systems, networks and services reliability (availability) problems.
Ref. – 124 items, figures - 88 , tables -28 .
CONTENT
ABBREVIATIONS…………………………………………………….3
INTRODUCTION………………………………………………………5
0.1. Problem of providing the high availability………………………….5
0.2. Book structure………………………………………………………6
CHAPTER 1. HIGH AVAILABILITY SYSTEMS BASIC NOTIONS AND DEFINITIONS…………………………………………………...10
1.1. Concept of high availability systems………………………………10
1.1.1. High availability factor and HAS classification………………...11
1.1.2. Standards analysis in the field of high availability………………14
1.2. Unavailability factors of HA systems……………………………..17
1.2.1. Taxonomical scheme of HAS dependability. Threats analysis…………………………………………………………………17
1.3. HAS reliability and availability requirements analysis…………………………………………………………………26
1.3.1. Analysis of HAS reliability requirements……………………….26
1.3.2. Analysis of HAS reliability parameter requirements…………….27
1.3.3. Requirements to faultlessness and fault-tolerance of HAS………30
1.4. Evolution of high availability technologies. HA-, CA- and DA- technologies……………………………………………………………32
1.4.1. HA- and CA- technologies………………………………………32
1.4.2. DA- technologie…………………………………………………39
1.5. The application of high availability systems and technologies……………………………………………………………39
CONTROL QUESTIONS…………………………………………….46
CHAPTER 2. HAS&T ARCHITECTURAL SOLUTIONS………….47
2.1. HAS architectural solutions based on FT-servers (Fault-tolerance servers) technologies…………………………………………………..47
2.1.1. Classification of HAS based on FT-servers technology…………47
2.1.2. HAS type………………………………………………………..48
2.1.3. Hewlett-Packard NonStop (NS) architecture……………………49
2.1.4. IBM z10 architecture…………………………………………….51
2.1.5. Sun SPARC Enterprise M9000 architecture…………………….52
2.1.6. Analysis of FT-servers subsystems possible defects and failures caused by them…………………………………………………………56
2.2. HAS architectural solutions based on using the fault-tolerant clusters………………………………………………………………….61
2.3. Distributed HAS. Structure and requirements to availability and survivability……………………………………………………………67
2.3.1 Analysis of distributed HAS survivability parameter…………….67
2.3.2. Distributer HAS as an object of survivability providing……………………………………………………………….69
2.4. Structural analysis of distributed information systems elements………………………………………………………………..72
2.4.1. Construction of the data processing center of distributed information systems……………………………………………………72
2.4.2. Construction of the commutation centers of distributed information systems…………………………………………………………………77
2.4.3 Fiber-optic lines construction for information transition in distributed information systems………………………………………..78
2.4.4. Analysis of requirements to availability and survivability of modern distributed information systems of critical application and their structural elements……………………………………………………..79
CONTROL QUESTIONS…………………………………………….80
CHAPTER 3. BASIC HAS ARCHITECTURES ASSESSMENT (HAS WITH CHANGING PARAMETERS; MARKOV AND SEMI-MARKOV MODELS). BASIC HAS ARCHITECTURES MODELING TOOLS………………………………………………………………...81
3.1. Basic definitions and assumptions…………………………………81
3.2. Software reliability assessment models……………………………83
3.3. Regularization of variants of software and hardware failure and failure recovery rates change…………………………………………...93
3.4. Sequence of HAS mathematical description using multy-fragment models…………………………………………………………………99
3.5. Basic macro-models of typical HAS architectures……………….100
3.6. HAS availability survey based ob imbedded Markov chains…………………………………………………………………106
3.6.1. Initial statements………………………………………………..106
3.6.2. Imbedded Markov chains construction for system modeling in case of software failure rate change………………………………………..109
3.6.3. Imbedded Markov chains construction for system modeling in case of linear change of software failure and failure recovery rates……………………………………………………………………117
3.6.4. Imbedded Markov chains construction for system modeling in case of no-linear change of software failure and failure recovery rates……………………………………………………………………121
3.6.5. Analysis of HAS modeling results based on imbedded Markov chains………………………………………………………………….125
3.6.6. Information technology of HAS modeling and assessment taking into account software failure and failure recovery rates change…………………………………………………………………136
3.7. HAS modeling and assessment taking into account software renovation……………………………………………………………..142
3.7.1. The comprehensive approach of assessment the computer systems reliability………………………………………………………………142
3.7.2. Multy-fragmental reliability model taking into account software defects and renovation………………………………………………...151
3.7.3. HAS multy-fragmental availability model in case of unauthorized actions………………………………………………………………...163
3.7.3.1. HAS with no software renovation……………………………163
3.7.3.2. HAS with software renovation……………………………….172
3.7.4. The decision-making support information technology for providing the reliability of the HAS with software renovation…………………..188
3.8. Method of survivability assessment of distributes information systems……………………………………………………………….192
3.8.1. The model of distributed information system…………………..193
3.9. Parameters of survivability assessment of distributed information systems………………………………………………………………..197
3.9.1. Implementation of the survivability assessment method of distributed information systems and results analysis………………….199
3.9.2. The stages of distributed information systems modeling………………………………………………………………200
3.9.3. The stage of analysis of the individual elements critical level in distributed information system……………………………………….203
3.9.4. Assessment of resulting survivability parameters of distributed information systems…………………………………………………..208
3.10. The information technology of survivability parameters assessment of distributed information systems and their elements………………........................................................................208
3.11. The development of the concept of decision-making support information technology for providing the survivability of the distributed information systems…………………………………………………..215
CONTROL QUESTIONS……………………………………………217
CONCLUSION………………………………………………………218
REFERENCES……………………………………………………….220
содержание
список сокращений…………………………………………….3
введение…………………………………………………………….5
0.1 задача – обеспечить высокую готовность………………………..5
0.2 Структура книги……………………………………………………6
раздел 1 ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ СИСТЕМ ВЫСОКОЙ ГОТОВНОСТИ………………………………………….10
1.1 Концепция систем высокой готовности…………………………10
1.1.1 Фактор высокой готовности и классификация СВГ…………..11
1.1.2 Анализ стандартов в сфере высокой готовности……………...14
1.2 Факторы неготовности СВГ………………………………………17
1.2.1 Таксономическая схема гарантоспособности СВГ. Анализ угроз……………………………………………………………………17
1.2.2 Классификация и анализ дефектов……………………………..22
1.3 Анализ требований к надежности и готовности СВГ……………………………………………………………………26
1.3.1 Анализ требований к надежности СВГ………………………26
1.3.2 Анализ требований к показателям надежности СВГ………...27
1.3.3 Требования к безотказности и отказоустойчивости СВГ……30
1.4 Эволюция технологий высокой готовности. HA, CA и DA технологии…………………………………………………………….32
1.4.1 НА и СА технологии…………………………………………..32
1.4.2 DA технология………………………………………………….39
1.5 Области применения систем и технологий высокой готовности…………………………………………………………….39
КОНТРОЛЬНЫЕ ВОПРОСЫ………………………………………46
РАЗДЕЛ 2 АРХИТЕКТУРНЫЕ РЕШЕНИЯ СИСТЕМ ВЫСОКОЙ ГОТОВНОСТИ……………………………………………………….47
2.1 Архитектурные решения СВГ на основе применения
технологии FT-servers (Fault Tolerance Server)……………………………………47
2.1.1 Классификации СВГ, построенных на основе технологии FT-servers………………………………………………………………….47
2.1.2 Классы СВГ…………………………………………………….48
2.1.3 Архитектура Hewlett—Packard NonStop (NS)…………………49
2.1.4 Архитектура IBM z10…………………………………………..51
2.1.5 Архитектура Sun SPARC Enterprise M9000……………………52
2.1.6 Анализ возможных дефектов и вызываемых ими сбоев и отказов подсистем FT – серверов…………………………………….56
2.2 Архитектурные решения СВГ на основе применения
отказоустойчивых вычислительных кластеров……………………..61
2.3 Распределенные СВГ. Структура и требования к готовности и живучести……………………………………………………………...67
2.3.1. Анализ свойства живучести распределенных СВГ…………..67
2.3.2. Распределенные СВГ как объект обеспечения живучести……………………………………………………………..69
2.4. Структурный анализ элементов РИС…………………………..72
2.4.1. Построение ЦОД РИС………………………………………….72
2.4.2. Построение коммутационных центров РИС………………….77
2.4.3. Построение волоконно-оптических линий передачи информации РИС……………………………………………………..78
2.4.4. Анализ требований к готовности и живучести современных РИС критического применения и их структурных элементов……………………………………………………………...79
КОНТРОЛЬНЫЕ ВОПРОСЫ………………………………………80
РАЗДЕЛ 3 ОЦЕНИВАНИЕ БАЗОВЫХ АРХИТЕКТУР СИСТЕМ ВЫСОКОЙ ГОТОВНОСТИ КАК СИСТЕМ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ. МАРКОВСКИЕ И ПОЛУМАРКОВСКИЕ МОДЕЛИ. ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА МОДЕЛИРОВАНИЯ…………………………………………………81
3.1. Основные термины и допущения………………………………..81
3.2 Модели оценки надежности программных средств……………83
Регуляризация вариантов изменения параметров потоков
отказов и восстановлений программного обеспечения и технических средств…………………………………………………………………93
3.4 Последовательность математического описания состояний СВГ c использованием многофрагментных моделей…………………….99
3.5 Базовые макромодели для типовых архитектур СВГ………….100
3.6 Исследование готовности СВГ на основе вложенных марковских цепей………………………………………………………………….106
3.6.1 Исходные положения………………………………………….106
3.6.2. Построение вложенных марковских цепей для моделирования систем при изменении параметра потока отказов программных средств………………………………………………………………..109
3.6.3. Построение вложенных марковских цепей для моделирования систем при линейном изменении параметров потоков отказов и восстановлений программных средств……………………………..117
3.6.4. Построение вложенных марковских цепей для моделирования систем при нелинейном изменении параметров потоков отказов и восстановлений программных средств……………………………..121
3.6.5. Анализ результатов моделирования СВГ на базе вложенных марковских цепей……………………………………………………125
3.6.6 Информационная технология моделирования и оценивания надежности СВГ с учетом изменяющихся параметров потоков отказов и восстановлений программных средств………………….136
3.7. Моделирование и оценка систем высокой готовности с учетом обновления программного обеспечения……………………………142
3.7.1. Комплексный подход к оцениванию надежности компьютерных систем………………………………………………142
3.7.2. Многофрагментная модель надежности с учетом обновлений и дефектов программного обеспечения………………………………151
3.7.3 Многофрагментная модель готовности СВГ с учетом несанкционированных действий……………………………………163
3.7.3.1 СВГ с не обновляемым программным обеспечением……..163
3.7.3.2 СВГ с обновляемым программным обеспечением………..172
3.7.4. Информационная технология поддержки принятия решения по обеспечению надежности СВГ с обновляемым программным обеспечением…………………………………………………………188
3.8. Метод оценивания живучести РИС……………………………192
3.8.1. Модель распределенной информационной системы………..193
3.9. Показатели оценивания живучести РИС………………………197
3.9.1. Применение метода оценки живучести распределенных информационных систем и анализ результатов…………………...199
3.9.2 Этап моделирования РИС…………………………………….200
3.9.3 Этап проведения анализа критичности отдельных элементов РИС…………………………………………………………………..203
3.9.4 Оценка результирующих показателей живучести РИС…………………………………………………………………..208
3.10. Информационная технология оценивания живучести распределенных информационных систем и их элементов…………………………………………………………….208
3.11. Информационная технология поддержки принятия решений по обеспечению живучести распределенных информационных систем…………………………………………………………………215
КОНТРОЛЬНЫЕ ВОПРОСЫ………………………………………217
ЗАКЛЮЧЕНИЕ……………………………………………………..218
ЛИТЕРАТУРА…………………………………………………220
АНОТАЦІЯ ТА ЗМІСТ……………………………………….235
ABSTRACT AND CONTENT………………………………...240
Дата добавления: 2015-08-11; просмотров: 568;