Программы исправления последствий сбоев
Программа исправления последствий сбоев, или кратко исправляющая программа (ИП), предназначена для повышения программной устойчивости работы устройств к воздействию сбоев. Эта программа включается в работу автоматически после того, как аппаратным или программно-логическим контролем выявлены ошибки в выполнении основных программ. Главная задача ИП состоит в анализе ошибок, исправлении искаженной информации, передаче управления основной программе после исправления. Если анализ показал, что данная ошибка возникла в результате отказов, то в работу включаются диагностические тест-программы.
В случае невозможности точного определения причин ошибки выдается осведомительная информация оператору, и работа устройства прекращается.
Рассмотрим принципы построения ИП применительно к ЭВМ, имеющей систему аппаратного контроля. При этом выделим следующие случаи искажения информации за счет сбоев в работе аппаратуры: в процессе приема данных, при переработке информации, во время ее хранения и в процессе выдачи результатов переработки. Эти случаи легко различаются между собой, так как отдельные устройства имеют схемы аппаратного контроля, сигнализирующие о месте появления сбоя.
В зависимости от места сбоя и характера искажения информации используют различные способы исправления последствий сбоев. Если произошел сбой устройств ввода данных, то задача ИП состоит в стирании этих неверно принятых данных и вторичном запросе того внешнего объекта, откуда поступили данные. При циклическом решении задач управления и невозможности перезапроса решение задачи блокируется до момента поступления новых данных.
Сбои устройств переработки информации по месту их возникновения разделяют на два класса: сбои арифметического устройства АУ и сбои устройства управления УУ. Первый класс сбоев вызывает искажение результатов отдельных операций. Для исправления результатов необходимо повторить сбившийся участок программы. Сбои УУ, как правило, приводят к более тяжелым последствиям, так как может быть полностью нарушен ход вычислительного процесса и искажена информация в отдельных ячейках оперативной памяти. Если после сбоя запись результата операции по искаженным адресам не проводилась, то исправление последствий можно осуществить повторением участка программы. Если запись произошла, то необходимо определить адрес записи и исправить информацию в ячейке по найденному адресу, что можно сделать далеко не всегда. Поэтому целесообразно после обнаружения сбоя в УУ аппаратным способом запрещать любую запись в память. В этом случае последствие любого сбоя в устройстве переработки информации можно исправить повторением участка программы.
Сбои в работе запоминающих устройств ведут к искажению хранимой информации. Здесь также можно различить два случая искажения перерабатываемой информации или программ, В первом случае последствия сбоя устраняют повторением участка программы (если искажены результаты вычислений), либо повторным вводом информации в память (если искажены исходные данные). Во втором случае в память вводят дубликат программы.
Исправление последствий сбоев, возникающих при выдаче результатов, состоит в блокировке процесса выдачи и посылке на внешний объект предупреждения о том, что выданные результаты ошибочны. Таким образом, ИП должна осуществлять анализ характера и последствий сбоя, после анализа включать в работу одну из частных исправляющих программ, выполняющую указанные выше действия. Кроме того, сами основные программы должны быть приспособлены для исправления ошибок. Для этого они строятся из относительно мелких функционально независимых блоков. Все исходные данные сохраняются до конца выполнения блока, а начальный адрес запоминается в отдельной ячейке и в случае необходимости используется для определения начала повторяемого участка.
С целью создания благоприятных условий для работы ИП в ЭВМ может быть введена специальная дополнительная аппаратура. В частности, аппаратными способами может запоминаться номер команды, при выполнении которой произошло искажение, осуществляться защита памяти от разрушения при записи по неверным адресам, запоминание номеров нескольких предыдущих выполненных команд и т. д.
Рассмотрим несколько подробнее принципы построения блока анализа ИП. На этот блок возлагаются следующие задачи: запомнить состояние процессора ЦВМ на момент начала исправления ошибок, определить место и причину появления ошибки, включить в работу одну из частных ИП или передать управление диагностической тестпрограмме и, наконец, после успешного исправления последствий сбоя восстановить начальное состояние процессора и передать управление основной программе.
Место появления ошибки, как уже подчеркивалось, определяется на основе анализа сигналов контроля, каждый из которых фиксируется аппаратно. Существо анализа причин появления ошибки состоит в выяснении, является она последствием отказа или сбоя. Вначале предполагается, что ошибка возникла в результате сбоя основной или контрольной аппаратуры, запоминается место и время появления ошибки. Если в процессе повторения участка программы аппаратный контроль не выдал сигнала ошибки, то полагают, что ошибка, возникшая в результате сбоя, исправлена. В случае повторного появления сигнала ошибки через небольшой интервал времени от того же самого устройства ошибка расценивается как систематическая, и в работу включаются диагностические тест-программы.
Структура ИП довольно сложна и в максимальной степени учитывает особенности конкретной вычислительной машины. Современные ЭВМ имеют, как правило, достаточно эффективные ИП, обеспечивающие автоматическое исправление 80-90% всех ошибок.
Дата добавления: 2017-03-29; просмотров: 948;