Мониторинг системы
Чтобы поддержать должный уровень обслуживания и чтобы серверы и приложения были в полной готовности, необходимо иметь информацию не только о характеристиках ЭВМ, но и о работающих приложениях или ресурсах. При этом недостаточно иметь субъективное мнение о том, как предположительно работает система. Необходимо знать точные параметры этой работы. Если вы только начинаете мониторинг системы, то вам ее, в основном, не с чем сравнивать. Лишь после того как накоплено значительное количество данных, на их основе следует выработать базовый критерий, на который можно опираться при последующих наблюдениях. Если производительность системы отклоняется от установленных базовых критериев, значит, в системе появляются узкие места. Рассмотрим минимальный рекомендуемый набор требований, необходимых при мониторинге производительности. Определим следующие параметры мониторинга.
1. Ресурс – диск, объект – логический диск, пороговое значение счетчика свободного пространства – 15 %. Так как не для всех процессов можно установить блокировку дискового пространства, то необходимо ограничить расходование пространства логического диска квотой 85 %. При этом необходимо сделать настройку сигналов тревоги, которые оповещали бы о превышении порогового значения.
2. Ресурс – диск, объект – логический диск, пороговое значение времени использования – 80 %. Имеется ввиду, что диск не должен использоваться более 80 % всего времени работы системы. При этом необходимо проверить, соответствует ли это значение рекомендациям производителя.
3. Ресурс – диск, объект – физический диск, пороговое значение счетчика операций чтения диска выбирается исходя из спецификации производителя. Информация о скорости считывания диска печатается на корпусе самого диска. Программа передает оповещение, если монитор производительности сообщает о том, что значение частоты обращения к диску превысило то, которое указано на диске.
4. Ресурс – память, объект – оперативная память, пороговое значение счетчика объема доступных файлов – 4 Мбайта. Если объем памяти снижается ниже 4 Мбайт, то страничный обмен начинает возрастать, а скорость реакции системы начинает идти на спад. Необходимо выработать сообщение об ошибке, в котором отразить, что системных ресурсов осталось мало.
5. Ресурс – память, объект – оперативная память, пороговое значение счетчика вывода страниц в секунду – 20. Если использование памяти растет, необходимо проверить, не превышает ли это пороговое значение базового показателя.
6. Ресурс – сеть, объект – сегмент сети, пороговое значение счетчика использования сети – 30 %. Это значение существенно зависит от типа сети.
7. Ресурс – процессор, объект – процессор, пороговое значение времени использования процессора – 85 %. Значение счетчика процент времени процессора (% Processor Time) можно наблюдать в панели диспетчера задач. Использование процессора свыше 80 % общего времени является поводом для беспокойства администратора.
8. Ресурс – процессор, объект – процессор, пороговое значение счетчика прерываний в секунду – 1500. Если значение счетчика резко увеличивается без соответствующего увеличения активности процессора сервера, то причиной этого могут быть неисправности аппаратной части ИС, дискового контроллера, сетевого интерфейса и т.д.
9. Ресурс – сервер, объект – сервер, пороговое значение счетчика Byte total/sec определяется максимальной скоростью передачи в сети. Для всех серверов в сети можно просуммировать значения их соответствующих счетчиков и, если суммарный результат равен или превышает максимальную скорость передачи, допустимую в сети, то требуется выработать соответствующий тревожный сигнал.
10. Ресурс – сервер, объект – рабочие очереди сервера, пороговое значение счетчика длины очереди 4. Данный счетчик может указывать на “узкое место” процессора. Значение длины очереди необходимо наблюдать в течение нескольких интервалов выборки.
11. Ресурс – многопроцессорная система, объект – система, пороговое значение очереди процессора равно 2. Если в течение нескольких интервалов наблюдения значение счетчика превышает 2, то системному администратору следует разобраться в причинах такой работы системы.
Дата добавления: 2014-12-27; просмотров: 976;