null

Первичный анализ результатов диагностики SUNWexplo

Постоянной и рутинной задачей любых solaris администраторов является чтение и анализ диагностических файлов, полученных от стандартной sun-овской диагностической утилиты -- SUNWexplo explorer.
Часто возникает вопрос, на какие детили следует обратить внимание в первую очередь и какие детали необходимо смотреть вне зависимости от специфики работы системы.
Обобщая многолетний опыт коллег мы сформировали следующий список направлений первичной диагностики: состояние UFS, состояние ZFS pool-ов, состояние свободного места файловых систем, ошибки iostat, ошибки netstat, ошибки fmd/fma, ошибки system event log и ошибки в /var/adm/messages.
Кроме того, мы часто работаем с серверами от производителя HP и не менее часто приходится анализировать вывод explorer, полученный на системах с SUN cluster. Поэтому резонно также в процессе предварительной диагностики учитывать наличие cpqary и кластерных сообщений.

Чтобы облегчить себе и коллегам жизнь, был написан небольшой скрипт, который в текстовом и html форматах позволяет выполнять первичную диагностику.
Теперь, каждую неделю, когда имеется четыре десятка архивов, можно для предварительной обработки натравить на них утилиту.
Для каждого из рассмотренных направлений первичной диагностики написан соответствующий модуль, которые всегда легко дополнить или написать новые для анализа других файлов эксплорера.
Я с радостью готов принимать ваши pull requests.

Чтобы написать новый модуль достаточно добавить скрипт в подкаталог modules и сделать его исполняемым. Модули принимают запускаются в каталоге с распакованными эксплорерами и в качестве аргументов принимают имена хостов (оно же: каталогов, в которых лежат файлы). В stdout модуль должен вывести статус хоста. Пример модуля можно посмотреть в readme файле.

Проект располагается на моём https://github.com/zhmylove/explodiag

korg

 

Коротко о себе

Работаю в компании Tune-IT, администрирую инфраструктуру компании и вычислительную сеть кафедры Вычислительной ТехникиСПбНИУ ИТМО.

Интересы: администрирование UNIX и UNIX-like систем и активного сетевого оборудования, написание shell- и perl-скриптов, изучение технологий глобальных сетей.
Люблю собирать GNU/Linux и FreeBSD, использовать тайлинговые оконные менеджеры и писать системный софт.