мониторинга жёсткого SMART

За дисками следить нужно даже если они в супер надежном рейд массиве, конечно же если вам не плевать на информацию! Для диагностики состояния HDD у нас есть smart — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

О проверки дисков и использования утилиты smartmontools  уже писалось в одной из пред идущих статей «SMART проверка дисков в Debian»

Сейчас будем настраивать smartd из того же пакета  smartmontools для непрерывного мониторинга HDD штатными средствами smartmontools, устанавливаем smartmontools: (или из Backports)

smartctl — просмотр текущих значений S.M.A.R.T., запуск тестов самодиагностики диска вручную;
smartd — демон для записи в системный журнал изменений в значениях S.M.A.R.T, уведомления по электронной почте об ошибках, запуска тестов самодиагностики по расписанию.

Убеждаемся что smart уже включен на нашем диске к примеру так

SMART support is: Enabled

Если smart отключен, то включаем:

Включаем демон smartd в /etc/default/smartmontools добавим (для 2х дисков sda sdb)

enable_smart=»/dev/sda /dev/sdb»
start_smartd=yes
smartd_opts=»—interval=1800″

настраиваем автоматический мониторинг для каждого из дисков к примеру таким образом как у меня:

в файл /etc/smartd.conf (вписываем наш email для получения уведомлений)

или

-a заставляет smartd наблюдать за всеми доступными SMART-параметрами дисков

-I 194 указывает smartd игнорировать изменения значения атрибута #194

-m указывает на необходимость отправки email-уведомлений.

 Внимание! в файле  smartd.conf есть готовые примеры с описанием, вы можете их использовать!

Стартуем

Проверяем

Видим что то типо такого

Некоторые ключи программы:

-d TYPE Тип устройства: ata, scsi, marvell, removable, 3ware,N, hpt,L/M/N
-T TYPE допустимое отклонение: normal, permissive
-o VAL Включает/выключает автоматические оффлайн тесты (on/off)
-S VAL Включает/выключает автосохранение атрибутов (on/off)
-n MODE Не проверять. Один из режимов: never, sleep, standby, idle
-H Мониторить SMART статус, уведомлять только при ошибках.
-l TYPE Мониторить SMART логи. Режимы: error, selftest
-f Монитор отказа для любых атрибутов ‘Usage’
-m ADD Письмо с варнингами на ADD для -H, -l error, -l selftest, and -f
-M TYPE Изменение поведения отсыла е-майлов (см. ман)
-s REGE Запустить тест когда дата совпадает с регулярным выражением (см. ман)
-p Сообщать о изменениях в ‘Prefailure’ атрибутах
-u ообщать о изменениях в ‘Usage’ атрибутах
-t Эквивалентно -p и -u директивам
-r ID Также сообщать ‘RAW’ значения атрибутов ID с -p, -u или -t
-R ID Следить за изменениями в атрибуте ID ‘Raw’ значения -p, -u or -t
-i ID Игнорировать атрибут ID для -f директивы
-I ID Игнорировать атрибут ID для -p, -u или -t директивы
-C ID Рапортовать если счётчик `ждущих` секторов не равен нулю
-U ID Рапортовать если счётчик `некорректируемых` секторов не равен нулю
-W D,I,C Monitor Temperature D)ifference, I)nformal limit, C)ritical limit
-v N,ST Mодифицировать метку для атрибута N (для нестандартных атрибутов)
-a Дефолт: эквивалентно -H -f -t -l error -l selftest -C 197 -U 198
-F TYPE Для ошибок в прошивке. Значения: none, samsung
-P TYPE Предустановки для диска: use, ignore, show, showall
# Комментарии: текст после него игнорируется
\ Продолжения строки

А теперь самое главное: Не нужно брать и копипастить, возможно эти настройки вам не подойдут, прежде чем настраивать рекомендую ознакомится с утилитой!

 

  Один комментарий в “Мониторинг диска на основе smartmontools”

  1. Огромное спасибо за статью. Только мало написано об отправке писем, дебаге запуска демона. Можно чуток от сюда взять

     

 Оставить комментарий

(обязательно)

(обязательно)

   
Copyright © 2012. Linuxguru.ru