6
Июн
0

SMART Проверка hdd


smartctl - Control and Monitor Utility for SMART Disks
Для проверки диска на поддержку smart
smartctl -i /dev/sda
...

SMART support is: Available — device has SMART capability.
SMART support is: Enabled

Для включения smart 
smartctl -s /dev/sda
Вся информация по диску:

        smartctl --all /dev/sda
smartctl -A  /dev/sda
Raw_Read_Error_Rate (частота ошибок при чтении данных с диска,
происхождение которых обусловлено аппаратной частью диска) - 049

Seek_Error_Rate (частота ошибок при позиционировании блока головок.) -
060 И температура не радует совсем, хотя проверка overall-health - PASSED

Настройка демона smartd
/etc/smartd.conf

По-умолчанию там только одна опция DEVICESCAN
Рекомендуется закомментировать ее и просто перечислить список устройств,
которые мы хотим мониторить.

/etc/smartd.conf config file

        /dev/sda -S on -o on -a -I 194 -m admin@inelsis.ru
        /dev/sdb -S on -o on -a -I 194 -m admin@inelsis.ru

Директива -o 	включает автоматическое off-line тестирование.
Директива -S 	включает автозапись атрибутов.
Директива -m 	за которой следует e-mail указывает куда warning сообщения отсылать.
Директива -a 	указывает smartd мониторить все SMART параметры диска

smartd по умолчанию логирует изменение значений всех атрибутов.

Директива -I 194 означает игнорировать атрибут #194, (т.е. температуру)

        /etc/init.d/smartd start
Смарт атрибуты:

Каждый атрибут имеет величину - Value.
Value Изменяется в диапазоне от 0 до 255 (задается производителем).

Низкое значение говорит о быстрой деградации диска или о возможном
скором сбое. т.е. чем выше значение Value атрибута, тем лучше.

Raw Value - это значение атрибута во внутреннем формате производителя
значение малоинформативно для всех кроме сервисманов.

Threshold. - минимальное возможное значение атрибута, при котором
гарантируется безотказная работа накопителя.

При Значении атрибута меньше Threshold очень вероятен сбой в работе или полный отказ.
Атрибуты бывают критически важными (Pre-fail) и некритически важными (Old_age).

Выход критически важного параметра за пределы Threshold фактический
означает выход диска из строя, выход за переделы допустимых значений
некритически важного параметра свидетельствует о наличии проблемы, но
диск может сохранять свою работоспособность.

Подробнее
http://www.opennet.ru/base/sys/smart_hdd_mon.txt.html
 



			
Enjoyed reading this post?
Subscribe to the RSS feed and have all new posts delivered straight to you.

Comments are closed.

Celadon theme by the Themes Boutique