Различия

Здесь показаны различия между двумя версиями данной страницы.

Ссылка на это сравнение

monitoring_smart_v_linux [2013/10/23 15:12] (текущий)
Строка 1: Строка 1:
 +====== Мониторинг SMART в Linux ======
 +===== Что можно мониторить ======
 +  - Raw_Read_Error_Rate
 +  - Spin_Up_Time
 +  - Start_Stop_Count
 +  - Reallocated_Sector_Ct
 +  - Seek_Error_Rate
 +  - Power_On_Hours
 +  - Spin_Retry_Count
 +  - Power_Cycle_Count
 +  - Unused_Rsvd_Blk_Cnt_Tot
 +  - End-to-End_Error
 +  - Reported_Uncorrect
 +  - Command_Timeout
 +  - High_Fly_Writes
 +  - Airflow_Temperature_Cel
 +  - G-Sense_Error_Rate
 +  - Power-Off_Retract_Count
 +  - Load_Cycle_Count
 +  - Temperature_Celsius
 +  - Hardware_ECC_Recovered
 +  - Reallocated_Event_Count
 +  - Current_Pending_Sector
 +  - Offline_Uncorrectable
 +  - UDMA_CRC_Error_Count
 +
 +
 +===== Требования =====
 +Для работы должны быть установлены следующие пакеты:​
 +  - smartd
 +  - sed
 +  - cut
 +  - grep
 +  - tr
 +
 +===== Установка скрипта для мониторинга =====
 +
 +В **/opt** сервера,​ на котором необходимо настроить мониторинг кладем 2 файла и ставим им аттрибут **на исполнение**:​
 +
 +Выдает значение параметра в том виде, как он содержится в системе
 +<file bash get_smart_value.sh>​
 +#!/bin/bash
 +if [ $# -ne 2 ];
 +then
 +echo "​Usage:​ $0 <​device>​ <​parameter>"​
 +exit
 +fi
 +
 +smartctl -A $1 | grep $2 | tr -s ' ' | sed "​s/​^[[:​space:​]]*\(.*\)[[:​space:​]]*$/​\1/"​ | cut -d" " -f10
 +</​file>​
 +
 +Выдает состояние параметра с учетом времени возможного отказа
 +<file bash get_smart_status.sh>​
 +#!/bin/bash
 +if [ $# -ne 2 ];
 +then
 +echo "​Usage:​ $0 <​device>​ <​parameter>"​
 +exit
 +fi
 +
 +smartctl -A $1 | grep $2 | tr -s ' ' | sed "​s/​^[[:​space:​]]*\(.*\)[[:​space:​]]*$/​\1/"​ | cut -d" " -f7
 +</​file>​
 +
 +===== Добавление параметров в конфигурацию агента =====
 +В конец файла **/​etc/​zabbix/​zabbix_agentd.conf** добавляем строки для нужных параметров,​ например:​
 +<file bash>
 +UserParameter=hdd.sda.temperature,/​usr/​local/​bin/​get_smart_value.sh /dev/sda Temperature_Celsius
 +UserParameter=hdd.sda.raw_read_error_rate,/​usr/​local/​bin/​get_smart_value.sh /dev/sda Raw_Read_Error_Rate
 +UserParameter=hdd.sda.reallocated_sector_count,/​usr/​local/​bin/​get_smart_value.sh /dev/sda Reallocated_Sector_Ct
 + 
 +UserParameter=hdd.sdb.temperature,/​usr/​local/​bin/​get_smart_value.sh /dev/sdb Temperature_Celsius
 +UserParameter=hdd.sdb.raw_read_error_rate,/​usr/​local/​bin/​get_smart_value.sh /dev/sdb Raw_Read_Error_Rate
 +UserParameter=hdd.sdb.reallocated_sector_count,/​usr/​local/​bin/​get_smart_value.sh /dev/sdb Reallocated_Sector_Ct
 +</​file>​
 +
 +===== Шаблон для zabbix'​a =====
 +
 +
 +
  
monitoring_smart_v_linux.txt · Последние изменения: 2013/10/23 15:12 (внешнее изменение)
GNU Free Documentation License 1.3
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Яндекс.Метрика