Мониторинг серверного железа через IPMI

Установка

Если ставим под RedHat:

yum install OpenIPMI OpenIPMI-tools
chkconfig ipmi on
/etc/init.d/ipmi start

Если же под SuSe:

zypper install OpenIPMI ipmitools
/etc/init.d/ipmi start

Общий формат

При работе по сети:

ipmitool -H <IP> -U <user> -P <password> [-v] <команда>

При работе локально(если на сервере запущен демон ipmi)

 ipmitool [-v] <команда>

где -v если хотим получить расширенный вывод

Справочник по командам

chassis

Тут собраны команды по работе с шасси сервера

chassis status

Выдает состояние подсистемы питания

Параметр Описание Допустимые значения
System Power Включен ли сервер on/off
Power Overload Перегрузка false/true
Power Interlock active/inactive
Main Power Fault Сбой по питанию false/true
Power Control Fault Сбой в системе мониторингаfalse/true
Power Restore PolicyВосстановления питания после сбояalways-on/always-off/last
Last Power Event Текст последней ошибки
Chassis Intrusion Контроль за открытием корпусаactive/inactive
Front-Panel Lockout Статус блокировки передней панели active/inactive
Drive Fault Ошибка в питании дисковой подсистемыfalse/true
Cooling/Fan Fault Ошибка в питании системы охлаждения false/true
Sleep Button DisableОтключение клавиши спящего режима allowed/not-allowed
Diag Button Disable Отключение клавиши диагностики/UID allowed/not-allowed
Reset Button DisableОтключение клавиши reset allowed/not-allowed
Power Button DisableОтключение клавиши питания allowed/not-allowed
Sleep Button DisabledСтатус отключения клавиши спящего режима false/true
Diag Button Disabled Статус отключения клавиши диагностики/UID false/true
Reset Button DisabledСтатус отключения клавиши reset false/true
Power Button DisabledСтатус отключения клавиши питания false/true

chassis power

  • chassis power status - Выдает состояние питания шасси по каждому блоку питания (on/off)
  • chassis power on - Включает питание сервера
  • chassis power off - Выключает питание сервера
  • chassis power сycle - Аналогично последовательности команд chassis power on и chassis power off
  • chassis power reset - сброс по питанию (чем отличается от cycle - хз)
  • chassis power soft - пытается программно послать операционной системе команду на выключение

chassis policy

задает политику подачи питания после сбоя в формате chassis policy <param>, где <param> может быть

  • list - получить список возможных состояний политики
  • always-on - автоматически включаться после сбоя питания
  • always-off - не включаться после сбоя питания
  • previous - перевести систему в то состояние, в котором она была перед сбоем сбоя

chassis restart_cause

Выдает причину последней перезагрузки

chassis poh

Выдает суммарное время работы шасси

chassis bootdev

Управление устройствами загрузки сервера

bootdev <device> [clear-cmos=yes|no]
bootdev <device> [options=help,...]
  none  : Do not change boot device order
  pxe   : Force PXE boot
  disk  : Force boot from default Hard-drive
  safe  : Force boot from default Hard-drive, request Safe Mode
  diag  : Force boot from Diagnostic Partition
  cdrom : Force boot from CD/DVD
  bios  : Force boot into BIOS Setup
  floppy: Force boot from Floppy/primary removable media

chassis selftest

Запустить самотестирование. В результате выдается либо passed, либо текст ошибки

sdr

Выводит краткую информацию о состоянии датчиков

OS Boot Status   | Not Readable      | ns
POST Error       | Not Readable      | ns
Memory ECC       | Not Readable      | ns
PCI-E Error      | Not Readable      | ns
NMI              | Not Readable      | ns
DIMM1E ECC       | Not Readable      | ns
DIMM2C ECC       | Not Readable      | ns
DIMM3A ECC       | Not Readable      | ns
DIMM4F ECC       | Not Readable      | ns
DIMM5D ECC       | Not Readable      | ns
DIMM6B ECC       | Not Readable      | ns
Therm-Trip0      | 0x01              | ok
CPU0 Vcore       | 0.93 Volts        | ok
System VTT       | 1.14 Volts        | ok
CPU Socket Occup | 0x00              | ok
Identify         | 0x00              | ok
System 12V       | 12.26 Volts       | ok
System 5V        | 5.22 Volts        | ok
Standby 5V       | 5.22 Volts        | ok
System 3.3V      | 3.35 Volts        | ok
Standby 3.3V     | 3.32 Volts        | ok
DDR3 1.5V        | 1.54 Volts        | ok
CPU Prochot      | 0x00              | ok
Fan1 Front Rotor | 5329.07 RPM       | ok
Fan1 Rear Rotor  | 5450.19 RPM       | ok
Fan2 Front Rotor | 5213.22 RPM       | ok
Fan2 Rear Rotor  | 5329.07 RPM       | ok
Fan3 Front Rotor | 5329.07 RPM       | ok
Fan3 Rear Rotor  | 5450.19 RPM       | ok
Fan4 Front Rotor | 6310.74 RPM       | ok
Fan4 Rear Rotor  | 6481.30 RPM       | ok
System Amb Temp  | 16 degrees C      | ok
CPU Temp         | 30 degrees C      | ok
PCI Ambient Temp | 21.50 degrees C   | ok
Rear DIMM Amb Te | 27 degrees C      | ok
DIMM3A Temp      | 27.50 degrees C   | ok
DIMM2C Temp      | no reading        | ns
DIMM1E Temp      | no reading        | ns
DIMM6B Temp      | 27 degrees C      | ok
DIMM5D Temp      | no reading        | ns
DIMM4F Temp      | no reading        | ns
Watchdog         | 0x00              | ok
Chassis          | 0x01              | ok
ACPI State       | 0x01              | ok

sensor

Выводит подробную информацию о состоянии датчиков

Therm-Trip0      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
CPU0 Vcore       | 0.960      | Volts      | ok    | na        | na        | na        | na        | na        | na        
System VTT       | 1.127      | Volts      | ok    | na        | na        | na        | na        | na        | na        
CPU Socket Occup | 0x1        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Identify         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
System 12V       | 12.264     | Volts      | ok    | na        | na        | na        | na        | na        | na        
System 5V        | 5.218      | Volts      | ok    | na        | na        | na        | na        | na        | na        
Standby 5V       | 5.218      | Volts      | ok    | na        | na        | na        | na        | na        | na        
System 3.3V      | 3.348      | Volts      | ok    | na        | na        | na        | na        | na        | na        
Standby 3.3V     | 3.317      | Volts      | ok    | na        | na        | na        | na        | na        | na        
DDR3 1.5V        | 1.548      | Volts      | ok    | na        | na        | na        | na        | na        | na        
CPU Prochot      | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Fan1 Front Rotor | 5329.070   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan1 Rear Rotor  | 5450.185   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan2 Front Rotor | 5213.221   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan2 Rear Rotor  | 5329.070   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan3 Front Rotor | 5329.070   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan3 Rear Rotor  | 5450.185   | RPM        | ok    | na        | na        | na        | na        | 2200.075  | na        
Fan4 Front Rotor | 6310.741   | RPM        | ok    | na        | na        | na        | na        | 2788.467  | na        
Fan4 Rear Rotor  | 6481.301   | RPM        | ok    | na        | na        | na        | na        | 2788.467  | na        
System Amb Temp  | 14.000     | degrees C  | ok    | na        | na        | na        | 38.000    | 42.000    | 46.000    
CPU Temp         | 30.000     | degrees C  | ok    | na        | na        | na        | na        | 81.000    | 127.000   
PCI Ambient Temp | 22.000     | degrees C  | ok    | na        | na        | na        | 57.000    | 62.000    | 67.000    
Rear DIMM Amb Te | 27.000     | degrees C  | ok    | na        | na        | na        | 62.000    | 67.000    | 72.000    
DIMM3A Temp      | 27.500     | degrees C  | ok    | na        | na        | na        | 82.000    | 87.000    | 95.000    
DIMM2C Temp      | na         | degrees C  | na    | na        | na        | na        | 82.000    | 87.000    | 95.000    
DIMM1E Temp      | na         | degrees C  | na    | na        | na        | na        | 82.000    | 87.000    | 95.000    
DIMM6B Temp      | 27.000     | degrees C  | ok    | na        | na        | na        | 82.000    | 87.000    | 95.000    
DIMM5D Temp      | na         | degrees C  | na    | na        | na        | na        | 82.000    | 87.000    | 95.000    
DIMM4F Temp      | na         | degrees C  | na    | na        | na        | na        | 82.000    | 87.000    | 95.000    
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Chassis          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
ACPI State       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na 

fru

Выводит информацию о сервере, такую как название сервера, производителя, серийный номер

FRU Device Description : Builtin FRU Device (ID 0)
 Unknown FRU header version 0xff

FRU Device Description : System FRU (ID 1)
 Product Manufacturer  : HP
 Product Name          : ProLiant DL120 G6
 Product Serial        : CZ110300ZY

lan

Тут собраны команды по работе с сетевым интерфейсом

print

Выводит текущий статус сетевого интерфейса

Set in Progress         : Set Complete
Auth Type Support       : NONE MD5 PASSWORD 
Auth Type Enable        : Callback : NONE MD5 PASSWORD 
                        : User     : NONE MD5 PASSWORD 
                        : Operator : NONE MD5 PASSWORD 
                        : Admin    : NONE MD5 PASSWORD 
                        : OEM      : NONE MD5 PASSWORD 
IP Address Source       : Static Address
IP Address              : 192.168.0.46
Subnet Mask             : 255.255.240.0
MAC Address             : 78:ac:c0:88:b2:31
SNMP Community String   : public
IP Header               : TTL=0x40 Flags=0x40 Precedence=0x00 TOS=0x10
Default Gateway IP      : 192.168.1.7
802.1q VLAN ID          : Disabled
802.1q VLAN Priority    : 0
RMCP+ Cipher Suites     : 0,1,2,3
Cipher Suite Priv Max   : OOOOXXXXXXXXXXX
                        :     X=Cipher Suite Unused
                        :     c=CALLBACK
                        :     u=USER
                        :     o=OPERATOR
                        :     a=ADMIN
                        :     O=OEM

set

Позволяет установить параметры сети

Формат:

set <channel number> <command> <parameter>

В качетве параметра возможны следующие варианты:

  ipaddr <x.x.x.x>               Set channel IP address
  netmask <x.x.x.x>              Set channel IP netmask
  macaddr <x:x:x:x:x:x>          Set channel MAC address
  defgw ipaddr <x.x.x.x>         Set default gateway IP address
  defgw macaddr <x:x:x:x:x:x>    Set default gateway MAC address
  bakgw ipaddr <x.x.x.x>         Set backup gateway IP address
  bakgw macaddr <x:x:x:x:x:x>    Set backup gateway MAC address
  password <password>            Set session password for this channel
  snmp <community string>        Set SNMP public community string
  user                           Enable default user for this channel
  access <on|off>                Enable or disable access to this channel
  alert <on|off>                 Enable or disable PEF alerting for this channel
  arp respond <on|off>           Enable or disable BMC ARP responding
  arp generate <on|off>          Enable or disable BMC gratuitous ARP generation
  arp interval <seconds>         Set gratuitous ARP generation interval
  vlan id <off|<id>>             Disable or enable VLAN and set ID (1-4094)
  vlan priority <priority>       Set vlan priority (0-7)
  auth <level> <type,..>         Set channel authentication types
    level  = CALLBACK, USER, OPERATOR, ADMIN
    type   = NONE, MD2, MD5, PASSWORD, OEM
  ipsrc <source>                 Set IP Address source
    none   = unspecified source
    static = address manually configured to be static
    dhcp   = address obtained by BMC running DHCP
    bios   = address loaded by BIOS or system software
  cipher_privs XXXXXXXXXXXXXXX   Set RMCP+ cipher suite privilege levels
    X = Cipher Suite Unused
    c = CALLBACK
    u = USER
    o = OPERATOR
    a = ADMIN
    O = OEM

Например, пример настройки ip-адреса будет выглядеть следующим образом:

lan set 2 ipaddr 10.10.10.12
lan set 2 netmask 255.255.255.0
lan set 2 defgw ipaddr 10.10.10.1

alert print

Выводит список предупреждений и ошибок

power

Команды работы с подсистемой питания

status

Выводит статус питания

Chassis Power is on

on

Включить питание сервера

off

Выключить питание сервера

cycle

Два раза подряд изменяет статус питания (в отличие от reset - например в том случае когда сервер выключен)

reset

«Жесткий» перезапуск сервера

soft

Попробовать программный перезапуск сервера

ipmitool.txt · Последние изменения: 2014/08/27 17:27 (внешнее изменение)
GNU Free Documentation License 1.3
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Яндекс.Метрика