硬件维护工具我常用的就2个:倚天剑ipmitool以及屠龙刀MegaCli。今天我们来介绍Ipmitool。注意:Ipmitool是针对硬件底层进行操作管理,对于电源相关的操作请三思!

1. IPMI简介

IPMI (intelligent platform management interface)智能平台管理接口是一种开放标准的硬件管理接口规格 ,定义了嵌入式管理子系统进行通信的特方法。 IPMI信息通过基板管理控制器 (BMC)(位于 IPMI规格的硬件组上)进行交流。使用低级智能管理而不使用操作系统 进行管理, 用户可以利用IPMI监视服务器的物理健康状态,如温度、电压、风扇工作状态、电源状态等。

2. IPMI优点

IPMI 把系统管理软件从系统的硬件平台管理任务中分离出来,并且把底层的服务器管理功能与高层软件分开。这样,推出一个通用的、跨系统的平台管理监控软件就成为可能;
IPMI 是可扩展的并且能够快速简单地在其上附加新功能,如增加更多的传感器、管理控制器或特定的配件设备;
在加入IPMI 技术的系统里,CPU 只需要与IPMI 就事件进行通信,形成IPMI 事件记录(Event Log)。在系统上的每个设备直接通过IPMI 与事件记录文件通信,而事件记录文件以统一的方法为每个特定的设备记录所有的事件状态。这一特点进一步简化了代理(Agent)的处理任务,提高了系统的整体运行性能。

3. IPMI工作原理

IPMI 的核心是基板管理控制器(BMC),其并不依赖于服务器的处理器、BIOS 或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有BMC 与IPMI 固件其便可开始工作,而BMC 通常是一个安装在服务器主板上的独立的板卡,现在也有服务器主板提供对IPMI 支持的。IPMI 良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。

在工作时,所有的IPMI 功能都是向BMC 发送命令来完成的,命令使用IPMI 规范中规定的指令,BMC 接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。在需要远程访问系统时,IPMI 的SOL 特性很有用。SOL 改变IPMI 会话过程中本地串口传送方向,从而提供对紧急管理服务、Windows 专用管理控制台或Linux 串行控制台的远程访问。BMC 通过在LAN 上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。

4. BMC的功能
  • 系统的串行端口进行访问
  • 故障日志记录和 SNMP 警报发送
  • 访问系统事件日志 (System Event Log ,SEL) 和传感器状况
  • 控制包括开机和关机
  • 独立于系统电源或工作状态的支持
  • 用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向
5. BMC工作原理

BMC 基板管理控制器 (baseboard management controller) 的缩写,这是一个在 IPMI结构下提供智能管理的控制器,BMC 因为多集成于主板而得名,系统管理软件对各个被管理器件的管理,都是通过与BMC 通信来实现的。BMC 通过与主板上的不同传感器通信来监视系统是否有严重事件,并在某些参数超出其预置阈值时发出警报和日志事件。BMC 支持工业标准的 Intelligent Platform Management Interface (IPMI) 协议,可以实现远程配置、监测和恢复系统。BMC 芯片就相当于计算机中的中央处理器,通过BMC 芯片上一对SMBus 接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过RS-232 接口连接Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取SDR、SEL 数据,分析诊断故障原因;BMC 通过IPMB 接口访问模组风扇背板、电源背板等上的SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC 通过系统接口(多用SMIC:ServerManagement Interface Chip),实现IPMI 消息传输机制,控制LCD 显示和实现上层软件与底层F/W 通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的E2PROM。

硬件运维:使用IPMITOOL解决服务器底层维护难题BMC 从不同的传感器收集信息,然后可以存到本地的SEL 里面,便于以后查询,也会把重要的信息显示到服务器前面板上面的那个小的LCD 显示器上(需要硬件支持)。同时还能通过网卡(LAN),串口(Serial)、本地(Host)来访问这些信息

6. Ipmitool的实现方式

6.1 本地调用系统结构图

硬件运维:使用IPMITOOL解决服务器底层维护难题

6.2 远程调用系统结构图

硬件运维:使用IPMITOOL解决服务器底层维护难题

6.3 配置本地啊哦做系统支持IPMI

载入系统功能模块(2.6 kernels):

modprobe ipmi_msghandler
modprobe ipmi_si
modprobe ipmi_devintf

注意:必须先载入模块,这样内核才能识别 ipmidev 设备。如果是2.4kernels 载入模块有所区别,请参考文档结尾附录部分。

7. 各品牌服务器对于Ipmitool的支持

如下命令都是在本地调用,如果需要配合远程调用使用,则改为:
ipmitool -I lanplus -H $ILO_IP -U $USERNAME -P $PASSWORD XXXXXXXX

8、坑—客户端无法获取dell机器的mac信息

现象无法远程获取dell机型的mac地址信息

#ipmitool -I lanplus -U $ILO_USER -P $ILO_PW -H $ILO_IP delloem mac get 1

Error in getting MAC Address : Not supported platform

经过多次测试,对比不同服务器的系统版本,ipmitool版本以及,IDRAC固件版本后发现是客户端的ipmitool的版本问题

9、坑—SOL重定向出现乱码

在启动的各个阶段都能够正常显示,一到登录界面,就出现乱码.

故障原因:配置不同

/etc/inittab文件配置不同 S0:12345:respawn:/sbin/agetty -L 57600 ttyS1 vt102

/boot/grub/menu.lst文件配置不同 未注释掉splashimage图形显示

原文来自:http://www.yunweipai.com/archives/19236.html

本文地址:https://www.linuxprobe.com/ipmitool-maintenance-server.html编辑员:郭建鹏,审核员:逄增宝

本文原创地址:https://www.linuxprobe.com/ipmitool-maintenance-server.html编辑:roc_guo,审核员:暂无