返回 Storage Management 目录页

存储运行状况和相关注意事项

Dell OpenManage™ Server Administrator Storage Management 用户指南

  存储运行状况

  存储组件严重性

  存储属性和当前活动

  警报或事件

  监测 RAID 控制器上的磁盘可靠性

  使用警报检测故障

  使用机柜温度探测器

  重新扫描以更新存储配置更改

  显示配置更改的时间延迟

  用于检测物理磁盘状况更改的输入/输出和重新引导要求

本部分介绍了多种方法来确定系统存储组件的状况或运行状况。

存储运行状况

“Health”(运行状况)子选项卡显示存储组件的当前状况。 “Storage”(存储)树形视图对象的“Health”(运行状况)子选项卡反映了所有低级别对象的状况。 例如,如果存储系统由于一个降级的机柜受到了影响,机柜“Health”(运行状况)子选项卡和“Storage”(存储)“Health”(运行状况)子选项卡都会显示一个黄色的感叹号 (!) 以表示警告严重性。 请参阅“存储组件严重性”了解详情。

快速查看所有存储组件状况的一个方法是,选择“Storage”(存储)树形视图,并查看“Health”(运行状况)子选项卡。 可以单击“Health”(运行状况)子选项卡上的存储组件来显示关于组件的详细信息。

存储组件严重性

组件状况由严重性来表示。 具有“警告”或“严重/故障”状况的组件需要立即进行检查以防止数据遗失。 查看事件警报日志便于找出那些说明组件为什么出现“警告”或“严重”状况。 有关故障排除的其它信息,请参阅“警报消息”“故障排除”

严重性

组件状况

“Normal/OK”(正常/良好) 组件正按预期运行。

 

“Warning/Non-critical”(警告/不严重)。 探测器或其它监测设备检测到组件的读数超过或低于所允许的级别。 组件可能仍在工作,但可能会造成故障。 组件还可能会在不稳定的状态下工作。 可能会出现数据遗失。

“Critical/Failure/Error”(严重/故障/错误)。 组件要么已经发生故障,要么即将发生故障。 组件需要立即进行检查并且可能需要更换。 可能已经发生数据遗失。

存储属性和当前活动

“Configuration/Information”(配置/信息)子选项卡显示关于存储组件的信息。 这些属性包括一些详情,比如控制器上的连接器(信道或端口)数或机柜管理模块 (EMM) 固件版本。

“State”(状态)和“Progress”(进度)属性表示组件的当前活动。 例如,脱机物理磁盘显示“Offline”(脱机)状况,而“Progress”(进度)属性显示还有多久就可以完成操作(比如重建)。

以下部分介绍各个组件的属性:

警报或事件

存储活动会生成警报或事件,这些警报或事件将显示在“警报日志”中。 有些警报表示正常的活动,只是为了提供信息而显示。 其它的警报则表示异常的活动,需要立即进行处理。 关于警报和其纠正操作的详情,请参阅“警报消息”

监测 RAID 控制器上的磁盘可靠性

Storage Management 在已启用 SMART 的物理磁盘上支持自我监测分析和报告技术 (SMART)。

SMART 会对每个磁盘执行预测性故障分析,并且在预计会发生磁盘故障时发出警报。 RAID 控制器会检查物理磁盘以寻找预计的故障,如果找到,就会将此信息传递给 Storage Management。 Storage Management 会立即在磁盘上显示一个警报图标。 Storage Management 还会将警报发送到警报日志和 Microsoft® Windows® 应用程序日志。

注:如果控制器的输入/输出已暂停,将不会收到 SMART 警报。
注:PERC 3/SC、3/DCL、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器对于未分配的或热备份磁盘不会报告 SMART 警报。

相关信息:

使用警报检测故障

有些存储组件具有警报。 启用后,这些警报会在组件失败时提醒用户。 请参阅以下部分了解详情:

使用机柜温度探测器

物理磁盘机柜带有温度探测器,在机柜超过允许的温度范围时会警告用户。 有关使用温度探测器的详情,请参阅以下内容:

重新扫描以更新存储配置更改

“Rescan”(重新扫描)任务扫描连接到控制器连接器(信道或端口)的存储,以验证当前连接的设备或识别连接器上已添加或删除的设备。 对控制器对象进行重新扫描时,所有连接到控制器的存储都将重新扫描。 执行重新扫描会使控制器识别出存储配置中的更改,比如虚拟磁盘添加或卸下了物理磁盘,或者更改了 RAID 级别。

可能想在以下情况进行重新扫描:

如果想重新扫描所有控制器,则执行“全局重新扫描”。 如果只想重新扫描连接到某个控制器的组件,则执行“重新扫描控制器”

相关信息:

显示配置更改的时间延迟

更改存储配置时,Storage Management 会迅速生成 SNMP 陷阱以响应配置更改。 Storage Management MIB(管理信息库)也会更新以反映存储配置更改。 不过可能需要多达五分钟以使用最新的存储配置更新 MIB。 因此,在接收 SNMP 陷阱和能够通过查询 Storage Management MIB 来识别配置更改的过程之间会有最多五分钟的时间延迟。 在 RAID 1 连锁虚拟磁盘上创建新虚拟磁盘或执行取消镜像或分割镜像时,这种时间延迟尤其明显。 可以通过执行控制器重新扫描来尽量缩短这种延时。 请参阅“重新扫描控制器”了解详情。

用于检测物理磁盘状况更改的输入/输出和重新引导要求

此部分适用于 PERC 3/SC、3/DCL、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器

由于硬件限制,PERC 3/SC、3/DCL、3/DC、3/QC、4/SC、4/DC、4e/DC、4/Di、4e/Si、4e/Di 和 CERC ATA100/4ch 控制器在尝试输入/输出或系统重新引导之前不会检测到物理磁盘更改。

如果控制器具有到磁盘的打开的通信路径,则在控制器上执行 I/O 操作会更新磁盘状况。 例如,如果未配置的磁盘已被卸下,则在手动扫描完成或尝试其它输入/输出操作之前,控制器不会检测到更改。 与此类似,要显示虚拟磁盘或其中某个物理磁盘的状况更改,需要在虚拟磁盘所在的控制器上执行输入/输出。

但是,如果控制器已失去通信路径,则需要重新引导系统才能更新磁盘状况。 如果在尝试访问数据时操作系统生成 I/O 错误则说明通信已失去,即使 Storage Management 显示磁盘状况为运行良好。 通信路径一旦恢复,则重新引导系统以更新磁盘状况。 如果通信路径没有恢复,则 Storage Management 在重新引导后不会显示存储对象。

相关信息:


返回 Storage Management 目录页