Server Administrator clasifica los sucesos que afectan a ciertos componentes fundamentales de su sistema usando un tipo de suceso. Normal, advertencia y crítico son los tres tipos de sucesos más comunes que se muestran como el estado de los componentes.
Este módulo de ayuda define los términos para los tipos, los estados y las gravedades de los sucesos. Lea este módulo de ayuda si desea obtener más detalles acerca de los diferentes términos que Server Administrator usa para clasificar los sucesos y para identificar el estado de los componentes.
Ya sea que Server Administrator informe acerca del estado de un componente o que clasifique un suceso, los atributos que se pueden distinguir son: el componente o la redundancia que se supervisa y el tipo, estado y gravedad del suceso que el componente atraviesa.
Server Administrator clasifica tanto a los componentes como a la redundancia de algunos componentes de acuerdo con el tipo, la gravedad y el estado.
Todos los componentes de un sistema son importantes de alguna manera. Las aplicaciones de Systems Management, como Server Administrator, destacan algunos componentes para darles atención especial. Los sistemas con condición satisfactoria dependen especialmente de un suministro estable de energía eléctrica en los voltajes adecuados para que los componentes del sistema funcionen correctamente. La energía eléctrica se suministra a través del interruptor de corriente alterna (CA) del sistema y hacia los suministros de energía del equipo. Los componentes de los sistemas también requieren un rango de temperaturas funcional dentro del chasis. La ejecución de programas y la elaboración de cálculos sobre los datos requiere que la memoria de acceso aleatorio funcione bien. Como resultado de estos requisitos, el interruptor de corriente, los suministros de energía, los ventiladores y la memoria del sistema son algunos de los componentes más importantes que Server Administrator supervisa.
Server Administrator supervisa la condición de los componentes redundantes y notifica el estado de la redundancia del sistema.
Dependiendo de la relevancia del sistema para la misión de una entidad u organización comercial, algunos componentes están instalados en el sistema con redundancia planificada. Es más probable que un sistema que es fundamental para la misión de una organización tenga componentes redundantes. Un componente redundante está diseñado para hacerse cargo de la operación cuando su componente acompañante falla. La redundancia ayuda a proteger a un sistema para que no experimente tiempo de inactividad debido a un apagado o a daños en los componentes. Los siguientes estados de redundancia son posibles:
Redundancia total para todo el sistema significa que todos los dispositivos están funcionando dentro de los límites normales. Si un sistema requiere cuatro ventiladores para la redundancia total y los cuatro están funcionando, el sistema tiene redundancia total para el componente del ventilador. Si cualquiera de los dos ventiladores principales falla, cada uno tiene un respaldo. La redundancia total no requiere ninguna acción además del mantenimiento preventivo normal.
Redundancia degradada significa que algunos de los componentes que se necesitan para la redundancia total no están funcionando. El sistema está operativo, pero no hay suficientes componentes funcionando para permitir que un componente operativo se haga cargo de la operación en caso de que falle un componente adicional. Por ejemplo, se necesitan cuatro ventiladores para la redundancia total, tres ventiladores operativos representan redundancia degradada. Sólo uno de los dos ventiladores primarios tiene un respaldo si falla.
Redundancia perdida significa que el sistema tiene sólo el número mínimo de componentes funcionando para evitar una falla del sistema. No hay ningún componente redundante funcionando. Si se necesitan cuatro ventiladores para la redundancia total y sólo hay dos ventiladores funcionando, ninguno de los ventiladores principales tiene un respaldo si un ventilador falla.
Un suceso se clasifica por tipo. Normal, advertencia y crítico son ejemplos de tipos de sucesos.
Los sucesos normales indican que un componente está funcionando dentro de un rango de valores que habilita al componente para realizar bien su función en el sistema. Otro término que se aplica a menudo a los componentes cuyo estado es normal es En buen estado. Cuando un componente está en buen estado o un suceso es normal, el operador del sistema no tiene que realizar ninguna acción correctiva.
Los sucesos de advertencia se producen cuando un componente administrado no está funcionando óptimamente, pero aún es capaz de funcionar. Los sucesos de advertencia proporcionan cierto tiempo de ventaja a los operadores del sistema. La acción adecuada para un suceso de advertencia es a menudo investigar más y programar el mantenimiento del componente. Las advertencias también alertan al operador del sistema para que ponga más atención a un componente hasta que éste regrese a su estado normal. Los usuarios avanzados y los administradores pueden definir los valores mínimo y máximo para un suceso de advertencia. El privilegio de definir el rango de advertencia permite a los usuarios avanzados y a los administradores incorporar el tiempo de reacción que desean cuando se maneja un componente operativo que está comenzando a mostrar signos de funcionamiento degradado.
Un suceso crítico o de falla indica que un componente está funcionando fuera de los límites del funcionamiento adecuado o que no está funcionando en absoluto. Un componente que no está funcionando en absoluto a menudo se denomina no recuperable. El fabricante del sistema define el rango crítico o de falla para los componentes, ya que el fabricante conoce mejor el diseño del componente y su funcionamiento más adecuado. El suceso crítico o de falla tiene una connotación más urgente comparado con el advertencia y los operadores del sistema toman más seriamente este tipo de degradación del funcionamiento de un componente. Las acciones adecuadas para un componente crítico o que está fallando pueden incluir el apagado inmediato del sistema o la programación del reemplazo del componente en muy poco tiempo.
El estado de un atributo de un componente o del sistema puede ser operativo, degradado o no operativo.
Una temperatura operativa significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas en el rango normal de operación.
Una temperatura degradada significa que las sondas de temperatura dentro de un chasis están leyendo temperaturas que están dentro del rango de advertencia definido por las temperaturas de operación mínima y máxima requeridas para una advertencia. La temperatura en el chasis está por debajo de la temperatura mínima normal o sobre la temperatura máxima normal.
Una redundancia degradada significa que no hay suficientes componentes funcionando para asegurar que cada componente fundamental tenga un respaldo que se haga cargo de la operación en caso de una falla.
Un componente o un atributo de un componente no operativo significa que el componente está funcionando en un rango ya sea de falla o no recuperable. Usando el ejemplo de la temperatura, si el sistema aún está funcionando, la temperatura está tan por encima o por debajo del rango normal que podría desencadenar un apagado térmico del sistema o la temperatura podría dañar o destruir los componentes del mismo.
Cada tipo de suceso y estado de un componente se clasifica de acuerdo a su gravedad. Las gravedades para sucesos incluyen informativo, leve, grave y crítico/falla.
Un suceso normal o el estado de un componente está en un estado operativo y la gravedad asociada con un suceso normal es informativa. La única acción que Server Administrator realiza para un suceso normal es informativa. Server Administrator informa al operador del sistema que el componente está en estado normal.
Un suceso de advertencia puede ser leve o crítico, dependiendo del componente. Por ejemplo, si desmonta un ventilador en un sistema con redundancia de ventiladores, la gravedad de ese suceso es leve.
Algunos sucesos de advertencia pueden indicar riesgos graves para el sistema. Si un ventilador permanece fuera del sistema por un periodo largo, el suceso podría convertirse en grave porque se estaría comprometiendo la redundancia. La ausencia por un periodo largo de un componente en un sistema cuya misión en una organización requiere redundancia, podría ocasionar fallas de los componentes sin respaldos disponibles y podría conducir finalmente a una falla del sistema.
Los sucesos que detectan componentes dentro del rango de falla son críticos. La falla de componentes como los ventiladores, los cables de corriente alterna o los módulos de memoria ponen en peligro la capacidad del sistema para funcionar y preservar los datos.
La siguiente tabla proporciona ejemplos de sucesos para componentes importantes y muestra cómo se relacionan el tipo de suceso, la gravedad y el estado.
Componente | Tipo de suceso o de alerta | Gravedad | Estado |
Cable de corriente alterna | Normal | Informativo | Operativo |
Cable de corriente alterna | Falla | Crítico | Degradado |
Suministro de energía | Falla | Crítico | Degradado |
Redundancia (para el sistema de energía) | Total | Informativo | Operativo |
Redundancia (para el sistema de energía) | Degradado | Leve | Degradado |
Redundancia (para el sistema de energía) | Perdido | Grave | Degradado |
Temperatura | Normal | Informativo | Operativo |
Temperatura | Advertencia | Leve | Degradado |
Temperatura | Falla | Crítico | Degradado |
Térmico | Apagado | Crítico | No operativo |