Server Administrator klassifiziert Ereignisse, die sich auf bestimmte wichtige Komponenten des Systems auswirken, mit Hilfe eines Ereignistyps. Normal, Warnung und Kritisch sind die drei am häufigsten als Komponentenstatus angezeigten Ereignistypen.
In diesem Hilfemodul werden Begriffe im Zusammenhang mit Ereignistypen, Zuständen und Schweregraden definiert. Lesen Sie dieses Hilfemodul, wenn Sie weitere Details zu den einzelnen Begriffen wünschen, die Server Administrator zur Klassifizierung von Ereignissen und zur Identifikation von Funktionszuständen verwendet.
Im Folgenden werden die unterscheidbaren Attribute des Ereignisses aufgeführt, unabhängig davon, ob Server Administrator den Funktionszustand einer Komponente ausgibt oder ein Ereignis klassifiziert: die überwachte Komponente bzw. Redundanz sowie Typ, Status und Schweregrad des Ereignisses, dem die Komponente unterliegt.
Server Administrator klassifiziert sowohl Komponenten als auch die Redundanz bei bestimmten Komponenten nach Typ, Schweregrad und Status.
Alle Komponenten in einem System sind auf eine bestimmte Weise wichtig. Systems Management-Anwendungen wie Server Administrator richten auf einige bestimmte Komponenten besondere Aufmerksamkeit. Für den fehlerfreien Betrieb eines Computersystems ist insbesondere eine stabile Spannungsversorgung mit korrekter Spannung erforderlich, damit die Systemkomponenten ordnungsgemäß betrieben werden können. Der elektrische Strom wird über den Wechselstromschalter des Systems an die Netzteile des Systems geliefert. Die Temperaturen im Gehäuse müssen innerhalb des Betriebstemperaturbereichs der Systemkomponenten liegen. Das Ausführen von Programmen und die Verarbeitung von Daten erfordert einen gut funktionierenden RAM-Speicher. Zur Erfüllung dieser Anforderungen überwacht Server Administrator unter anderem diese wichtigen Komponenten: Netzschalter, Netzteile, Lüfter und Systemspeicher.
Server Administrator überwacht den Funktionszustand redundanter Komponenten und meldet den Redundanzstatus für das System.
Abhängig davon, wie wichtig ein System für die Erreichung kritischer Ziele in einem Unternehmen oder einer Organisation ist, werden einige der in das System eingebauten Komponenten redundant ausgelegt. Ein System, das wichtig für die Erreichung kritischer Ziele in einer Organisation ist, hat sehr wahrscheinlich redundante Komponenten. Eine redundante Komponente ist so konzipiert, dass sie in Betrieb geht, wenn die Begleitkomponente ausfällt. Redundanz verhindert Betriebsunterbrechungen aufgrund von Herunterfahren oder beschädigten Komponenten. Die folgenden Redundanzzustände sind möglich:
Volle Redundanz für das gesamte System ist hergestellt, wenn alle Geräte innerhalb ihrer normalen Grenzwerte arbeiten. Wenn bei einem System für volle Redundanz vier Lüfter erforderlich sind und alle vier Lüfter funktionieren, besteht für das System vollständige Redundanz für die Lüfterkomponente. Wenn einer der beiden primären Lüfter ausfällt, ist für jeden Lüfter ein Reservelüfter verfügbar. Bei voller Redundanz sind neben der normalen vorbeugenden Wartung keine Maßnahmen erforderlich.
Bei herabgesetzter Redundanz funktionieren einige der Komponenten nicht, die für volle Redundanz erforderlich sind. Das System ist betriebsbereit, doch es funktionieren nicht genügend Komponenten, sodass im Falle eines zusätzlichen Komponentenausfalls keine betriebsbereite Komponente in Reserve ist, die den Betrieb übernehmen könnte. Wenn beispielsweise vier Lüfter für die volle Redundanz erforderlich sind, liegt bei drei betriebsbereiten Lüftern herabgesetzte Redundanz vor. Nur einer der beiden primären Lüfter hat einen in Reserve, wenn er ausfällt.
Verlorene Redundanz bedeutet, dass im System nur die Mindestanzahl an Komponenten funktioniert, um einen Systemfehler zu verhindern. Keine redundanten Komponenten funktionieren. Wenn zum Erreichen voller Redundanz vier Lüfter erforderlich sind, aber nur zwei Lüfter funktionieren, steht bei einem Lüfterausfall für keinen der primären Lüfter ein Reservelüfter zur Verfügung.
Ein Ereignis wird nach Typ klassifiziert. Beispielereignistypen sind: Normal, Warnung und Kritisch.
Ereignisse vom Typ Normal geben an, dass eine Komponente innerhalb eines Wertebereichs funktioniert, in dem die Komponente ihre Funktion im System fehlerfrei ausüben kann. Ein anderer Begriff, der Komponenten mit dem Status Normal häufig zugewiesen wird, ist OK. Wenn eine Komponente OK oder ein Ereignis normal ist, ist es für den Systembediener nicht notwendig, Korrekturmaßnahmen einzuleiten.
Warnungsereignisse treten auf, wenn eine verwaltete Komponente nicht optimal funktioniert, jedoch weiterhin betriebsfähig ist. Warnungsereignisse gewähren Systembedienern eine Reaktionszeit. Die geeignete Maßnahme bei Warnungsereignissen ist häufig eine genauere Untersuchung und die Terminfestlegung für die Wartung der Komponente. Warnungen machen den Systembediener auch darauf aufmerksam, auf eine Komponente größere Aufmerksamkeit zu richten, bis die Komponente wieder zum normalen Betrieb zurückkehrt. Hauptbenutzer und Administratoren können die Minimal- und Maximalwerte für ein Warnungsereignis definieren. Die Berechtigung zur Festlegung des Warnungsbereichs ermöglicht Hauptbenutzern und Administratoren, eine Reaktionszeit einzubauen, die ihnen bleibt, um auf eine betriebsbereite Komponente mit Anzeichen herabgesetzter Leistung zu reagieren.
Ein kritisches Fehlerereignis zeigt an, dass eine Komponente entweder außerhalb der Grenzen funktioniert, die einen ordnungsgemäßen Betrieb gewährleisten, oder ganz ausgefallen ist. Eine Komponente, die überhaupt nicht mehr funktioniert, wird häufig als nicht wiederherstellbar bezeichnet. Der kritische Fehlerbereich für eine Komponente wird von deren Hersteller definiert, da dieser die Komponente entwickelt hat und am besten weiß, bei welchen Parametern die Komponente ordnungsgemäß funktioniert. Kritische Fehlerereignisse sind dringlicher als Warnereignisse, und Systembediener erachten diesen Typ der Beeinträchtigung bei der Komponentenleistung als schwerwiegender. Geeignete Maßnahmen bei einer kritischen oder fehlerhaften Komponente können das sofortige Herunterfahren des Systems oder das Veranlassen des baldigen Austauschs der Komponente sein.
Der Status einer Komponente oder eines Systemattributs ist entweder betriebsbereit, herabgesetzt oder nicht betriebsbereit.
Eine betriebsgerechte Temperatur bedeutet, dass Temperatursonden in einem Gehäuse Temperaturen messen, die im normalen Betriebsbereich liegen.
Eine herabgesetzte Temperatur bedeutet, dass Temperatursonden in einem Gehäuse Temperaturen messen, die im Warnungsbereich liegen. Der Warnungsbereich wird durch die minimalen und maximalen Betriebstemperaturen definiert, die erreicht werden müssen, bevor eine Warnung ausgegeben wird. Die Temperatur im Gehäuse liegt entweder unter der minimalen oder über der maximalen Normaltemperatur.
Eine herabgesetzte Redundanz bedeutet, dass nicht genügend Komponenten funktionieren, womit sichergestellt werden könnte, dass für jede wichtige Komponente eine Reservekomponente vorhanden ist, die bei einem Ausfall den Betrieb übernehmen könnte.
Eine nicht betriebsbereite Komponente oder ein Komponentenattribut bedeutet, dass die Komponente entweder im Fehler- oder Nicht-wiederherstellbar-Bereich arbeitet. Beispiel des Temperaturwerts: Wenn das System überhaupt noch funktioniert, liegt der Temperaturwert so weit über oder unter dem normalen Wert, dass ein temperaturbedingtes Herunterfahren des Systems ausgelöst werden könnte, oder dass Systemkomponenten beschädigt oder zerstört werden könnten.
Jeder Ereignistyp und -zustand für eine Komponente wird entsprechend seines Schweregrads eingestuft. Zu den Schweregraden für Ereignisse gehören Zur Information, Minder schwer, Schwerwiegend und Kritisch/Fehler.
Beim Ereignistyp Normal oder bei einer Komponente mit Status Normal ist die Komponente betriebsbereit, und der dem Ereignistyp Normal zugeordnete Schweregrad lautet Zur Information. Server Administrator führt für normale Ereignisse nur Maßnahmen zu Informationszwecken aus. Server Administrator informiert den Systembediener, dass eine Komponente normal funktioniert.
Ein Warnungsereignis kann, abhängig von der Komponente, minder schwer oder kritisch sein. Wenn Sie z. B. einen Lüfter aus einem lüfterredundanten System entfernen, ist der Schweregrad dieses Ereignisses minder schwer.
Bestimmte Warnungsereignisse können auf schwerwiegende Probleme im System hinweisen. Wenn ein Lüfter für längere Zeit aus dem System entfernt wird, könnte das Ereignis schwerwiegend werden, da die Redundanz gefährdet ist. Die längere Abwesenheit einer Systemkomponente, deren Funktion in einer Organisation Redundanz erfordert, könnte zu Komponentenausfällen führen, ohne dass Reservekomponenten verfügbar wären. Dies wiederum könnte zu einem Systemausfall führen.
Werden Komponenten festgestellt, die innerhalb des Fehlerbereichs arbeiten, liegt ein kritisches Ereignis vor. Das Versagen von Komponenten wie Lüfter, Netzstromkabel oder Speichermodule gefährden den unterbrechungsfreien Betrieb des Systems und die Erhaltung von Daten.
Die folgende Tabelle bietet Beispielereignisse für wichtige Komponenten und stellt den Zusammenhang zwischen Ereignistyp, Schweregrad und Zustand dar.
Komponente | Ereignis- oder Warnungstyp | Schweregrad | Zustand |
Netzkabel | Normal | Zur Information | Betriebsbereit |
Netzkabel | Fehler | Kritisch | Herabgesetzt |
Netzteil | Fehler | Kritisch | Herabgesetzt |
Redundanz (für Stromversorgungssystem) | Voll | Zur Information | Betriebsbereit |
Redundanz (für Stromversorgungssystem) | Herabgesetzt | Minder schwer | Herabgesetzt |
Redundanz (für Stromversorgungssystem) | Verloren | Schwerwiegend | Herabgesetzt |
Temperaturwert | Normal | Zur Information | Betriebsbereit |
Temperaturwert | Warnung | Minder schwer | Herabgesetzt |
Temperaturwert | Fehler | Kritisch | Herabgesetzt |
Temperaturbedingtes | Herunterfahren | Kritisch | Nicht betriebsbereit |