Retour au sommaire de Storage Management

Dépannage

Guide d'utilisation de Dell OpenManage™ Server Administrator Storage Management

  Procédures de dépannage standard

  Dépannage des disques virtuels

  Situations problématiques spécifiques et solutions

Cette section contient des procédures de dépannage aux problèmes standard et spécifiques.

Procédures de dépannage standard

Cette section décrit les commandes et les procédures que vous pouvez utiliser pour le dépannage. Les sections décrites sont :

Bon raccordement des câbles

Vérifiez que le cordon d'alimentation et les câbles de l'adaptateur sont bien raccordés. Si le système rencontre des problèmes lors des opérations de lecture et d'écriture sur un disque virtuel donné ou sur un disque physique non RAID (si le système bloque, par exemple), assurez-vous que les câbles sont correctement raccordés à l'enceinte ou au fond de panier correspondant. Si la connexion est bien faite mais que le problème persiste, vous devrez peut-être remplacer le câble. Reportez-vous à « Détermination des problèmes matériels ».

Sur les contrôleurs SAS, vous devez vérifier si la configuration des câbles est valide. Consultez la documentation du système SAS pour connaître les configurations de câbles valides. Si la configuration des câbles n'est pas valide, vous pouvez recevoir les alertes « 2182 » ou « 2356 ».

Spécifications système

Le système doit répondre à toutes les spécifications. Vérifiez surtout que les bons niveaux de micrologiciels et de pilotes sont installés sur le système. Pour plus d'informations sur les pilotes et les micrologiciels, reportez-vous à « Pilotes et micrologiciels ».

Pilotes et micrologiciels

Storage Management est testé avec les micrologiciels et les pilotes du contrôleur pris en charge. Pour fonctionner correctement, le contrôleur doit avoir la version minimale requise du micrologiciel et des pilotes installée. Vous pouvez obtenir les dernières versions sur le site de support de Dell™ à l'adresse support.dell.com.

REMARQUE : Vous pouvez vérifier les micrologiciels et les pilotes installés en sélectionnant l'objet Stockage dans l'arborescence et en cliquant sur l'onglet Informations/Configuration. Vous pouvez également consulter le journal des alertes pour les versions de micrologiciels et de pilotes non prises en charge.

Nous vous conseillons aussi recommandé d'obtenir et d'appliquer régulièrement le BIOS système pour serveur Dell PowerEdge™ pour profiter des améliorations les plus récentes. Consultez la documentation du système Dell PowerEdge pour des informations supplémentaires.

Détermination des problèmes matériels

Si vous recevez une alerte d'expiration de délai concernant un périphérique ou si vous pensez que l'un des périphériques raccordé au système a une panne de matériel, procédez comme suit pour confirmer le problème :

Nouvelle analyse pour mettre à jour les informations des contrôleurs SCSI

Sur les contrôleurs SCSI, utilisez la tâche Analyser de nouveau pour mettre à jour les informations du contrôleur et des périphériques qui lui sont raccordés. Cette opération peut prendre quelques minutes s'il y a plusieurs périphériques reliés au contrôleur.

Si cela ne met pas correctement à jour les informations du disque, il vous faudra redémarrer le système.

Remplacement d'un disque en panne

Il peut être nécessaire de remplacer un disque en panne dans les cas suivants :

Remplacement d'un disque en panne qui fait partie d'un disque virtuel redondant

Si le disque en panne fait partie d'un disque virtuel redondant, la panne de disque ne devrait pas occasionner de perte de données. Cependant, vous devriez immédiatement remplacer le disque en panne car d'autres pannes de disque pourraient entraîner une perte de données.

Si un disque de secours a été attribué au disque virtuel redondant, les données du disque en panne sont recréées sur le disque de secours. Après la recréation, l'ancien disque de secours fonctionne comme un disque physique normal et le disque virtuel n'a plus de disque de secours. Dans ce cas, vous devriez remplacer le disque en panne et transformer le disque de remplacement en disque de secours.

REMARQUE : Si aucun disque de secours n'est attribué au disque virtuel redondant, remplacez le disque en panne à l'aide de la procédure décrite dans la section « Remplacement d'un disque physique qui reçoit des alertes SMART ».

Remplacement du disque :

  1. Retirez le disque en panne.

  2. Insérez un nouveau disque. Le nouveau disque doit avoir une taille supérieure ou égale à celle du disque que vous remplacez. Sur certains contrôleurs, vous ne pourrez peut-être pas utiliser l'espace disque supplémentaire si vous insérez un disque plus important. Reportez-vous à « Considérations pour les disques virtuels des contrôleurs PERC 3/SC, 3/DCL, 3/DC, 3/QC, 4/SC, 4/DC, 4e/DC, 4/Di, 4e/Si, 4e/Di, CERC ATA100/4ch, PERC 5/E, PERC 5/i et SAS 5/iR » pour plus d'informations.)

Une recréation est automatiquement lancée car le disque virtuel est redondant.

Attribution d'un disque de secours :

Si un disque de secours a déjà été attribué au disque virtuel redondant, les données du disque en panne ont peut-être déjà été recréées sur le disque de secours. Dans ce cas, vous devez attribuer un nouveau disque de secours. Reportez-vous à « Attribution et annulation de l'attribution d'un disque de secours dédié » et « Attribution et annulation de l'attribution d'un disque de secours global » pour plus d'informations.

Remplacement d'un disque physique en panne qui fait partie d'un disque virtuel non redondant

Si le disque physique en panne fait partie d'un disque virtuel non redondant (comme le RAID 0), la panne d'un seul disque physique provoquera la panne de tout le disque virtuel. Vous devez alors vérifier la date de votre dernière sauvegarde et si de nouvelles données ont été écrites sur le disque virtuel depuis.

Si vous avez récemment fait une sauvegarde et qu'il n'y a pas de nouvelles données qui manqueraient sur les disques, vous pouvez effectuer une restauration à partir de la sauvegarde.

NOTE : Si le disque en panne est relié à un contrôleur PERC 3/SC, 3/DCL, 3/DC, 3/QC, 4/SC, 4/DC, 4e/DC, 4/Di ou CERC ATA100/4ch, vous pouvez tenter de récupérer des données du disque avec la procédure de la section « Utilisation de la commande de mise en ligne de disques physiques sur des contrôleurs sélectionnés » avant d'effectuer la procédure suivante.

Faites ce qui suit :

  1. Supprimez le disque virtuel qui est en panne.

  2. Retirez le disque physique en panne.

  3. Insérez un nouveau disque physique.

  4. Créez un nouveau disque virtuel.

  5. Effectuez une restauration depuis la sauvegarde.

Utilisation de la commande de mise en ligne de disques physiques sur des contrôleurs sélectionnés

Mon contrôleur prend-il en charge cette fonctionnalité ? Reportez-vous à « Annexe : Fonctionnalités prises en charge ».

Si vous ne disposez pas d'une sauvegarde appropriée et si le disque en panne fait partie d'un disque virtuel d'un contrôleur qui prend en charge la tâche de disque physique En ligne, vous pouvez alors tenter de récupérer les données en sélectionnant En ligne dans le menu déroulant des tâches du disque en panne.

La commande En ligne essaie de forcer le disque en panne à se remettre en ligne. Si vous arrivez à forcer le disque à se remettre en ligne, vous pourrez peut-être récupérer des fichiers isolés. La quantité de données récupérables dépend de l'étendue des dommages sur le disque. La récupération de fichiers n'est possible que si une petite portion du disque est endommagée.

Il n'est pas sûr que vous puissiez récupérer des données avec cette méthode. Une commande En ligne forcée ne répare pas un disque en panne. N'essayez pas d'écrire de nouvelles données sur le disque virtuel.

Après avoir récupéré toutes les données viables du disque, remplacez le disque en panne comme décrit précédemment dans la section « Remplacement d'un disque en panne qui fait partie d'un disque virtuel redondant » ou « Remplacement d'un disque physique en panne qui fait partie d'un disque virtuel non redondant ».

Remplacement d'un disque physique en panne dans un RAID 1 sur un contrôleur CERC SATA1.5/2s

Sur un contrôleur CERC SATA1.5/2s, la recréation risque de ne pas se lancer automatiquement si vous remplacez un disque physique en panne qui fait partie d'un disque virtuel RAID 1. Dans ce cas, utilisez la procédure suivante pour remplacer le disque physique en panne et recréer les données redondantes.

  1. Arrêtez le système.

  2. Déconnectez le câble SATA du disque physique en panne sur le disque virtuel RAID 1.

  3. Remplacez le disque physique en panne par un disque physique formaté. Vous pouvez formater le disque physique avec les utilitaires de disques du BIOS du contrôleur. Vous n'aurez peut-être pas besoin de formater tout le disque physique. Il suffit parfois de formater 1 % du disque.

  4. Redémarrez le système. Au redémarrage, le disque virtuel RAID 1 devrait afficher l'état Perte de la redondance.

  5. Développez l'objet Contrôleur dans l'arborescence et sélectionnez l'objet Disques physiques.

  6. Exécutez la tâche Recréer pour le disque physique ajouté.

Récupération après avoir retiré le mauvais disque physique

Si le disque physique retiré par erreur fait partie d'un disque virtuel redondant qui a aussi un disque de secours, le disque virtuel se recrée, soit immédiatement, soit lorsqu'une requête d'écriture est faite. Une fois la recréation terminée, le disque virtuel n'aura plus de disque de secours car les données ont été recréées sur le disque qui servait de disque de secours. Dans ce cas, vous devez attribuer un nouveau disque de secours.

Si le disque physique que vous avez retiré fait partie d'un disque virtuel redondant qui n'a pas de disque de secours, remplacez le disque physique et effectuez une recréation.

Consultez les sections suivantes pour obtenir des informations sur la reconstruction des disques physiques et l'attribution de disques de secours :

Pour vous assurer que vous retirez le disque physique adéquat, faites clignoter la LED du disque physique à enlever. Reportez-vous à « Clignotement et arrêt du clignotement de la LED » pour obtenir des informations sur le clignotement des LED.

Résolution des problèmes de mise à niveau Microsoft® Windows®

Si vous mettez à niveau le système d'exploitation Microsoft Windows sur un serveur, il se peut que Storage Management ne fonctionne plus après la mise à niveau. Le processus d'installation installe des fichiers et crée des entrées de registre sur le serveur qui sont spécifiques au système d'exploitation. Les changements apportés au système d'exploitation peuvent ainsi désactiver Storage Management.

Pour éviter ce problème, désinstallez Storage Management avant d'effectuer une mise à niveau. Cependant, si vous avez déjà effectué une mise à niveau sans désinstaller Storage Management, désinstallez Storage Management après la mise à niveau.

Après avoir désinstallé Storage Management et terminé la mise à niveau, réinstallez Storage Management avec le média d'installation de Storage Management. Vous pouvez télécharger Storage Management à partir du site Web de support Dell à l'adresse support.dell.com.

Dépannage des disques virtuels

Les sections suivantes décrivent les procédures de dépannage des disques virtuels.

La recréation ne fonctionne pas

Une recréation ne fonctionnera pas dans les situations suivantes :

Une recréation s'effectue avec des erreurs

Cette section concerne les contrôleurs PERC 3/SC, 3/DCL, 3/DC, 3/QC, 4/SC, 4/DC, 4e/DC, 4/Di, 4e/Si, 4e/Di et CERC ATA100/4ch

Dans certains cas, une recréation peut réussir tout en rapportant des erreurs. Ceci peut se produire si la partie du disque qui contient les informations (de parité) redondantes est endommagée. La procédure de recréation peut restaurer les données à partir des parties intègres du disque mais pas à partir de la partie endommagée.

Lorsqu'une recréation est capable de restaurer toutes les données à l'exception de celles issues de parties endommagées du disque, elle indiquera que l'opération s'est terminée correctement tout en générant également l'alerte « 2163 ». La recréation peut également générer un rapport des erreurs de clés de détection. Dans ce cas, effectuez les étapes suivantes pour restaurer le maximum possible de données :

  1. Faites une sauvegarde du disque virtuel dégradé sur une nouvelle bande (inutilisée).

  2. Effectuez une « vérification de la cohérence » du disque virtuel que vous avez sauvegardé sur une bande.

  3. Restaurez le disque virtuel à partir de la bande sur des disques physiques intègres.

Il n'est pas possible de créer de disque virtuel

Vous tentez peut-être une configuration RAID qui n'est pas prise en charge par le contrôleur. Vérifiez les éléments suivants :

Un disque virtuel de taille minimale ne peut pas être reconnu par le Gestionnaire de disques de Windows

Si vous créez un disque virtuel à l'aide de la taille minimale autorisée dans Storage Management, le disque virtuel peut ne pas être reconnu par le Gestionnaire de disques de Windows, même après une initialisation. Ceci se produit parce que le Gestionnaire de disques de Windows peut seulement reconnaître les disques virtuels extrêmement petits s'ils sont dynamiques. Il est généralement recommandé de créer des disques virtuels de plus grande taille lorsque vous utilisez Storage Management.

Erreurs de disque virtuel sous Linux

Sur certaines versions du système d'exploitation Linux, la taille du disque virtuel est limitée à 1 To. Si vous créez un disque virtuel de plus de 1 To, votre système peut avoir le comportement suivant :

Si vous avez créé un disque virtuel de plus de 1 To, vous devez procéder comme suit :

  1. Sauvegardez vos données.

  2. Supprimez le disque virtuel.

  3. Créez un ou plusieurs disques virtuels de moins de 1 To.

  4. Restaurez vos données à partir de la sauvegarde.

La limitation ou non de la taille du disque virtuel à 1 To par votre système d'exploitation Linux dépend de la version du système d'exploitation et des mises à jour ou modifications que vous avez effectuées. Consultez la documentation de votre système d'exploitation pour plus d'informations.

Problèmes associés à l'utilisation de disques physiques identiques pour des disques virtuels redondants et non redondants

Évitez d'utiliser les mêmes disques physiques pour créer des disques virtuels redondants et non redondants. Cette recommandation s'applique à tous les contrôleurs. L'utilisation de disques physiques identiques pour créer des disques virtuels redondants et non redondants peut entraîner un comportement imprévu, notamment une perte de données.

REMARQUE : Les contrôleurs SAS ne vous permettent pas de créer de disques virtuels redondants et non redondants sur le même jeu de disques physiques.

Considérations pour les contrôleurs PERC 3/Si, 3/Di, CERC SATA1.5/6ch et CERC SATA1.5/2s lorsque les disques physiques sont partagés par des disques virtuels redondants et non redondants

Cette section décrit le comportement susceptible de se produire sur les contrôleurs PERC 3/Si, 3/Di, CERC SATA1.5/6ch et CERC SATA1.5/2s si vous utilisez des disques physiques identiques pour créer des disques virtuels redondants et non redondants. Dans ce type de configuration, la panne ou le retrait d'un disque physique peut entraîner les comportements suivants :

Solution : ce comportement est normal car le disque virtuel est non redondant. Dans ce cas, la panne ou le retrait d'un seul disque physique entraîne une panne générale du disque virtuel sans qu'il ne soit possible de récupérer les données si aucune sauvegarde n'est disponible.

Solution : ce comportement est également normal. Les données peuvent être récupérées si un disque de secours est disponible pour recréer le disque défaillant ou retiré.

Solution : exécutez la tâche « Analyser de nouveau le contrôleur ». Une fois la nouvelle analyse terminée, sélectionnez chaque disque physique qui est hors ligne et exécutez la tâche « Supprimer les segments morts ». Vous devez supprimer les segments morts avant de remettre en ligne le disque physique. Les segments morts sont dus à une panne ou au retrait du disque physique partagé.

REMARQUE : Vous devez, de préférence, éviter d'utiliser les mêmes disques physique pour créer des disques virtuels redondants et non redondants.

Situations problématiques spécifiques et solutions

Cette section contient d'autres solutions de dépannage de problèmes. Les sujets suivants sont couverts :

Le disque physique est hors ligne ou affiche une condition d'erreur

Un disque physique peut afficher une condition d'erreur s'il a été endommagé, mis hors ligne ou s'il était membre d'un disque virtuel qui a été supprimé ou initialisé. Les actions suivantes peuvent résoudre cette erreur :

Un disque est considéré comme étant en panne après sa recréation dans une configuration en cluster

Lorsqu'un système en cluster tente de recréer un disque en panne mais que la recréation échoue, un autre système prend en charge la recréation. Dans cette situation, vous remarquerez peut-être que le disque recréé continue d'apparaître comme étant en panne sur les deux systèmes, même après la recréation du second système. Pour résoudre ce problème, effectuez une nouvelle analyse des deux systèmes après sa recréation.

Le disque d'un contrôleur PERC 4/Di ne renvoie pas de condition En ligne après une préparation au retrait

Lorsque vous exécutez une commande Préparation au retrait sur un disque physique raccordé à un contrôleur PERC 4/Di, il se peut que le disque ne s'affiche pas dans l'arborescence de Storage Management, même après une nouvelle analyse ou un redémarrage.

Dans ce cas, effectuez ce qui suit pour que le disque réapparaisse dans l'arborescence de Storage Management :

  1. Retirez manuellement puis remettez en place le disque physique.

  2. Analysez de nouveau le contrôleur ou redémarrez le système.

Réception d'une alerte « Bloc endommagé » avec une erreur de remplacement, de détection ou de média

Les alertes ou les événements suivants sont générés quand une partie d'un disque physique est endommagée :

Ce problème est découvert quand le contrôleur effectue une opération qui nécessite l'analyse du disque. Exemples d'opérations pouvant produire ces alertes :

Si vous recevez des alertes 2146 à 2150 pendant une recréation ou quand le disque virtuel est dans un état dégradé, les données du disque endommagé ne peuvent être récupérées qu'à partir de la sauvegarde. Si vous recevez des alertes 2146 à 2150 dans une circonstance autre qu'une recréation, vous pourrez peut-être récupérer les données. Les sections suivantes décrivent chacun de ces cas.

Réception d'alertes 2146 à 2150 pendant une recréation ou quand un disque virtuel est dégradé

Si vous recevez des alertes 2146 à 2150 pendant une recréation ou quand le disque virtuel est dégradé, effectuez les étapes suivantes :

  1. Remplacez le disque physique endommagé.

  2. Créez un nouveau disque virtuel et donnez-lui le temps de se resynchroniser complètement. Pendant la resynchronisation, la condition du disque virtuel affichée est En cours de resynchronisation.

  3. Restaurez les données du disque virtuel à partir de la sauvegarde.

Réception d'alertes 2146 à 2150 pendant des opérations d'E/S, une vérification de la cohérence, un formatage ou d'autres opérations

Si vous recevez des alertes 2146 à 2150 pendant d'autres opérations qu'une recréation, remplacez immédiatement le disque endommagé pour éviter de perdre des données.

Faites ce qui suit :

  1. Faites une sauvegarde du disque virtuel dégradé sur une nouvelle bande (inutilisée).

  2. Remplacez le disque endommagé.

  3. Faites une recréation.

Les opérations de lecture et d'écriture ont des problèmes

Si le système se bloque ou qu'il a d'autres problèmes avec les opérations de lecture et d'écriture, il y a peut-être un problème de câbles du contrôleur ou de périphérique. Reportez-vous au « Bon raccordement des câbles » et « Détermination des problèmes matériels » pour plus d'informations.

Les E/S s'arrêtent quand un canal redondant tombe en panne

Si vous avez implémenté la redondance de canaux sur un contrôleur PERC 3/SC, 3/DCL, 3/DC, 3/QC, 4/SC, 4/DC, 4e/DC ou 4/Di, la panne d'un des canaux entraîne l'arrêt des E/S sur les autres canaux, y compris sur la configuration à canaux redondants. Pour résoudre ce problème, reportez-vous à « Redondance de canaux pour les contrôleurs PERC 3/DCL, 3/DC, 3/QC, 4/DC, 4e/DC, 4/Di et 4e/Di ».

Une option du menu des tâches ne s'affiche pas

Vous avez peut-être remarqué que les menus des tâches n'affichent pas toujours les mêmes options de tâche. Ceci vient du fait que Storage Management affiche uniquement les tâches qui sont valides au moment où le menu est affiché. Certaines tâches ne sont valides que pour certains types d'objets ou qu'à certains moments. Par exemple, une tâche de vérification de la cohérence ne peut être effectuée que sur un disque virtuel redondant. De même, si un disque est déjà hors ligne, l'option de menu Hors ligne ne s'affichera pas.

D'autres raisons peuvent expliquer pourquoi une tâche ne peut pas être exécutée à un moment donné. Par exemple, il y a peut-être déjà une tâche qui s'exécute sur un objet qui doit être terminée avant que d'autres tâches puissent être exécutées.

Un message « disque ou lecteur corrompu » vous suggère d'exécuter une vérification automatique pendant un redémarrage

Laissez la vérification automatique s'exécuter sans vous préoccuper du message. Le redémarrage se terminera une fois que la vérification automatique sera terminée. Selon la taille de votre système, ceci peut prendre environ 10 minutes.

Condition erronée et messages d'erreur après une mise en veille prolongée sous Windows

L'activation de la fonctionnalité de mise en veille prolongée de Windows peut entraîner l'affichage par Storage Management d'informations sur la condition erronées et de messages d'erreur. Ce problème se résout lorsque le système d'exploitation Windows termine sa mise en veille prolongée.

Vous n'arrivez pas à ouvrir une session sur un système distant

L'accès peut vous être refusé si vous n'entrez pas un nom d'utilisateur et un mot de passe qui correspondent au compte d'administrateur de l'ordinateur distant ou si vous faites une erreur en tapant les informations d'ouverture de session. Le système distant n'est peut-être pas sous tension ou il y a peut-être des problèmes de réseau.

Il n'est pas possible de se connecter au système Windows Server™ 2003 distant

Lorsque vous vous connectez à un système Windows Server 2003 distant, vous devez ouvrir une session sur le système distant avec un compte qui a des privilèges d'administrateur. Par défaut, Windows Server 2003 ne permet pas aux connexions anonymes (sans informations) d'accéder aux comptes utilisateurs SAM. Ainsi, si vous tentez de vous connecter avec un compte sans mot de passe, la connexion risque d'échouer.

La reconfiguration d'un disque virtuel affiche une erreur dans le navigateur Mozilla

Lors de la reconfiguration d'un disque virtuel à l'aide du navigateur Mozilla, le message d'erreur suivant peut s'afficher :

Although this page is encrypted, the information you have entered is to be sent over an unencrypted connection and could easily be read by a third party.

(Bien que cette page soit cryptée, les informations que vous avez saisies doivent être envoyées via une connexion cryptée et pourront être lues par un tiers.)

Vous pouvez désactiver ce message d'erreur en modifiant un paramètre du navigateur Mozilla. Pour désactiver ce message d'erreur :

  1. Sélectionnez Modifier, puis Préférences.

  2. Cliquez sur Confidentialité et Sécurité.

  3. Cliquez sur SSL.

  4. Désélectionnez l'option « Envoi des données d'une page cryptée vers une page cryptée ».

Les disques physiques sont affichés dans l'objet de l'arborescence Connecteur et non Enceinte

Storage Management interroge fréquemment la condition des disques physiques. Lorsque le disque physique est situé dans une enceinte, Storage Management utilise les données signalées par le processeur SEP (SCSI Enclosure Processor) pour identifier la condition du disque physique. Si le SEP ne fonctionne pas, Storage Management peut quand même interroger la condition du disque physique mais il ne peut pas identifier le disque physique comme étant situé dans l'enceinte. Dans ce cas, Storage Management affiche directement le disque physique sous l'objet Connecteur dans l'arborescence mais pas sous l'objet Enceinte.

Vous pouvez résoudre ce problème en redémarrant le service Server Administrator ou en redémarrant le système. Pour plus d'informations sur le redémarrage du service Server Administrator, consultez le Guide d'utilisation de Dell OpenManage™ Server Administrator.


Retour au sommaire de Storage Management