08 Mai 2009 à 16h15
dans la catégorie problème récurrent et étonnant : le non fonctionnement des Raids (0, 1, 5...)
Premier symptome l'impossibilité d'accèder à son raid depuis son système
Au démarrage de la machine le contrôleur Raid indique que certains disques sont toujours membres (normal!) mais un ou plusieurs sont indiqués en erreur (pas normal!), bien évidement le disque raid est inaccessible pour le système d'exploitation.
pour simplifier un ou des disques constituant une grappe ou array Raid (quelque soit le type 0, 1, 5...) sont éjectés de la grappe.
comment est-ce possible ?
Quand un des disques durs effectue une correction d'erreur interne, pendant le temps de cette opération le contrôleur raid ne peut plus accéder au disque. Cependant le contrôleur raid s'il ne voit pas un disque pendant un certain laps de temps, il marque le disque comme défectueux et l'exclu du raid, ce qui provoque un disfonctionnement de l'array et les symptômes évoqués plus haut.
Le problème viendrait donc de ce que le temps de correction des erreurs internes et plus long que le temps d'attente du contrôleur raid avant de marquer un disque comme défectueux.
D'où les disques estampillés "raid" vendu par les constructeurs. Outre une fiabilité accrue, durée de vie améliorer, garantie de plusieurs années, système de protection amélioré; dans ces disques le TLER (Time Limit Error Recovery = reprise sur erreur limitée dans le temps) chez Western digital, ERC (Error Recovery Control) chez seagate ou CCTL (Command Completion Time Limit) chez Samsung ou Hitachi sont limités à un nombre de seconde inférieur au temps que met un contrôleur raid à sortir un disque non-accessible d'une array.
Le problème pour l'utilisateur moyen est qu'il croit que son ou ses disque(s) dur(s) sont défectueux et doit les remplacer alors qu'il suffit d'entrer dans le Gestionnaire Intel Matrix Storage, de cliquer droit avec la souris sur le ou les diques durs marqués en erreur et de simplement choisir marquer comme normal dans le menu contextuel qui apparait. Au redémarrage L'Intel Matrix Storage reconstruit tout simplement le Raid.
Apparaît ainsi le gros point noir des Raids avec des disques durs grands publics, votre système d'exploitation ne doit pas être installé dessus. Parce qu'il faut pouvoir démarrer Windows pour accéder à l'Intel Matrix Storage et reconfigurer ses disques marquer en erreur comme normal. Les ingénieurs des constructeur de disques indiquent même qu'il faut faire un formatage de bas niveau pour réinitialiser la variable responsable de l'état erreur ou normal, d'où une perte de donnée et surtout de temps !
A noter que chez le constructeur Western digital, le bit de malfonction peut être remis à normal grâce à une disque de boot dos.