Une note rapide sur l'incident de surchauffe du contrôleur RAID LSI dans un serveur dans un centre de données froid

TL, DR; Le réglage du mode de fonctionnement du système de refroidissement du serveur Supermicro Optimal ne garantit pas la stabilité du contrôleur MegaRAID 9361-8i LSI dans un centre de données froid.



Nous essayons de ne pas utiliser de contrôleurs RAID matériels, mais nous avons un client qui préfère les configurations LSI MegaRAID. Aujourd'hui, nous avons été confrontés à une surchauffe de la carte MegaRAID 9361-8i due au fait que la plate - forme ne ressentait pas de surchauffe, mais le contrôleur RAID l'a ressentie .



Une vue de la plate-forme avec une carte RAID est illustrée ci-dessous:







Plusieurs points importants liés à ce serveur et à l'environnement d'exploitation:



L'ingénieur qui a assemblé la plate-forme a spécialement placé deux ventilateurs devant la carte, car il sait que les contrôleurs LSI deviennent très chauds. Faites attention à la carte mère, elle ne rentre pratiquement pas sous le contrôleur, se terminant 3 cm après le slot PCI-E.



, Supermicro Optimal "" , CPU.



Xeon E-2236 — CPU, , , .



, — 18-20 .



— RAID-.



,



  1. , .
  2. RAID- , .
  3. , , Optimal , CPU.
  4. Le contrôleur a surchauffé sans recevoir un débit d'air suffisant.


Qu'est-ce que



Nous avons fait passer les ventilateurs en mode "Standard", si nécessaire, nous passerons à un mode plus performant.



conclusions



Très probablement, si le couloir froid du centre de données n'était pas aussi froid, ou si le client utilisait le processeur de manière intensive, ce problème ne se serait peut-être pas produit, car les ventilateurs auraient fonctionné à un mode plus intensif.



Pour nous-mêmes, nous avons décidé de changer définitivement le mode de fonctionnement des ventilateurs sur les serveurs avec RAID d'Optimal au mode avec une fréquence de rotation accrue.




All Articles