"Que la lumière soit!", Ou Comment nous avons changé le système UPS dans le centre de données en pleine pandémie









- COVID-19 – , . , , -. 



, - . 









Delta Linxdatacenter





Le système d'alimentation sans coupure (UPS) de notre centre de données à Saint-Pétersbourg a été conçu à l'origine selon le modèle 2N. 



Cela signifie que si un onduleur tombe en panne (ou est arrêté pour maintenance), l'autre prend en charge la pleine charge. Par conséquent, la puissance réelle utilisée d'une alimentation sans coupure (UPS) dans une paire ne doit pas dépasser 50% du maximum disponible. Cela garantit la fiabilité du système. 



En fonctionnement normal, les onduleurs fournissent la puissance requise à 100%, partageant la charge de manière égale. 



Cependant, la croissance des charges sur le centre de données a conduit à un besoin de modernisation: le niveau de consommation de capacité approchait du seuil maximum autorisé. 



En raison de la forte demande en ressources du site, nous avons pris une décision en faveur des onduleurs modulaires comme format qui répond de manière optimale aux défis du développement des centres de données à l'heure actuelle et permet d'augmenter la capacité à l'avenir. 



Dans le même temps, il s'est avéré impossible de mettre en œuvre des onduleurs modulaires dans l'onduleur, construits sur des solutions monoblocs. Il serait nécessaire de déconnecter certains équipements, ce qui entraînerait des temps d'arrêt des systèmes informatiques des clients, nous avons donc tout de suite écarté ce scénario. 



Il était nécessaire de créer un onduleur fondamentalement nouveau, en redistribuant la charge entre les onduleurs monoblocs existants et les nouveaux onduleurs modulaires. Dans le même temps, il était important de se conformer aux exigences de l'Uptime Institute en termes de surveillance des charges - jusqu'à 50% du maximum par onduleur. 



Choix en faveur



Le choix s'est porté sur l'équipement de Delta Electronics: le modèle d'onduleur requis Delta DPH 500 kVA était disponible dans un entrepôt à Saint-Pétersbourg, et l'intégrateur de solutions (Tempesto Group of Companies) avait également le statut de distributeur mono-marque du fournisseur en Russie, qui a joué un grand rôle pour nous en cours de route. projet. 



Le format modulaire de l'onduleur permet de résoudre de nombreux problèmes liés à l'alimentation électrique du centre de données, dont le principal est l'augmentation de la tolérance aux pannes. 



Le fait est que les onduleurs monoblocs échouent entièrement, déclenchant un «effet domino» tout au long de la chaîne de réalisation des SLA. En revanche, les onduleurs modulaires en cas d'urgence "s'envolent" de manière modulaire, perdant chacun 50 kW, ce qui, avec une configuration appropriée de l'architecture ASI, vous permet de ne pas ressentir les conséquences de telles pannes, et dans certains cas l'effet d'un tel accident aura tendance à zéro. 



De plus, les solutions modulaires permettent le remplacement des modules défectueux «à chaud», sont facilement évolutives aux fluctuations de charge de la salle informatique, et sont beaucoup plus compactes (un onduleur modulaire occupe un rack contre 2,5 racks pour un appareil monobloc). Le facteur économique est également important: les solutions modulaires coûtent près de la moitié du prix par rapport aux modèles monoblocs leaders du marché.  



En bref, c'était un choix assez facile. 



Travailler



L'équipe du projet était composée de 15 personnes. L'équipe était composée de dix installateurs, d'un ingénieur en chef, ainsi que de ses adjoints dans divers domaines (automatisme, électricité, etc.). 



Les travaux ont commencé en avril 2020 et devraient être achevés d'ici juin. Cependant, il n'a pas été si facile de suivre le plan: la tâche a été compliquée par la pandémie COVID-19, en raison de laquelle l'un des fournisseurs n'a pas été en mesure de livrer à temps les disjoncteurs nécessaires aux équipements de panneaux d'Europe. 



À ce moment-là, toutes les études préalables à la conception sont déjà terminées et la documentation de conception a été préparée, l'onduleur nécessaire et la plupart des matériaux ont été achetés. Il était impossible d'attendre que la situation revienne à la normale: les capacités de serveur renouvelées devaient être mises en service dans un délai prédéterminé aux termes du contrat avec le nouveau client du centre de données. 



Il a donc été décidé de procéder à l'installation sur le site afin de respecter les étapes de travaux prévues.









Réseau de batteries UPS dans le centre de données Linxdatacenter



Battre COVID-19: flexibilité de la planification, équipes et facteur GUI



Tout d'abord, nous nous sommes appuyés sur le travail bien coordonné de l'équipe, en particulier sur l'équipe des «contremaîtres-monteurs». Je tiens à souligner la contribution du contractant: les spécialistes de Tempesto ont pu offrir la plus grande flexibilité d'interaction avec nous et entre eux dans des conditions difficiles.



Par exemple, lorsqu'il était nécessaire de passer du courant d'une source d'électricité à une autre, les clients étaient loin d'être toujours prêts pour cette procédure, malgré les notifications. Souvent, ils ne permettaient pas d'éteindre leur équipement, car ils n'avaient pas le temps de se préparer correctement - ils n'ont pas fait de sauvegarde, n'ont pas transféré les systèmes sur un site de sauvegarde, etc. 



Malgré cela, les temps d'arrêt ont été presque totalement évités. «Plan B» était toujours prêt pour de tels cas, de quoi occuper les installateurs dans les tâches actuelles. 



Afin de terminer le projet à temps, des travaux ont été effectués quotidiennement, sans interruption le week-end. Les employés ont dû travailler dans des conditions plutôt inhabituelles: avec un port constant d'EPI et un maintien à distance en raison de la pandémie. 









Panneau de distribution électrique dans le centre de données Linxdatacenter



Une gestion compétente du temps de l'équipe et une compréhension claire de l'architecture de la future solution ont permis d'éviter des pertes de temps significatives, et l'installation du câblage, des équipements de panneaux et de l'onduleur a été réalisée à temps.



Le statut de distributeur officiel de l'entrepreneur pour les produits du vendeur a également aidé. Lorsqu'il s'est avéré qu'un des onduleurs était endommagé après le déballage, grâce au contact direct avec le fournisseur, le remplacement est intervenu en 1 semaine. Si le fournisseur de l'équipement en était un, et l'installateur en était un autre, ce n'est que sur ce problème que nous perdrions 2-4 semaines. 



résultats



À la suite de la mise à niveau, qui comprenait 4 onduleurs Delta DHP 500 kVA supplémentaires, l'alimentation a été partiellement redistribuée vers de nouveaux équipements et la charge maximale par onduleur a finalement été réduite de 49% à 43%.



Dans l'ensemble, la tolérance aux pannes du centre de données était déjà satisfaisante, mais la mise à niveau l'a améliorée. Auparavant, si la charge d'un onduleur dépassait 50% du maximum, alors en cas d'urgence, l'arrêt serait inévitable. Par exemple, lorsqu'un condensateur tombe en panne dans un onduleur monobloc, tous les systèmes qui y sont liés tombent. Dans un onduleur modulaire, un seul module échouera et le reste des éléments continuera à fonctionner. 



Le plus important: les conclusions



Les membres de l'équipe de projet ont acquis une expérience importante dans la gestion de tâches complexes face à des crises imprévues. 



À quelles conclusions sommes-nous arrivés:



  • Des problèmes d'approvisionnement peuvent survenir même dans des conditions normales. Dans le contexte d'une pandémie et d'autres circonstances de force majeure, il est nécessaire de se préparer aux scénarios les plus négatifs d'évolution des événements: les délais de livraison peuvent être perturbés plus souvent et pour des périodes plus longues;
  • Les travaux doivent être exécutés conformément au plan-programme, dans lequel les risques sont calculés à l'avance. Une attention particulière devrait être accordée aux points nodaux auxquels les stades se croisent;
  • En cas de violation du délai de livraison, il est nécessaire de faire les travaux qui peuvent être effectués indépendamment de la perturbation. Si vous suspendez tous les travaux sur le projet jusqu'à ce que tous les composants soient reçus, les travaux risquent soit d'être retardés, soit de se transformer en "prise d'assaut";
  • – ,   . . 



All Articles