Pendant de nombreuses années sur le marché des processeurs de serveur et des chipsets, Intel et ses xeons ont régné sans condition, mais en 2017, AMD a finalement concurrencé avec eux avec la sortie de la première ligne de leurs nouveaux processeurs de serveur EPYC. Depuis, leur position n'a fait que se renforcer, et la programmation s'est reconstituée avec une nouvelle version des "epics". AMD fournit ses processeurs modernes à de nombreuses entreprises renommées, notamment Dropbox, Hetzner, Linode, CERN, OVHcloud, Scaleway, plusieurs universités et petites organisations, y compris des centres de données. Tout le monde fait l'éloge des plateformes d'EPYC et les recommande pour l'organisation et la mise à l'échelle d'un cluster de serveurs hautes performances.
Lorsque la nouvelle a commencé à arriver qu'AMD a commencé à fabriquer des processeurs qui contournaient
les processeurs Intel en termes de performances et de rapport qualité / prix, nous avons commencé à penser à un service distinct sur cette plate-forme. Le choix s'est porté sur Supermicro A + Server 2124BT-HNTR . Le serveur se compose de 4 nœuds, chaque nœud a la spécification suivante:
- Processeurs: 2x AMD EPYC 7742 64-Core Processor 2.25GHz;
- Mémoire: 16x64GB RAM 3200 MT / s;
- Disques NVMe pour le cluster: 4x INTEL SSDPE2KE076T8;
- Disque système: 1x INTEL SSDSC2KB240G8;
- Contrôleur réseau: AOC-MH25G-m2S2T.
Toutes les caractéristiques
Il n'y avait pas de serveur de ce type à Moscou et en Russie, nous devions le commander directement auprès du
fabricant. Après une attente, qui a été complétée par quelques problèmes logistiques liés au COVID-19, le serveur s'est retrouvé avec nous début juin.
Assemblée
À première vue, il nous a semblé qu'il n'y avait rien de particulièrement épique sur le serveur, puisque nous avons l'expérience de travailler avec des plates-formes de 12 nœuds pour le service de serveurs Hi-CPU . La même plate-forme ne représente que quatre nœuds indépendants, mais nous n'avons pas encore compris la puissance qu'ils donnent au total.
Des tests
Après l'assemblage, bien sûr, nous voulions charger le serveur, nous avons affaire à un monstre, au
total, qui a 1024 cœurs, 4 To de RAM sur 4 nœuds: Image cliquable Les résultats des tests de performances nous ont impressionnés. La qualité de fabrication des ingénieurs de Supermicro est également satisfaisante.
Installation
Nous l'avons monté dans un rack et avons commencé à assembler le cluster: Le
cluster est assemblé sur ces 4 nœuds. À l'avenir, le cluster pourra être mis à l'échelle sur des
équipements similaires ou sur des équipements similaires d'autres fournisseurs. Le réseau public du cluster est situé sur des
interfaces 25Gbps (SFP28), le réseau privé est également 25Gbps (SFP28).
Révision du logiciel
Les fondamentaux et principes posés dans le logiciel de gestion du service client ont permis de finaliser rapidement le code de la nouvelle architecture, à la mi-juin le service Epic Servers a été lancé.
Avantages pour nous et nos clients
AMD EPYC vous permet de créer des tarifs jusqu'à EPIC 128 x 3,4 GHz CPU / 512 Go RAM / 4000 Go NVMe, que personne ne peut offrir sur une plateforme avec des processeurs d'Intel. De plus, nous utilisons uniquement des NAS NVMe avec triple réplication de données.
Pendant 2 mois de travail avec cette plate-forme, nous avons ressenti tous ses charmes - les clients peuvent disposer des mêmes ressources que dans le cas d'Intel, mais pour moins d'argent. Un nœud avec 2 processeurs AMD remplace 10 nœuds par 2 processeurs Intel Scalable Silver.
Une cuillère de goudron
Un tel serveur coûte très cher - le coût est d'environ 150000 $ et, bien sûr, il a été acheté avec un prépaiement complet.En fait, nous achetions un cochon en un rien de temps car nous n'avions pas travaillé auparavant avec des serveurs AMD.
Le deuxième point, QEMU-KVM ne permet pas de migrer en continu des machines virtuelles d'AMD vers Intel et vice versa, mais en utilisant notre fonctionnalité de sauvegarde , vous pouvez passer d'un type de serveur à un autre à tout moment sans perte de données.
Le cluster nous a montré des indicateurs de performance auparavant inconnus, qui ont naturellement
commencé à affecter la température des processeurs. Même avec une charge de processeur de 30% sur le nœud, la température approchait 95 degrés. Nous avons quelque peu optimisé le refroidissement
rack, mais cela n'a donné aucun résultat significatif. Puis, sous la forme d'un test, ils ont enlevé le couvercle du boîtier du serveur:
le saut de température était de plus de 10 degrés et ne dépassait pas 80 degrés, même avec une
charge de plus de 70%, ce qui nous satisfait plus que. Il est également prévu de mettre un refroidissement supplémentaire dans le rack.
Résultat
Du coup, le serveur a plus que répondu à nos attentes, le processeur AMD EPYC 7742 nous semble incassable sous charge. Le programme basé sur de telles solutions continuera à
évoluer, avec le temps, nous prévoyons de lancer ce service aux Pays-Bas. Nous avons apprécié travailler avec EPYC et espérons que vous l'apprécierez aussi!