Accélération: mise à niveau de l'infrastructure du centre de données





Dans notre centre de données, un autre cycle de mise à niveau matérielle a commencé. Pourquoi et comment nous l'avons fait, et surtout - comment exactement le travail de la plate-forme cloud Linxdatacenter s'améliorera après la mise à niveau en nombre spécifique, - déclare Oleg Fedorov, responsable des produits et solutions Linxdatacenter, dans l'article d'aujourd'hui.



C'est maintenant 



Au cours de l'année dernière, les demandes des clients pour des processeurs haute fréquence sont devenues plus fréquentes pour le déploiement de systèmes exigeants en termes de vitesse de calcul et de disponibilité des ressources CPU - un signe clair du prochain cycle de mises à niveau matérielles. C'est ainsi qu'est né notre propre projet de mise à niveau de l'infrastructure cloud Linxdatacenter. 



Au cours de longs calculs et négociations entre notre équipe technique et les fabricants, il a été décidé d'utiliser une conception validée de Cisco VersaStack. Cette conception est utilisée dans Cisco Fabric Interconnect, les serveurs UCS, les systèmes de stockage de la famille IBM FlashSystem.



Il a été décidé de porter les performances du processeur de la plate-forme cloud à un nouveau niveau: pour cela, nous avons acheté de nouveaux serveurs lames haute fréquence basés sur le châssis UCS de la gamme Cisco B200 M5. Il s'agit de la ligne la plus récente, avec des processeurs de dernière génération cadencés à 3,4 GHz, qui ne sont arrivés sur le marché qu'au premier trimestre 2020. 



Une solution avec de tels «cerveaux» en son cœur permet d'accélérer le travail des produits qui demandent des performances. Tout d'abord, ce sont les plateformes cloud 1C et SAP, les solutions ERP, les applications nécessitant le traitement d'ensembles de données sérieux, diverses solutions de développement et de test de logiciels. 



Une autre mise à jour importante est le nouveau système de stockage de sauvegarde. Pour garantir le SLA du service BaaS, il a été décidé d'installer dans notre centre de données Cisco S3260 - une grande moissonneuse à 4 unités, dans laquelle 54 disques sont "bloqués". Cette mesure a été prise pour unifier les plates-formes de Saint-Pétersbourg et de Moscou. De plus, contrairement à l'ancien matériel, cela nous permettra d'utiliser la technologie Direct Storage Access. 



Le logiciel Veeam est installé sur le Cisco S3260 avec la perspective de fournir le modèle Direct Access via l'intégration avec un nouveau système de stockage d'IBM. Les instantanés des dernières versions du système de stockage et la collecte des sauvegardes auront lieu sans demande aux serveurs de virtualisation - nous supprimons ainsi une commande supplémentaire de VMware. 



Un tel schéma supprime la charge excessive des serveurs, améliore les performances et les performances. 



Les systèmes de sauvegarde de VM traditionnels prennent un instantané avant l'exécution, puis copient les données de la VM sur eux-mêmes et suppriment l'instantané. Pour les machines virtuelles volumineuses et à haute intensité, la taille de l'instantané peut augmenter considérablement pendant le processus de sauvegarde, et lorsque l'instantané est supprimé, le disque principal de la machine virtuelle et l'instantané fusionnent. À ce stade, la machine virtuelle peut être indisponible pendant quelques secondes. L'utilisation de la technologie de capture instantanée au niveau du stockage évite de tels problèmes.



Un peu plus de détails



Voyons comment la plate-forme cloud Linxdatacenter s'améliorera après la mise à niveau. 



Le point clé est que nous sommes l'un des premiers à essayer de mettre sur le marché la technologie NVME de bout en bout, qui se distingue par des IOPS élevés et une latence faible (un ordre de grandeur inférieur au SSD) (délai avant l'exécution de la requête). Cependant, cette technologie nécessite une amélioration supplémentaire de l'infrastructure et affecte également la partie réseau, dont la mise à jour est également prévue pour nous.



Passons au CPU. Traditionnellement, c'est le domaine qui connaît la croissance la plus rapide des équipements informatiques. Par exemple, au deuxième trimestre 2019, le processeur du marché à une fréquence d'horloge de 3,3 GHz ne donnait que 8 cœurs. 



Nos nouveaux processeurs Intel 6246R sont cadencés à 3,4 GHz avec 16 cœurs. En un peu plus d'un an, la fréquence et le nombre de cœurs disponibles ont considérablement augmenté. En termes de virtualisation, la mise à niveau permettra à davantage de clients de disposer d'un système informatique plus performant.



Comme pour les systèmes de stockage, cet élément a toujours été le domaine de développement le plus lent de tous les systèmes d'information. En fait, la RAM, en tant qu'élément de tout système informatique - utilisateur ou professionnel, est devenue un outil permettant de contourner les faibles performances de stockage. 



Mais aujourd'hui, il existe une opportunité technologique d'assimiler la vitesse des systèmes de stockage à la vitesse de la RAM, ce qui permettra d'exécuter des transactions et de récupérer leurs résultats des systèmes de stockage de données des dizaines de fois plus rapidement. 



Supposons que si une opération - par exemple, le traitement d'une requête vers une base de données à forte charge - était auparavant effectuée en 1 minute, alors sur les systèmes de stockage modernes, cela ne prendra que quelques secondes.



Enfin, IBM FlashSystem vous permet théoriquement de réduire la latence maximale du disque à moins de 1 milliseconde, c'est-à-dire littéralement pas même 0,1, mais 0,01 milliseconde. Nous avons maintenant franchi une nouvelle étape vers ces indicateurs: ils seront disponibles dans notre cloud après la prochaine étape de la mise à niveau. 



En alimentation pour chevaux, en croissance commerciale



Pour décrire avec précision l'effet d'une mise à niveau de fer sur un nuage, il convient d'utiliser cette analogie. 



Imaginez que vous écrivez du texte dans l'éditeur Word. Vous l'avez tapé sur le clavier, recherchez, et le programme de la phrase que vous avez tapée a réussi à n'afficher que le premier mot à l'écran. Vous avez réfléchi, formulé, tapé avec vos doigts sur le clavier, il est déjà là, est déjà entré dans l'ordinateur, mais n'est pas encore apparu à l'écran.



Après la mise à niveau de l'infrastructure avec une approche intégrée, cette lacune disparaît et devient impossible même sur un plan théorique. 



Il va sans dire que tous ces éléments «gonflés» doivent être correctement assemblés en une solution finale qui offrira un niveau élevé d'efficacité économique et d'avantages commerciaux. 



Pour l'activité de nos clients en Russie, de nouvelles opportunités permettront, tout d'abord, d'accélérer significativement le travail du logiciel 1C. 



Si 1C n'est requis que pour 10 à 15 utilisateurs, il fonctionnera bien même «sur une calculatrice», c'est-à-dire qu'il disposera de suffisamment de ressources informatiques modestes ou standard. Cependant, dès qu'une entreprise commence à fournir des services en temps réel basés sur 1C, ou que l'entreprise a des opérations à une échelle suffisante et de nombreuses améliorations différentes - tout cela «consomme» du temps et de la puissance du processeur. 



En conséquence, plus il y a d'améliorations, plus l'échelle des opérations sur 1C est large, plus les besoins en ressources CPU sont élevés. L'architecture du logiciel 1C est construite de cette manière. Et puis ce qui suit se produit: plus la fréquence du processeur est élevée, moins il peut donner de cœurs. Et son prix augmente en même temps.



Par conséquent, si vous utilisez des applications métier de niveau intermédiaire ou de haut niveau, vous ne pouvez pas vous passer de processeurs hautes performances au cœur d'une solution informatique moderne.



D'un point de vue commercial, leur utilisation signifie qu'un comptable qui a appuyé sur un bouton en 1C pour recevoir, par exemple, un rapport annuel, sur un système performant recevra le résultat non pas en 2 minutes, mais instantanément. Ainsi, il peut compléter le résultat final de la synthèse des budgets, des totaux et de la clôture de l'exercice dans toute l'entreprise non pas en trois jours, comme maintenant, mais clairement à partir du dernier jour de la période de reporting. 



En ce qui concerne les tâches de sauvegarde, il faut comprendre que tout instantané «fige» la machine virtuelle pendant au moins une fraction de seconde, et parfois même plus. Lorsque la version précédente est supprimée, elle peut également geler la machine virtuelle pendant quelques secondes de plus. C'est un effet standard. 



Le transfert de la procédure au niveau de stockage à l'aide de la technologie Direct Storage Access élimine complètement ces retards, même s'ils sont minimes. 



Supposons qu'une entreprise exécute des tâches de sauvegarde sur une plate-forme hyperconvergée à l'aide d'un cluster Ceph distribué (un système de stockage de fichiers pour plusieurs machines virtuelles). Avec cette approche, tout retard de VM est inacceptable. 



Ou prenez ce scénario: l'exécution d'une transaction dans la base de données de la banque, qui dure, disons, 30 secondes, coïncide dans le temps avec le «gel» de la VM impliquée dans cette transaction lors de la création de l'instantané. 



En conséquence, le client a déposé de l'argent au guichet automatique, mais l'argent n'a pas été crédité sur le compte. Le client n'est pas satisfait et partage par le bouche à oreille son opinion négative sur la banque. Le résultat est une perte de réputation pour l'entreprise.



Premiers utilisateurs



Il y a déjà des entreprises dans notre centre de données qui s'intéressent aux capacités de la plate-forme mise à jour et la testent gratuitement pour voir quels résultats pratiques seront obtenus. 



Jusqu'à présent, nous enregistrons l'intérêt du segment des services financiers, de la construction, ainsi que des entreprises utilisant des applications métier essentielles à tout temps d'arrêt, même minimal. Moins il y a de temps d'arrêt, plus la disponibilité du service est élevée et plus le coût de maintenance de l'application est bas - et meilleur est le service que l'utilisateur final reçoit. 



Très probablement, tous les participants à ces tests seront intéressés par la plate-forme mise à jour - car le choix économique entre acheter un serveur haute performance sans développement supplémentaire et le louer pendant un mois est pratiquement évident à la fois lorsque l'on se concentre sur des projets à court terme et sur la perspective d'un développement commercial à long terme basé sur une informatique avancée. solutions.



All Articles