SRE intensif en ligne: nous allons tout casser au sol, puis le réparer, le décomposer encore quelques fois, puis le reconstruire

Brisons quelque chose? Sinon, nous construisons et construisons, réparons et réparons. L'ennui est mortel.



Décomposons-le afin que nous n’ayons rien pour cela - non seulement nous serons loués pour cette honte. Et puis nous reconstruirons tout - à tel point que ce sera un ordre de grandeur meilleur, plus tolérant aux pannes et plus rapide.



Et nous le casserons Ă  nouveau.



Pensez-vous qu'il s'agit d'un concours pour l'utilisation de l'instrument le plus secret de toutes nos astronautes - le Big Russian Space Hammer?



Non, il s'agit d'un SRE intensif en ligne. Il se trouve que chaque cours Slurm SREjamais et pour rien de différent du précédent. Tout simplement parce que vous ne devinerez jamais que dans un énorme système complexe, auquel des milliers et des milliers d'utilisateurs sont connectés chaque seconde, et le public lui-même est de plusieurs millions, il peut tomber, s'effondrer, s'émousser, pépin, et de centaines d'autres façons gâcher l'humeur du changement de fonctions des ingénieurs SRE.



En décembre, nous organiserons un autre intensif SRE .



image



Organisons une petite rétrospective. Considérez comment, il y a quelques années à peine, les RH ont mené une course pour trouver plus d'ingénieurs DevOps dans leur entreprise. Le prix a changé. Maintenant, ils inspectent, comme un système de suivi "Pantsir-C1", les environs, à la recherche d'ingénieurs SRE. J'ai dit dans l'article « Eugene Varavva, un développeur chez Google. Comment décrire Google en 5 mots », comment vit un ingénieur SRE chez Google et comment même une telle entreprise connaît une pénurie de spécialistes SRE.



Sur le Slurm SRE intensif en ligne en décembre, dans trois jours, de 10h00 à 19h00, vous apprendrez comment assurer la rapidité, la tolérance aux pannes et la disponibilité des sites dans des conditions de ressources limitées, éliminer les incidents informatiques et effectuer un débriefing pour que les problèmes ne se reproduisent pas.



Orateurs du cours:



Ivan Kruglov . Ingénieur logiciel chez Databricks. Possède de l'expérience dans les entreprises en matière de distribution distribuée et de traitement de messages, BigData et Web-stack, recherche, création de cloud interne, maillage de services.



Pavel Selivanov . Ingénieur DevOps senior chez Mail.ru Cloud Solutions. En raison de dizaines d'infrastructures construites et de centaines de pipelines CI / CD écrits. Administrateur certifié Kubernetes. Auteur de plusieurs cours sur Kubernetes et DevOps. Conférencier régulier lors de conférences informatiques russes et internationales.



Tout sera difficile, imprévisible et pratique. Vous construirez, casserez et réparerez - et parfois dans une variété de séquences.



Construire:Vous devez formuler des indicateurs SLO, SLI, SLA pour un site constitué de plusieurs microservices; développer une architecture et une infrastructure qui les soutiendront; construire, tester et déployer le site; configurer la surveillance et les alertes.



Pause: Vous prendrez en compte les facteurs internes et externes de détérioration du SLO: erreurs de développeur, défaillances d'infrastructure, afflux de visiteurs, attaques DoS. Apprenez à comprendre la résilience, le budget d'erreur, les pratiques de test, la gestion des interruptions et la charge opérationnelle.



Correction: Vous serez formé pour organiser rapidement et efficacement le travail de l'équipe d'intervention d'urgence dans les plus brefs délais: connecter des collègues, informer les parties prenantes et définir des priorités.



Étude:Vous pourrez analyser l'approche du site en termes de SRE. Analysez les incidents. Déterminer comment les éviter à l'avenir: améliorer la surveillance, changer l'architecture, les approches de développement et d'exploitation, les réglementations. Automatisez les processus.



Le SRE intensif en ligne simule des conditions réelles - le temps de restauration des performances du service sera extrêmement limité. Comme dans la vraie vie, comme dans une vraie situation de travail.



Vous pouvez découvrir les conditions du cours SRE et étudier le programme complet ici .



L'intensif en ligne est prévu pour décembre 2020. Pour ceux qui paient leur participation à l'avance, nous avons préparé une réduction.



Êtes-vous prêt pour un entraînement intense, des défis difficiles et des accidents soudains?



Ce ne sera pas le cas. Il y aura une croissance professionnelle.



All Articles