Formation Site Reliability Engineering (SRE) Practitioner, avec certification
La formation SRE Practitioner offre des méthodes pour améliorer l'agilité et la résilience des services d'une organisation. Les participants apprendront à travers des scénarios réels et seront équipés pour mettre en œuvre des modèles SRE adaptés, améliorer l'observabilité dans les systèmes distribués et répondre efficacement aux incidents.
Prérequis
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
Objectifs pédagogiques
- Comprendre et mettre en œuvre une culture SRE au sein de votre organisation
- Acquérir une vision claire des principes sous-jacents de la SRE
- Maîtriser les Indicateurs de niveau de service (SLIs) et les Objectifs de niveau de service (SLOs) dans un écosystème distribué
- Construire la sécurité et la résilience par conception dans un environnement distribué
- Mettre en œuvre l'observabilité full stack et le traçage distribué
- Collecter des données en utilisant l'IA pour passer d'une gestion réactive à une gestion proactive et prédictive des incidents
- Comprendre le rôle et les responsabilités du SRE
Programme de la formation
Anti-patterns SRE
Reprendre l’image des Ops ou DevOps ou Dev en tant que SRE
Les utilisateurs remarquent un problème avant vous
Jusqu’où mesurer
Les faux positifs sont pires que l’absence d’alertes
Le piège de la gestion de la configuration
La réponse aux incidents
Fixation des points
Gardien de l’état de préparation à la mise en production
La sécurité intégrée, vraiment ?
Le SLO est un indicateur du bonheur du client
Définir des SLI qui mesurent de manière significative la fiabilité d’un service du point de vue de l’utilisateur
Définir les limites du système dans un écosystème distribué pour définir des SLI corrects
Utiliser les budgets d’erreur pour aider votre équipe à avoir de meilleures discussions et à prendre de meilleures décisions basées sur les données
Globalement, la fiabilité est seulement aussi bonne que le maillon le plus faible de votre graphique de service
Seuils d’erreur en cas d’utilisation de services tiers
Construire des systèmes sûrs et fiables
SRE et leur rôle dans la construction de systèmes sûrs et fiables
Conception pour une architecture changeante
Conception tolérante aux fautes
Conception pour la sécurité
Conception pour la résilience
Conception pour l’évolutivité
Conception pour la performance
Conception pour la fiabilité
Garantir la sécurité et la confidentialité des données
Observabilité full stack
Les applications modernes sont complexes et imprévisibles
La lenteur est la nouvelle règle
Les piliers de l’observabilité
Mise en œuvre d’un contrôle synthétique et d’un contrôle de l’utilisateur final
Développement axé sur l’observabilité
Traçage distribué
Qu’advient-il de la surveillance ?
Instrumentation à l’aide de bibliothèques et d’agents
Platform Engineering et AIOps
Adopter une vision centrée sur la plateforme permet de résoudre les problèmes d’évolutivité de l’organisation tels que la fragmentation, l’incohérence et l’imprévisibilité.
Comment utiliser les AIOps pour améliorer la résilience ?
Comment les DataOps peuvent-ils vous aider dans cette démarche ?
Une recette simple pour mettre en œuvre l’AIOps
Mesures indicatives de l’AIOps
SRE et gestion des réponses aux incidents
Responsabilités clés du SRE en matière de réponse aux incidents
DevOps & SRE et ITIL
OODA et la réponse aux incidents SRE
Remédiation en boucle fermée et ses avantages
Swarming – Matière à réflexion
L’IA/ML pour une meilleure gestion des incidents
Ingénierie du chaos
Naviguer dans la complexité
Définition de l’ingénierie du chaos
Quelques faits sur l’ingénierie du chaos
Histoire de l’origine du Chaos Monkey
Qui adopte l’ingénierie du chaos
Mythes du chaos
Expériences d’ingénierie du chaos
Exercices GameDay
Sécurité de l’ingénierie du chaos
Ressources sur l’ingénierie du chaos
SRE est la forme la plus pure de DevOps
Principes clés du SRE
Les SRE aident à augmenter la fiabilité dans l’ensemble du spectre des produits
Mesures de réussite
Sélection des domaines cibles
Modèle d’exécution SRE
La culture et les compétences comportementales sont essentielles
Étude de cas SRE
Passage de l’examen de certification SRE Practitioner
En ligne, en fin de session ou en différé
La réussite (65%) à l’examen de 90 minutes, composé de 40 questions à choix multiples, permet d’obtenir le certificat SRE Practitioner.

Proposé par
Sparks
"Tout l'IT, vraiment tout"

Proposé par
Sparks
