Die Automatisierung der Codeerstellung und des Codetests mit CI/CD ermöglicht es uns, Code häufig auszuliefern und dabei ein hohes Maß an Vertrauen zu haben, dass Fehler die Endbenutzer nicht beeinträchtigen. Warum sind unsere CI/CD-Systeme dann immer noch oft quälend langsam, unzuverlässig und unsere Lieferfähigkeit wird häufig blockiert?
Site Reliability Engineering (SRE) zielt darauf ab, die Probleme zu reduzieren, die durch fehlerhafte Plattformen und Prozesse verursacht werden, welche die Zuverlässigkeit und Stabilität von Produktionssystemen beeinträchtigen.
Begleiten Sie Mel Kaulfuss von Buildkite, während sie CI/CD aus der Perspektive von SRE betrachtet.
In der Sitzung erfahren Sie, wie Sie SRE-Prinzipien und -Praktiken in CI/CD integrieren, darunter:
- Definition aussagekräftiger SLOs (Service-Level-Objectives) und SLIs (Service-Level-Indikatoren)
- Beobachten der Systemleistung und -metriken
- Verwenden von Fehlerbudgets zum Optimieren Ihrer Test-Suites und Pipelines
Indem Sie Ihre CI/CD-Infrastruktur und -Prozesse wie Ihre Produktionssysteme verwalten, und dabei eine SRE-Denkweise verwenden, können Sie schnell reagieren, wenn etwas schief geht, und die Kontrolle über große, langsame und unzuverlässige Build- und Bereitstellungsprozesse zurückgewinnen.
„Die PagerDuty Operations Cloud ist für TUI von entscheidender Bedeutung. Sie wird uns tatsächlich dabei helfen, als Unternehmen zu wachsen und sicherzustellen, dass wir unseren Kunden qualitativ hochwertige Dienstleistungen bieten.“
- Yasin Quareshy, Technologiechef bei TUI