プロダクト開発者とSRE間でリリース可否を決めるための指標となるような考え方。
SLOを満たせない時間を名前の通り予算として管理する。
エラーバジェットが残っていればリリース可能、エラーバジェットを使い切っていればリリースはストップしシステムの改善を行うというような運用をする。
エラーバジェットによってプロダクト開発者とSREでイノベーションと信頼性のバランスを適切に扱う
commited date: 2024-12-20
プロダクト開発者とSRE間でリリース可否を決めるための指標となるような考え方。
SLOを満たせない時間を名前の通り予算として管理する。
エラーバジェットが残っていればリリース可能、エラーバジェットを使い切っていればリリースはストップしシステムの改善を行うというような運用をする。
エラーバジェットによってプロダクト開発者とSREでイノベーションと信頼性のバランスを適切に扱う
SRE サイトリライアビリティエンジニアリング