Kush's Wiki

エラーバジェット

commited date: 2024-07-14

#Site Reliability Engineering

プロダクト開発者とSRE間でリリース可否を決めるための指標となるような考え方。

SLOを満たせない時間を名前の通り予算として管理する。

エラーバジェットが残っていればリリース可能、エラーバジェットを使い切っていればリリースはストップしシステムの改善を行うというような運用をする。

エラーバジェットによってプロダクト開発者とSREでイノベーションと信頼性のバランスを適切に扱う