Kush's Wiki

エラーバジェット

commited date: 2024-12-20

#Reliability

プロダクト開発者とSRE間でリリース可否を決めるための指標となるような考え方。

SLOを満たせない時間を名前の通り予算として管理する。

エラーバジェットが残っていればリリース可能、エラーバジェットを使い切っていればリリースはストップしシステムの改善を行うというような運用をする。

エラーバジェットによってプロダクト開発者とSREでイノベーションと信頼性のバランスを適切に扱う