Kush's Wiki
SRE
Site Reliability Engineering
Webサービスの
信頼性
に対してソフトウェアエンジニアリングの手法を適用する分野
CUJ
Critical User Journey SREにおいてサービスの信頼性を測る単位となる、ユーザーが達成したい一連のタスクの流れの略。 ユーザー視点で重要な経路を特定し、その達成度合いに対してSLOを定義する。機能単位ではなくユーザーの目的単位で信頼性を語ることで、エラーバジェットの投資先をユーザー満足に直結する経路に絞れる。
クラウドネイティブで実現する マイクロサービス開発・運用 実践ガイド
サービスの信頼性の階層
NINES don’t matter if USERS aren’t HAPPY
SREの文脈でのCharity Majorsによる主張。ナインとは可用性のこと ユーザーが満足していなければ、ナインは重要ではない
Book/
SRE サイトリライアビリティエンジニアリング
Book/
チームトポロジー
SLO
Service level objectives SREにおけるサービスレベル目標の略。 サービスレベル指標(Service level indicators = SLI)に対してターゲットとする値または範囲を目標とする。 サービスレベル指標に用いられるのは主に以下のようなもの 可用性 リクエストレイテンシ エラー率 システムスループット サービスレベルアグリーメント(Service level agreement = SLA)は、SLOを守るまたは守れないケースに関する規定をユーザーと同意するもの。 SLO, SLI, SLAは定義が曖昧になりやすいので注意が必要
一人SREが歩んだPlatform Engineeringスモールスタート実践録 ~ クラウドネイティブ会議版 ~
Platform Engineering #Team Organization 井上翔太(MIXI)による、一人 SRE が小規模から Platform Engineering を実践した経験報告(クラウドネイティブ会議, 2026)。「Platform Engineering は大規模チームの専売特許ではない」と説く アプリエンジニア→SRE→PE と段階的に守備範囲を広げた実践録 Platform as Code(Terraform / IaC)、AI 付き Slack bot によるセルフサービス権限管理、Golden Path 改善、Workload Identity 導入 制約はリソース不足と設計の相談相手不在。AI が一人実践のイネーブラーになった https://speakerdeck.com/syossan27/ren-sregabu-ndaplatform-engineeringsumorusutatoshi-jian-lu-kuraudoneiteibuhui-yi-ban
あなたの興味は信頼性?それとも生産性? SREとしてのキャリアに悩むみなさまに伝えたい選択肢
Author: 草間 一人 SRE/SRE サイトリライアビリティエンジニアリング エレガントパズル Four Keys/DevOps Platform Engineering Team Topologies Building Effective AI Agents
Platform EngineeringはこれまでのSREやインフラチームと何が違うのか?
Platform Engineering SRE SLI/SLO/SLA https://codezine.jp/article/detail/18856
エラーバジェット
SREにおいてリリース可否を決めるための指標となるような考え方。 SLOを満たせない時間を名前の通り予算として管理する。 エラーバジェットが残っていればリリース可能、エラーバジェットを使い切っていればリリースはストップしシステムの改善を行うというような運用をする。 エラーバジェットによってプロダクト開発者とSREでイノベーションと信頼性のバランスを適切に扱う