Observability
-
Datadog Logs
#Observability Datadog上でログを扱い、高機能な検索機能等を利用できる 設定方法は以下 ログの収集とインテグレーション
-
Honeycomb
Observabilityに関するエンドツーエンドのプロダクト Retrieverというオブザーバビリティに最適化された独自のデータストアを備えており、Amazon S3によって実装されている Honeycomb.io Documentation | Honeycomb
-
ログ
Observabilityにおけるテキストベースの記録 Observability Whitepaperを参考にすると、ログにはいくつかのカテゴリがある Application Logs Security Log System Log Audit Log Infrastructure Log またログレベルとして以下の4パターンがある ERROR WARNING INFO DEBUG
-
Datadog RUM
Datadog Real User Monitoring #Observability Datadog上で個々のユーザーのアクティビティをリアルタイムで可視化する APMと紐づける(以下、詳細)ことでフロントエンドで収集したデータをバックエンドのトレースと相関づけて追跡できる Connect RUM and Traces RUM & セッションリプレイ
-
Observability Primary Signals
-
マスタリングAPIアーキテクチャ
-
サービスメッシュ
#Network #Observability #Security #API Architecture マイクロサービスで行われるようなサービス間通信をルーティング、監視、保護する機能を提供する Kubernetesにおいてはクラスタ単位でサービスメッシュを構築する サービスメッシュはクラスタ内の全てのサービス間通信を制御するコントロールプレーンとコントロールプレーンで指定された作業が実行されるデータプレーン(サービス)の2つの基本要素を持つ。
-
オブザーバビリティ成熟度モデル
-
Datadog APM
Datadog Application Performance Monitoring #Observability Datadog上で分散トレースによってアプリケーションを詳細に可視化し、パフォーマンスボトルネックを特定するのに役立てる 設定方法は以下 アプリケーションインスツルメンテーション APM
-
Datadog Database Monitoring
#Observability #Data Store Datadog上でデータベースの詳細な可視性を提供する Explain Plansでは実行計画を容易に把握することができる 導入にはAPMの有効化が必須でありでクエリを呼んでいるサービスの内訳を可視化できる データベース モニタリング
-
入門 監視
-
計装
#Observability テレメトリーをオブザーバビリティソリューションに送信するための実装のこと 前提としてエージェントをシステムに組み込んだ上で、アプリケーションエンドポイントへの自動計装や手動スパン埋め込み等のカスタム計装を行う
-
適応度関数
Fitness Function #API Architecture システムの品質特性を数量化可能な指標で評価する、システムの目標を一貫して保証するためにビルドパイプラインに組み込まれる それぞれの特性は以下のようにカテゴライズされる コード品質(Code Quality) レジリエンス(Resiliency) オブザーバビリティ(Observability) パフォーマンス(Performance) コンプライアンス(Compliance) セキュリティ(Security) 運用操作性(Operability) Fitness function-driven development | Thoughtworks
-
Datadog Agent
#Observability Datadogへホストのログを送信するソフトウェア。 各ホストの環境別にいくつかのインストール手段が用意されている 例としてKubernetesへのインストール方法は以下 Kubernetes に Datadog Agent をインストールする Agent
-
Argo Rollouts
-
SRE サイトリライアビリティエンジニアリング(書籍)
-
OpenTelemetry
-
gRPC
-
メトリクス
#Observability システムの状態を表すために収集された数値、例としてログを元に時間単位のHTTPリクエスト数をメトリクスとして収集する等 ログやトレースとは異なり詳細なデータは抜けているため、システムで何が起きているかの調査のスタート地点(アラート)となることが多い Observability Whitepaper システム状態を表すために収集されたスカラー値であり、オプションでタグが付与され、数値をグループ化したり検索したりすることがある オブザーバビリティ・エンジニアリング | P55
-
監視SaaSの運用におけるObservability改善の歩み
#Observability キーワード Observability Primary Signals Unknown unknowns ログ/メトリクス/トレース OpenTelemetry オブザーバビリティ成熟度モデル
-
Monitoring and observability
#Observability DevOps capabilitiesの1つ、Fast Feedbackに分類される DORA | Capabilities: Monitoring and observability
-
分散トレース
Observabilityにおいて分散トランザクションの各コンポーネントで何が発生したかを追跡する、単にトレースと呼ばれることもある 各コンポーネントに対応するデータポイントはスパンと呼ばれ、分散トレースはスパンの集合を扱う Observability Whitepaper
-
テレメトリー
#Observability ログ、分散トレース、メトリクスのようなシステムの状態に関するデータ Datadogのようなオブザーバビリティソリューションに送信される
-
オブザーバビリティ・エンジニアリング
-
Proactive failure notification
#Observability DevOps capabilitiesの1つ、Fast Feedbackに分類される DORA | Capabilities: Proactive failure notification
-
Observability Whitepaper
CNCFによるObservabilityに関する文書 tag-observability/whitepaper.md at main · cncf/tag-observability
-
Datadog