カテゴリ
可観測性・SRE(OpenTelemetry / SLO)の実践ガイド
可観測性は「ログを出すこと」ではなく「止まった処理を一目で追えること」です。OpenTelemetryで三本柱(ログ・メトリクス・トレース)を相関させ、構造化ログに相関IDを通し、SLO/エラーバジェットで判断し、原因ではなく症状でアラートを鳴らす——本番の信頼性を数字で運用する設計を扱います。
全 3 記事
基礎ガイド
基礎ガイド(まずはここから)
可観測性
OpenTelemetry
アーキテクチャ設計
Python
Next.js
OpenTelemetry 本番可観測性ガイド:トレース・メトリクス・ログを相関させ、止まった処理を一目で追えるようにする
OpenTelemetryで本番システムを可観測にする実装ガイド。3シグナル(トレース/メトリクス/ログ)とコンテキスト伝播の考え方から、FastAPI(Python)とNext.js(Node)の計装、OTel Collector、Head/Tailサンプリング、ログとトレースの相関、PIIスクラブ、テレメトリのコスト最適化までを公式準拠の実コードで解説します。
23分
関連する実践記事
- アーキテクチャ設計AWSTypeScriptサーバーレス
インシデント対応の実務ガイド2026:Incident Commander・Runbook・ポストモーテム・オンコールをSRE流に設計する
本番障害に強いチームの作り方を、Google SREの公式知見に忠実に解説。Incident Commanderモデル、SEV1〜4の重大度設計、検知→緩和→検証→広報のRunbookテンプレート、非難なきポストモーテム、オンコール衛生(toil/アラート疲れ削減)、MTTD/MTTRとエラーバジェットまで、運用込みで設計する実務知を実コードとテンプレートで示します。
24分 - AWS可観測性OpenTelemetrySREECS
AWS ECS Fargate の SRE 実践ガイド:ADOT分散トレース・EMFメトリクス・SLO/エラーバジェット/バーンレートアラート設計
ECS Fargate本番運用を題材に、OpenTelemetry/ADOTによる分散トレース、JSON構造化ログと相関ID、EMFカスタムメトリクス、RED/USE、SLO・エラーバジェット・バーンレートアラート、複合アラームとサンプリング設計までを公式ドキュメント準拠の実コード(TypeScript/Terraform)で解説する可観測性・SREの決定版ガイドです。
23分