カテゴリ
Google Cloud Run 本番運用ガイド(コンテナ契約・並行性/スケールトゥゼロ・リクエスト課金/インスタンス課金・リビジョンとトラフィック分割・最小権限SAとSecret Manager・Direct VPC egress・コスト最適化・技術選定)
Cloud Runは『コード・関数・コンテナをGoogleのインフラ上で動かす』フルマネージドのサーバーレス基盤で、ノードもクラスタも持たずにコンテナを本番運用できます。本クラスタは、Cloud Runを採用した後の『どう本番で作るか』に集中します——$PORTで0.0.0.0待受・SIGTERMで10秒以内に後始末・状態を持たない・重い処理はJobs/Workflowsへ切り離すというコンテナ契約、原価とスケールを決める並行性(既定80・最大1000)、60%使用率を目標にゼロまで縮むオートスケールと最小/最大インスタンス、リクエスト課金とインスタンス課金を稼働率で選ぶコスト設計、リビジョンの不変スナップショットを使ったトラフィック分割(カナリア→Blue/Green→即時ロールバック)、startup/livenessプローブ、サービスごとの最小権限サービスアカウントとSecret Manager(環境変数=起動時固定/ボリューム=常に最新)・認証必須・Cloud Armor、コネクタ常駐費を消すDirect VPC egress、そしてCloud Run/GKE Autopilot/App Engine/Cloud Run functionsの技術選定まで——可観測性・回復性・冪等性・最小権限・コスト効率・テスト容易性を軸に体系化します。国内大手放送事業者の社内AIプラットフォームをGCP上にTerraformでIaC構築し、Cloud Run(サービス+ジョブ)でFastAPI・音声合成・OCRパイプライン・ClamAVマルウェアスキャナを本番運用し、Workload Identity Federationで鍵レスCI/CDを組んだ知見を根拠に、Google Cloud公式ドキュメントに忠実な実コードで解説します。AWS ECS on Fargate・Azure Container Appsとのクロスクラウドの勘所は地続きで、各クラスタからも相互に参照できます。
全 7 記事
基礎ガイド
基礎ガイド(まずはここから)
Google Cloud Run 本番運用ガイド:コンテナ契約・並行性・オートスケール・デプロイ・コスト・セキュリティを実コードで
Google Cloud公式ドキュメントに忠実なCloud Runの本番運用ガイド。コンテナ契約(PORT/SIGTERM)、並行性(既定80・最大1000)、スケールトゥゼロ、リクエスト課金とインスタンス課金、リビジョンによるトラフィック分割(Blue/Green・カナリア)、ヘルスチェック、最小権限サービスアカウントとSecret Manager、Direct VPC egressまでを、gcloud・Terraform・FastAPI/Nodeの実コードで体系化します。
関連する実践記事
- GCPCloud Runコスト最適化オートスケールサーバーレス
Cloud Run の並行性・オートスケール・課金モデルとコスト最適化:スケールトゥゼロと冷起動を実コードで攻略
Cloud Runのコストを決める3要素——並行性(既定80・最大1000)・オートスケール(60%使用率目標・スケールトゥゼロ)・課金モデル(リクエスト課金 vs インスタンス課金)——を公式仕様に忠実に解説。冷起動対策(最小インスタンス・起動CPUブースト・gen1/gen2・スリムイメージ)、損益分岐の試算、コスト最適化チェックリストまでをgcloud・Terraformの実コードで体系化します。
13分 - GCPCloud RunCI/CDDevOpsWorkload Identity
Cloud Run の CI/CD:Cloud Build / GitHub Actions × Workload Identity で鍵レス・Blue/Green・カナリアを実コードで
Cloud Runへの継続的デプロイを本番品質で組む実装ガイド。Artifact Registry、Cloud BuildとGitHub Actions(Workload Identity Federationで鍵レス)の使い分け、--no-traffic+タグURLで検証してからカナリア→Blue/Green→即時ロールバック、DBマイグレーションのジョブ分離、Terraformとの責務分離までを、cloudbuild.yaml・GitHub Actions・gcloudの実コードで解説します。
8分 - GCPCloud RunCloud Workflowsバッチ処理冪等性
Cloud Run Jobs と Cloud Workflows:長時間バッチ・並列処理を冪等・再開可能に設計する
HTTPに向かない処理(バッチ・長時間ジョブ・並列処理)をCloud Run JobsとCloud Workflowsで本番品質に作る実装ガイド。--tasks/--parallelismによるシャーディング、CLOUD_RUN_TASK_INDEXでの分割、決定的IDによる冪等・再開設計、Cloud Schedulerのcron実行とEventarcのイベント駆動、Workflowsの並列・リトライ・エラー処理までを、gcloud・YAML・Pythonの実コードで解説します。
9分 - GCPCloud RunセキュリティネットワークCloud Armor
Cloud Run のネットワーキングとセキュリティ:Ingress制御・IAM認証・Direct VPC egress・Cloud Armorで多層防御
Cloud Runの入口と出口を本番品質で固める実装ガイド。Ingress設定(all/internal/internal-and-cloud-load-balancing)、IAMによるサービス間認証(roles/run.invoker・IDトークン)、Direct VPC egressによるCloud SQLプライベートIP接続、外部ロードバランサ前段のCloud Armor(OWASP WAF・レート制限・適応型DDoS)、最小権限サービスアカウントとSecret Managerまでを、gcloud・Terraformの実コードで多層防御として解説します。
8分 - GCPCloud Runトラブルシューティング可観測性サーバーレス
Cloud Run トラブルシュート大全:起動失敗・503/504・OOM(exit 137)・冷起動・デプロイ失敗の原因と直し方
Cloud Runの本番でよく出るエラーを、公式の正確なメッセージとともに原因別に直す実践ガイド。『Container failed to start and listen on the port defined by the PORT environment variable』、メモリ超過によるexit 137(OOM)、503『no available instance』、504リクエストタイムアウト、イメージpull権限エラー、冷起動の遅さまでを、診断手順とgcloud・コードの修正例で解説します。
9分 - GCPCloud RunGKEApp Engineサーバーレス
GCPコンテナ/コンピュート技術選定:Cloud Run / GKE Autopilot / App Engine / Cloud Run functions をどう選ぶか
GCPで『コードをどこで動かすか』を決めるための技術選定ガイド。Cloud Run・Cloud Run functions(旧Cloud Functions)・App Engine・GKE/GKE Autopilot・Compute Engineを、公式の推奨と実運用の観点で比較。スケールトゥゼロ・Kubernetes固有機能・課金モデル・移行性を軸に、意思決定フローチャートとAWS/Azureとのクロスクラウド対応表まで、発注者・開発者の両視点で解説します。
11分