【2025年版】Cloud Runとは?料金、機能、始め方から最新活用事例まで徹底解説

【2025年版】Cloud Runとは?料金、機能、始め方から最新活用事例まで徹底解説

※この記事は、公開から時間が経過したため、2025年9月に最新情報をもとに内容を全面的に見直し、2025/09/18に更新いたしました。

こんにちは。クラウドエース編集部です。

サーバーレスのサービスについて調べていると、「Cloud Run」という言葉を目にする機会も多いのではないでしょうか。

具体的に何ができるのか、またGoogleが提供するその他のサービスとの違いがわかりにくいと感じる人もいますよね。

今回は、Cloud Runの概要や特徴、その他のサーバーレスサービスとの違い、そして2025年現在の最新情報に基づいた活用事例について、分かりやすく紹介していきます。

Cloud Runとは

Cloud Runとは、Google Cloudが提供するサーバーレスのコンテナ実行環境です。自作したDockerコンテナなどを、サーバーのプロビジョニングや管理を一切意識することなく、Googleの堅牢なインフラ上で直接実行できます。

これまでコンテナ化されたアプリケーションの管理には、一般的にKubernetesが利用されてきました。しかし、Kubernetesを使いこなすには専門的な知識やクラスタ管理のコストが課題となる場合があります。

Cloud Runは、こうしたKubernetesの持つ強力なスケーリングやポータビリティといった利点を、インフラ管理の複雑さを気にすることなく利用できるようにしたフルマネージドサービスです。WebサイトやAPI、データ処理ジョブなど、コンテナ化できるアプリケーションであれば、コマンド一つで数秒でデプロイし、リクエスト数に応じてゼロインスタンスからでも自動でスケールさせることが可能です。

これにより開発者は、インフラの運用・保守から解放され、アプリケーション開発そのものに集中できるようになります。

サーバーレスとコンテナ技術の簡単な解説

Cloud Runを理解する上で重要な「サーバーレス」と「コンテナ」を解説します。

サーバーレスとは、開発者がサーバーの構築や管理をする必要がない仕組みのことです。アクセスがあった時だけプログラムが実行され、その分だけ料金が発生するため、コストを効率化できます。

コンテナ(Dockerが代表的)は、アプリケーションを実行環境ごとひとまとめにパッケージ化する技術です。これにより「開発PCでは動いたのに、本番サーバーでは動かない」といった環境差異の問題を防ぎ、どこでも同じように動作させられます。

つまりCloud Runは、この便利な「コンテナ」を、管理不要の「サーバーレス」で手軽に動かすためのサービスなのです。

Cloud RunとGKE(Google Kubernetes Engine)の違い

GKEとの最大の違いは「管理の手間」と「自由度」のバランスです。GKEには、ノード(サーバー)を自分で管理する「Standardモード」と、ノード管理の大部分が不要な「Autopilotモード」があります。

GKE Standardはインフラを細かく制御できる反面、ノードの運用負荷とコスト管理が必要です。GKE Autopilotは運用負荷が低いですが、Cloud Runほどのシンプルさはありません。

Cloud Runは、これらGKEのどちらよりもさらに抽象化されており、コンテナを動かすことだけに集中できる、最も手軽な選択肢と言えます。手軽さを最優先するならCloud Run、Kubernetesの豊富な機能を細かく制御したいならGKE、というのが基本的な使い分けです。

【2025年版】Cloud Run vs GKE比較表

比較項目 Cloud Run GKE Autopilot GKE Standard
運用負荷 ほぼゼロ 低い 高い
課金単位 リクエスト/インスタンス時間 Podのリソース要求量 ノードの起動時間
ゼロスケール 可能(ネイティブ機能) 不可(ノードは常時起動) 不可(ノードは常時起動)
手軽さ ◎ 非常に手軽 〇 手軽 △ 学習コスト要
制御の自由度 △ 限定的 〇 高い ◎ 非常に高い

Cloud Runの主な機能とメリット

Cloud Runは、その手軽さと強力な機能により、開発のあり方を大きく変える可能性を秘めています。ここでは、Cloud Runが持つ主な機能と、開発者が享受できる具体的なメリットについて見ていきましょう。

メリット1. あらゆる言語やライブラリが利用可能

Cloud Runはコンテナを実行する環境のため、プログラミング言語やOSライブラリ、フレームワークに一切制約がありません。使い慣れた技術スタックをそのままコンテナ化すれば、すぐにCloud Run上で動かすことができます。

これにより、サーバーレスのメリットを享受しつつ、技術選定の自由度を最大限に確保できます。

メリット2. 他の環境への移行が比較的容易(ポータビビリティ)

Cloud Runは、Kubernetesベースのオープンな標準技術「Knative」を採用しています。これにより、特定のクラウドサービスに縛られる「ベンダーロックイン」のリスクが低減されます。

ただし、注意点もあります。実際のアプリケーションは、データベース(Cloud SQL)や認証(IAM)など、他のGoogle Cloudサービスと連携することがほとんどです 2。これらの連携部分まで含めた完全な移行には、移行先プラットフォームに合わせた再設計が必要になる場合があります。

メリット3. アクセスに応じた高速な自動スケーリング

Cloud Runは、リクエスト数に応じてコンテナの数を自動で増減させます。急なアクセス増にも瞬時に対応し、逆にアクセスがない時はインスタンス数をゼロにまでスケールダウンしてくれるため、リソースを無駄にしません。

インフラのスケール管理から解放され、安定したサービス運用が実現します。

メリット4. コマンド一つで完了するシンプルなデプロイ

Cloud Runでは、コンテナ化したアプリケーションをたった一つのコマンドでデプロイできます。複雑な設定ファイルを用意する必要はなく、デプロイを実行すれば自動的に外部からアクセス可能なURLが発行されます。

この圧倒的なシンプルさが、開発サイクルを高速化する大きなメリットです。

メリット5. AI/ML推論に革命をもたらすGPUサポート

2025年現在、Cloud Runの最も注目すべき新機能の一つがGPUのサポートです(プレビュー機能)。これにより、AIによる画像生成や自然言語処理の推論といった、これまで専用のVMやGKEクラスタが必要だった重い処理を、サーバーレスで実行できるようになりました。

リクエストがあった時だけGPUインスタンスが起動し、処理が終わればゼロになるため、コストを劇的に抑えながらAI/MLアプリケーションを運用できます。

Cloud Runの料金体系|無料枠の真実も解説

Cloud Runの大きな魅力の一つが、2種類の課金モードから選べるコスト効率の高い料金体系です。ここでは、具体的に何に料金がかかるのかを解説します。

選べる2つの課金モデル

Cloud Runには、用途に応じて選択できる2つの課金モードがあります。

リクエスト課金 (Request-based billing)

リクエストを処理している間だけCPUとメモリに課金され、リクエスト数にも料金がかかります。アクセスがない(アイドル状態の)時はCPUが割り当てられず、最小インスタンス数を0に設定すればコストは0円になります。多くのWebサイトやAPIに適しています。

インスタンス課金 (Instance-based billing)

コンテナのインスタンスが起動している全期間に対してCPUとメモリの料金がかかります。リクエスト単位の料金はありません。常に一定数のリクエストを処理する、応答性を重視するアプリケーションに向いています。

【重要】誤解されがちな「Always Free」無料利用枠の真実

Cloud Runの無料利用枠について、「米国リージョン限定」という情報を見かけることがありますが、これは現在では誤りです。

正しくは、Cloud Runの「Always Free」無料利用枠は、特定のリージョンに縛られません。請求アカウント単位で毎月一定量が提供され、東京や大阪リージョンでの利用も対象となります

この無料枠は、請求アカウント全体で合算されるグローバルな許容量として提供されるため、日本の開発者も安心して利用を開始できます。

無料利用枠(リクエスト課金の場合) 月間許容量
CPU 180,000 vCPU秒
メモリ 360,000 GiB秒
リクエスト数 200万リクエスト

上記は請求アカウントごとに毎月リセットされます。

Cloud Runチュートリアル:デプロイの始め方

このセクションでは、実際に手を動かし、Cloud Runへ最初のアプリケーションをデプロイする手順をステップバイステップで見ていきましょう。

ステップ1:Google Cloudプロジェクトの準備

まず、Google Cloud Consoleにログインし、プロジェクトを選択または新規作成します。画面上部の検索バーで「Cloud Run API」と入力し、Cloud Run APIのページに移動して「有効にする」をクリックします。

ステップ2:Cloud Runサービスの作成

次に、コンソール左上のナビゲーションメニューから、「サービスの作成」 ボタンをクリックしてください。

ステップ3:サンプルコンテナのデプロイと設定

「サービスの作成」フォームで、以下の通りに各項目を設定します。

  • デプロイ元:「既存のコンテナ イメージから1つのリビジョンをデプロイする」を選択します。
  • コンテナイメージのURL:us-docker.pkg.dev/cloudrun/container/helloと入力します。これはGoogleが公式に提供しているサンプルです。
  • サービス名:hello-runなど、好きな名前を付けます。
  • リージョン:asia-northeast1(東京)など、任意のリージョンを選択します。
  • 認証:「未認証の呼び出しを許可」を選択します。

【重要】セキュリティに関する注意

「未認証の呼び出しを許可」を選択すると、発行されたURLを知っている人なら誰でもサービスにアクセスできてしまいます。公開Webサイトの場合はこれで問題ありませんが、内部APIやテスト環境の場合は、意図しないアクセスや攻撃を受け、想定外の料金が発生するリスクがあります。

本番環境や非公開のアプリケーションでは、原則として「認証が必要」を選択し、IAMでアクセスを制御することを強く推奨します。

最後に、フォーム下部の「作成」ボタンをクリックします。

ステップ4:デプロイの確認とアクセス

「作成」をクリックすると、デプロイが自動的に開始され、通常は1分もかからずに完了します。緑色のチェックマークと共にURLが表示されたら成功です。そのURLをクリックして、「Congratulations!」というページが表示されれば、あなたの最初のCloud Runアプリケーションが公開されました。

Cloud Runの主なユースケースと活用事例

Cloud Runはその柔軟性から、Webサイトのホスティングからバックエンド処理、さらにはAIまで、幅広い用途で利用されています。

Webサイト・APIサーバーとしての活用

Cloud Runの最も代表的なユースケースが、WebサイトやREST APIといったHTTPリクエストに応答するアプリケーションの実行です。突発的なアクセス増にも自動でスケールするため、メディアサイトやキャンペーンサイト、マイクロサービスのAPIエンドポイントなどに最適です。

非同期処理・バッチ処理(Cloud Run Jobs)

HTTPリクエストを待たずに実行する一括処理には「Cloud Run Jobs」が最適です。特筆すべきは、最大実行時間が168時間(7日間)まで設定可能(プレビュー機能)になった点です。これにより、従来はVMを常時起動する必要があった長時間のデータ処理やレポート生成なども、サーバーレスで効率的に実行できるようになりました。

AI/ML推論(GPU活用)

前述のGPUサポートにより、Cloud RunはAI/MLモデルの推論エンドポイントとして非常に有力な選択肢となりました。Pythonで構築された推論用コンテナをデプロイすれば、スケーラブルかつコスト効率の高いAIサービスを簡単に構築できます。

K株式会社様のチャット監視システム事例

ソーシャルゲーム開発を行うK株式会社様は、ゲーム内チャットの迷惑ユーザー判定を自動化するシステムにCloud Runを採用しています。判定処理は数分で完了するため、リクエスト処理中だけ課金されるCloud Runの特性がコスト削減の決め手となりました。また、任意の自然言語処理ライブラリを導入できる自由度の高さも採用理由の一つでした。

まとめ

本記事では、Google Cloudのサーバーレスサービス「Cloud Run」について、2025年現在の最新情報に基づいて解説しました。

Cloud Runは、単なるWebアプリ実行環境から、長時間バッチ処理やAI/ML推論までこなす、非常に汎用性の高いプラットフォームへと進化しています。コンテナの持つ「どこでも動く」ポータビリティと、サーバーレスの持つ「管理不要で高コスト効率」という手軽さを両立させています。

これまでインフラ管理に費やしていた時間と労力を削減し、開発者が本来集中すべきアプリケーション開発に注力できる環境を提供してくれます。

この記事のチュートリアルを参考に、まずはリージョンを問わず適用される手厚い無料利用枠を使って、その速さとシンプルさを体験してみてはいかがでしょうか。