こんにちは、クラウドエース編集部です。 2021 年、AWS がデータウェアハウスサービス「Redshift」のサーバーレス版である「Redshift Serverless」を発表しました。これまで、サーバーレスで簡単に使えるデータウェアハウスとしては Google Cloud の 「BigQuery」が有名でしたが、Redshift Serverless の登場により、どちらを使うべきか迷う人も多いかもしれません。 今回は、AWS が提供する「Redshift Serverless」と Google Cloud の 「BigQuery」の違いついて、わかりやすく解説していきます。 目次 Toggle BigQuery とはRedshift serverles とはBigQuery と Redshift Serverless の違いBigQuery と Redshift Serverless のどちらを使うべきか BigQuery とは BigQuery とは、Google Cloud が提供するデータウェアハウスです。サーバーレス・フルマネージドのサービスであり、大量のデータを超高速で処理分析できることが特徴です。 サーバーレスであるため事前チューニングが不要で、直感的に操作しやすいインターフェースが採用されているため、データベースについての専門知識がない人でもデータ分析を行うことができます。 料金は、ストレージ量とクエリの実行サイズによって決まる従量課金制で、コストを最適化しやすいことも特徴です。さらに、ストレージ料金は毎月 10 GB まで、分析料金は毎月 1 TB までをそれぞれ無料で使えることも大きなポイントです。 Redshift serverles とは Redshift Serverless とは、2021 年末に AWS が発表したデータウェアハウスサービスです。AWS が提供していたデータウェアハウス「Amazon Redshift」のサーバーレス版となります。 BigQuery 同様、サーバーレスでフルマネージドのサービスであるため、事前のチューニングが不要で利用できます。これは従来の Redshift との大きな違いの一つです。 また、従来の Redshift ではインスタンスの利用時間に応じて課金される仕組みだったのが、Redshift Serverless では BigQuery 同様に、クエリの実行に対して料金が決まる時間課金従量課金制となりました。 BigQuery と Redshift Serverless の違い ここまで紹介した通り、BigQuery と Redshift Serverless は、どちらもサーバレスでシンプルな操作で利用できるデータウェアハウスです。しかし、料金体系などについては、少し違いがあります。両サービスの特徴をまとめると、以下の通りとなります。 サービス Redshift Serverless BigQuery ユーザビリティ 事前チューニング不要 事前チューニング不要 スケーラビリティ 自動スケール 自動スケール 料金体系 (東京リージョンの場合) コンピュート料金 (0.494 USD/RPU) + ストレージ料金 (0.0261 USD/GB) 分析料金 (6.00 USD/TB) *毎月1TBまで無料 + アクティブストレージ料金 (0.023 USD/GB) or 長期保存ストレージ料金 (0.016 USD/GB) *毎月 10GB まで無料 対応リージョン 11 リージョン 32 リージョン それぞれの項目について、詳しく見てみましょう。 ユーザビリティ まずは、ユーザビリティについて考えてみましょう。 Redshift Serverless と BigQuery は、どちらもサーバーレス・フルマネージドのサービスです。そのため、事前にノードやクラスタなどの設定不要で利用することが可能で、高いユーザビリティを誇ると言えます。 従来の Redshift では、データ分析の前に、インスタンスの作成やチューニングが必要であり、ノードとクラスターの基本的な知識が必要でした。しかし Redshift Serverless では、これらの事前設定が不要で、AWS に関する専門知識がなくてもデータ分析を行えます。 スケーラビリティ 続いては、スケーラビリティについてです。Redshift Serverless、BigQuery ともに、自動スケールに対応しており、手動管理が不要で一貫したパフォーマンスを発揮してくれます。 また、どちらのサービスでもリソースの使用量の上限を決めて、制限に達した際はアラートを発報させるなどの設定が可能です。これにより、想定以上のコスト発生を防ぐことができます。 さらに BigQuery では、事前に定義した予算に基づいてスロットを自動でスケーリングする機能も発表されました。これにより、予測が難しい処理でもコストの無駄を発生させずに高いパフォーマンスを発揮できるでしょう。 料金体系 続いては、料金体系について解説します。 Redshift Serverless Redshift Serverless の利用料金は、コンピュートに対する請求と、ストレージに対する請求によって構成されます。 それぞれの東京リージョンでの料金は、以下の通りです。 コンピュート料金 0.494 USD/RPU ストレージ料金 0.0261 USD/GB RPU とは、ワークロードの処理に使用されるリソースです。コンピュートの請求については、クエリが実行されていない時間は料金が発生しません。ただし、60 秒の最低料金が設定されています。 また、これまでに Redshift Serverless を利用したことがない場合、トライアルとしてコンピューティングとストレージの利用に対して 90 日間有効な 300 USD のクレジットが付与されます。ただし、無料トライアル枠での使用に関する請求は、請求コンソールには表示されないため注意が必要です。 BigQuery BigQuery の料金は、クエリに対する料金とストレージに対する料金によって構成されます。 ストレージ料金については、過去 90 日間で変更されたテーブルを含む「アクティブストレージ」と、90 日間連続して変更されていないテーブルの「長期保存ストレージ」によって価格が異なります。それぞれ、東京リージョンでの価格は以下の通りです。 分析料金 *毎月 1 TB まで無料 6.00 USD/TB アクティブストレージ料金 *毎月 10 GB まで無料 0.023 USD/GB 長期保存ストレージ料金 *毎月 10 GBまで無料 0.016 USD/GB BigQuery の大きなメリットは、毎月上限まで無料で使える枠が用意されていることです。利用回数があまり多くないというケースや、まずはお試しで小規模分析から始めてみたいというケースにはピッタリでしょう。 また、月々の無料枠とは別に、Google Cloud の新規ユーザー向けに用意される 300 USD 分の無料クレジットも利用可能です。有効期限は 90 日間で、アップグレードしない限り自動で課金されることはありません。 対応リージョン 続いては、対応リージョンについて見てみましょう。各サービスの対応リージョンは以下の通りです。 Redshift Serverless BigQuery オハイオ州/ノースバージニア州/オレゴン州/シンガポール/シドニー/ソウル/東京/フランクフルト/アイルランド/ロンドン/ストックホルム アイオワ/ラスベガス/ロサンゼルス/モントリオール/北バージニア/オレゴン/ソルトレイクシティ/サンパウロ/サンティアゴ/サウスカロライナ/トロント/デリー /香港/ジャカルタ/メルボルン/ムンバイ/大阪/ソウル/シンガポール/シドニー/台湾/東京/ベルギー/フィンランド/フランクフルト/ロンドン/マドリッド/ミラノ/オランダ/パリ/ワルシャワ /チューリッヒ Redshift Serverless も今後、提供リージョンを拡大予定とのことですが、現時点(2022 年 12 月)では BigQuery の方が対応リージョンは広いと言えます。 データ分析 続いては、Redshift Serverless、BigQuery がそれぞれで使えるデータ分析サービスの例について紹介します。 サービス Redshift Serverless BigQuery データ加工 Redshift 内でのデータ加工/AWS GlueKinesis Data Firehose/Stream/MSKなど BigQuery 内でのデータ加工/Cloud Dataflow/Cloud Composer/Cloud Data Fusion/Workflowsなど BI QuickSight など Looker Studio など データ分析 EMR/Kinesis Data Analytics/Glue DataBrew など Cloud DataPrep/Cloud Dataplex/Analytics Hub など それぞれ、豊富なサービスでデータ分析や可視化ができることがわかります。もちろん、データの取り込みについてもクラウド内外を問わず、あらゆるサービスとの連携が可能です。 BigQuery と Redshift Serverless のどちらを使うべきか ここまで、BigQuery と Redshift Serverless の違いについて紹介してきました。 料金体系や無料枠、対応リージョンなどに多少の差はあるものの、どちらもサーバーレスでコストに優れ、使い勝手の良いサービスと言えます。 どちらを使うべきか迷った場合には、使い慣れたクラウドサービスのものを選ぶというのが一つの方法となります。Google Cloud の他製品を使っている場合は BigQuery を、AWS の他製品を使っている場合は Redshift Serverless を選ぶと、使いやすさを感じやすいでしょう。 また、どちらのサービスにもそれぞれ無料枠が用意されているため、実際にトライアルとして使ってみてから好きな方を選ぶというのも良い方法です。 これまでは、AWS で基本のワークロードを設計し、データ分析だけ BigQuery を使う というケースがエンタープライズを中心に多くみられましたが、Redshift Serverless の登場により今後それぞれのプロダクトがどのような進化を遂げていくのか注目と言えるでしょう。 弊社クラウドエースでは Google Cloud のパートナーとして、BigQuery を活用したデータ分析の支援を行っております。 Redshift Serverless の登場で BigQuery の立ち位置が危ぶまれるかとも思いましたが、現場のエンジニアにとっての使い勝手の部分や、処理性能の面でも BigQuery のパフォーマンスの高さは自信を持ってお客様に推奨できると考えています。 こちらでは毎月 BigQuery に関するオンラインセミナーも開催しておりますので、ぜひ気になる方は無料ですのでご参加いただけると幸いです。 クラウドエース無料セミナー セミナー一覧はこちら ここまで、BigQuery と Redshift Serverless の違いについて解説してきました。この記事を参考に、自社にとってベストなデータウェアハウスを選択してください。 参考元 AWS “Amazon Redshift Serverless” Google Cloud “BigQuery”