- IT・トレンド記事
BigQuery がわかる!概要・強み・比較・事例などを徹底解説
こんにちは、クラウドエース編集部です。
Google Cloud が提供する BigQuery は、大量データを瞬時に分析できることで高く支持されているサービスです。
この記事では、BigQuery のサービス内容や強み、具体的な活用事例について紹介していきます。効率的でわかりやすくハイパフォーマンスなデータ分析サービスを使いたいと考えている方は、ぜひ参考にしてみてください。
目次
BigQuery ってどんなサービス?
BigQuery とは、Google Cloud が提供するフルマネージドのデータウェアハウスです。
もともとは、Google 社内で利用されていた「Dremel」という社内データ解析ツールを外部ユーザー向けに公開したものです。ペタバイト規模の大量データを短時間で終わらせる超高速処理と、シンプルな操作でデータ分析ができるということが大きな特徴となっています。
新規事業の創出やマーケティング戦略の立案、業務効率化など、あらゆる場面でビッグデータが活用されている今、エンジニアでなくても簡単に大量のデータを分析できる BigQuery はビジネスの成長の強い味方となるはずです。
BigQuery の強み・できること
ここからは、BigQuery の具体的な強みや、どんなことができるのか、どのような導入メリットがあるのかについて紹介します。
大量のデータを高速に処理分析できる
1 つ目のメリットは、大量のデータを高速に処理分析できることです。
これは、BigQuery の最大の特徴とも言えるでしょう。具体的に BigQuery では、1 ペタバイトあるいは 10 億行という規模のデータの集計・分析処理を、数秒もしくは数分という高速さで実行します。
これは従来のデータ分析サービスと比較しても卓越した速さと言えます。実際に他サービスから BigQuery に移行した人からは、「今までは丸一日かかっていたような処理が数十分で終わるようになった」「従来は 2 時間前後必要だった数億レコードを対象としたデータ分析が、BigQuery では 2、3 分で終了する」「30~40 秒かかっていた分析が、BigQuery に移行した後はわずか 5 秒程度で終わるようになった」という声が上がっています。
IoT や AI の普及により、リアルタイムなデータ分析のニーズが高まっている中、大規模データの分析を高速に行えることは大きなメリットとなります。
完全サーバーレスで利用可能
2 つ目のメリットは、完全サーバーレスで利用可能なことです。
従来のデータウェアサービスでは、処理するデータ量などに合わせてリソースを効率よく使うための設計などが必要なことがほとんどでした。しかし、サーバーレスのデータウェアハウスである BigQuery では、サーバーの設定や管理が不要です。さらに、必要に応じて自動でスケールアウト/スケールインまでしてくれます。
事前のチューニングが不要ですぐに利用開始でき、運用後も管理が不要なため、業務効率化に大きく貢献してくれるでしょう。
シンプルな操作で分析が可能
3 つ目のメリットは、シンプルな操作で分析が可能なことです。
BigQuery は、事前チューニングが不要なことに加えて、わかりやすいインターフェースも特徴です。直感的に操作できるため、データ分析に関する専門知識がなくても分析を行えます。
IT 部門やエンジニア部門以外でデータ分析を行いたいというケースにも、非常におすすめできます。
従量課金制でコスト最適化しやすい
4 つ目のメリットは、従量課金制でコストを最適化しやすいことです。
BigQuery は、月額制ではなく使った分に応じて料金が決まる従量課金制のサービスです。そのため、コストの無駄を抑えやすいと言えます。なお利用料金は、「ストレージに保存したデータ量」と「クエリの実行サイズ」によって決まります。
ちなみに、BigQuery では毎月一定量までは無料で使うことができます。「ストレージに保存したデータ量」に応じた費用については毎月 10GB 分が、「クエリの実行サイズ」に応じた費用については毎月 1TB 分が無料で使えます。
ちなみに、 大手調査会社の Enterprise Strategy Group は、「BigQuery では大規模分析に伴う 3 年間のシステム導入や維持管理のコストを、他のサービスと比べて約 27% 削減できる」と発表しています。
Google サービスと連携できる
5 つ目のメリットは、Google が提供する多彩なサービスと簡単に連携できることです。Google Cloud では、BigQuery 以外にも、データ分析に役立つさまざまなサービスを提供しています。
例えば BigQuery と「 Google Spread Sheets 」を連携すれば、スプレッドシート(Google 版のエクセル) 上のデータをテーブルとして自動取得できるので、使い慣れた UI で簡単にデータ分析をすることができます。
参考記事
5分でわかる Google Cloud!コネクテッドシート編|クラウドエース株式会社
また、アクセス解析ツールとしてお馴染みの「 Google アナリティクス 」との連携では、BigQuery 上の既存のデータと統合して分析したり、Google アナリティクスのデータをグラフや表にしたりできます。さらに 「 Looker 」などの BI ツールと接続して、BigQuery をデータソースとして活用することもできます。
このように、BigQuery と Google Cloud の他プロダクトを連携することで、各サービスをさらに便利に使えるようになるのです。
BigQuery と Redshift の違いって?
高機能なデータウェアハウスの導入を検討している人の中には、BigQuery を使うか、AWS の「 Redshift 」を使うかで迷っている人もいるのではないでしょうか。
Redshift は、AWS で提供されるデータウェアハウスです。BigQuery 同様に、高速処理が可能で従量課金制でコストを最適化しやすいサービスとして知られています。
BigQuery と Redshift の主な違いは、サーバーレスであるか否かという部分と、料金システムにあると言えます。
2022年、Redshift でも Redshift Serverless というサービスが登場しましたが、従来の Redshift ではデータ分析の前に、仮想コンピューターであるインスタンスの作成が求められます。インスタンスを作成するには実行環境の細かい設定が必要であるため、AWS の知識を持つエンジニアの力が必要になります。
また、スケーリングについても、BigQuery は自動で行われますが、Redshift では手動で行う必要があります。処理の立ち上げた分析基盤が使用するコンピューティングリソースを変更する必要があるため、スケールアウト/スケールインの際には、利用している分析基盤を一度停止しなければなりません。
このような点から、「環境設定なしですぐに分析機能を使いたい」「ダウンタイムは避けたい」といったケースにおいては、BigQuery の方がおすすめできると言えます。
料金システムについては、BigQuery はクエリの実行量およびストレージ使用量に応じて料金が決まるのに対して、Redshift はインスタンスの利用時間によって料金が決まります。ですので、使っていない時間でも課金されてしまうという欠点がありました。
なお、Redshift Serverless の場合は BigQuery と同じように分析処理を利用した分と、ストレージの使用量に応じた従量課金制となります。具体的な料金は、それぞれ以下の通りです。
分析処理の料金 | ストレージの利用料金(月間) | |
---|---|---|
BigQuery | 6 ドル/TB (毎月 1 TB まで無料) |
アクティブ ストレージ:0.023 ドル/GB 長期保存:0.016 ドル/GB(毎月 10 GB まで無料) |
Redshift Serverless | 起動時間(時) x RPU x 0.494 ドル | 0.0261 ドル/GB |
月々の無料枠が用意されている BigQuery の方が、使い始めのハードルも低く、コストも抑えやすいと言えるでしょう。
BigQuery の活用事例
ここまで、BigQuery の特徴や強みについて紹介してきました。それでは BigQuery を使うと、具体的にどのようなことを実現できるのでしょうか。BigQuery の実際の企業での活用事例について見てみましょう。
トヨタ・カナダ
トヨタ・カナダは、BigQuery をはじめとした複数の Google Cloud サービスを組み合わせて活用することで、オンラインでのマーケティングにおいての成果を向上させています。
トヨタ・カナダでは、オンラインサイトに訪問した見込み客を実際の売上に結びつけることが課題でした。多くの人が新車の購入を考えるとき、オンラインでリサーチし、その後、ディーラーで実物を見て購入を決めます。そのため、HP 上でのマーケティングをどのように行うべきかを把握できていなかったのです。
この解決策として、トヨタ・カナダは Google Cloud の活用を決めました。まずは Web 解析ツール「 Google Analytics 360 」と広告配信プラットフォーム「 Display & Video 360 」を導入します。これにより、サイト内の車をカスタマイズして見積もりを表示する「 Build & Price 」の完了率を高めることに成功しました。Build & Price を完了すれば、車を購入する可能性が高くなることがわかっています。
続いて同社は、Analytics 360 のデータを BigQuery にエクスポートし、サイト訪問者が 30 日以内に再訪問して Build & Price を完了する確率を分析しました。これにより、どの顧客を優先してマーケティング・メッセージを送るべきかを把握できるようになったといいます。そして最終的には、BigQuery からの分析に基づいて、購入の可能性の高い見込み客リストを作成し、彼らに対するディスプレイ広告の配信に成功しました。
このマーケテイングの結果は、大きな効果を示しました。BigQuery によって特定された見込み客が成約する確率は以前の 6 倍以上になり、同時にその獲得単価は 80% も削減されたのです。結果として、トヨタのカローラモデルは、数ヶ月間カナダ全土で大幅な販売増を記録したそうです。
The New York Times
アメリカの大手新聞社 The New York Times は、オンラインサイトの顧客行動の分析に BigQuery を活用しています。
誰がどの記事を読んでいるのか、どれくらいの時間サイトに滞在しているのかを分析し、読者が関心を持つトピックデータを収集したり、Google 検索や SNS でのプロモーションを分析し、何が The New York Times を読むきっかけになるのかを把握したりしているとのこと。
しかし、Google Cloud の導入以前、The New York Times ではアナリストにとって解析するのが難しいようなデータが収集されており、さらにそのデータ活用も上手くいっていなかったといいます。クエリを実行してからコーヒーを飲み、デスクに戻るまでにクエリが終了していないことがあったり、正しいデータが得られていないことがあったりしたとのこと。
このようなオンプレミスでのデータ分析に限界を感じ、Google Cloud の導入を決意した同社。まずは BigQuery への移行からデジタル変革をスタートさせました。同社は「データ分析においては、アナリストが高品質の成果を出すために必要な作業を迅速に行えることが重要」と考えていたとのこと。 BigQuery の導入後、担当者が初めてクエリを実行し、コーヒーを飲みに立ち上がろうとした瞬間、すでにクエリが終了していたことの衝撃は、社内で今でも語られているそうです。
当時、BigQuery への移行にあたり、他のシステムが正しくスケーリングされないのではという懸念もあったとのこと。しかし App Engine や Dataflow などの Google Cloud プロダクトも活用することで、多くのアクセスが予想された 2020 年のアメリカでの選挙期間も、データの損失などの問題なく稼働しました。そして 2020 年の 4 半期には、読者数 2 億 7300 万人という過去最大のトラフィックを記録しています。
まとめ
ここまで、Google Cloud が提供する BigQuery の概要や利用するメリットについて解説してきました。この記事を参考に、自社ビジネスの成長に BigQuery の導入を検討してみてください。
この記事を共有する