【速報まとめ】Google Cloud Next ‘24 基調講演

※この記事は迅速な情報提供を重視し、速報として掲載しております。もし記事内に誤りがございましたら、後日訂正いたします。

こんにちは、クラウドエース技術本部 SRE 部の間瀬と吉積ホールディングスクラウド事業部の飯島です。

2024 年 4 月9 日（太平洋時間）に開催された Google Cloud のカンファレンスイベント「Google Cloud Next’24」では、昨年に引き続き生成 AI を中心に新機能が発表されました。本稿では、Google Cloud Next’24 1 日目に実施された基調講演の内容をご紹介します。

① Google CEO とGoogle Cloud CEO の挨拶

まず、Google CEO スンダー・ピチャイ氏と Google Cloud CEO トーマス・クリアン氏による挨拶がありました。

Google Cloud Next’23 から 8 ヶ月ほどしか経っていないにもかかわらず、Google Cloud と Google Workspace で 1,000 を超えるアップデートを実施するなど、Google プロダクトの急速な成長がアピールされました。実際に数字でも表れており、クラウドの ARR は前四半期で 360 億ドルに達し、5 年前の 5 倍となっているとのこと。クラウドの成長がいかに速いかがわかります。

特に AI への投資が成長につながり、Generative AI スタートアップの 60％以上、また AI ユニコーンの 90％近くが Google Cloud の顧客であると述べられています。

AI の中でも、今年最も注力して説明されていたのは Generative AI エージェントでした。エージェントは、特定の目標を達成するためにマルチモーダルな情報を同時に処理し、会話し、推論し、学習し、意思決定をすることができます。

下記では、AI を中心としたアップデートの概要をご紹介します。

② AI Hypercomputer

Generative AI への需要に対応するため、Google は AI HyperComputer を設計・構築してきました。すでに Forrester 社の AI Infrastructure Solutions 分野でリーダーとして認められていますが、さらなる強化を発表しました。

A3 Mega VMs
A3 インスタンスと比較して、GPU あたりのネットワーク帯域幅が 2 倍となる A3 mega の一般提供が発表されました。

NVIDIA HGX B200 and NVIDIA GB200 NVL72
次世代 NVIDIA ネットワーキングを搭載したチップである NVIDIA B200 と GB200 が発表されました。どちらも 2025 年頭のリリースを予定しているとのことです。

TPU v5p
トレーニングおよび推論のための最も強力な AI アクセラレータである、TPU v5p の一般提供が発表されました。1 ポッドあたりの計算能力が前世代に比べて 4 倍に向上しています。

Hyperdisk ML
AI の推論とワークロードの実行に最適化された次世代ブロックストレージサービスである Hyperdisk ML がプレビューとして発表されました。一般的な他社製品と比較して、モデルのロード時間を最大 11.9 倍短縮し、ボリュームあたりのスループットが 100 倍以上向上しています。

Dynamic Workload Scheduler
リソース管理とジョブスケジューリングのプラットフォームである Dynamic Workload Scheduler が発表されました。開始時間を保証するカレンダーモードと、経済性を最適化するフレックススタートは、複雑なトレーニングや推論を実施する際に効率的なリソース管理を可能にします。

Google Distributed Cloud
NVIDIA GPU、GKE Enterprise、OpenAI モデル（Gemma や Llama を含む）、Vector Search などの機能が新たに GDC で利用できるようになりました。

Google Axion
Google 初のカスタム ARM ベース CPU である Google Axion が発表されました。2024 年下期にプレビュー版を提供予定とのことです。現行世代の X86 ベースの VM と比較して、パフォーマンスが最大 50％向上し、エネルギー効率が最大 60％改善します。Spanner、BigQuery、GKE、Google Earth Engine、YouTube Ads Platform などのサービス向けにデプロイされ始めています。

③ Vertex AI

Vertex AI では、130 以上のモデルを利用できますが、今回新たにいくつかのモデルが追加されました。

Gemini 1.5 Pro
今回新たに Gemini 1.5 Pro がプレビュー版として提供されました。Gemini 1.5 Pro は、最大 100 万トークンをサポートします。1 時間のビデオ、11 時間の音声、30,00 0 行を超えるコード、700,000 語を超える単語など、膨大な量の情報を 1 つのストリームで処理することができます。

Claude 3
Claude 3 Sonnet、Claude 3 Haiku が Vertex AI で一般公開され、Claude Opus も数週間以内に追加される予定です。

CodeGemma
CodeGemma の提供開始も発表されました。CodeGemma は、Gemini の開発に使用されたのと同じ技術をもとに、コーディング用に設計された微調整された軽量でオープンなモデルです。

Vertex AI のグラウンディング機能の拡張も発表されました。

Google Search
Gemini の回答を Google Search でグラウンディングすることにより、回答の質が向上し、ハルシネーションを大幅に軽減できます。

顧客データ
顧客データベースやアプリケーション、外部データベースからのデータを使って、簡単にモデルをグラウンディングできます。

また、MLOps 機能もいくつか追加されました。

Prompt Management
Prompt Management がプレビュー版として発表されました。これにより、開発者はプロンプトのメモやステータスを確認しながら共同作業を行い、変更を追跡し、異なるプロンプトの品質を比較できるようになります。

Automatic Side by Side(AutoSxS)
Automatic Side by Side(AutoSxS) 機能が一般提供されました。AutoSxS を利用することで、回答の質を評価し、改善することができます。

Rapid Evaluation
現在プレビュー中の Rapid Evaluation により、小規模なデータセットでモデルを迅速に評価することができます。

④ Customer Agents

優れた販売員やサービスマンと同様に、カスタマーエージェントはお客様の声に耳を傾け、ニーズを理解し、適切な商品やサービスを勧めることができます。ウェブ、モバイルアプリ、POS、コールセンターなど、あらゆるチャネルでシームレスに対応できます。

Vertex AI Agent Builder を利用することで、カスタマーエージェントを迅速に構築できます。Google Search と組織のデータを基に、さまざまな種類の AI エージェントをすばやく作成できます。

カスタマーエージェントのデモでは、エージェントがビデオリンクを含めたプロンプトから顧客が求める服を提案、またエージェントと電話で会話をして購入するまで流れを実施していました。

本デモは Youtube にて公開されている基調講演の動画の 58:10 あたりより参照できますので、興味がある方はご覧ください。

⑤ Employee Agents

従業員の生産性を高めるために 1 人の従業員として業務をサポートするようなエージェントとして、Gemini for Google Workspace の新機能やデモが紹介されました。

すでに提供されている文書やスライドの生成機能の評価として、複数の導入企業の事例と共に、Google docs や Gmail での文書作成支援機能である「Help me write」では、70% のユーザーが Gemini からの提案を受け入れて利用している点や、Google スライドのスライドや画像生成の機能について 75% のユーザーが提案を受け入れ、利用していると紹介されていました。

AI Meetings and Messaging Add-on

Google Meet に Gemini を活用したリアルタイムでの音声やチャットの翻訳を提供する機能として、AI Meetings and Messaging Add-on が発表されました。ユーザーあたり 10 ドルで利用できるようです。

AI Security Add-on

スプレッドシートやスライドなど、Google Workspace で作成した文書に対して情報資産のセキュリティレベルを分類する目的等でラベルを付与して管理することがありますが、このラベルを自動で付与する機能として「AI Security Add-on」が発表されました。

Gemini in Google Chat

Google Chat でのスレッド上の会話内容を要約する機能として Gemini in Google Chat が発表されました。

Gemini for Google Workspace のデモ

前述した新機能以外の Gemini for Google Workspace の機能を紹介するデモがいくつか行われました。

Google ドライブ上の Google Docs ファイルの内容を踏まえた回答を行うデモ

Google ドライブにて Gemini を活用し、チャットからの指示に従いドライブ上の複数のファイルへアクセスして内容を読み取り、回答するというデモが行われました。

本デモは Youtube にて公開されている基調講演の動画の 1:08:00 あたりより参照できますので興味ある方は参照してください。

Google Chat から Gmail に添付された長時間の動画ファイルの内容を要約するデモ

Gmail で受け取ったメールに添付された動画内容の要約をチャットから、メールのタイトルを指示するだけで回答するというデモが行われました。

本デモは Youtube にて公開されている基調講演の動画の 1:14:00 あたりより参照できますので興味ある方は参照してください。

これらのデモでは、エージェントが Gemini のマルチモーダルの機能を活用して、メールテキストの読み取りや動画ファイルの読み取りといった、指示を完遂するために必要なタスクを自身で判断した上で実行し、回答することができるという点がアピールされていました。

⑥ Creative Agents

デザイナーのようなクリエイティブなタスクをこなすエージェントとして、全く新しいプロダクトや生成 AI モデルが発表されました。

Google Vids

生成 AI による動画作成ツールとして、Google Vids が発表されました。

Gemini が活用されており、動画の自動作成だけでなく、アウトラインやスクリプトも自動作成することができ、自身の写真や動画も組み合わせて編集することが可能とのことです。

本ツールは Google Docs や Google スライドのように Google Workspace のラインナップに追加されるとのことです。

Imagen 2.0

テキストから画像を生成するモデルである Imagen 2.0 の一般提供が発表されました。

Text-to-Live Image

アニメーション付きの画像である Live Image をテキストから生成する Text-to-Live Image が発表されました。

Google Workspace と Imagen を組み合わせたデモ

サンプルアプリケーション上のチャットより指示を行い、エージェントから会社の情報が蓄積された Google ドライブ上のファイルへアクセスして会社の象徴的なイメージやスタイルを回答させた上で、Imagen がそれらをインプットに画像を生成するデモが行われました。

また、上記に加え、前述した Text-to-Live Image による Live Image を生成するデモも行われました。

本デモは Youtube にて公開されている基調講演の動画の 1:27:21 あたりより参照できますので、興味のある方はご覧ください。

画像の生成に加えて、様々な Google Workspace との連携をエージェントが API 経由で実現できる点が強くアピールされた印象でした。

⑦Data Agents

AI がデータアナリストのように振る舞い、企業のデータを使った意思決定をサポートするための機能がいくつかの事例と共に発表されました。

Gemini in BigQuery

BigQuery にて Gemini と連携してデータの準備から検出・分析・ガバナンスを支援する機能が提供されるようになると発表されました。具体的な機能については、後述します。

BigQuery Data Canvas

Gemini in BigQery に付属する機能として、自然言語サポートと Embedding Visualization を備えた新しいノートブックのようなエクスペリエンスを提供する BigQuery Data Canvas が発表されました。

Vertex Indexing in BigQuery and AlloyDB

BigQuery と AlloyDB 上に保管するベクトルインデックスに対して直接クエリを実行できる機能として、 Vertex Indexing in BigQuery and AlloyDB が発表されました。より迅速に正確な応答が可能になるとのことです。

Direct Access to Vertex AI from BigQuery

BigQuery から Vertex AI のモデルへ直接アクセスできる機能として、 Direct Access to Vertex AI from BigQuery が発表されました。

Gemini in Looker

Looker と Gemini が連携する機能として Gemini in Looker が発表されました。Looker 上で閲覧できるデータを踏まえたチャットができる機能や Google Workspace と連携する機能が提供されるようになるとのことです。

蓄積されたデータに基づいた回答を行うチャットデモ

サンプルアプリケーション上のチャットから質問を受けたエージェントが Looker のセマンティックレイヤを使用して、必要なデータの検索を行い、テキストやグラフを用いた回答を行うデモが行われました。単純なデータの検索だけではなく、データ間の相関関係や今後の売上予測などの質問に対して回答することができ、1 人のデータアナリストとしての役割を果たしているように感じました。

本デモは Youtube にて公開されている基調講演の動画の 1:39:20 あたりより参照できますので、興味のある方はご覧ください。

⑧Code Agents

アプリケーションを開発するエンジニアの生産性を高める支援をするための機能が発表されました。

Gemini Code Assist

Duet AI for Developer の進化版にあたる機能として、Gemini Code Assist が発表されました。

コードへの新機能の追加、ファイル間の依存関係の修正、バージョンアップグレードの支援、包括的なコードレビューなど、これまでに比べて大規模な変更が可能になるとのこと。

また、プライベートに蓄積されたコードベースから Gemini Code Assist を調整して、プライベートなコンテキストを踏まえた支援が可能になるとのことです。さらに GitLab、GitHub、Bitbucket を含む複数のソースコードリポジトリに Gemini Code Assist がアクセスできるようになる予定です。

さらに本機能の紹介に併せて、大規模なアプリケーションの機能追加を Gemini Code Assist によってコードを生成するデモが行われました。

本デモは Youtube にて公開されている基調講演の動画の 1:48:53 あたりより参照できますので、興味のある方はご覧ください。

⑨Security Agents

最後に生成 AI によってセキュリティを高めるための機能が発表されました。

Gemini in Threat Intelligence

Mandient が持つセキュリティに関する脅威の知見や脅威アクターに関する情報を踏まえたチャット機能が提供されます。また、Gemini の大きなコンテキストウィンドウを活用し、モジュール間の作用を含めた大規模なコードの分析を行い、潜在的な問題がないか分析することが可能となるようです。

Gemini in Security Operations

チャットを通じて、セキュリティインシデントといった問題の内容を要約して、問題を対処するために推奨されるアクションを提案したり、プレイブックを作成して実行することができる機能とのことです。

Gemini in Security Command Center

セキュリティチームのインシデントの調査結果の評価や攻撃パスの要約を行い、潜在的な脆弱性を突いた攻撃に対処するための推奨事項を提供するセキュリティを高める機能があります。

まとめと感想

Google Cloud Next ‘24 1 日目午前中に開催された基調講演の速報情報を紹介しました。

昨年に引き続き生成 AI を中心としたアップデートが中心で、あらためて Google Cloud が生成 AI に非常に力を入れている姿勢を本講演を通じて感じました。

本セッション含めてイベントでのアップデート情報のキャッチアップを行い、多くのお客様にお届けできるよう努めたいと思います。

※Google Cloud、Google Workspace、Vertex AI、Gemini 、BigQuery、GKE、Google Chat、YouTube、Looker、Duet AI は Google LLC の商標です。

① Google CEO とGoogle Cloud CEO の挨拶

② AI Hypercomputer

③ Vertex AI

④ Customer Agents