【速報】Google I/O 2026！AIエージェント時代に向けた主要発表を整理

※この記事は迅速な情報提供を重視し、速報として掲載しております。もし記事内に誤りがございましたら、後日訂正いたします。

こんにちは。クラウドエースのラリオスです。

先月の「Google Cloud Next ’26」の興奮も冷めやらぬ中、ついに今年も「Google I/O 2026」が開催されました。米国マウンテンビューのショアラインの会場は、世界中からの熱気に包まれていました。

https://io.google/2026/

この1年を振り返ると、AIの進化と実装がこれまで以上の速さで進んだ期間だったと感じます。

基調講演の冒頭でスンダー・ピチャイ（Sundar Pichai）CEOも、この流れを”Hyper Progress”と表現し、Googleがこの変化の中で手応えを深めていることを語っていました。

Googleが「AI first（AI最優先）」の企業へと舵を切ってから、今年でちょうど10年。私たちが普段何気なく使っている検索やアプリの裏側では、非常に大きな変化が起きています。

例えば、Googleのサービス全体で処理されるデータの基本単位（トークン）は、なんと毎月0.32京トークンという、驚くべき規模にまで膨れ上がっているそうです。また、13もの巨大な製品群が、Geminiをベースに新しい体験へと変わりつつあります。

日常の検索から、スマホでの体験、そして仕事の進め方まで、今回の発表は私たちの生活にどのような変化をもたらすのでしょうか。当日の具体的なデモや発表内容をじっくり紐解いていきたいと思います。

桁違いにスケールするGoogle AIの現在地

基調講演の冒頭でピチャイ氏は、まず現在のGoogleが誇るAIの圧倒的な処理規模について、具体的な数値を交えて説明しました。

Googleのサービス全体で処理されるデータの基本単位であるトークンの数は、2年前は月間9.7兆トークンでしたが、昨年のGoogle I/Oでは約480兆トークンに成長し、現在はなんと月間3,200兆トークン（0.32京トークン）にまで達しているそうです。

この桁違いの需要を支えるように、毎月850万人以上の開発者がGoogleのモデルを使って新しいアプリや体験を構築しており、モデルAPIは過去12ヶ月で毎分約190億トークンを処理しています。さらに、1兆トークン以上を処理する大口の顧客は375社を超えているとのことです。

さらに、製品ごとの成長も目を見張るものがあります。Googleでは現在、10億人以上のユーザーを抱える製品が13個あり、そのうち5つの製品はなんと30億人以上のユーザーに使われています。
中でも検索に導入された「AI Overview」は月間25億人以上のユーザーに利用されており、昨年登場して検索体験を大きく変えた「AI Mode」は、わずか1年で月間10億ユーザーを突破しました。ユーザーは単発の検索ではなく、まるで会話を続けるように深く情報を探索するようになっているそうです。

また、Geminiアプリの月間アクティブユーザー数は、昨年の4億人から現在は9億人を突破し、わずか1年で2倍以上に増えました。一日あたりのリクエスト数は7倍以上に成長しており、アプリ内の画像生成機能ではこれまでに500億枚以上の画像が作られてきた実績が明かされました。

そして、日常の身近なアプリも進化しています。最近ではGoogleマップに「Ask Maps」という新機能が追加され、より複雑で長い質問ができるようになりました。デモでは「子供がアヒルの池に落ちてしまい、30分後に結婚式が始まる。歩いて行って新しいドレスを買える場所はどこ？」という切実な質問に対して、的確な場所を案内するシーンが紹介され、AIが日常の困りごとに深く寄り添い始めている様子が伝わってきました。

日常をさらに便利にする新機能「Ask YouTube」と「Docs Live」

続いてピチャイ氏は、会話型AIの技術をさらに2つの製品に広げることを発表しました。

Ask YouTube──動画の中から最適な場面へジャンプ

例えば「バランスバイク（キックバイク）に乗れる3歳の子に、ペダルバイクの乗り方を教えたい」と質問すると、AIが情報を分かりやすく要約し、動画内の最も関連性の高い場面へピンポイントでジャンプさせてくれます。

さらに「ハンドブレーキとペダルブレーキのどちらを買うべき？」といった追加の質問にも文脈を保ったまま答えてくれ、情報を分かりやすい比較表にして提示してくれます。
この機能は現在テストが始まっており、今夏に米国で広く展開される予定です。

Docs Live──声のスピードでドキュメントを仕上げる

2つ目は、声のスピードで作業をこなせる音声機能「Docs Live」です。これまでは、Geminiにドキュメント作成を頼むときもテキストで指示する場面が中心でしたが、Docs Liveでは、頭に浮かんだアイデアを声でそのまま話すだけで、Geminiが残りの作業を進めてくれます。

製品チームによるリアルタイムのデモでは、翌日高校の進路講演会で話をするソフトウェアエンジニアの登壇者が、Docs Liveを使ってスピーチの骨子を作る様子が実演されました。

登壇者が「Googleドライブから自分の履歴書を引っ張ってきて。でも退屈にならないように面白い比喩を交えてほしい」「学校から届いた案内メールから詳細を掴んで、時間や場所をドキュメントのトップに置いて」「比喩は表形式にして、兄から刺激を受けたエピソードを上部に太字で追加して」と、次々に口頭で注文をつけます。

Geminiは音声の指示を受け取りながら、ドキュメントの内容や構成をその場で更新していきました。このDocs Liveは、今夏にProおよびUltraのサブスクライバー向けにロールアウトされ、将来的にはGmailやGoogle Keepにも導入される計画です。

1,850億ドル規模のインフラ投資と、第8世代TPUの圧倒的なパフォーマンス

これらの高度なAI機能を世界中で安全かつ安定して稼働させるため、Googleはインフラストラクチャに対して巨額の投資を続けています。

6倍規模に膨らむ設備投資

2022年の年間設備投資額（CapEx）は約310億〜320億ドルでしたが、今年は約6倍の規模となる約1,750億〜1,850億ドルに達する見込みであることが公表されました。

この投資の中核をなすのが、Google独自のカスタムシリコンであるTPU（テンサープロセッシングユニット）です。先日の「Google Cloud Next ’26」で発表された第8世代TPUは、トレーニング用の「TPU 8t」と推論用の「TPU 8i」という、それぞれ専用のアーキテクチャを持つデュアルチップアプローチが採用されています。

トレーニング用「TPU 8t」──前世代比3倍の計算能力

大型モデルの事前トレーニングに最適化されたTPU 8tは、前世代の約3倍という圧倒的な計算能力を誇ります。

さらに「JAX」や「Pathways」といったGoogle独自のインフラ技術により、単一の大規模データセンターの限界に縛られることなく、複数のデータセンターにまたがって、100万以上のTPUを1つの学習クラスターのように扱えるようになりました。これにより、これまでは数ヶ月かかっていた巨大なモデルの構築を、わずか数週間へと短縮することに成功しているそうです。

推論用「TPU 8i」──毎秒1,500トークンの驚異的な速度

一方、推論に特化したTPU 8iは、ユーザーへのレイテンシを徹底的に突き詰めて設計されています。

ステージ上では、開発中の次期フラッシュモデルをTPU 8i上で動かし、定番の「Chrome Dino風ゲーム」をゼロからコード生成させるリアルタイムデモが行われました。指示を入力して実行ボタンを押した瞬間、画面右上には毎秒約 1,500トークンという驚異的な生成速度が表示され、またたく間にプレイ可能なゲームが完成しました。要求をテキストで書き終えるよりも速いスピードでゲームが立ち上がる様子からは、新しいチップがもたらす圧倒的な快適さが如実に伝わってきました。

また、性能の向上だけでなく、サステナビリティへの配慮も忘れていません。どちらのチップもエネルギー効率が大幅に向上しており、ワットあたり最大2倍のパフォーマンス向上（performance-per-watt）を達成しているとのことです。

ここで重要なのは、Googleが単に高性能なモデルだけを競っているわけではないという点です。ピチャイ氏は、GoogleのAI戦略を「フルスタックでのAIイノベーション」と表現しました。TPUのようなカスタムシリコン、セキュアなインフラ、DeepMindの研究とGeminiモデル、そして検索や Workspace、Androidなど数十億人が使う製品までを一気通貫で持っていることが、Googleの大きな強みになっています。

世界をシミュレートする「Gemini Omni」がもたらす映像表現の地平線

インフラの進化に続いて登壇したのは、Google DeepMindを率いるデミス・ハサビス（Demis Hassabis）氏です。

デミス氏は、AIが単にテキストを予測する段階から、私たちの代わりに計画を立てて行動する「エージェント」の段階へと大きく躍進している現状を語りました。さらに、今回の発表が人間の知能に匹敵する「AGI（人工汎用知能）」に向けた重要なステップであることを示しました。

そのAGIに向けた重要なステップとして紹介されたのが、現実世界を理解し擬似的に再現する「世界モデル（World Model）」という概念です。これは、次世代のAIアシスタントの開発やロボットの訓練において、極めて重要な土台になります。

そして今回、あらゆる入力から新しい表現を生み出すことを目指す新しいモデルファミリー「Gemini Omni」が発表されました。まずは動画生成から始まり、Geminiの知性と、Veo、Genie、Nano Bananaなどの生成メディアモデルの技術を組み合わせることで、世界理解、マルチモーダル性、対話的な編集能力を大きく高めるものだと説明されました。

クレイアニメから現実の加工まで、物理法則を再現する生成力

Gemini Omniの最大の特徴は、運動エネルギーや重力、流体力学といった「直感的な物理法則」をよりよく理解し、リアルな映像生成につなげる点にあります。これまでのAIシステムでは表現が難しかった、リアルな物体の動きや変化を映像として描き出すことができるようになりました。

ステージ上では、非常に興味深いデモが紹介されました。例えば「タンパク質の折りたたみの仕組みを説明するクレイアニメを作って」というシンプルな指示を出すと、アミノ酸の鎖がアルファヘリックスやベータシートといった構造へと立体的に折りたたまれていく複雑な科学のプロセスが、まるで本物の粘土細工のコマ撮りアニメーションのような美しい映像として生成されました。高度な世界知識と推論能力が備わっているからこそ、これほど正確で分かりやすい映像が作れるのだと感じます。

さらに、クリエイティブな作業は一度の指示だけで終わることはありません。Gemini Omniでは、対話的な言葉を使って、生成された映像を何度も自然に編集していくことができます。

また、自分が撮影したオリジナルの動画をアップロードして、その内容をベースに新しい現実を付け加えることも可能です。デモビデオでは、アーティストのSasha（サーシャ）氏が自身の自撮り動画と参考となるビジュアルを読み込ませ、カメラの角度を360度に切り替えたり、周囲の環境やスタイルを全く新しい世界観へとモーフィング（変形）させたりする様子が実演されました。人物の動きの物理的な特徴やソウル（魂）を損なうことなく、背景に美しいエフェクトが違和感なくレイヤーされていく描写は、映像制作のプロセスを大きく変える可能性を感じさせます。

Gemini Omniは、まず動画生成からスタートしますが、将来的にはさまざまな入力をもとに、より幅広い形式の出力へ広げていくことを目指しています。その第一歩として、軽量で高速な「Gemini Omni Flash」が、GeminiアプリやGoogle Flowなどで提供開始されました。APIの提供も今後予定されており、より高性能な「Omni Pro」についても、後日詳細が明らかにされる見込みです。

AI時代の信頼性を担保するウォーターマーク技術の拡大

デミス氏の発表の後、再びステージに戻ったピチャイ氏は、生成AIの技術が進化する一方で、情報の透明性を確保することがこれまで以上に重要になっていると語りました。

調査によると、精巧に作られたディープフェイク動画を人間が正しく見分けられる確率は、わずか4分の1程度にとどまるそうです。こうした課題に対し、Googleは3年前に人間の目には見えないデジタルウォーターマーク技術である「SynthID」を立ち上げました。これまでに1,000億以上の画像や動画、そして60,000年分に相当する音声にウォーターマークを適用してきた実績が明かされました。

さらに今回は、情報の出所を検証する「Content Credentials（コンテンツ認証情報）」の仕組みを各種製品へ導入していくことが発表されました。これにより、コンテンツの出所がカメラで撮影されたものか、あるいはAIで生成されたものか、さらに生成AIツールによる編集が加えられたかどうかが一目で分かるようになります。デモでは、Pixelカメラで撮影され、Googleフォトで編集されたという具体的な履歴が画面に示されました。

この検証機能の展開スケジュールも明かされました。SynthIDの検証機能はGoogle検索に本日から、Chromeには今後数週間で拡大されます。また、Content CredentialsもGeminiアプリから導入が始まり、今後数か月で検索やChromeにも広がる予定です。

ピチャイ氏は、こうした取り組みは業界全体の協力があって初めて効果を発揮すると指摘しました。昨年提携したNVIDIAに続き、新たにOpenAI、Kakao、ElevenLabsがSynthIDの採用に同意したことが発表され、業界横断の連携による透明性の標準化が進んでいることが示されました。

圧倒的なスピードと実用性を備えた最新モデル「Gemini 3.5 Flash」

続いて発表されたのが、最新のモデルシリーズの第一弾となる「Gemini 3.5 Flash」です。

前世代上位モデルを超えるベンチマーク性能

数ヶ月前にローンチされたGemini3ファミリーは多くの開発者に受け入れられてきましたが、Googleはさらにタスクの実行力や現実のワークフローへの適応力を高めるための改良を続けてきました。Gemini 3.5 Flashは、前世代の上位モデルである「Gemini 3.1 Pro」と比較しても、ほぼすべての性能評価指標（ベンチマーク）で向上を記録しているそうです。特にコーディング能力の進化が著しく、実際の業務において経済的価値の高いタスクを評価するベンチマーク「GDP Val」では、非常に大きな性能の跳ね上がりを示しました。

他社比4倍の処理スピード

また、知性の高さだけでなく、圧倒的な処理スピードを兼ね備えている点も大きな特徴です。他の主要なフロンティアモデルと比較した場合、出力スピードは4倍に達し、ピチャイ氏は「全く異なる次元の快適さ（in a whole league of its own）」と表現しました。

Antigravityでの活用で加速するトークン処理量

この優れた処理能力とコスト効率は、すでにGoogleの社内開発において大きな成果を上げています。Googleでは、開発者向けのシステムである「Antigravity」に Gemini 3.5 Flashを組み込んで活用しています。

社内でのトークン処理数は、今年3月時点では1日あたり0.5兆トークンでしたが、わずか数週間のうちに倍増を繰り返し、現在は1日あたり3兆トークンを超える規模に達しているそうです。
この強力な改善サイクルを経て磨かれたGemini 3.5 Flashは、本日より各種製品やAPIを通じてすべてのユーザーに提供が開始されます。また、上位モデルである「Gemini 3.5 Pro」についても社内でのテストで素晴らしい成果が出ており、来月には提供が開始される予定であることが公表されました。

エージェントファーストへ進化した「Antigravity 2.0」

続いて、開発チームのヴァルン（Varun）氏が登壇し、Gemini 3.5 Flashのパワーを最大限に引き出す開発者向けのアップデートを紹介しました。

昨年11月にローンチされたAntigravityは、すでに世界中の多くの開発者に利用されています。今回はそのエコシステムを大きく拡張し、フルCLI体験やAntigravity SDK、ライブ音声入力に対応したネイティブな音声サポートのほか、Android、Firebase、Google AI Studioとの統合が本日より提供されることが発表されました。

正式に独立したスタンドアロンデスクトップアプリケーションとして提供される「Antigravity 2.0」は、その設計思想から大きく変わっています。「エージェントファースト」を掲げて全面的に再設計された画面は、エージェントとの会話、エージェントが生成した成果物（アーティファクト）、そして複数のエージェントを連携させるマルチエージェントオーケストレーションに特化した構成になっています。

さらに、エージェントが現実世界のタスクを自律的にこなすための基本的な構成要素として、新たに「サブエージェント（subagents）」「フック（hooks）」「非同期タスク管理（asynchronous task management）」といった強力な枠組みが導入されました。

デモが示した可能性｜自律エージェントによるOS構築とバグ修正

ステージ上では、この自律エージェントとGemini 3.5 Flashの組み合わせがどれほどの可能性を持つのか、非常に難易度の高い実験的なプロジェクトの成果が実演されました。

93のサブエージェントが並列稼働してOSを自律構築

それは、何も入っていない空のプロジェクトから、動作する「OS（オペレーティングシステム）」の中核をゼロから自律的に構築するという試みです。

結果は驚くべきものでした。Antigravityのエージェントは、与えられた課題を自律的に分析して一連の計画に分解し、約12時間の作業のなかで93のサブエージェントが並列に動き、15,000回以上のモデルリクエストと26億トークンを処理することで、OSの中核機能を構築したと説明されました。しかも、Gemini 3.5 Flashの優れたコスト効率により、これだけの処理を行いながら消費されたAPIクレジットは1,000ドル未満に抑えられたことが明かされました。

そして、ヴァルン氏は、実際にエージェントが構築したOSのターミナル画面を立ち上げる実演を行いました。コマンドを入力すると、Antigravityのロゴをあしらった蒸気機関車が画面を通り抜ける、遊び心のあるユーティリティ「sl」が正常に動作しました。

対話型パネルでリアルタイムにバグを修正

続けて名作ゲーム「Doom」を起動しようとすると、必要なキーボードドライバーが足りずにエラーになってしまいます。

ここでヴァルン氏は、Antigravity 2.0の対話型パネルを使い、エージェントへ不足しているドライバーの追加と修正を指示しました。エージェントは自動的に必要なリサーチを行い、必要なコードを生成してシステムを修正しました。

再びターミナルで実行コマンドを入力すると、見事にゲームが滑らかに起動し、自律的に構築されたOSの上で本当にプレイできる様子が示され、会場からは大きな拍手が沸き起こりました。
このサブエージェントチームワーク機能は、まずは早期リサーチプレビューとして提供されます。さらに、Antigravityの環境内では、Gemini 3.5 Flashが通常比で12倍にまで高速化される特別な最適化が施されていることも明かされました。新しいAntigravity 2.0は、本日より全世界で提供が開始されます。

企業のコストを劇的に抑える「Gemini 3.5 Flash」の経済価値

ヴァルン氏による驚異的なデモを受けて、再びマイクを握ったピチャイ氏は、Gemini 3.5 Flashがもたらす圧倒的なコストパフォーマンスについて、具体的な試算を交えて説明しました。

Gemini 3.5 Flashは、最先端モデルに匹敵する高い性能を提供しながら、価格は同等の他社モデルの半分未満に抑えられています。ピチャイ氏は、多くの企業がAI予算の逼迫に悩まされている現状に触れ、Gemini 3.5 Flashを賢く組み合わせることで、巨額のコスト削減が可能になると語りました。

例えば、Google Cloudを利用するトップ企業では、現在1日あたり約1兆トークンものデータを処理しています。もし、これらの企業がワークロード（業務負荷）の80%を、Gemini 3.5 Flashと上位の最先端モデルを組み合わせた構成へ移行した場合、なんと年間で10億ドル（約1,500億円）以上のコストを節約できる計算になるそうです。企業にとって、これほど大きな原資を別の成長投資に回せる意味は極めて大きいと言えます。

本日より各種製品やAPIを通じて提供が始まっているGemini 3.5 Flashに加え、さらに上位モデルである「Gemini 3.5 Pro」も社内で素晴らしい進化を遂げており、来月にはユーザーの元へ届けられる予定であることが改めて強調されました。

24時間バックグラウンドで働く個人用AIエージェント「Gemini Spark」

そして、今回の基調講演におけるもう一つの大きな柱として発表されたのが、個人向けAIエージェントの「Gemini Spark」です。

Gemini Sparkは、これまでの「質問に答えるチャットAI」とは異なり、ユーザーの指示と管理のもとで、デジタルライフにおける複雑なタスクを自律的に実行してくれるパーソナルAIエージェントです。Google Cloud上の専用のバーチャルマシン（仮想マシン）で駆動するため、24時間365日、バックグラウンドで常に働き続けてくれます。指示を出した後は、パソコンの画面を閉じてもタスクが止まることはありません。

Gemini 3.5とAntigravityのハーネス（連携機構）によって支えられているGemini Sparkは、まずはGoogle自身の各種ツールと深く統合され、今後数週間から今夏にかけて、「MCP」という共通の仕組みを通じてサードパーティのツールとも接続できるようになる予定です。

複数アプリをまたいで自律駆動する、驚きのバックグラウンドデモ

ここからは、プロダクトチームのジョッシュ（Josh）氏が登壇し、完全にデザインが刷新されたGeminiアプリの画面から、Gemini Sparkが実際にタスクをこなす様子を実演しました。ジョッシュ氏のパソコン画面に表示されたGemini Sparkのダッシュボードには、現在バックグラウンドで進行している複数のタスクが一覧（リスト）で並んでいます。

仕事向けタスク──メール下書きを自律生成

デモでは、まず仕事向けのタスクとして「チーム宛てに、先週のGemini Liveのローンチ成果をまとめたメールの下書きを作って。私の文体を真似るゴーストライター（/ghostwriter）スキルを使って」と指示を出しました。Gemini Sparkは即座に、Googleドキュメントやメール、チャットをまたいで情報を収集し、ツールを呼び出し始めました。

続いて、プライベートの複雑なタスクとして「町内会の交流イベントの計画」を依頼します。指示の内容は「招待状の返信をまとめ、誰が何を持ってくるかのリストを作り、まだサインアップしていない隣人にはリマインダーのメールを送って」という、手作業では非常に手間のかかるタスクです。

Gemini Sparkは、ステップバイステップ（段階的）で自律的にタスクを分解して実行していきました。画面上には、自動生成されたGoogleスプレッドシートの「ライブRSVPトラッカー」が表示されます。これはGmailと直接連動しているため、隣人のエル・トンプソン（El Thompson）氏から出席の返信メールが届くと、シートのステータスがリアルタイムで自動的に「確定」へと更新されました。

さらに、案内用のプレゼン資料をGoogleスライドで自動作成するだけでなく、Googleドライブ内に保存されていた地域の自治会の規約ファイルを自律的に読み込み、「金曜日の午後までは機材の設営が禁止されている」という見落としがちなルールを自動で検出して、資料内に注意書きとして反映させる賢さも見せました。

スマホでの音声一括指示と、今後の展開・新料金プラン

スマホから3つのタスクを音声で一気に依頼

Gemini Sparkの実力は、外出先のスマートフォンからでも発揮されます。ジョッシュ氏は、スマホの画面に向かって、頭に浮かんだ3つの異なるタスクを音声で一気に投げかけました。

「スンダー氏との今後のミーティングをすべて見つけて、見落とさないようにホットピンクに変えて」「昨夜会った新しい隣人のジョンの家族に、町内会の交流イベントの招待メールを書いて」「妻と私のために、子供たちの学期末までにやるべきことのリストを締め切りと優先度順にまとめたドキュメントを作って」これほどバラバラで複雑な指示であっても、Gemini Sparkは音声のスピードのまま文脈を捉え、裏側で個別のタスクへと自動的に分解しました。ユーザーは指示を出した瞬間、スマホをポケットにしまって自分の日常に戻ることができます。

展開スケジュールと新料金プラン

この新しいタイプのサポートをいち早く届けるため、Googleは今週から信頼できるテスター向けに展開を開始し、来週には米国の「Google AI Ultra」サブスクライバー（有料会員）向けにベータ版を導入することを発表しました。

これに伴い、月額100ドルの新しいUltraプランが新設されるほか、最上位のUltraプランの価格が、月額250ドルから200ドルへと値下げされることも公表されました。

また、Google Workspaceのビジネス顧客向けにはGeminiアプリ内でSparkのプレビュー提供が予定されており、Gemini Enterpriseアプリでも顧客向けに順次展開される予定です。さらに今夏後半には、Gemini SparkがChromeブラウザ内でも直接動作するようになり、Web上のタスクを私たちの代わりにこなすエージェントとして機能するようになります。

正式な提供時期は今年後半となりますが、スマートフォン上でこれらのエージェントの専用のホームベースとなる新機能「Android Halo（アンドロイド・ハロ）」が導入されるロードマップも明かされ、会場は大きな興奮に包まれました。

「検索は徹頭徹尾、AI検索へ」｜インテリジェンス検索ボックスの誕生

Gemini Sparkの熱狂に続き、Google Searchを率いるリズ・リード（Liz Reid）氏が登壇し、Googleの核である検索の未来について語りました。

現在、月間ユーザー数が10億人を突破している「AI Mode」は、本日よりGemini 3.5 Flashをデフォルトモデルとして利用するようになります。ユーザーの検索行動は単発の調べものから、詳細で具体的な条件を伴う会話型へと変化しており、AI Modeのクエリ数は四半期ごとに倍増するほどの急成長を遂げているそうです。

この変化に対応するため、Googleは検索窓そのものをAIによって完全に再設計した「インテリジェンス検索ボックス（Intelligent Search Box）」を発表しました。新しい検索ボックスは、ユーザーが文字を入力し始めると、単純な予測変換を超えて、AI が質問のニュアンスを補完するような洗練されたサジェストを提示してくれます。テキストだけでなく、画像、ファイル、動画などさまざまな形式を組み合わせたマルチモーダルな質問をこの一つの窓から投げかけることが可能です。

アイコンである検索窓のデビュー以来、極めて大きなアップグレードとなるこのインテリジェンス検索ボックスは、AI Modeが利用できる国と言語を対象に、本日より順次展開が開始されます。あわせて、AI OverviewsからAI Modeへ自然に移り、調べものの文脈を保ったまま追加の質問を続けられるシームレスな体験も発表され、本日よりデスクトップおよびモバイルの双方で世界中へ展開が始まります。

バックグラウンドで情報を監視する「検索エージェント」

リズ氏はさらに、検索のなかに自律型エージェントの仕組みを取り入れた「検索エージェント」を、今夏よりまずGoogle AI ProユーザーおよびUltra加入者向けに導入することを明らかにしました。

これは、ユーザーが指定した複雑な条件の調査タスクを、AIがバックグラウンドで24時間365日にわたり継続して実行してくれる機能です。デモでは、バイオテクノロジー関連の株式において、キャッシュフローや負債に関する特定の条件を設定する様子が紹介されました。検索エージェントはリアルタイムの金融データと接続し、市場が動いた瞬間に要約されたインテリジェントな通知をユーザーに届けます。この通知には、信頼できるニュースサイトやソーシャルメディア、検証済みのリサーチプラットフォームへのハイパーリンクも添えられており、情報の出所に素早くアクセスできるよう配慮されています。

質問に合わせて画面をその場でコード生成する「Generative UI」

続いて登壇した検索チームのロビー（Robbie）氏は、Gemini 3.5 FlashとAntigravityのエージェント型コーディング技術を検索へ直接組み込んだ、「Generative UI」のデモを実演しました。

これは、ユーザーが投げかけた複雑な質問に対し、AIが最適な回答フォーマット（レイアウトや双方向の部品など）をその場でゼロからコード生成し、安全なコンテナ環境で即座に実行・表示する技術です。

宇宙物理学を学ぶ大学生を想定したデモでは、まず「ブラックホールは時空にどう影響を与えるか」と検索すると、視覚的に理解を助けるインタラクティブな解説画面がその場で構築されました。さらに続けて「二つのブラックホールが互いの周りを回るバイナリブラックホールが、どのように重力波を生み出すか見せて」と追加で質問を重ねます。

すると検索画面のなかに、軌道離隔（orbital separation）や質量比（mass ratio）といったパラメーターをユーザー自身が手動で調整できる、独自の「インタラクティブビジュアル（双方向のシミュレーター部品）」がリアルタイムにコード生成されて出現しました。ユーザーがパラメーターを操作すると、波のパターンが変化し、小さなブラックホールが大きなブラックホールへ吸い込まれていく様子がリアルタイムに計算されて画面上でアニメーション描画されます。画面下部には、より深い学習へ進むための「LIGO（ライゴ）の発見論文」への直接のリンクなども提示されていました。

このAntigravityの技術を活用したGenerative UIは、今夏より検索を通じてすべてのユーザーに無料で提供される予定です。

ツールやカレンダーと連動する「週末プランナー」ミニアプリの動的構築

ロビー氏はさらに、単発の質問を超えて、ユーザーが何度も再利用できる継続的な管理ツール（ミニアプリやダッシュボード）を検索のなかで丸ごと構築するデモを行いました。

実演されたのは、毎週木曜日になると頭を悩ませるという「週末の家族の予定表（weekend planner）」の構築です。検索エージェントへ予定の作成を指示すると、検索画面の裏側でAIがどのようなコンポーネント（表示部品）を組み立てるべきか思考するステップがリアルタイムに表示され、数秒で美しい専用のスケジュール管理画面のコードが生成されました。

この機能は、ユーザーの許可のもとでGmail、Googleフォト、Googleカレンダーと安全に接続されており、個人に最適化されたサジェストを行います。「2人の子供が動物好きであること」や「上の子がチェスを習い始めていること」といった家族の文脈（パーソナルインテリジェンス）を自動で汲み取り、おすすめの動物園やイベントをカレンダーの空き時間や移動時間、天気予報を考慮して綺麗に配置してくれます。

ロビー氏が口頭で「金曜日の夜にデートナイトの予定を追加して、マップの表示を一番上へ移動させて」と画面に指示を与えると、またたく間に画面のレイアウトとスケジュールが書き換わり、金曜日の夜のタブや最適なレストランのサジェスト、保存されたマップが最上部に再構成されました。

完成した予定表アプリは、リンクを通じて妻のダニエル（Danielle）氏のスマートフォンへ簡単に共有でき、承認を得たスケジュールはワンクリックで家族全員のGoogleカレンダーへ自動で一括登録されました。

この永続的なカスタム体験を構築できる機能は、米国のGoogleAI ProユーザーおよびUltra加入者向けに、今夏より今後数ヶ月をかけて順次展開される予定であることが公表されました。

エージェントeコマースを支えるUCP、AP2、Universal Cart

リズ・リード氏に続いて登壇したのは、Ads＆Commerce領域の責任者であるヴィディア（Vidya）氏です。現在、Google上では毎日10億回以上のショッピングが日常的に行われています。その基盤となっているのが、世界で最も包括的な商品カタログである「Shopping Graph（ショッピンググラフ）」です。ここには現在、常に更新され続ける600億以上の商品情報が登録されています。

ヴィディア氏は、この膨大なデータベースと先進的なGeminiモデルを組み合わせることで実現する、新しい「エージェントeコマース」の世界について説明しました。AIエージェントが私たちの代わりに安全に、そして賢く買い物ができる未来に向けて、Googleは3つの重要な構成要素を提示しました。

Universal Commerce Protocol（UCP）──eコマースの共通言語

1つ目は、エージェントやシステムの間で共通の言語となるオープンソースの標準規格「Universal Commerce Protocol（UCP、ユニバーサルコマースプロトコル）」です。これは、ウェブにおける「HTTP」のような役割を果たすもので、商品の調査から決済、配送や購入後の体験に至るまでをシームレスにつなぎます。

すでにAmazon、Meta、Microsoft、Salesforce、Stripeといった業界の主要企業がこのオープン標準の推進に参画しており、今後はホテル予約やローカルのフードデリバリー、YouTubeなどの製品にも拡大されます。また、今後数ヶ月以内にはカナダ、オーストラリア、英国などの地域にもこのプロトコルを活用した体験が広がる予定です。

Agent Payments Protocol（AP2）──エージェントによる安全な決済代行

2つ目は、ユーザーの管理のもとでエージェントが安全に決済を代行するための仕組み「Agent Payments Protocol（AP2、エージェントペイメンツプロトコル）」です。

エージェントが勝手に高額な買い物をしないかという懸念に対し、AP2 では厳格なガードレールを設定できるようにしています。購入してよい特定のブランドや商品、予算の上限をあらかじめエージェントに指定しておくことで、条件を満たしたときのみ自動で購入が進みます。プライバシー保護技術や改ざん防止のデジタルマンデート（デジタルな記録）により、データや決済情報は強固に守られ、返品時にも加盟店と同じ記録を確認できる透明な仕組みが作られています。このAP2は、今後数ヶ月の間に、まずはGemini SparkからGoogle製品へ順次導入される予定です。

Universal Cart──複数サービスをまたぐインテリジェントな買い物かご

そして3つ目の構成要素として発表されたのが、Geminiモデルの推論能力を組み込んだインテリジェントな買い物かご「Universal Cart（ユニバーサルカート）」です。このカートは、特定のサイト内だけでなく、複数の加盟店やサービスをまたいで機能します。

ユーザーはGoogle検索で商品を探しているときも、Geminiとチャットしているときも、YouTubeの動画を見ているときも、Gmailでメールを確認しているときも、気になった商品をその場で Universal Cartに追加できます。追加された商品については、カートがバックグラウンドで価格や在庫の変化を追跡し、セール情報や値下がり、再入荷のタイミングを知らせてくれます。

さらに面白いのは、AIによって購入のトラブルを未然に防いでくれる点です。デモでは、初めて自作PCを組み立てるユーザーが、評価の高いマザーボードをカートに入れたケースが紹介されました。すでにプロセッサを選んでいたユーザーに対し、カートは「そのプロセッサを載せるには、ソケットの形状が異なる別のマザーボードが必要です」という不一致を自律的に検出し、最適な代替品を提案しました。

また、Google Payなどの機能を備えたGoogleウォレットと連動することで、ユーザーが所有している複数のクレジットカードの隠れた特典やポイント、割引などを自動で追跡し、最もお得になる特典を自動で適用してくれます。

決済時は、Google Payを使って数タップでGoogle上から直接購入を完了させることも、カートの内容をそのまま小売店のサイトへ転送して手続きを続けることも可能です。このUniversal Cart機能は、今夏よりまずは米国の検索およびGeminiアプリからロールアウトが開始され、その後にYouTubeやGmailへと続いていく計画が明かされました。

新デザイン「Neural Expressive」で生まれ変わるGeminiアプリ

eコマースに続くステージでは、Geminiアプリの劇的な進化が明かされました。現在、Geminiアプリの月間ユーザー数は9億人を突破しており、その成長を加速させるため、アプリの体験が根本から再設計されたことが発表されました。

今回導入されたのが、「Neural Expressive（ニューラルエクスプレッシブ）」と呼ばれる新しいデザイン言語です。流動的なアニメーションや鮮やかな色彩、新しいタイポグラフィ、あるいはアプリ全体に心地よい触覚フィードバック（ボタンを押したときの振動など）が取り入れられています。

Geminiの応答も、これまでのように長いテキストをそのまま表示するだけではなく、質問の内容に合わせて、画像やタイムライン、動画などを組み合わせた見やすい画面として表示されるようになります。ダークモードとライトモードのどちらにも対応し、より直感的に情報をたどれる体験へと進化しています。この新しいGeminiアプリは、Android、iOS、Web向けに、本日より世界中で順次展開が始まります。

さらに、リアルタイム音声会話機能である「Gemini Live」もアップデートされ、今後数ヶ月をかけて、さまざまな地域の方言やアクセントを選択できるようになるロードマップが示されました。

有料プラン向けの「Gemini Omni」統合と、朝の味方「The Daily Brief」

デザインの大刷新をベースに、米国のGoogle AI Plus、Pro、Ultraの加入者向けには、さらに強力な機能が本日から追加されます。

Gemini Omniのアプリ統合──あらゆる素材からクリエイティブ映像を生成

1つ目は、新モデル「Gemini Omni」のアプリへの統合です。テキスト、画像、動画のあらゆる組み合わせからクリエイティブな映像を直感的に作成・編集できるようになります。デモでは、アーティストが自撮り動画にエフェクトを滑らかに融合させ、人物の動きや物理的な特徴を損なわずに全く新しい映像へと仕上げていくプロセスが紹介されました。

The Daily Brief──朝のパーソナルダイジェストを自律生成

2つ目は、日々忙しい現代人のために新しく用意された自律型の機能「The Daily Brief（デイリーブリーフ）」です。朝一番にアプリを開くと、あなたの受信トレイ、カレンダー、タスクを自律的に横断し、その日の最も重要な情報を美しく整理したパーソナルダイジェストを生成してくれます。

単なるスケジュールの要約にとどまらず、旅行の予定やリマインダーなど、忘れがちなタスクをトピックごとに分類し、その場で次に取るべきアクションまでアシストしてくれます。このThe Daily Briefは、まずは米国の有料プラン向けに本日から展開が始まります。

macOS版アプリと音声機能の強化

さらにデモでは、先月リリースされたmacOS版の専用アプリについても、今夏に大きなアップデートが来ることが予告されました。

旅行の際に必要となる、ペットの犬のワクチンやアレルギーに関する複数の書類（PDFやインボイス画像など）をFinder上で選択し、ファンクションキーを長押しして口頭で指示を出すデモが行われました。「Louis CinnamonとHankという2匹の犬を今週の木曜日、いや金曜日から預けたい。彼らのアレルギーや最近のワクチン情報をインラインの表形式に整理して、メールの文章をフレンドリーにして」と話しかけるだけで、Geminiがマルチモーダルに中身を理解し、言い間違いを自動で修正しながら、瞬時に綺麗な表付きのメール文を再構成しました。こうした強力な音声機能やGemini Sparkへのアクセスが、今夏追加される予定です。

セクションの最後には、AIの可能性を形にした一例として、韓国からの移住者であるHolly（ホリー）氏の事例ビデオが紹介されました。ホリー氏は自身のレストラン運営でのGemini 活用をきっかけに、技術に不慣れな小規模ビジネスと求職者を繋ぐ雇用プラットフォーム「Work Onward（ワークオンワード）」を立ち上げました。ニューヨーク市で13,000人以上に利用されているこのプラットフォームの歩みは、AIが単なる便利な道具を超えて、人々の尊厳や社会課題に深く関わり始めている例として紹介されました。

表現の枠を超えるクリエイティブAI「Google Pics」と「Stitch」

アプリの大刷新に続き、クリエイティブ領域におけるアップデートが紹介されました。技術が人間の創造性を支えるキャンバスとなり、アイデアから形にするまでの距離を縮めるための進化です。

Google Pics──Workspaceに統合された画像作成・編集ツール

まず、Google Workspaceの新しいツールとして、画像作成・編集ツールの「Google Pics」が発表されました。パーティーのチラシやイラスト入りの解説資料を簡単に作れるツールです。画像の中のイラストや文字を個別のパーツとして扱えるため、特定の場所を消したり、大きさを変えたり、新しく文字を追加したりできます。

作成した画像には自動でSynthIDの透かしが入り、現在は一部のテスター向けに提供されています。今夏には米国の有料プラン（Google AI Pro/Ultra）の加入者や、ビジネス向けのユーザーに広く展開される予定です。

Stitch──ラフなアイデアからアプリ画面を即座にデザイン

次に、ラフなアイデアからアプリやウェブの画面設計ができるデザインツール「Stitch」のアップデートが発表されました。短い指示を一つ入力するだけで画面のデザインがその場で切り替わり、そこからさらに「見出しの文字を大きくして」「メニューのおすすめメニューを目立たせて」といった細かな要望を、音声やテキストを使ってリアルタイムに調整できます。

デザインが完成した後は、プログラム用のコードとして書き出したり、そのままウェブサイトを公開したりすることも可能です。この機能は、本日より世界中で提供が開始されます。

映像と音楽の制作を革新する「Google Flow」の進化

続いて、映像や音楽の制作を支援するプラットフォーム「Google Flow」および「Google Flow Music」の劇的な進化が明かされました。本日より「Gemini Omni」の統合や、新しいエージェント、カスタムツールの導入が行われます。

Google Flow──映像制作にGemini Omniとエージェントを統合

映像制作のデモでは、撮影した元の映像にGemini Omniを組み合わせ、人物の動きや演技をそのまま保ちながら、周囲の背景や映像エフェクトを全く別の世界観へと滑らかに変形させる様子が実演されました。

さらに新しく導入された「Flowエージェント」は、一度の指示で複数の作業を同時にこなします。デモでは、1枚の写真から最適なカメラアングルをAIが自動で分析し、16パターンの異なる動画を一瞬で作り出す効率性が示されました。自分だけの制作ツールを自作できる「Flow Tools」機能も追加され、本日より利用できます。

Flow Music──シンプルな演奏を本格的な楽曲へ

音楽制作をサポートする「Flow Music」でも、表現の幅がさらに広がりました。ステージでは、録音したシンプルなピアノの演奏をもとに「R&B調にして、女性ボーカルのイメージを追加して」と指示を出すデモが行われました。バンドの試作音源としてメンバーと共有し、次の録音の方向性を決めるのに十分なクオリティの楽曲がその場で生成されました。

これら Google Flow と Flow Music の新機能は、本日より米国の有料プラン（Google AI Pro/Ultra）の加入者向けに提供が始まります。

身につけるAIへ進化する「Android XR」とスマートグラス

eコマースやアプリの刷新に続き、ステージではAI技術を現実世界へと拡張するハードウェアの最新動向が紹介されました。XR・デバイス部門を率いるシャラム（Sharam）氏が登壇し、新しいプラットフォーム「Android XR」について説明しました。

Android XRは、GoogleがSamsungと共同で構築し、QualcommのSnapdragon向けに最適化したプラットフォームです。このハードウェアにGeminiを組み合わせることで、周囲の状況に合わせたサポートをハンズフリーで受けられるようになります。

表示付きグラス──視界の中にリアルタイム情報を表示

シャラム氏は、今後の展開として「表示付きグラス（Display glasses）」と「音声グラス（Audio glasses）」という2つのスマートグラスのアプローチを発表しました。

レンズ内に小さなディスプレイを備える表示付きグラスは、視界の中に配車の到着時刻を表示したり、旅行中にリアルタイムで翻訳を表示したりできます。こちらは今後のテスター向けプログラムの拡大が予定されています。

音声グラス──今秋登場、Gentle Monster・Warby Parkerとコラボ

一方、今秋に登場予定なのが音声グラスです。ディスプレイを持たず、Geminiによる音声サポートを耳元で受け取る設計になっています。スマートフォンをポケットから取り出すことなく、音楽の再生、写真や動画の撮影、通話、各種アプリの操作などをこなせます。

この音声グラスは、GoogleとSamsungの共同開発を軸に、Gentle MonsterやWarby Parkerといったアイウェアブランドのデザインによって進められています。製品は AndroidとiOSの双方のデバイスに対応する予定です。ステージにはSamsungのジェー・キム（Jae Kim）氏が登壇し、メガネとしての美しさとテクノロジーを融合させた最初のコレクションの映像を公開しました。

音声案内からアプリの代理注文までこなす実機デモ

続いて、シャラム氏とデモ担当のニシュタ（Nishtha）氏が実際にスマートグラスを着用し、ステージ上で実機デモを行いました。通常は耳元だけで聞こえるAIの音声を、デモのために会場のスピーカーに出力して実演が進められました。

ニシュタ氏が「先週ジアナと会った場所まで案内して」とメガネに話しかけると、カレンダーや位置情報の履歴から文脈を理解し、「先週のハイキングで行ったレッドウッドグローブ自然保護区へのルートを設定しました。途中でいつものナイトロコールドブリューを注文しますか？」と音声で提案を返します。

ニシュタ氏がこれに同意すると、ポケットに入ったスマートフォンの画面が自動で動き出し、デリバリーアプリの「DoorDash（ドアダッシュ）」をGeminiが自律的に操作し始めました。メニューの選択からオプションの指定までを自動で進め、最後はニシュタ氏が口頭で確認と承認の指示を出すことで、支払いの手続きまで完了させました。

さらに、通知をオフにしていたスマートフォンに届いていたメッセージの確認を求めると、「家族のグループチャットで、今日の19時に夕食を食べる計画が進んでいます」と要約して教えてくれます。そして、そのまま口頭で指示を出すだけで、カレンダーの予定表へ自動的に登録されました。

最後に、会場の観客をバックにした撮影デモが行われました。ニシュタ氏がスマートグラスに向かって写真を撮影し、AIによる画像加工の指示を出すと、内蔵カメラでシャッターが切られました。数秒後、ニシュタ氏が手元に付けたスマートウォッチの画面に、美しく加工された観客席の写真が同期されて表示され、会場から拍手が送られました。

デザイン、エンジニアリング、そしてAIエージェントの技術を融合させた最初のスマートグラスコレクションは、今秋に登場する予定です。

科学の進歩を加速させるAIシミュレーションとセキュリティの盾

基調講演の最後を締めくくるために再び登壇したのは、Google DeepMindのデミス・ハサビス（Demis Hassabis）氏です。デミス氏は、AI 技術がもたらす大きな可能性と同時に、安全性を確保する責任の重要性について語りました。

サイバーセキュリティ──脆弱性を自動検出・修正する「Code Mender」

まず紹介されたのが、サイバーセキュリティ領域における取り組みです。Googleは、開発したセキュリティエージェント「Code Mender」のAPIを、特定の専門家グループに向けてテスト提供し始めたことを発表しました。このツールは、ソフトウェアの深刻な脆弱性を自動的に発見し、修正することを目指しています。

科学研究支援──気象予測から創薬まで広がる「Gemini for Science」

続いて、科学研究の現場を強力に支援する「Gemini for Science」が発表されました。大量の論文の把握や研究目標に応じたプログラムコードの生成、新しい仮説の構築といった日常的な研究タスクを効率化するプロトタイプが動き出しています。

とくに大きな成果を上げているのが、複雑な地球環境を予測するAIシミュレーションの領域です。世界をデジタル上で再現する試みとして「AlphaEarth Foundations」などの研究が進められていますが、中でも気象予測モデルの「WeatherNext」は極めて実用的な成果を残しています。2025年のハリケーンMelissaがジャマイカに上陸する進路予測において、WeatherNextによる迅速で正確な予測は、早期警戒や避難判断を支える実例として紹介されました。

さらに、生物学の領域で世界中の研究者に使われている「AlphaFold」や「Alpha Genome」といったモデルも進化を続けています。Google傘下のIsomorphic Labs（アイソモーフィックラボ）では、AlphaFold由来の技術や独自モデルを活用して分子の相互作用を解析し、がんや免疫領域を中心に新薬候補の開発を進めています。臨床試験に向けた準備も進んでおり、AIが創薬プロセスを大きく加速する可能性が示されています。

まとめ｜今回の発表を振り返って

今年のGoogle I/Oは、AIを単独のアプリとして使うだけでなく、検索やスマートフォン、ウェアラブルデバイスなど、普段使っている環境に組み込んでいく方向性がはっきり見えた発表でした。
とくに、Gemini Sparkや検索エージェントのように、ユーザーが細かく操作しなくても裏側でタスクを進めてくれる機能や、Generative UIのようにその場で画面を組み立ててしまう試みが印象的です。

すぐに生活のすべてが変わるわけではありませんが、AIが「質問に答える道具」から「作業を任せる存在」へ移りつつあるのを実感しています。先月の「Google Cloud Next ’26」でも同じような感想を抱きましたが、今回の発表でその確信がさらに強まりました。そして、新機能をただ追いかけるだけでなく、自分の日常のどこを任せると本当に楽になるか、実際に触りながら見極めていきたいです。

ラリオス川口

Google Cloud認定トレーニング事業の立ち上げに従事し、国内トップクラスのトレーニングパートナーに成長させた。その後、自ら認定トレーナーとなり、さらにエバンジェリストの活動と合わせて、Google Cloudの普及と人材育成を牽引。講義の満足度にも定評があり、2025年に新設されたグローバルなGoogle Cloud Trainer Difference Maker賞を日本で初めて受賞。