二つ目は、Gemini は他の Google のサービスとの直接的な連携が可能であるという特徴を持っています。これにより、ユーザーは他の Google のサービスをより効率的に、そしてより総合的に利用することができるようになりました。
マルチモーダルモデル
マルチモーダルモデルという言葉は、複数の種類の入力データを同時に処理する能力を持つ AI モデルを指します。
これまでの生成 AI モデルは、主にテキストデータを入力として利用するものが大半でした。このようなモデルは、大量のテキストデータを学習し、人間が理解できる文章を生成することに特化していることがほとんどです。
しかし、 Gemini は、テキストはもちろん、音声、画像、動画といった多様なデータ形式を処理する能力を持っています。これは、人間と同じように、異なる種類の情報を同時に理解し、それに基づいた処理をすることができ、今までにない高性能な生成 AI であると言えます。
Gemini Pro は、多様なタスクを適切なスケールで効率的に処理するのに適したモデルで、一般的なビジネスや個人のニーズに対応しています。
Google アカウントを持っている全てのユーザーが利用できるため、手軽に高性能な機能を活用することができます。
バージョンは 1.0と1.5(プライベートプレビュー)が提供されています。
Gemini 1.0 Pro は GPT-3.5 や Claude 2 に相当するモデルと考えるとイメージしやすいかと思います。
Gemini Nano
Gemini Nano は、デバイス上でのタスクを効率的に実行するのに最適化されたモデルです。
現在、Pixel 8 Pro という先進的な Google のスマートフォンにはこの Gemini Nano が搭載されています。
提供されているバージョンは 1.0 のみです。
Google サービスとの連携
GPT では拡張機能を活用して外部サービスとの連携を行っていましたが、Gemini は Google の様々な既存サービスとデフォルトで連携しています。具体的には Google 検索、YouTube 、Google Maps 、Google flights といったサービスに組み込まれており、サードパーティのプラグインを利用することなく、YouTube の動画の検索や指定した動画の要約を作成したり、フライトの料金や時間を調べたりすることが可能になりました。さらに、Gemini は Gmail などのユーザ個人に紐づくサービスにもアクセスすることができるため、Gemini のプロンプトを通して、メールの閲覧や検索も可能になっています。
他にも日本語ではまだサポートされていない機能ですが、 Google Docs 内の文章の更生や加筆などをしてくれる機能もリリースされはじめています。
このように Gemini は、ユーザの情報アクセスの手間を大幅に削減し、より迅速な情報取得を実現しています。また、既存の Google サービスとの連携は今後も進化を続け、ユーザの嗜好に応じた情報提案などが可能になるため、Google サービスを利用しているユーザや企業からはGemini の今後の進化に大きな注目が集まっています。
Gemini の特徴と、それが従来の AI とどう異なるのか
マルチモーダルな処理能力
従来の生成 AI の多くは、テキストのみを入力データとして扱うものや、入力データの種類ごとに異なるモデルを利用するものが主流でした。
Duet AI は Google Cloud、Gmail、Google ドキュメントなどのサービスで利用できるユーザ支援 AI でしたが、これらも全て Gemini にサービス名称が統一され、Gemini for Google Cloud、 Gemini for Workspace として提供される予定です。
Vertex AI と Gemini の違い
Vertex AI も Google が開発しているサービスですが、 AI モデルではなく、AI プラットフォームと呼ばれるサービスです。そのため、これらは競合するものではなく、Vertex AI で Gemini を利用することでより簡単に生成 AI をシステムに組み込むことができるようになります。
Vertex AI の提供する Search と Conversation の二つの機能の両方で、Gemini モデルを利用することができます。これにより、サービスや組織に特化したエージェントを作成することができます。
Gemini Advancedを利用するためには、Google One の有料プランである「AI Premium」を契約する必要があります。現在、AI Premium の利用料は月 2,900 円で加入することができます。
AI Premium は Gemini Advanced を利用できるようになるだけでなく以下の特典も含まれます。
Gmail や Goole Docs での Gemini の利用
Google Photos や Google Drive で利用できる 2TB のストレージ
Google Store の 10% 割引
Google Meet、Google Calender の新機能の利用
まとめ
Gemini は Google が開発した最新の人工知能(AI)モデルで、幅広いマルチモーダル処理能力と高度な言語理解を持っています。この革新的な AI モデルは、テキスト、画像、音声、動画など、様々なデータ形式を同時に処理する能力を持っています。それにより、これまでにないほど正確な情報理解と自然なコミュニケーションを実現しています。
従来の AI モデルと Gemini は情報理解が格段に深く、人間と同等のコミュニケーションが可能です。さらに、多くのベンチマークテストで GPT-4 を上回る性能を示しており、その高いパフォーマンスは広く認知されつつあります。
このような特性から、Gemini は様々な分野での活用が期待されています。また、それを可能にするのが、Gemini が Google のさまざまなサービスと簡単に連携できるという特長です。それにより、ユーザーは Google のサービスを最大限に活用しながら、Gemini の高度な AI 能力を享受することができます。
さらに Google は自社が提供するさまざまな AI サービスの名称を Gemini に統一し、The Gemini era として Gemini が今後 Google のサービスの中核になっていくということを改めて強調していると言えると思います。