- Google Cloudに関する記事
Google Cloud 生成 AI サービスまとめ
こんにちは、クラウドエース編集部です。
ChatGPT の人気を筆頭に、生成 AI サービスが盛り上がりを見せています。Google Cloud でも、対話型 AI サービスや、AI によるコード生成機能などをはじめとして、さまざまな 生成 AI の関連サービスが発表されています。
この記事では、Google Cloud が提供している生成 AI サービスの機能や特徴をまとめて紹介します。
開発者向けのサービス
まずは、AI 開発者やデベロッパー、データサイエンティストなど開発者が利用できる生成 AI プロダクトについて見ていきましょう。
Generative AI Studio
Generative AI Studio は、「Vertex AI」(Google Cloud の機械学習のワークロードを構築するツールのプラットフォーム)のサービスの一つで、Google の基盤モデルである PaLM2 や、この後で紹介する Imagen、Chirp などのモデルを API として利用することができ、調整してデプロイをすることができるサービスです。Generative AI Studio には、チャットインターフェース、プロンプトのデザインと調整の機能、モデルの重みを微調整する機能などが備わっています。
画像引用元: Google Cloud コンソール画面内 Vertex AI – Generative AI Studio
また、新たに調整したモデルをアプリケーションに直接実装したり、本番環境にモデルをデプロイしたりすることもできます。これにより、アプリケーションを本番環境にデプロイする時間を大幅に短縮できるようになります。
Vertex AI のマネージドエンドポイントにより、数行のコードの記述でアプリケーションに生成機能を構築することができ、デプロイした基盤モデルはフルマネージドな Vertex AI による MLOps 機能を使用して本番環境でスケーリングできます。
Model Garden
Model Garden は、さまざまな事前構築済みの機械学習モデルを 1 か所で検索、検出、操作できる、カタログのようなツールです。これを使うことで、機械学習モデルの構築とデプロイのプロセスを簡素化することができます。
サポートされるモデルタイプには、 Google Cloud が提供するモデルを API などを通して利用できる「ファーストパーティモデル」、エンタープライズ対応のさまざまなオープンソースモデルを利用できる「オープンソースモデル」、「サードパーティモデル」の 3 種類があります。
Model Garden では、モデルを直接使用できるほか、Generative AI Studio で調整したり、データサイエンスノートブックにデプロイしたりなど、さまざまなワークフローを実行できます。このような Model Garden は、ニーズに合うモデルを簡単に探したり、必要なタスクが漠然としている場合にイメージを膨らませたりするのにも役立てられます。
Model Garden 公式ドキュメント
参考記事
Previewになった Vertex AI Model Garden について
Vertex AI Codey APIs
Vertex AI Codey APIs は、テキストからコードを生成する基盤モデルです。
具体的には、開発者が入れた自然言語のプロンプトをもとにコードを生成する「コード生成」、プロンプトに入力されたコードの文脈に基づき次の数行を提案する「コード補完」、デバッグ・ドキュメント作成・新しいコンセプトの学習など、コードに関連する質問を会話形式で問える「コードチャット」の機能が備わっています。
コード生成モデルは、Go、Google Standard SQL、Java、Javascript、Python、Typescriptn など、20 以上の言語が対象です。この機能を使うことで、作業効率の向上や、エンジニア間のスキルギャップの解消に繋げられるでしょう。
Vertex AI Codey APIs 公式ドキュメント
Vertex AI Codey APIs 公式ブログ
参考記事
一般公開されたVertex AI Codey APIsを活用して、コード自動生成プログラムを書いてみた
Enterprise Search
Gogole Cloud ではエンタープライズ向けの検索システム構築サービスとして Enterprise Search を提供しておりましたが、Google Cloud の AI アプリケーション開発環境「Generative AI App Builder」に組み込まれることで会話型の検索が可能となりました。いわゆる企業向けの ChatGPT と考えていただければわかりやすいかもしれません。顧客や従業員向けの IT システムで活用できる会話型の検索機能です。
この機能を使うことで、企業内に蓄積されたテキスト・画像・動画・数値・音声などあらゆる種類のデータから、必要な情報を瞬時に検索できるようになります。検索結果は機械的なものではなく、問い合わせの文章からユーザーの意図を理解した上で、わかりやすくまとめられた形で返ってきます。さらに、データから特に重要な情報を自動抽出し、パーソナライズされた結果を得ることも可能です。
Enterprise Search の検索内容や結果は モデルのトレーニングや学習に使われることはないので安心して導入が可能です。
Enterprise Search公式ドキュメント
Conversation AI
Conversation AI も、Enterprise Search 同様に「Generative AI App Builder」で提供されている機能です。
これまでのチャットボットは、予め登録された回答や回答パターンを質問内容に応じて機械的に返答するといったものが主流でしたが、Conversation AI であれば LLM が質問や問い合わせ内容に対する回答を自然な文章で生成することができます。
これをカスタマーサービス業務などに活用することで、より自然で意図に合った回答をスムーズに提供できるようになりユーザーの体験価値は飛躍的に向上すると考えられます。
Conversation AI 公式ドキュメント
ビジネスユーザー向けのサービス
最後に、業種や職種に関わらずビジネスユーザーが広く便利に利用できる AI 関連プロダクトを解説します。
Duet AI for Google Cloud
Duet AI for Google Cloud は、AI ベースの開発支援機能です。
Duet AI for Google Cloud の機能は主に 3 つです。1 つ目は「コードアシスタンス」で、主にアプリケーション開発者やデータエンジニア向けの機能で、AI がコード入力のサポートをしてくれるものです。2 つ目は「チャットアシスタンス」で、アプリケーション開発やクラウドに関連した質問への回答を会話形式で得ることができます。3 つ目は「Duet AI for AppSheet 」で、チャット上で必要な機能を伝えるだけで、コーディングなしでアプリケーションを構築できます。
このように、Duet AI for Google Cloud はスキルを持ったエンジニアから非エンジニアまで、あらゆるレベルの人に必要な支援を提供してくれるサービスと言えます。
Bard
Bard は、Google Cloud が提供する対話型 AI サービスです。人間と会話するような形で質問すると、瞬時に自然な言葉での回答を得ることができます。また、回答はインターネット上の情報も利用して返されるため、リアルタイムな質問も投げることができます。
2023 年 5 月には、この Bard に新たな言語生成モデル「PaLM 2」が搭載されたことが発表されました。PaLM 2 は、日本語を含む 100 以上の多言語対応のモデルです。慣用句や詩、なぞなぞなども理解しながら文章を生成するほか、数式を含む化学論文なども学習済みとのことです。さらに、Python や JavaScript などのプログラミング言語でコードを生成することもできます。
Imagen
Imagen は、入力したテキストから AI が画像を生成するサービスです。例えば「A dragon fruit wearing karate belt in the snow.(雪の中の空手帯を着けたドラゴンフルーツ)」といった突拍子のないテキストであっても、高精度な画像を自動で生成してくれます。*
*参照
https://imagen.research.google/
この機能は、特に大量のコンテンツをタイムリーに配信する必要があるコンテンツマーケティングや、Web 広告やロゴマーク、ポスターなどのあらゆるデザイン作成の補助として活用することができます。
Contact Center AI
Contact Center AI は、AI が人間のように顧客対応を行ってくれる機能です。Contact Center AI をカスタマーサービスに導入することで、仮想エージェントが人間に代わって音声や文章で質問への回答をしてくれます。
これを使用することで、コストを削減しながら「オペレーターにつながるまでの待ち時間が長い」「なかなかつながらない」などの課題の解決に繋げられます。また、単純な質問を AI に任せることで、人間のスタッフはより複雑な問題への対応に集中できるようにもなるでしょう。
Discovery AI
Discovery AI は、自社のデジタル資産に対して、Google 品質の検索、ブラウジング、レコメンデーション機能を提供できるプロダクトです。
これは特に E コマースにおいて便利に活用できます。例えば、検索意図に基づいて適切な結果を表示したり、画像から商品を簡単に検索したり、商品カタログ内の類似品や補完品の情報をリアルタイムに提供したり、より高精度なレコメンデーション機能を実装したりできます。
Discovery AI を活用して快適なネットショッピング体験を提供することで、途中の離脱を防ぎ、コンバージョンの向上や注文額のアップに繋げられます。
Duet AI for Workspace
Duet AI for Workspace は、文書編集や表計算、オンライン会議ツールなど、さまざまなサービスを提供するWorkspaceで利用できる AI 機能の総称です。Duet AI for Workspace で提供される機能は主に 3 種類あります。
1 つ目は「Help me write」です。これは、短いテキストを入力すると、適切なメール本文や文書を自動で生成してくれる機能です。Gmai や Google ドキュメントで使うことができます。例えば、Gmail 本文に「ask for a full refund for this canceled flight(欠航便の全額返金リクエスト)」と入力するだけで、その後に続く本文をすべて自動生成してくれます。*
*参照
https://twitter.com/Google/status/1656344805268389911
2 つ目は「Help me Visualize」です。これは、Google スライドで利用できる機能で、必要な画像に関連する単語を複数入力するだけで画像を自動生成してくれます。生成される画像は、被写体、設定、被写体との距離、背景などが考慮された自然なものです。また、生成された画像をフィードバックを通じて調整することも可能です。
3 つ目は「Help me Organize」です。これは Google スプレッドシート向けの機能で、必要な表データの概要を入力すると、それに応じたテンプレートを自動で作成してくれる機能です。例えば「Client and pet roster for dog walking business with rates(犬の散歩サービス用の顧客名・ペット名・値段のリスト)」と入力するだけで、必要項目が掲載された見やすい表を瞬時に自動生成してくれます。
これらの AI 機能を活用することで、日々の業務をより効率的に処理できるようになるでしょう。
Chirp(Speech-to-Text)
Chirp は、Google が 2023 年 5 月に発表した次世代の Speech-to-Text(自動音声認識機能)モデルです。これは特に顧客エンゲージメントの強化に重点が置かれており、キャプションや音声アシストによって顧客の母国語でより深くコミュニケーションが取れるようになります。
Chirp の対応言語は 100 以上にのぼり、現在も言語や方言が追加されています。音声の認識精度も高く、英語では 98% の精度であり、話者数が 1,000 万人未満の言語では以前のモデルと比較して相対的に最大 300% の向上となっています。*
*参照
https://cloud.google.com/generative-ai-studio?hl=ja
まとめ
ここまで、Google Cloud が提供している生成 AI プロダクトについて紹介してきました。生成系 AI 関連のサービスは進化が激しく、日々新しい機能が発表されています。この記事を参考に、Google Cloud の生成 AI サービスを活用し、業務効率化や新たなビジネスの創出に繋げてみてください。
この記事を共有する