• Google Cloudに関する記事
17分で読める

GCP AI / 機械学習関連プロダクト 9 個まとめ

こんにちは、クラウドエース編集部です。

こちらの記事では、Google Cloud が提供するクラウドベースの AI および機械学習プラットフォームについてご紹介していきます。Google Cloud(GCP) ではデータ分析、自然言語処理、画像処理、音声処理、予測分析、およびその他の機械学習タスクに使用できるさまざまなツールを提供しています。

 
また、Amazon の AWS や Microsoft の Azure も同様に AI / 機械学習のプロダクトを提供しており、GCP の各プロダクトと類似する AWS や Azure のプロダクトについても紹介していきます。ぜひ、クラウド活用の際の参考にしていただけましたら幸いです。

 

1.Cloud AutoML(クラウドオートエムエル)

Cloud AutoML は、Google Cloud Platform(GCP)が提供する自動機械学習(AutoML)プラットフォームです。Cloud AutoML は、機械学習モデルを構築するために必要な技術的なスキルがない人でも、自分たちのデータを使用して高品質な機械学習モデルを作成できるように設計されています。

 
Cloud AutoML には、画像分類、テキスト分類、言語翻訳、およびテーブルの自動機械学習モデルの作成という 4 つの主要なツールで構成されます。これらのツールは、Google Cloud の先進的な機械学習技術を使用しており、ユーザーが必要な機能を選択するだけで、自動的に機械学習モデルを作成できます。

 
なお、AWS では「Amazon SageMaker Autopilot」、Azure では「Microsoft Azure AutoML」という自動機械学習プロダクトが提供されています。

機能とメリット

  • 高品質のモデルの作成:Google Cloud の強力な機械学習技術を使用して、高品質のモデルを簡単に作成できます。
  • カスタマイズ可能なモデル:ユーザーがカスタマイズできるパラメーターが提供され、より正確な予測を行うようモデルを最適化することができます。
  • シンプルなインターフェース:ユーザーが簡単に操作できるように、シンプルで使いやすいインターフェースを提供しています。
  • スケーラブル:クラウドベースのサービスであるため、必要に応じてスケールアップできます。
  • セキュア:GCP のセキュリティインフラストラクチャを使用して、高度なセキュリティ保護を提供します。

 

ユースケース

  • 画像認識:Cloud AutoML Vision で機械学習モデルをトレーニングして、画像を自動的に分類することができます。例えば、製品画像を自動的に分類して、類似の製品を推薦することができます。
  • 自然言語処理:Cloud AutoML Natural Language を使用して、テキストを自動的に分類できます。例えば、カスタマーサービスを自動化するために、チャットボットを作れます。
  • レコメンデーション:Cloud AutoML Tables を使用して、ユーザーの購入履歴や行動から、製品のレコメンデーションを行うことができます。例えば、オンラインストアでおすすめ商品を表示することができます。
  • フォーム処理:Cloud AutoML Document Intelligence を使用して、フォームから情報を自動的に抽出できます。例えば、手書きのフォームから情報を抽出できるようになります。

2.Vertex AI(バーテックスエーアイ)

Vertex AI は、2022 年 11 月に Cloud AI Platform が名称変更し誕生した GCP の機械学習(ML)プラットフォームです。機械学習の専門知識に関係なく、あらゆる規模の組織が ML モデルをすばやく簡単に構築、デプロイ、および管理できるように設計されています。Vertex AI を使用すると、機械学習モデルのトレーニングに最適なコンピューティングとストレージリソースを簡単にプロビジョニングできます。また、モデルのデプロイとスケーリングを簡単に行い、モデルのパフォーマンスを監視および管理することもできます。

 
なお、AWS では「Amazon SageMaker」、Azure では「Azure Machine Learning」という自動機械学習プロダクトが提供されています。

 
Vertex AI には、機械学習の専門知識に関係なく、あらゆる規模の組織が ML モデルを開発およびデプロイするのに役立つ多くの機能があります。これらの機能には以下が含まれます。

  • Auto ML: 自動的に最適な機械学習モデルを生成するための機能。
  • Vertex Pipelines: 機械学習ワークフローを自動化・管理するためのパイプライン。
  • Vertex Training: カスタム機械学習モデルのトレーニングを容易にする機能。
  • Vertex Prediction: トレーニング済みモデルをデプロイし、予測を提供するための機能。
  • Vertex Feature Store: 機械学習の特徴量を一元管理・再利用するための機能。
  • Vertex Experiments: 機械学習実験の管理・追跡を支援する機能。
  • Vertex TensorBoard: 機械学習モデルのパフォーマンスを可視化・分析するためのツール。

ユースケース

  • 画像認識: 画像分類や物体検出などのタスクで、機械学習モデルを構築・適用。
  • 自然言語処理: テキスト分類、感情分析、エンティティ抽出、機械翻訳などのタスクで、機械学習モデルを構築・適用。
  • 音声認識: 音声コマンドや音声対話システムなどの機能を実現するための機械学習モデルの開発。
  • 時系列データ予測: 株価予測や需要予測など、時系列データを扱う機械学習モデルの構築・適用。
  • レコメンドシステム: ユーザーの好みや行動履歴に基づいて、関連性の高いコンテンツや商品を推薦する機械学習モデルの開発。
  • 異常検出: センサーデータやログデータから異常パターンを検出する機械学習モデルの構築・適用。
  • フレームワークやプリビルトモデルの活用: TensorFlow、 PyTorch、 XGBoost などの機械学習フレームワークや、Google Cloud が提供するプリビルトモデルを活用した、独自の機械学習アプリケーションの開発。

3.Dialogflow(ダイアログフロー)

Google Cloud の Dialogflow は、自然言語理解(Natural Language Understanding、NLU)を利用して、ユーザーとの会話型のインタラクションを可能にするツールです。このプラットフォームを使うことで、開発者は、Web サイト、アプリ、モバイルデバイス、および人気のあるメッセージングプラットフォーム(Slack や Facebook Messenger)上で動作するボイスとテキストベースの対話型インターフェースを簡単に構築できます。

 
Dialogflow は、自然言語の入力を理解し、適切な応答を生成することができます。これにより、ユーザーと会話するアプリケーション、例えばチャットボットや音声アシスタントを開発することが可能になります。

 
なお、AWS では「Amazon Lex」、Azure では「Microsoft Azure Bot Service」という自然言語理解(NLU)プラットフォームが提供されています。

ユースケース

  • カスタマーサポート: Dialogflow は、顧客からの問い合わせに自動で応答するチャットボットを作るためによく使用されます。これにより、顧客はすぐに回答を得ることができ、企業はカスタマーサポートのコストを削減することができます。
  • パーソナルアシスタント: Dialogflow を使用して、ユーザーの質問に答える、リマインダーを設定する、通知を送信するなどのタスクを行うパーソナルアシスタントを作成することも可能です。
  • e コマーストランザクション: Dialogflow は、ユーザーが商品を検索し、購入するプロセスをガイドする e コマースチャットボットを開発するのにも使われます。
  • コンテンツ配信:ユーザーがニュース、天気の更新、その他の情報を要求したときに自動的にそれらを提供するボットを作るためにも使用できます。

4.Cloud Vision API(クラウドビジョンエーピーアイ)

Cloud Vision API は、画像解析を自動化するためのサービスです。この API は、画像内のオブジェクト、ラベル、顔、テキスト、その他の要素を検出し、分類できます。また、画像内の顔の表情や、顔の特徴を分析することもできます。これにより、企業や開発者は、人間が手動で行うような膨大な作業を自動化し、生産性を向上させることができます。

 
Cloud Vision API は、Google Cloud が開発した AI 技術を使用しています。この技術は、深層学習モデルに基づいており、Google Cloud が持つ大量のデータを使用してトレーニングされています。高い精度で画像解析が行われるため、ユーザーは手動での作業を省略できます。

 

ユースケース

  • セキュリティ監視:ビデオ監視カメラの映像から、不審な行動や犯罪行為を検出するために利用できます。人、車、建物などのオブジェクトを検出し、その動きをトラッキングすることもできます。
  • インターネット広告:Web サイトやアプリのコンテンツ内の画像を解析し、関連する広告を表示できます。
  • ファッション:ファッションブランドなどにおけるオンラインストアは、Cloud Vision API を使ってアイテムの特徴やカテゴリーを分類し、類似商品を提案できます。
  • メディア:ニュースや出版物の画像を解析し、テキストに変換したり、関連記事を提案したりできます。
  • 医療:医療画像の解析に使用することで、病変の位置や種類を特定できます。

AWS、Azure、GCP 類似プロダクト

  • Cloud Vision API : 画像のラベル付け、顔の検出、顔の識別、テキストの認識、画像の類似性の検出、特定のエンティティの検出、画像の属性の検出、OCR(Optical Character Recognition)などの機能を備えています。
  • AWS Rekognition : 人、オブジェクト、テキスト、顔の検出や識別、特定の表情の分析、顔の比較、その他の機能が含まれます。また、リアルタイムストリーミングビデオからの検出と分析もサポートしています。
  • Microsoft Azure Cognitive Services Vision API : オブジェクト、テキスト、顔の検出や分析、イメージマッチング、OCR(Optical Character Recognition)、画像内の異常検知など、幅広い機能を備えています。

5.Cloud Video Intelligence API(クラウドビデオインテリジェンスエーピーアイ)

Google Cloud (GCP)の Cloud Video Intelligence API は、ビデオファイルから自動的にメタデータを抽出するための機械学習ツールです。この API を使用すると、大量のビデオファイルから音声、顔、オブジェクト、シーン、テキストを自動的に識別することができます。この API は、インフラストラクチャ、アルゴリズム、およびデータセットによって支えられた Google Cloud の最新の機械学習技術を使用しています。

 
Cloud Video Intelligence APIは、MP4、FLV、AVI、MOV、WMVなどの主要なビデオ形式に対応しています。また、このAPIは、Google Cloud Storage などのクラウドストレージと連携し、ストレージに保存されたビデオファイルを自動的に処理することもできます。

 
AWS においては Cloud Video Intelligence API に相当するサービスはありませんが、Microsoft Azure においては、「Azure Video Analyzer」が Cloud Video Intelligence API の類似プロダクトとして提供されています。

機能とメリット

  • シーン検出(Scene detection):動画内のシーンの変更を検出し、シーンごとに動画を分割できます。これにより、大量の動画データを効率的に処理できます。
  • オブジェクトトラッキング(Object tracking):動画内の特定のオブジェクトをトラッキングし、そのオブジェクトを追跡できます。これにより、動画内でのオブジェクトの移動や挙動を分析できます。
  • ラベル検出(Label detection):動画内の様々なオブジェクトやシーンについて、自動的にラベルを付けることができます。例えば、ビーチ、山、車、人、犬などのラベルを付けられます。
  • 音声認識(Speech transcription):動画内の音声をテキストに変換し、字幕を生成できます。これにより、動画内の音声をテキストデータとして利用したり、動画に字幕を付けたりできます。
  • ブランドロゴ検出(Logo detection):動画内に表示されるブランドのロゴを検出し、そのブランドの情報を自動的に抽出できます。これにより、広告やマーケティングの分野で有用な情報を得ることができます。
  • コンテンツモデレーション(Content moderation):動画内のコンテンツをモデレートし、適切なコンテンツかどうかを自動的に判断できます。これにより、過激なコンテンツを除外するなどの適切なコンテンツ管理が可能になります。

ユースケース

  • 動画広告のターゲティング:動画広告を見ているユーザーの属性や興味を把握し、より適切な広告を表示できます。例えば、ビデオ内の検出された顔やオブジェクト、シーン、音声の分析を通じて、広告を表示するターゲット層を明確にできます。
  • ビデオモニタリング:監視カメラやセキュリティシステムなどのビデオフィードを自動的に処理できます。ビデオ内に検出された特定のオブジェクトや行動に基づいて、監視員にアラートを送信することもできます。また、ビデオ内のオブジェクトやシーンを分類することで、ビデオの内容を自動的に検索できるよう設定することもできます。
  • 違法コンテンツの検出:検出されたオブジェクトやシーン、音声の分析に基づいて、違法なコンテンツを自動的に把握できます。これにより、違法なビデオをホスティングすることがなくなり、コンテンツプラットフォームの信頼性が向上します。
  • セキュリティシステムの監視:ビデオ監視システムの運用コストを削減できます。自動的に識別されたオブジェクトやシーンに基づいて、ビデオフィードを自動的に監視し、必要に応じてアラートを送信できます。
  • 動画の自動キャプション生成:音声をテキストに変換する機能を利用することで、自動キャプション生成に利用できます。この機能により、手動でキャプションを作成する必要がなくなり、コストと時間の削減につながります。

6.Cloud Natural Language API(クラウドナチュラルランゲージエーピーアイ)

Cloud Natural Language API は、テキストを分析するためのクラウドベースの自然言語処理ツールです。この API は、テキストを解析し、文章の感情、エンティティ、トピック、構文、言語などを識別できます。

 
Cloud Natural Language API は、自然言語処理の専門知識がなくても利用できるため、開発者やビジネスユーザーにとって非常に便利です。また、Google Cloud(GCP)との統合も容易であり、他のクラウドサービスとも連携が可能です。Cloud Natural Language API は、広範な業界で利用されており、自然言語処理の自動化やデータ分析を強化できます。

 
なお、AWS、Azure でもそれぞれ自然言語処理ツールが提供されています。AWS では「Amazon Comprehend」、Azure では「Azure Cognitive Services Text Analytics」が、Cloud Natural Language API に相当します。

機能とメリット

  • 感情分析:文章の感情を判別できます。文章がポジティブ、ネガティブ、またはニュートラルかどうかを特定し、その強度も測定することができます。
  • エンティティ抽出:文章からエンティティ(人、場所、組織、イベントなど)を自動的に抽出できます。これは、大量のテキストから重要な情報を抽出するために役立ちます。
  • トピック分類:文章をトピックに分類することができます。これは、ニュース記事やブログ記事などの大量のテキストを処理する場合に役立ちます。
  • 構文解析:文章の構文を解析し、文法エラーや文の構造を分析できます。
  • 言語識別:文章の言語を自動的に識別できます。これは、多言語環境での翻訳や、多言語の顧客からのフィードバックを処理する際に役立ちます。

ユースケース

  • SNS 分析:Twitter や Facebook などの SNS 投稿を分析できます。これにより、企業は製品やサービスに関する顧客のフィードバックを把握し、製品やサービスの改善に役立てることができます。
  • マーケティングの最適化:ウェブサイトのコメント、フォーラムの投稿、レビューなどの分析にも使えます。これにより、企業は自社製品や競合他社の製品についての意見を収集し、マーケティングキャンペーンを最適化できます。
  • 顧客サービスの改善:顧客からのフィードバックや問い合わせのテキストを分析できます。これにより、企業は顧客の問題や不満点を特定し、サポートの改善に役立てることができます。
  • 法的文書の分析:法的文書の分析にも役立ちます。これにより、法律事務所は契約書や訴訟文書などの大量のテキストを効率的に処理し、重要な情報を抽出できます。
  • 教育分野での活用:教育機関は、学生の論文やエッセイを分析し、フィードバックを提供できます。また、教育分野での自動評価や学習者の評価も行うことができます。

7.Cloud Translation API(クラウドトランスレーションエーピーアイ)

Cloud Translation API は、GCP が提供する自然言語翻訳を提供する API です。この API を使うことで、多言語のテキストを、高度な機械学習技術を用いて、自動的に翻訳することができます。この API は、企業が国際的な顧客とのコミュニケーションや、海外進出に必要な翻訳作業を効率化するのに役立ちます。この API を使用することで、翻訳作業にかかるコストと時間を削減し、ビジネスプロセスを改善できます。
Cloud Translation API には、Basic と Advanced の 2 つのエディションがあります。Basic は無料の基本的なエディションであり、Advanced はより高度な機能とサポートを備えた有料のエディションです。

 
類似サービスとして、AWS では「Amazon Translate」、Azure では「Azure Translator Text API」という自然言語翻訳を提供するプロダクトが用意されています。

機能とメリット

  • 多言語対応:100 を超える言語に対応しています。このAPIを使用することで、簡単に複数言語のテキストを翻訳できます。
  • 翻訳品質の向上:高度な機械学習技術を使用して、より正確な翻訳を提供します。このAPIは、大量の翻訳データを使用して、自動的に学習し、翻訳品質を向上させます。
  • カスタマイズ可能なモデル:カスタムモデルを使用して、特定の文脈や専門用語に最適な翻訳を提供できます。この機能を使用することで、より正確な翻訳を実現できます。
  • 高速な翻訳処理:高速な翻訳処理が提供されています。この API を使用することで、大量のテキストを短時間で翻訳できます。
  • 安全性の確保:企業のデータを保護するためのセキュリティ機能を提供しています。この API は、TLS/SSL 暗号化通信を使用し、データの保護を確保します。

 

ユースケース

  • マルチリンガルカスタマーサポート:さまざまな言語での顧客の問い合わせを翻訳し、顧客の言語で返答することができます。これにより、グローバルに顧客を抱える企業の顧客対応業務を効率化します。
  • 多言語サイト:企業が海外市場に進出する際には、複数の言語に対応したウェブサイトを提供する必要があります。Cloud Translation API を使用することで、自動的にウェブサイトのコンテンツを翻訳し、多言語サイトを作成することができます。
  • マルチリンガルドキュメント:自動的に文書を翻訳し、多言語ドキュメントを作成することができます。これにより、異なる言語で書かれた文書を簡単に管理できます。
  • グローバルEコマース:オンラインショップにおいて商品説明や注文確認メールなどを自動的に翻訳し、グローバルEコマースを実現することができます。
  • グローバルなマーケティングキャンペーン:広告やマーケティングキャンペーンのコンテンツを自動的に翻訳し、グローバルなマーケティングキャンペーンを実現できます。

8.Cloud Speech-to-Text API(クラウドスピーチトゥテキストエーピーアイ)

Cloud Speech-to-Text API  は、Google Cloud Platform(GCP)の音声認識サービスの一つであり、音声データをテキストに変換するために使用されます。この API を使用することで、音声ファイルやストリームを入力として受け取り、高精度かつ高速な音声認識を行うことができます。

 
Cloud Speech-to-Text API は、音声認識における高い精度と高速性、さまざまな言語に対応した自動言語判定などの特徴により、様々な業務において効率的な業務処理を実現することができます。

 
なお、AWS では「Amazon Transcribe」、Azure では「Azure Speech Services」という音声認識サービスをそれぞれ提供しています。

機能とメリット

  • 多言語対応:Cloud Speech-to-Text API は、125 を超える言語と方言に対応しており、音声データを自動的に言語判定して、その言語に応じたテキストに変換することができます。
  • リアルタイムストリーミング:リアルタイムでの音声認識も可能であり、リアルタイムストリーミングの音声をほぼリアルタイムでテキストに変換できます。(録音データの認識ももちろん可能です)
  • 音声の前処理機能:音声認識の前処理機能として、ノイズの除去や音量の正規化などがあり、これにより、音声認識の精度を向上させることができます。
  • カスタムモデルのトレーニング機能:カスタムモデルをトレーニングすることで、特定の業界用語や専門用語にも対応できます。カスタムモデルは、Cloud Speech-to-Text API に用意されたトレーニングデータを使用して作成できます。

 

ユースケース

  • コールセンターの自動音声応答:コールセンターの音声対応において、音声認識を用いることで、自動応答システムを実現できます。
  • 議事録作成:会議やセミナーの録音データを入力として、自動的に議事録を作成できます。
  • テキスト掲載付き動画作成:動画内の音声をテキストに変換し、そのテキストを動画に掲載することで、聴覚障がい者の方や外国人の方にも動画を理解しやすくすることができます。
  • 翻訳サービス:音声をテキストに変換した後、翻訳サービスと連携して、多言語の音声翻訳サービスを提供できます。
  • 自然災害情報伝達:自然災害発生時に、緊急速報の音声をテキストに変換し、緊急速報テキストメッセージや SNS での情報伝達を行うことができます。
  • ボイスコマース:音声認識を活用したボイスコマースにおいて、音声から商品名や価格を認識し、自動的に注文処理を行うことができます。
  • ボイスアシスタント:音声入力によるアシスタントサービスにおいて、音声からの入力をテキストに変換して、リクエストを理解しやすくすることができます。

 

9.Cloud Text-to-Speech API(クラウドテキストトゥスピーチエーピーアイ)

 
Cloud Text-to-Speech API は、Google Cloud(GCP)が提供する音声合成サービスです。このAPI を使用することで、自然な音声合成を行うことができます。また、開発者は自分のアプリケーションやサービスに音声合成機能を追加できます。音声は、多数の言語や声質に対応しており、細かい調整も可能です。

 
AWS、Azure での類似プロダクトとしては、AWS では「Amazon Polly」、Azure では「Azure Cognitive Services Speech Services」が提供されています。

機能とメリット

  • 多言語に対応:Cloud Text-to-Speech API は、多数の言語に対応しており、新しい言語も順次追加されています。また、同じ言語でも、多数のアクセントや話者モデルを提供するため、音声の質をカスタマイズできます。
  • 自然な音声合成:WaveNet というニューラルネットワーク技術を採用することで、自然な音声合成を実現しています。この技術により、口調やイントネーション、ストレスなどの情報が考慮され、非常にリアルな音声を生成できます。
  • 簡単な操作性:Cloud Text-to-Speech API では、簡単な REST API も提供しています。そのため、プログラマーは API を容易に使用でき、自分のアプリケーションに統合できます。また、API のドキュメントには、必要な情報が豊富に記載されており、開発者がAPIを使用する際に役立ちます。
  • カスタマイズ性:音声の音量や速度、話者の声質などをカスタマイズできます。これにより、ユーザーに対して好ましい音声を生成できます。

ユースケース

  • 音声ガイダンス:電話による問い合わせに対して、音声で案内することができます。たとえば、コールセンターなどでテキストを音声に変換し、案内を提供できます。
  • 音声アシスタント:音声認識と組み合わせることで、音声アシスタントとして使用できます。たとえば、音声アシスタントに問い合わせることで、天気予報、ニュース、地図、タイマーなどの情報を取得できます。
  • ビデオゲーム:ビデオゲームに音声合成を組み込むことができます。これにより、ゲームの世界観を音声によって表現することができます。たとえば、キャラクターの声やゲーム内のテキストを音声に変換できます。
  • 教育用途:Cloud Text-to-Speech API は、教育分野でも活用されています。たとえば、テキストを音声に変換することで、視覚障害者がテキストを理解できます。また、教材の音声化や講義の録音、朗読アプリなどにも使用されます。
  • マーケティング:オーディオ広告やナレーションを生成できます。音声合成により、自然な音声を生成し、広告や動画コンテンツをより魅力的にすることができます。
  • プロダクトのアクセシビリティ:製品やサービスのアクセシビリティ向上のためにも、Cloud Text-to-Speech API が使用されます。たとえば、製品の説明や使用方法を音声によって提供することで、視覚障害者や高齢者などが製品をより簡単に理解できるようになります。

 

まとめ

Google Cloud の AI と機械学習関連のプロダクトは、さまざまなビジネスや技術的な課題を解決するための強力なツール群を提供しています。Cloud AutoML と Vertex AI は、データ分析やモデル開発を自動化し、AI を使いこなすための専門知識がないユーザーでも利用できるように設計されています。

 
一方、Cloud Vision API、Cloud Video Intelligence API、Cloud Natural Language API、Cloud Translation API、Cloud Speech-to-Text API、および Cloud Text-to-Speech API は、それぞれの特定の課題に対して特化した解決策を提供しています。これらの API は画像分析、動画のコンテンツ理解、自然言語処理、言語翻訳、音声認識、そしてテキストから音声への変換を行う能力を提供し、様々なビジネスケースでの有効な応用を可能にします。

 
これらのツールは、単体で利用することも、複数を組み合わせてより複雑な問題を解決することも可能です。Google Cloud の AI と機械学習のプロダクトは、企業が直面する課題を解決し、新しいニーズを生み出していくための重要なリソースと言えるでしょう。

 
クラウドエースは、Google Cloud のプロバイダとして、1,000 社以上の企業様に Google Cloud を導入いただいております。
クラウドの導入支援や、Google Cloud での開発支援など、お客様一社一社のビジネス要件を理解し、ニーズに合った最適なクラウドソリューションをご提案しております。
ぜひ、Google Cloud をご検討中でしたら下記よりお問い合わせいただけましたら幸いです。
クラウドエースへのお問い合わせはこちら

AWS、Azure、GCP 3大クラウドサービス比較表のDLはこちらから

この記事を共有する

合わせて読みたい