
AutoMLとは 概要や機能、主要サービスの特徴を紹介
こんにちは、クラウドエース編集部です。
機械学習の技術の中でも最近話題の「 AutoML 」。簡単に言うと、機械学習モデルを自動的に構築する技術のことです。
今回は、AutoML の機能やできることについて詳しく解説した上で、代表的な AutoML サービスについても紹介していきます。
また、こちらの GCP・AWS・Azure 3大クラウドサービス比較表にて各クラウドサービスにおける機械学習 / AI 分野の比較も行なっておりますので、本記事と合わせてお読みいただければと思います。
AutoML とは
AutoML とは「 Automated Machine Learning 」の略称で、日本語にすると「自動化された機械学習」となります。つまり、機械学習モデルの設計や構築のプロセスを自動化してくれる技術のことです。
「機械学習のプロセスを自動化」と言っても、上手くイメージが湧かないという人も多いかもしれません。もう少し深く理解するために、まずは「機械学習のプロセス」について詳しく見てみましょう。
一般的な機械学習のステップをシンプルに表すと、以下のようになります。
- 解決したい問題の定義
- 仮説の定義
- データ収集
- データの加工・整形準備
- 特徴量エンジニアリング
- 分析・予測
- 機械学習モデルの生成
- 機械学習モデル解釈・運用
- 事業への適用
AutoMLでは、上記のプロセスのうち「データ収集」から「機械学習モデルの生成」までを自動化します。ちなみに「特徴量エンジニアリング」とは、機械学習モデル構築の際に、その入力となる素性を設計する作業です。AutoML の登場以前は、これらの作業は全て人の手で行われていました。
しかし、適切な機械学習モデルを生成するためには、高度なデータサイエンスの知識・技術が必要ですが、専門家の数が不足しているという問題がありました。さらに、これらのプロセスは地道で非常に多くの工数がかかるものでした。
このような課題を解決するのが AutoML です。適切な形にデータを整形したり、そこから問題分析・予測を行ってくれる AutoML を用いることで、高度な技術や知識がなくても機械学習モデルの構築が可能となったのです。
Auto ML の主要サービス
ここまで、Auto ML の概要やできることについて紹介してきました。ここからは、具体的な Auto ML サービスの内容について見てみましょう。IT 系大企業各社がそれぞれ独自の Auto ML 製品を提供しています。
AutoML Table(Google)
Google では「 AutoML Table 」という名称の AutoML サービスを提供しています。
これは、あらゆるの AutoML サービスの中で最も知名度が高いものと言えるでしょう。主な機能はデータの自動処理で、数値や文字列などのデータの種類を自動的に判別・整形し、問題があった場合も自動的に抽出してくれます。
なお、Google では取り扱うデータごとに、以下のようなサービスも用意されています。
- Vertex AI(AI モデルの構築)
- AutoML Image(画像認識)
- AutoML VideoAI (動画認識)
- AutoML Text(テキスト認識)
- AutoML Translation(テキスト認識・翻訳)
- AutoML Tabula(構造化モデルの構築)
どのサービスも直感的に使いやすく、またわかりやすいマニュアルも用意されているため、統計・機械学習に詳しくない人でも十分に活用できるでしょう。
Automated ML(Microsoft)
Microsoft では、クラウドサービス「 Azure Machine Learning 」にて、「 Automated ML 」という Auto ML を提供しています。Automated ML では、機械学習モデルの構築手順のうち、主にデータの整形の自動化をしてくれます。
公式 HP では、具体的にできることとして、以下のことが挙げられています。
- 分類(データの分類予測)
- 回帰(連続値などの値の予測)
- 時系列予測(収益、在庫、販売、顧客需要などの予測)
- Computer Vision(画像分類や物体検出)
- NLP(自然言語処理)
「 Automated ML 」は、Google の「 AutoML Table 」に次いで認知度の高いサービスと言えるでしょう。ただし、「 AutoML Table 」と比較すると利用方法などの説明が少なく、機械学習についての知識を持った人でなければ使いこなすことが難しいかもしれません。
ただし利用者が多いため、日本語でのマニュアルや仕様書もインターネットで数多く見つけることができます。それらを読み込んだ上で操作する必要があるでしょう。
AutoAI(IBM)
IBM では、クラウドサービスの「 Watson Studio 」において「 AutoAI 」という名前の Auto ML を提供しています。他社の Auto ML サービスと同様に、データの整形、抽出を行ってくれます。
具体的には、機械学習モデルの構築における以下のタスクを自動化することが可能です。
- 特徴量エンジニアリングと選択
- 機械学習アルゴリズムのタイプの選択
- アルゴリズムに基づく分析モデルの構築
- ハイパーパラメーターの最適化
- テストされたデータ・セットでのモデルのトレーニング
- スコアと検出結果の生成のためのモデルの実行
なお、「ハイパーパラメーター」とは、機械学習アルゴリズムの設定のことです。
AutoAI を利用することで、自動的に必要なデータを用意して、アルゴリズムを適用しながら、データやユース・ケースに最適な機械学習のモデル作成が可能です。
Prediction One(Sony)
Sony は、データからあらゆる予測を算出する「 Prediction One 」という GUI ソフトウエアを提供しています。
GUI とは「 Graphical User Interface 」の略称で、「ユーザーが画面上で視覚的に捉えて直感的に操作できるインターフェース」のことです。名前の通り、非常にシンプルでわかりやすい UI が特徴のソフトウェアです。
同サービスは、特に専門性を要する部分を自動化し、機械学習やプログラミングのスキルがなくても簡単に使えることを強みとしています。具体的な機能および対応データは、以下の通りです。
基本機能 | 二値分類 |
---|---|
多値分類 | |
数値予測(回帰) | |
時系列予測(回帰) | |
機械学習 | 学習・評価 |
予測 | |
対応データ | 表形式データ(数値、文字列、テキスト、日付) |
操作のしやすさ、見た目のわかりやすさを重視する人に最適でしょう。
DataRobot
機械学習自動化の AI プラットフォームを提供する DataRobot 社では、「 Automated Machine Learning 」という AutoML 製品を販売しています。
「 Automated Machine Learning 」の主な機能は、「連続値」や「分類」の高度な予測を行うモデルを機械学習で自動的に複数作成し、より精度の高いモデルを推奨することです。さらに製品のアップデートも頻繁に行われ、それにより以下のような機能も追加されています。
- Visual AI(画像を用いたモデルの作成、解釈、利用)
- Auto DL(非時系列・時系列モデリング)
- AIアプリケーション(機械学習モデルを利用したアプリケーション作成の自動化)
DataRobot はアメリカを本拠地とする企業ですが、日本国内でも Docomo、日立製作所、KIRIN、LION、ANA といった数多くの企業での導入実績があります。
MatrixFlow
MatrixFlow は、ビジネス向けの AI プラットフォームを提供している企業です。
同社では、データから最適なアルゴリズムとパラメータの組み合わせを自動探索する「 AutoFlow 」、データを入力するだけで未来を予測する時系列解析機能の「 TrendFlow」、データが予測対象にどれだけの影響を与えたかを可視化する「要因説明機能」などの提供により AutoML を実現できます。
特に時系列解析は、欠損値の前処理やアルゴリズムの構築・評価など、専門家でも難しいケースもありますが、TrendFlow ではデータを投入するだけで簡単に予測可能となります。また、要因説明機能では AI が予測値を出した根拠も知ることができます。予測の根拠を求められることの多いビジネスの現場で非常に活躍するでしょう。
Nanonets
Nanonets は、AI を使用した手動データ入力を自動化するサービスを提供している企業です。
Nanonets の特徴は、画像認証や対象のオブジェクトの検出・抽出などの視覚認識の機能に強いことです。具体的には、AI を使用して、ドキュメントから必要なデータを抽出し、整形してくれます。これは、例えば請求書の処理や保険金の請求、患者記録、配達証明、注文フォームなどを自動化するのに役立てられます。
また、Nanonets ではテキストや画像などの構造化データだけでなく、 画像とテキストの両方を組み合わせた、半構造データも取り扱います。複雑な密度の高いデータから、必要なものを抽出したい場合などにも最適でしょう。
初めての AutoML なら Google AutoML Tables がおすすめ
ここまで、さまざまな AutoML を紹介してきました。各社が独自のサービスを提供しており、「自社に合ったものはどれだろう?」と迷ってしまうこともあるかもしれません。
結論から言えば、サービス選びで迷った場合は、Google AutoML Tables を選択するのがおすすめです。
その理由は、Google は数ある AutoML の中でも最も機械学習・AI に強いと言われており、精度が高く最適なモデルを簡単に構築できると期待できるからです。
また、高度な技術を非常に手軽に利用できることもメリットでしょう。Google AutoML Tables では、データさえ用意すればマウスやタッチパネルによる操作だけで機械学習モデルを構築してくれます。
加えて、従量課金制で予算を最適化しやすいこともメリットでしょう。利用時間、データ、コンピューティング、メモリの利用量に合わせて請求されるため、決めることができます。
まとめ
ここまで、 AutoML の概要や主要サービスについて紹介してきました。収集したデータを簡単に、効果的にビジネスに活かしたいと考えている方は、Google AutoML Tables の利用検討をしてみてください。
Google Cloud の詳細についてはこちらの資料をご活用ください。
Google Cloud と クラウドエースのご紹介資料
AWS、Azure と GCP の比較についてはこちら
GCP・AWS・Azure 3大クラウドサービス比較表では各社クラウドのあらゆるサービスや料金等の比較を網羅的に行なっております。よりクラウドサービスを体型的にご理解いただける内容となっておりますのでこちらもぜひお読みください。