RAGとは?その仕組みと構築方法を徹底解説!Vertex AI Searchを使った例も紹介

RAGとは?その仕組みと構築方法を徹底解説!Vertex AI Searchを使った例も紹介

生成AIをビジネスで活用する際、最新の社内データや専門知識に基づいた正確な回答が求められます。しかし、一般的なAIモデルだけでは情報の鮮度や正確性に限界があるのも事実でしょう。

この課題を解決する手法として、今まさに大きな注目を集めているのがRAG(検索拡張生成)です。外部の知識ソースを自在に参照させることで、AIは確かな根拠に基づいた回答を生成できるようになります。

本記事では、RAGの仕組みから具体的な手順までを初心者の方にも分かりやすく整理しました。あわせて、Google Cloudの「Vertex AI Search」を用いて自社専用AIの構築を試みた際のプロセスも詳しく共有します。

RAGとは?

RAG(Retrieval-Augmented Generation)とは、大規模言語モデル(LLM)が本来持っていない外部データを検索・参照し、その情報に基づいて回答を生成する仕組みを指します。日本語では「検索拡張生成」と訳される技術です。

RAGの大きな特徴はAIに最新の情報や組織特有の知識を「補足資料」として与えることで、回答の精度を向上させ「ハルシネーション」を軽減しやすい点と言えます。

膨大な社内マニュアルから必要な情報を素早く探し出したい場合や、日々更新される業務規定に沿った正確な回答が求められる場面などで、有効な手段となります。

RAG(検索拡張生成)の仕組み

一般的なAIは学習した時点までの情報しか持っていませんが、RAGを用いると、最新のドキュメントを検索して参照し、その内容を回答に反映させることができます。

たとえるなら、AIが自分の記憶だけで答えるのではなく、手元にある資料を「参考書」のように開きながら回答するイメージと言えるでしょう。

このプロセスによって、AIが本来知らないはずの自社固有の情報や、日々更新される最新情報についても、根拠のある正確な回答が可能になります。

検索と生成のプロセス

RAGの動作は、大きく分けて以下の3つのステップで構成されます。情報の「事前準備」から「回答の出力」までの流れを整理しましょう。

1.事前準備
まず、PDFなどの資料をAIが検索しやすい「数値のデータ」に変換し、専用のデータベースに保管します。これがAIにとっての「図書館」を作る作業になります。

2.検索
ユーザーの質問に対し、作成したデータベース(図書館)の中から、内容が近い情報を探し出します。単なるキーワード一致だけでなく、文章の「意味」も加味しながら、関連度の高い情報を抽出します。

3.生成
抽出された情報と元の質問をセットにしてAIに渡します。AIはその資料を「カンニングペーパー」として読み込んだ上で回答を作成するため、参照した根拠を添えたアウトプットが可能になります。

このように、あらかじめ準備された「確かな情報」を参照してから答える仕組みによって、ハルシネーションを大きく減らすのに役立つのです。なお実運用では、資料の分割(チャンク)や検索の当たり方を調整して、“図書館の探しやすさ”を整えることが回答品質を左右します。

ファインチューニングとの決定的な違い

AIに特定の知識を持たせる手法には、RAGのほかに「ファインチューニング(微調整)」が存在します。両者の最大の違いは、知識をAIの脳に直接覚え込ませるのか、それとも外部の資料を調べさせるのかという点に集約されるでしょう。

ファインチューニングはAI自体に追加学習をさせますが、情報の更新には再学習のコストと手間を要するのが一般的です。対照的に、RAGはモデルに手を加えず、外部資料を「参考書」として活用します。

例えるなら、前者は「教科書の丸暗記」、後者は「資料の持ち込みが許可された試験」で答えを探すようなイメージと言えるでしょう。ファイルを差し替えるだけで情報を即座に更新でき、回答の根拠を明示できる点は、実務上の大きなメリットとなります。

RAG導入の具体的な進め方

RAGは、単にシステムを導入すれば完成というものではありません。自社のデータを活用して期待通りの回答を得るためには、事前の準備から実運用に向けた検証まで、段階を追って進めることが重要です。

技術的な複雑さに惑わされず、まずは「どのような目的で、どのデータを使うのか」を整理することから始まります。ここでは、RAG導入の具体的な進め方を解説していきます。

目的の明確化とデータの整理

RAGのプロジェクトを始めるにあたって、まず最初に行うべきは「誰が、どのような課題を解決するために使うのか」という目的を定義することです。目的が曖昧なまま進めてしまうと、AIが参照すべきデータの範囲を絞り込めず、結果として回答の精度が上がらない原因になります。

あわせて、AIに読み込ませるデータの整理も欠かせません。社内のファイルサーバーやクラウドストレージに保管されている資料の中から、最新かつ正確なものを選別します。古いバージョンのマニュアルや重複したデータをあらかじめ除外しておくことが、精度の高い回答を引き出すための最も重要な「下準備」となります。

検証(PoC)による精度の確認

環境を整えたら、いきなり全社に展開するのではなく、まずは限定的な範囲で実際にどれだけ正しく回答できるかを確かめる「検証(PoC:概念実証)」を行います。準備したデータに対して、現場で想定される質問をいくつか投げかけ、AIが適切な資料を正しく参照しているか、回答に「もっともらしい嘘」が混じっていないかをチェックします。

この段階では、実際の利用者となる現場の担当者にもテストに参加してもらうのが理想的です。開発者だけでは気づかない「現場ならではの言い回し」や「独特な質問のされ方」を試すことで、実運用で直面する課題を事前に洗い出すことができます。この検証と改善のサイクルを回すことが、最終的な回答精度を左右する重要なプロセスとなります。

本番運用と継続的なメンテナンス

検証を経て精度に納得ができたら、いよいよ本番運用を開始します。ここで忘れてはならないのが、RAGは「導入して終わり」ではないという点です。社内の規定や製品の仕様が更新されるたびに、参照元となるデータも最新の状態に差し替えていく必要があります。

また、実際に運用を始めると、AIがうまく答えられなかった質問や、情報の不足が浮き彫りになることがあります。利用者のフィードバックやログを定期的に確認し、足りない資料を補充したり、AIへの指示を微調整したりといった継続的なメンテナンスを行うことが、信頼性の高いシステムを維持し続けるための鍵となります。

RAG構築実践編:Vertex AI Searchを活用して開発してみた

「理屈はわかったけれど、実際に自分でも作れるものなの?」という疑問を解消するため、Google CloudのVertex AI Searchを使って実際にRAGを作ってみました。

今回は「社内ルール検索AI」の作成をゴールに設定。検証にあたっては、まず架空の会社の就業規則や福利厚生ガイドを自ら作成し、それらの資料をもとに質問に答えてくれる社内FAQボットを構築しました。今回はまず、管理画面上のプレビューで動作確認するところまで(本番環境への実装やAPI化までは行わず)試しています。

専門的なコードを一行も書かなくても、自分で用意した資料をAIが正しく参照し、的確な回答を生成する様子を目の当たりにすることで、一つひとつの設定がどう最終的な回答に繋がるのか、実感を伴う理解を深めることができました。実際に手を動かして見えてきた構築のプロセスを、以下の4つのステップに整理して解説します。

Step 1:Cloud Storageへのデータアップロード

RAGを構築するには、まずAIが参照するための「知識(データ)」を保存する場所を確保する必要があります。今回は、Google Cloudの「Cloud Storage(GCS)」というストレージサービスを利用しました。

GCSでは、データを保存する「バケット」という入れ物を作成します。保存場所(リージョン)などの設定項目はいくつかありますが、基本的には画面の案内に沿って選択していくだけなので、スムーズに準備することができました。

バケットができたら、あらかじめ自作しておいた「架空の会社の就業規則」や「福利厚生ガイド」などのPDFファイルをアップロードします。あっという間にAIが参照するための「知識の素」がクラウド上に準備できました。

Step 2:アプリの作成とデータストアの紐付け

次に行うのは、取り込んだデータを活用するための「アプリ」の作成です。Vertex AI Searchの管理画面から「カスタム検索(一般)」という種類を選択して、アプリの枠組みを作っていきます。

構成の設定画面では、今回はチャット形式での回答を目指していたため、デフォルトで入っているチェックマークはそのままにして、アプリ名を設定し「続行」を押しました。

次に、Step 1で用意した知識(データストア)をアプリに紐付ける作業を行います。「データストアを作成」をクリックするとデータソースのリストが表示されるので、今回は事前にPDFをアップしておいた「Cloud Storage」を選択しました。

なお、データストアを作成する際、AIに資料をどう読み解かせるか決める「パーサー(解析機能)」の設定が出てきます。いくつか種類があり、資料の形式に合わせてパーサーを選ぶと、取り込みがスムーズになりやすいです。

  • Digital Parser(デジタルパーサー):テキストデータ主体のPDFに適しており、処理が速いのが特徴です。
  • OCR Parser(OCRパーサー):スキャンした画像や手書き文字など、そのままでは文字として認識できない資料を読み取る際に使用します。
  • Layout Parser(レイアウトパーサー):文字だけでなく、表や見出し、段組などの「文書の構造」を理解して読み取ります。

今回の「就業規則」や「福利厚生ガイド」には表や項目立てが多く含まれていたため、構造を正しく把握して回答精度を高めてくれそうな「Layout Parser」を選択しました。

Step 3:プレビュー機能での動作確認

設定が完了したら、いよいよ動作確認です。ただし、設定を終えてすぐにテストができるわけではありません。

実際にやってみて「待ち」が必要だと感じたのが、データのインデックス化(検索可能な状態にする作業)です。Layout Parserを選んだときは、解析に少し時間がかかりました。

ステータスが「完了」になるのを待ってから、プレビュー画面で「在宅勤務って週に何回まで可能?」と質問を投げかけてみました。すると、AIが即座に資料の該当箇所を見つけ出し、自然な日本語で回答を生成してくれました。回答と同時に、「資料のどの部分を参考にしたのか」というソース(参照元)を明示してくれるため、非常に安心感があります。

また、検証のためにあえて「生成AIポリシー」という資料の「旧版」と「改訂版」をあわせてアップロードしておいたのですが、AIは混乱することなく、しっかりと最新版の記述を参照して回答してくれました。

極めつけは、「この会社は実在しますか?」という質問への回答です。AIは、資料の中に私があらかじめ仕込んでおいた「本ドキュメント群は、社内RAGシステムの検証やデモンストレーションを目的として作成されたものであり、実在する企業とは一切関係ございません」という注釈を正確に引用し、このデータが何であるかを完璧に説明してくれました。

実際に触ってみて感じたこと

今回の検証を通して、コードを一行も書かずに、設定だけでここまで精度の高いアウトプットが出せるということがよくわかりました。

正直なところ、単に手元のPDFの内容に基づいて回答を得たいだけなら、GoogleのNotebookLMのほうが、手早く試せる場面もあります。資料をアップするだけで済みますし、あえて複雑な設定画面に向き合う必要もありません。

それでも今回、Cloud Storageへのアップロードから細かい設定までを自分で行ったのは、「業務システムの一部としてRAGを組み込む」という感触を確かめたかったからです。

実際に手を動かしたことで、情報の新旧を正しく見分けたり、資料内の細かい注釈まで正確に引用したりするRAGの振る舞いを、自分の目で直接確かめることができました。単なる便利ツールを超えた「システムとしてのRAG」の手応えを感じられたことは、大きな収穫です。

RAGの具体的な活用例

RAGは、情報の正確性と最新性が求められるビジネスの現場において、その真価を発揮します。単に「何でも答えられるAI」を目指すのではなく、特定の業務領域に絞って導入することで、情報検索に要するコストを劇的に削減することが可能です。

ここでは、実務において特に効果を実感しやすい代表的なユースケースをご紹介します。

1. 業務マニュアルや社内規定の即時検索

最も代表的な活用シーンは、社内に散在する膨大なドキュメントをAIの参照先にすることです。人事規定や経理の精算ルール、IT機器の操作マニュアルといった資料をRAGに読み込ませることで、従業員は自分自身で必要な情報を即座に引き出せるようになります。

これまでは「あの人に聞かないとわからない」といった属人化が発生し、バックオフィス部門への問い合わせが集中しがちでした。RAGを導入することで、こうした「検索の迷子」を解消し、管理側の対応コストを削減すると同時に、組織全体の意思決定をスピードアップさせることが可能になります。

2. カスタマーサポートや技術支援の高度化

顧客対応や技術サポートの現場においても、RAGは大きな力を発揮するでしょう。製品の仕様書、過去のトラブルシューティング事例、FAQといった膨大なナレッジをAIに連携させることで、担当者は複雑な質問に対しても即座に的確な回答案を得やすくなります。

そのため、経験の浅いスタッフでもベテランに近いレベルでの対応が可能となり、回答品質の均一化が図れるはずです。また、情報の更新が早い製品であっても、最新資料を読み込ませるだけで常に正しい情報を顧客へ提供できるため、教育コストの削減と顧客満足度の向上を同時に目指せるでしょう。

また、より詳細な実例として、東邦ガス株式会社や高島株式会社の導入事例を以下のページにて公開しております。導入後の具体的な活用イメージを確認したい方は、ぜひ参考にしてみてください。

▼公開事例はこちらから
東邦ガス株式会社の導入事例
高島株式会社の導入事例

RAGがビジネスにもたらす「信頼」と「効率」

本記事では、RAG(検索拡張生成)の基礎知識からその仕組み、そして実際の構築イメージまでを解説してきました。

生成AIをビジネスで活用する上で、最大の壁となるのは「情報の不確かさ」です。どれだけ強力なAIであっても、自社固有のルールや最新の動向を知らなければ、実務での活用には限界があります。その限界を突破し、AIに「確かな根拠」を持たせる仕組みこそがRAGです。

AIを「汎用的な道具」として使う段階から、自社のデータと結びつけて「専門的なパートナー」へと進化させる。その有力な手段として、RAGの活用は今後さらに加速していくでしょう。

まずは小さなドキュメントから、AIに「参考書」を渡してみる。その最初の一歩が、停滞していた情報の活用を加速させ、次世代の業務スタイルを切り拓く鍵となるはずです。

塩瀬 悠樹

塩瀬 悠樹の画像

クラウドエース株式会社 カスタマーサクセス部 カスタマーエンジニア。大規模案件を中心にWEBサービス、法務、小売、ゲームなどの業種問わず、様々なシステムの要件定義から実装を経験、中でもミドルウェア開発を通じての開発チームの効率化を得意とする。親会社である吉積ホールディングス株式会社では技術チームの指揮をとり、クラウドエースにも初期メンバーとして参画。現在はシニアスペシャリストとして様々な新事業の立ち上げに従事。