RAGとは?Amazon Bedrock Knowledge Basesで仕組みを図解【AIF-C01】

無料オールインワン対策|公式シラバス(AIF-C01)準拠|
読む(教科書)+解く(演習クイズ)が1ページで完結。AWSのAIサービスを図解で理解できます。

「AIプラクティショナー試験(AIF-C01)の勉強をしているとRAGAmazon Bedrock Knowledge Basesが必ず出てくるけど、いまいち仕組みがピンとこない」――そんな方向けの記事です。
RAGはドメイン3「基盤モデルの応用」(配点28%=最大)の頻出テーマ。図と具体例で、試験で迷わないレベルまで一気に整理します。

この記事でわかること

  1. RAGとは何か(ひとことで)
  2. なぜRAGが必要か=ハルシネーション問題
  3. RAGの仕組みを図解(Bedrockでの流れ)
  4. Amazon Bedrock Knowledge Bases とベクトルDBの選択肢
  5. RAG vs ファインチューニング(試験頻出の比較)
  6. AIF試験で問われるポイント+確認クイズ

1. RAGとは? ―― ひとことで言うと「カンニングOKのLLM」

RAG(Retrieval-Augmented Generation/検索拡張生成)とは、
大規模言語モデル(LLM)が回答する前に外部の文書を検索し、その内容を根拠にして回答を生成する仕組みです。

イメージは「カンニングOKの試験」。LLMは記憶だけで答えるのではなく、
信頼できる資料(社内マニュアル、製品FAQ、最新の社内規程など)をその場で参照してから答えます。
これにより、モデルが知らないはずの最新情報や社内固有の情報にも正確に答えられるようになります。

2. なぜRAGが必要か ―― ハルシネーション問題

LLM単体には弱点があります。AIF試験のドメイン2でも問われるハルシネーション(hallucination)――
もっともらしいが事実でない回答を自信満々に生成してしまう現象です。原因はおもに次の2つ。

  • 知識が学習時点で固定:学習後に起きた出来事や、学習データに無い社内情報は知らない
  • 「知らない」と言えない:空白を埋めようとして、それらしい嘘を作ってしまう

RAGはこの弱点を「外部知識を検索して根拠を与える」ことで補います。
回答の根拠(出典)を提示できるため、事実性・最新性・追跡可能性が大きく向上します。

3. RAGの仕組みを図解(Bedrockでの流れ)

下の図は、Amazon Bedrock を使った典型的なRAGの流れです。スマホでは上から下へ順に追ってください。

Bedrock で作る RAG の流れAIF-C01 ドメイン3 / RAG・ベクトルDB質問ベクトル検索関連文書回答ユーザー知りたいことを質問する1Knowledge Bases質問を検索クエリに変換2ベクトルDB類似する社内文書を検索3Bedrock(LLM)文書を根拠に回答を生成4ユーザー根拠つきの回答を受け取る5※事前準備:社内文書を埋め込みモデルでベクトル化し、ベクトルDBに登録しておく(オフライン)ポイント:LLMは文書を「学習」せず、検索結果を根拠に回答 → ハルシネーション低減・情報更新が容易
図:Amazon Bedrock を使ったRAGの基本フロー

ポイントは ①〜⑤ の流れと、図の下にある「事前準備(オフライン)」です。

  1. 事前準備:社内文書を埋め込みモデルでベクトル(数値の並び)に変換し、ベクトルDBに登録しておく
  2. ①質問:ユーザーが質問する
  3. ②検索:Knowledge Bases が質問をベクトル化し、ベクトルDBで意味の近い文書を検索
  4. ④回答生成:検索でヒットした文書を根拠(コンテキスト)としてLLMに渡し、回答を生成
  5. ⑤回答:根拠にもとづいた回答がユーザーへ返る

重要なのは 「LLMは社内文書を“学習”していない」 こと。あくまで検索結果をその場で参照するだけなので、
文書を差し替えれば回答も即座に最新化されます。これがRAGの大きな利点です。

4. Amazon Bedrock Knowledge Bases とベクトルDB

AWSでは、この一連の流れをマネージドサービスとして提供しているのが
Amazon Bedrock Knowledge Basesです。文書の取り込み・ベクトル化・検索・LLMへの受け渡しを自動でつないでくれます。

検索の核となるベクトルDB(ベクトルストア)には、AIF試験で次のサービスが選択肢として登場します。

サービス 特徴・覚え方
Amazon OpenSearch Service RAGのベクトル検索で最もよく挙がる定番
Amazon Aurora(PostgreSQL) pgvectorでベクトル検索に対応したリレーショナルDB
Amazon RDS for PostgreSQL 同じくpgvector。既存のRDS資産を活かせる
Amazon Neptune グラフDB。関係性をたどる検索に強い

💡 試験対策:上記は公式試験ガイド(AIF-C01)に挙げられているベクトルDBです。「ベクトル検索=OpenSearch / Aurora・RDS(pgvector) / Neptune」と紐づけて覚えると、選択肢で迷いません。

📌 最新情報の補足:AWSの製品アップデートにより、現在のBedrock Knowledge Basesでは
Amazon S3 Vectorsが新たに対応し、OpenSearchはServerless、NeptuneはNeptune Analyticsとして提供されています。
試験対策としては上表(試験ガイド準拠)を軸に、実務ではこの最新仕様も押さえておきましょう。
(出典:AWS公式ドキュメント Bedrock Knowledge Bases)

5. RAG vs ファインチューニング(頻出の比較)

AIF試験では「社内情報に対応させたい」場面でRAGとファインチューニングのどちらを選ぶかがよく問われます。違いを押さえましょう。

観点 RAG ファインチューニング
やり方 外部文書を検索して参照 モデル自体を追加学習
情報の更新 文書を差し替えるだけ(容易) 再学習が必要(手間・コスト大)
コスト 比較的低い 学習コストが高い
得意なこと 最新・社内固有の知識を与える 口調・形式・専門スタイルの習得

ざっくり 「知識を足したいならRAG、振る舞い・文体を変えたいならファインチューニング」
頻繁に変わる社内情報への対応は、まずRAGが第一候補――この感覚が試験でも実務でも役立ちます。

📝 AIF-C01 試験のポイント

  • RAG=検索した外部文書を根拠に回答。モデルを再学習しない
  • マネージドサービスは Amazon Bedrock Knowledge Bases
  • ベクトルDB=OpenSearch / Aurora・RDS(pgvector) / Neptune
  • 最新・社内知識を与える=RAG、文体・形式を変える=ファインチューニング

6. 確認クイズ(4択)

Q. 頻繁に更新される社内規程について、LLMに正確かつ最新の回答をさせたい。最も適切なAWSの選択肢は?

A. モデルを社内規程でファインチューニングし、規程が変わるたびに再学習する
B. Amazon Bedrock Knowledge Bases で規程文書を参照させる(RAG)
C. プロンプトに毎回すべての規程を貼り付ける
D. temperatureを上げて回答の多様性を高める

まとめ

  • RAG=外部文書を検索して根拠に回答する仕組み。ハルシネーションを抑え、最新情報に強い
  • AWSのマネージド実装が Amazon Bedrock Knowledge Bases、検索基盤がベクトルDB
  • 知識を足す=RAG/振る舞いを変える=ファインチューニング、の使い分けが試験頻出

🎯 次のステップ

※本記事はAWS公式試験ガイド(AIF-C01)の出題範囲に基づき、エンジニアKが作成しています。

コメント

タイトルとURLをコピーしました