RAGとは？Amazon Bedrock Knowledge Basesで仕組みを図解【AIF-C01】

📘 無料・オールインワン対策｜公式シラバス(AIF-C01)準拠｜
読む（教科書）＋解く（演習クイズ）が1ページで完結。AWSのAIサービスを図解で理解できます。

「AIプラクティショナー試験(AIF-C01)の勉強をしているとRAGやAmazon Bedrock Knowledge Basesが必ず出てくるけど、いまいち仕組みがピンとこない」――そんな方向けの記事です。
RAGはドメイン3「基盤モデルの応用」（配点28%＝最大）の頻出テーマ。図と具体例で、試験で迷わないレベルまで一気に整理します。

この記事でわかること

RAGとは何か（ひとことで）
なぜRAGが必要か＝ハルシネーション問題
RAGの仕組みを図解（Bedrockでの流れ）
Amazon Bedrock Knowledge Bases とベクトルDBの選択肢
RAG vs ファインチューニング（試験頻出の比較）
AIF試験で問われるポイント＋確認クイズ

1. RAGとは？ ―― ひとことで言うと「カンニングOKのLLM」
2. なぜRAGが必要か ―― ハルシネーション問題
3. RAGの仕組みを図解（Bedrockでの流れ）
4. Amazon Bedrock Knowledge Bases とベクトルDB
5. RAG vs ファインチューニング（頻出の比較）
6. 確認クイズ
まとめ

1. RAGとは？ ―― ひとことで言うと「カンニングOKのLLM」

RAG（Retrieval-Augmented Generation／検索拡張生成）とは、
大規模言語モデル（LLM）が回答する前に外部の文書を検索し、その内容を根拠にして回答を生成する仕組みです。

イメージは「カンニングOKの試験」。LLMは記憶だけで答えるのではなく、
信頼できる資料（社内マニュアル、製品FAQ、最新の社内規程など）をその場で参照してから答えます。
これにより、モデルが知らないはずの最新情報や社内固有の情報にも正確に答えられるようになります。

2. なぜRAGが必要か ―― ハルシネーション問題

LLM単体には弱点があります。AIF試験のドメイン2でも問われるハルシネーション（hallucination）――
もっともらしいが事実でない回答を自信満々に生成してしまう現象です。原因はおもに次の2つ。

知識が学習時点で固定：学習後に起きた出来事や、学習データに無い社内情報は知らない
「知らない」と言えない：空白を埋めようとして、それらしい嘘を作ってしまう

RAGはこの弱点を「外部知識を検索して根拠を与える」ことで補います。
回答の根拠（出典）を提示できるため、事実性・最新性・追跡可能性が大きく向上します。

左（RAGなし）：LLMは学習済みの知識だけで答えるため、社内情報や最新情報を知らず、もっともらしい誤り（ハルシネーション）を生むことがあります。
右（RAGあり）：質問に関連する文書をまず検索し、それを根拠に回答するので、最新・社内固有の情報にも正確に答えられます。

3. RAGの仕組みを図解（Bedrockでの流れ）

下の図は、Amazon Bedrock を使った典型的なRAGの流れです。スマホでは上から下へ順に追ってください。

図：Amazon Bedrock を使ったRAGの基本フロー

ポイントは ①〜⑤ の流れと、図の下にある「事前準備（オフライン）」です。

事前準備：社内文書を埋め込みモデルでベクトル（数値の並び）に変換し、ベクトルDBに登録しておく
①質問：ユーザーが質問する
②検索：Knowledge Bases が質問をベクトル化し、③ベクトルDBで意味の近い文書を検索
④回答生成：検索でヒットした文書を根拠（コンテキスト）としてLLMに渡し、回答を生成
⑤回答：根拠にもとづいた回答がユーザーへ返る

重要なのは 「LLMは社内文書を“学習”していない」 こと。あくまで検索結果をその場で参照するだけなので、
文書を差し替えれば回答も即座に最新化されます。これがRAGの大きな利点です。

4. Amazon Bedrock Knowledge Bases とベクトルDB

AWSでは、この一連の流れをマネージドサービスとして提供しているのが
Amazon Bedrock Knowledge Basesです。文書の取り込み・ベクトル化・検索・LLMへの受け渡しを自動でつないでくれます。

検索の核となるベクトルDB（ベクトルストア）には、AIF試験で次のサービスが選択肢として登場します。

サービス	特徴・覚え方
Amazon OpenSearch Service	RAGのベクトル検索で最もよく挙がる定番
Amazon Aurora（PostgreSQL）	pgvectorでベクトル検索に対応したリレーショナルDB
Amazon RDS for PostgreSQL	同じくpgvector。既存のRDS資産を活かせる
Amazon Neptune	グラフDB。関係性をたどる検索に強い

💡 試験対策：上記は公式試験ガイド(AIF-C01)に挙げられているベクトルDBです。「ベクトル検索＝OpenSearch / Aurora・RDS(pgvector) / Neptune」と紐づけて覚えると、選択肢で迷いません。

📌 最新情報の補足：AWSの製品アップデートにより、現在のBedrock Knowledge Basesでは
Amazon S3 Vectorsが新たに対応し、OpenSearchはServerless、NeptuneはNeptune Analyticsとして提供されています。
試験対策としては上表（試験ガイド準拠）を軸に、実務ではこの最新仕様も押さえておきましょう。
（出典：AWS公式ドキュメント Bedrock Knowledge Bases）

5. RAG vs ファインチューニング（頻出の比較）

AIF試験では「社内情報に対応させたい」場面でRAGとファインチューニングのどちらを選ぶかがよく問われます。違いを押さえましょう。

観点	RAG	ファインチューニング
やり方	外部文書を検索して参照	モデル自体を追加学習
情報の更新	文書を差し替えるだけ（容易）	再学習が必要（手間・コスト大）
コスト	比較的低い	学習コストが高い
得意なこと	最新・社内固有の知識を与える	口調・形式・専門スタイルの習得

ざっくり 「知識を足したいならRAG、振る舞い・文体を変えたいならファインチューニング」。
頻繁に変わる社内情報への対応は、まずRAGが第一候補――この感覚が試験でも実務でも役立ちます。

📝 AIF-C01 試験のポイント

RAG＝検索した外部文書を根拠に回答。モデルを再学習しない
マネージドサービスは Amazon Bedrock Knowledge Bases
ベクトルDB＝OpenSearch / Aurora・RDS(pgvector) / Neptune
最新・社内知識を与える＝RAG、文体・形式を変える＝ファインチューニング

6. 確認クイズ

Q1. 社内文書に基づいて根拠付きで回答させ、ハルシネーション（もっともらしい誤り）を減らしたい。最も適した構成は？

A. temperatureを0にする

B. より大きなモデルに変える

C. ファインチューニングで口調を整える

D. RAG（Amazon Bedrock Knowledge Bases）

Q2. Amazon Bedrock Knowledge Basesで、文書をベクトル化して保存・検索する『ベクトルストア』として使えるサービスはどれか？

A. Amazon OpenSearch Service

B. Amazon Comprehend

C. Amazon Polly

D. Amazon Translate

Q3. 自前でベクトルDBの構築・文書の同期・チャンク分割を管理せず、マネージドにRAGを実装したい。最適なサービスは？

A. Amazon SageMaker Clarify

B. Amazon Bedrock Knowledge Bases

C. Amazon Bedrock Agents

D. Amazon Bedrock Guardrails

Q4. （1）最新の社内ナレッジを回答に反映したい（2）モデルの口調・出力形式を自社仕様に固定したい。それぞれに最も適した手法の組合せは？

A. （1）事前学習（2）インコンテキスト学習

B. （1）プロンプトエンジニアリング（2）蒸留

C. （1）RAG （2）ファインチューニング

D. （1）ファインチューニング（2）RAG

まとめ

RAG＝外部文書を検索して根拠に回答する仕組み。ハルシネーションを抑え、最新情報に強い
AWSのマネージド実装が Amazon Bedrock Knowledge Bases、検索基盤がベクトルDB
知識を足す＝RAG／振る舞いを変える＝ファインチューニング、の使い分けが試験頻出

🎯 次のステップ

➡ AIF-C01 シラバスマップで全体像と関連トピックを確認
➡ 無料模試（4択演習）でRAGの問題に挑戦
➡ 仕上げに本番形式で演習したい方へ：おすすめのUdemy講座・問題集

※本記事はAWS公式試験ガイド（AIF-C01）の出題範囲に基づき、エンジニアKが作成しています。