「AIプラクティショナー試験(AIF-C01)の勉強をしているとRAGやAmazon Bedrock Knowledge Basesが必ず出てくるけど、いまいち仕組みがピンとこない」――そんな方向けの記事です。
RAGはドメイン3「基盤モデルの応用」(配点28%=最大)の頻出テーマ。図と具体例で、試験で迷わないレベルまで一気に整理します。
- RAGとは何か(ひとことで)
- なぜRAGが必要か=ハルシネーション問題
- RAGの仕組みを図解(Bedrockでの流れ)
- Amazon Bedrock Knowledge Bases とベクトルDBの選択肢
- RAG vs ファインチューニング(試験頻出の比較)
- AIF試験で問われるポイント+確認クイズ
1. RAGとは? ―― ひとことで言うと「カンニングOKのLLM」
RAG(Retrieval-Augmented Generation/検索拡張生成)とは、
大規模言語モデル(LLM)が回答する前に外部の文書を検索し、その内容を根拠にして回答を生成する仕組みです。
イメージは「カンニングOKの試験」。LLMは記憶だけで答えるのではなく、
信頼できる資料(社内マニュアル、製品FAQ、最新の社内規程など)をその場で参照してから答えます。
これにより、モデルが知らないはずの最新情報や社内固有の情報にも正確に答えられるようになります。
2. なぜRAGが必要か ―― ハルシネーション問題
LLM単体には弱点があります。AIF試験のドメイン2でも問われるハルシネーション(hallucination)――
もっともらしいが事実でない回答を自信満々に生成してしまう現象です。原因はおもに次の2つ。
- 知識が学習時点で固定:学習後に起きた出来事や、学習データに無い社内情報は知らない
- 「知らない」と言えない:空白を埋めようとして、それらしい嘘を作ってしまう
RAGはこの弱点を「外部知識を検索して根拠を与える」ことで補います。
回答の根拠(出典)を提示できるため、事実性・最新性・追跡可能性が大きく向上します。
3. RAGの仕組みを図解(Bedrockでの流れ)
下の図は、Amazon Bedrock を使った典型的なRAGの流れです。スマホでは上から下へ順に追ってください。
ポイントは ①〜⑤ の流れと、図の下にある「事前準備(オフライン)」です。
- 事前準備:社内文書を埋め込みモデルでベクトル(数値の並び)に変換し、ベクトルDBに登録しておく
- ①質問:ユーザーが質問する
- ②検索:Knowledge Bases が質問をベクトル化し、③ベクトルDBで意味の近い文書を検索
- ④回答生成:検索でヒットした文書を根拠(コンテキスト)としてLLMに渡し、回答を生成
- ⑤回答:根拠にもとづいた回答がユーザーへ返る
重要なのは 「LLMは社内文書を“学習”していない」 こと。あくまで検索結果をその場で参照するだけなので、
文書を差し替えれば回答も即座に最新化されます。これがRAGの大きな利点です。
4. Amazon Bedrock Knowledge Bases とベクトルDB
AWSでは、この一連の流れをマネージドサービスとして提供しているのが
Amazon Bedrock Knowledge Basesです。文書の取り込み・ベクトル化・検索・LLMへの受け渡しを自動でつないでくれます。
検索の核となるベクトルDB(ベクトルストア)には、AIF試験で次のサービスが選択肢として登場します。
| サービス | 特徴・覚え方 |
|---|---|
| Amazon OpenSearch Service | RAGのベクトル検索で最もよく挙がる定番 |
| Amazon Aurora(PostgreSQL) | pgvectorでベクトル検索に対応したリレーショナルDB |
| Amazon RDS for PostgreSQL | 同じくpgvector。既存のRDS資産を活かせる |
| Amazon Neptune | グラフDB。関係性をたどる検索に強い |
💡 試験対策:上記は公式試験ガイド(AIF-C01)に挙げられているベクトルDBです。「ベクトル検索=OpenSearch / Aurora・RDS(pgvector) / Neptune」と紐づけて覚えると、選択肢で迷いません。
Amazon S3 Vectorsが新たに対応し、OpenSearchはServerless、NeptuneはNeptune Analyticsとして提供されています。
試験対策としては上表(試験ガイド準拠)を軸に、実務ではこの最新仕様も押さえておきましょう。
(出典:AWS公式ドキュメント Bedrock Knowledge Bases)
5. RAG vs ファインチューニング(頻出の比較)
AIF試験では「社内情報に対応させたい」場面でRAGとファインチューニングのどちらを選ぶかがよく問われます。違いを押さえましょう。
| 観点 | RAG | ファインチューニング |
|---|---|---|
| やり方 | 外部文書を検索して参照 | モデル自体を追加学習 |
| 情報の更新 | 文書を差し替えるだけ(容易) | 再学習が必要(手間・コスト大) |
| コスト | 比較的低い | 学習コストが高い |
| 得意なこと | 最新・社内固有の知識を与える | 口調・形式・専門スタイルの習得 |
ざっくり 「知識を足したいならRAG、振る舞い・文体を変えたいならファインチューニング」。
頻繁に変わる社内情報への対応は、まずRAGが第一候補――この感覚が試験でも実務でも役立ちます。
- RAG=検索した外部文書を根拠に回答。モデルを再学習しない
- マネージドサービスは Amazon Bedrock Knowledge Bases
- ベクトルDB=OpenSearch / Aurora・RDS(pgvector) / Neptune
- 最新・社内知識を与える=RAG、文体・形式を変える=ファインチューニング
6. 確認クイズ(4択)
Q. 頻繁に更新される社内規程について、LLMに正確かつ最新の回答をさせたい。最も適切なAWSの選択肢は?
まとめ
- RAG=外部文書を検索して根拠に回答する仕組み。ハルシネーションを抑え、最新情報に強い
- AWSのマネージド実装が Amazon Bedrock Knowledge Bases、検索基盤がベクトルDB
- 知識を足す=RAG/振る舞いを変える=ファインチューニング、の使い分けが試験頻出
- ➡ AIF-C01 シラバスマップで全体像と関連トピックを確認
- ➡ 無料模試(4択演習)でRAGの問題に挑戦
- ➡ 仕上げに本番形式で演習したい方へ:おすすめUdemy問題集(準備中:アフィリリンク)
※本記事はAWS公式試験ガイド(AIF-C01)の出題範囲に基づき、エンジニアKが作成しています。


コメント