【AIF-C01】基盤モデルのライフサイクルとは?データ選定からデプロイまで図解

AWS認定AIプラクティショナー(AIF-C01) 基盤モデルのライフサイクル 解説アイキャッチ AIプラクティショナー(AIF)
無料オールインワン対策|公式シラバス(AIF-C01)準拠|基盤モデルが作られ使われるまでの全工程を、図と具体例でやさしく。

生成AIの中核にある基盤モデル(Foundation Model, FM)。AWS認定AIプラクティショナー(AIF-C01)のドメイン2では、FMがどう作られ、どう自社の用途に合わせて使われるかという「ライフサイクル」が問われます。各工程の役割と、AWS(Amazon Bedrock / SageMaker)でどう関わるかを順に押さえましょう。用語が不安な方は 生成AIの基礎用語 から。

基盤モデルのライフサイクル(全体像)

FMのライフサイクルは、大きく次の6工程+継続的なフィードバックで進みます。多くの企業は事前学習済みのFMを「選んで・適応させて・使う」のが基本です。

基盤モデルのライフサイクル:データ選定→モデル選定→事前学習→ファインチューニング→評価→デプロイの6工程
図:基盤モデルのライフサイクル。多くの企業は「事前学習済みのFMを選び、適応・評価・デプロイ」を担います。

① データ選定(data selection)

学習や適応に使うデータを選ぶ工程です。質・量・多様性が性能を左右し、偏ったデータはバイアスにつながります。著作権・個人情報などライセンス/コンプライアンスの確認も必須です。例:社内チャットボット用に、最新の社内FAQと製品マニュアルを整備する。

② モデル選定(model selection)

ゼロから作るのではなく、既存の事前学習済みFMを選ぶのが一般的です。用途・サイズ・コスト・対応モダリティ(テキスト/画像)・対応言語で比較します。AWSではAmazon Bedrockで複数ベンダーのFMをAPIで選べ、SageMaker JumpStartで公開モデルを手早く試せます。

③ 事前学習(pre-training)

大量の汎用データでモデルに幅広い基礎能力を身につけさせる工程。膨大な計算資源とコストがかかるため、多くの企業は自前では行わず、提供済みのFMを利用します。「FMはここまで出来上がっている」と理解すればOKです。

④ ファインチューニング(fine-tuning)

事前学習済みFMを、自社のタスクやドメインに適応させる工程。少量の専用データで、口調・形式・専門用語を学ばせます(指示チューニング、ドメイン適応など)。「知識を足す」ならRAG、「振る舞いを変える」ならファインチューニングが使い分けの基本です。例:自社の問い合わせ対応の文体に合わせて回答させる。

⑤ 評価(evaluation)

適応したモデルが期待どおりかを検証します。人手評価・ベンチマークデータ・各種指標を組み合わせ、精度や安全性を確認。AWSではAmazon Bedrock のモデル評価機能などが使えます。ビジネス目標(効率・満足度など)に沿っているかも見ます。

⑥ デプロイと継続的なフィードバック

本番に出す工程。マネージドAPI(Amazon Bedrock)で手軽に提供するか、自前ホスティング(SageMaker)で運用します。公開後は利用データやユーザー反応をフィードバックとして集め、④適応・⑤評価に戻って継続的に改善します(RLHF=人間のフィードバックによる強化学習もこの一種)。

📝 AIF-C01 試験のポイント

  • 流れ=データ選定→モデル選定→事前学習→ファインチューニング→評価→デプロイ→フィードバック
  • 事前学習は高コスト → 多くは既存FMを選んで適応して使う
  • 知識追加=RAG/振る舞い変更=ファインチューニング
  • AWS:選定/利用=Bedrock・JumpStart、評価=Bedrockモデル評価、運用=Bedrock/SageMaker

確認クイズ

Q1. 多くの企業が「自前ではほとんど行わない」工程はどれ?

A. ファインチューニング
B. 大規模な事前学習(pre-training)
C. 評価
D. デプロイ

Q2. FMを「自社の文体・専門用語」に適応させる工程は?

A. データ選定
B. ファインチューニング
C. デプロイ
D. 事前学習

よくある質問(FAQ)

Q. ファインチューニングとRAGはどう使い分ける?

A. 最新・社内の「知識」を与えたいならRAG、口調・形式・専門スタイルなど「振る舞い」を変えたいならファインチューニングが基本です(併用も可)。

Q. 事前学習とファインチューニングの違いは?

A. 事前学習は大量データで“汎用能力”を作る重い工程、ファインチューニングは少量データで“特定用途”に寄せる軽い工程です。

Q. AWSではどのサービスが関わる?

A. モデル選定・利用はAmazon Bedrock/SageMaker JumpStart、評価はBedrockのモデル評価、運用はBedrock(API)やSageMaker(自前ホスティング)が代表例です。

まとめ

  • FMライフサイクル=データ選定→モデル選定→事前学習→FT→評価→デプロイ→フィードバック
  • 事前学習は高コスト、企業は“既存FMを選んで適応して使う”が基本
  • 知識追加=RAG/振る舞い変更=ファインチューニング

※本記事はAWS公式試験ガイド(AIF-C01)に基づき、エンジニアKが作成しています。

コメント

タイトルとURLをコピーしました