難問チャレンジ定義問題

「量子化(Quantization)」をAIモデルに適用する主な目的はどれか?

A.モデルの訓練精度を向上させる
✗ 量子化は精度とのトレードオフがある。精度向上ではなくサイズ・コスト削減が目的。
B.モデルの重みをより低精度の数値形式に変換してファイルサイズと推論コストを削減する← 正解
✓ 正解。32bit浮動小数点(FP32)を8bit整数(INT8)等に変換してモデルを軽量化し推論を高速化する。
C.モデルのコンテキストウィンドウを拡張する
✗ コンテキストウィンドウはモデルのアーキテクチャで決定。量子化では変更できない。
D.モデルのAPIレート制限を解除する
✗ APIレート制限はAzureのクォータ設定が担う。モデルの数値精度と無関係。

AI-900:Microsoft Azure AI Fundamentals の問題一覧