難問チャレンジ応用

Azure MLで機械学習モデルに対して「量子化(int8への変換)」を適用した場合、推論時のレイテンシと精度にはどのような相互作用が発生するか?

A.レイテンシが著しく低下(高速化)し、精度もわずかに向上するため、量子化は常に推奨される
✗ 量子化により精度が向上することはありません。通常、精度低下とのトレードオフが発生します。
B.推論速度が向上する一方で、精度が低下するトレードオフが発生し、用途に応じて許容範囲を判断する必要があります← 正解
✓ 正解です。量子化は計算量削減で速度向上を実現しますが、精度低下とのバランス調整が課題です。
C.レイテンシは変わらず、精度のみが低下するため、エッジデバイスでの展開には不向きです
✗ レイテンシは改善されます。量子化の主な利点は推論時間の短縮です。
D.精度は維持されますが、推論速度が低下するため、モバイルアプリケーションには適していません
✗ 量子化により推論速度は向上します。エッジデバイス展開の際に活用される技術です。

この問題のポイント

量子化は計算量削減で速度向上を実現しますが、精度低下とのバランス調整が課題です。

AI-900:Microsoft Azure AI Fundamentals の問題一覧