難問チャレンジ定義問題

Azure AI Foundryにおいて「Safety Evaluations」が計測するメトリクスの例として正しいのはどれか?

A.APIの平均レスポンス時間
✗ レスポンス時間はAzure MonitorのパフォーマンスメトリクスでSafety Evaluationsの指標ではない。
B.ユーザーの満足度スコア
✗ ユーザー満足度はアプリケーション層の指標でAI Foundryのビルトインメトリクスではない。
C.GroundednessとRelevance(回答の根拠性と関連性)← 正解
✓ 正解。Groundedness(根拠のある回答か)、Relevance(質問に関連しているか)、Coherence等をAIで自動評価する。
D.モデルのパラメータ数
✗ パラメータ数はモデルのアーキテクチャ情報であり評価メトリクスではない。

AI-900:Microsoft Azure AI Fundamentals の問題一覧