機械学習の評価定義

回帰モデルの評価指標「決定係数(R²)」の定義として最も適切なものはどれか?

A.予測値と実際値の絶対値の差を全て足した値の平均
✗ この説明は「平均絶対誤差(MAE)」です。符号を考慮しない誤差指標です。
B.モデルが説明できる分散の割合を示す指標で、1に近いほど精度が高い← 正解
✓ 正解です。R²は(1 - SS_res/SS_tot)で計算され、0~1の範囲で、1に近いほどモデルがデータをよく説明しています。
C.予測値と実際値の差の二乗の平均に平方根を取った値
✗ この説明は「二乗平均平方根誤差(RMSE)」です。予測誤差の大きさを測ります。
D.全データポイントにおける最大予測誤差
✗ この説明は「最大誤差」で、定義係数ではなく個別の誤差を測る指標です。

この問題のポイント

R²は(1 - SS_res/SS_tot)で計算され、0~1の範囲で、1に近いほどモデルがデータをよく説明しています。

AI-900:Microsoft Azure AI Fundamentals の問題一覧