統計的手法応用

あるデータセットで外れ値が1つ追加されたとき、次の統計量への影響として最も適切なものはどれか。

A.平均値は外れ値の影響を受けやすいが、中央値はほとんど影響を受けない← 正解
✓ 正解です。平均値は全データの総和をデータ数で割るため外れ値に敏感で、中央値は順序に基づくため外れ値の影響を受けにくいです。
B.中央値は外れ値の影響を受けやすいが、平均値はほとんど影響を受けない
✗ 平均値と中央値の説明が逆です。外れ値に敏感なのは平均値であり、中央値は外れ値に強い頑健な統計量です。
C.平均値も中央値も外れ値の影響を同程度に受ける
✗ 平均値と中央値は外れ値への感度が異なります。中央値は頑健な統計量として知られています。
D.外れ値はデータ数が多い場合にのみ平均値に影響する
✗ 平均値はデータ数の多少に関わらず外れ値の影響を受けます。データ数が多いと影響が相対的に小さくなるだけです。