統計的手法定義
次のデータ(2, 4, 6, 8, 10)の分散の計算式として正しいものはどれか。ただし、平均値は6である。
A.{ (2−6)² + (4−6)² + (6−6)² + (8−6)² + (10−6)² } ÷ 5← 正解
✓ 正解です。分散は各データと平均との偏差の二乗の平均(母分散)で、この場合は偏差二乗和÷データ数(5)で求めます。
B.{ (2−6) + (4−6) + (6−6) + (8−6) + (10−6) } ÷ 5
✗ 偏差の単純和をデータ数で割った式です。偏差の和は常に0になるため分散の定義としては誤りです。
C.{ |2−6| + |4−6| + |6−6| + |8−6| + |10−6| } ÷ 5
✗ これは「平均絶対偏差」の計算式であり、分散の定義ではありません。
D.{ (2−6)² + (4−6)² + (6−6)² + (8−6)² + (10−6)² } ÷ 4
✗ 分母が4(n−1)となっており、これは「不偏分散」の計算式です。母分散の定義はn(5)で割ります。
「統計的手法」の他の問題
あるデータセットで外れ値が1つ追加されたとき、次の統計量への影響として最も適切なものはどれか。管理図において、点が管理限界線の内側にあっても「工程が異常である」と判断する場合がある。その根拠として最も適切なものはど…単回帰分析において、決定係数R²が0.95から0.60に低下した。このとき考えられる状況として最も適切なものはどれか。正規分布に従う工程において、規格の上限値と下限値を変えずに工程の標準偏差σを半分にしたとき、工程能力指数Cpはどのように…二元配置実験(繰り返し有り)で交互作用が有意であった場合、主効果の解釈について最も適切な記述はどれか。仮説検定において、サンプルサイズnを4倍に増やしたとき、他の条件(母分散・有意水準)を一定とした場合に起こる変化として最…