偏差、分散、標準偏差の意味と性質、練習問題について



1. 偏差とは
偏差 とは、データの平均値からの差を表す指標です。各データから平均値を引いた値がそのデータの偏差となります。偏差を求めることで、各データがデータの平均からどの程度はなれているかを把握することができます。数式では以下のようにあらわします。データを$x_i$,平均を$\bar{x}$とすると、
$$x_i-\bar{x}$$

1.1. 偏差の性質
偏差には各データの偏差の和は0になるという性質があります。以下にその具体例を示します。
1,2,3,4というデータが与えれているとします。このデータの平均$\bar{x}$は、$\bar{x}=\dfrac{10}{4}$です。
したがって、偏差の和は以下のようにあらわすことができる。
$1-\bar{x}+2-\bar{x}+3-\bar{x}+4-\bar{x}$
$=10-4\bar{x}$
$=10-4\cdot\dfrac{10}{4}$
$=0$
1.2. 偏差の性質の証明
n個のデータが$x_1,x_2・・・x_n$とあるとします。データの平均は、$\bar{x}=\dfrac{1}{n}\displaystyle\sum^n_{i=0}x_i$とあらわすことができます。
偏差の和を$S$として、以下で表すと、
$S=\left(\displaystyle\sum^n_{i=1} x_i\right)-n\bar{x}$
$=\left(\displaystyle\sum^n_{i=1}x_i\right)-\left(n\cdot\dfrac{1}{n}\displaystyle\sum^n_{i=1}x_i\right)$
$=0$
このように、偏差では、各データのばらつきはわかったとしても、全体のばらつき具合がわかりません。そのため、分散を用いることで、全体のばらつき具合を調べることができます。
2. 分散とは
分散 とは、偏差の二乗の平均値で求めることができます。各データから求めた偏差を2乗してその和をデータの個数で割ります。分散を求めることで、データのばらつきの大きさを数値化することができます。分散が大きいほど、データのばらつきが大きく、逆にばらつきが小さい場合は、データのばらつきが小さいです。
分散を$s^2$とすると、数式では以下のようにあらわすことができます。
$$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$$
2.1. 分散の式変形
$$s^2=\displaystyle\dfrac{1}{n}\sum^n_{i=1}{x_{i}^2}-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2$$
2.2. 式変形
$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$であるから、
$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$
$=\large\left(\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2\right)-2\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}\overline{x}x_i+\overline{x^2}$
$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-2\overline{x}\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i+\overline{x^2}$
$\overline{x}=\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i$であるから、
$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-2\overline{x}\cdot\overline{x}+\overline{x^2}$
$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-\overline{x^2}$
$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2$
となる。
3. 標準偏差とは
標準偏差 は、分散の平方根で求めることができます。標準偏差は、分散の平方根を取ることで求められます。標準偏差を求めることで、データのばらつきの大きさをデータと同じ単位で表現することができます。また、標準偏差が小さいほど、データのばらつきが小さいことを意味します。標準偏差sを数式で表すと、以下のようになります。
$s=\large\displaystyle\sqrt{\dfrac{1}{n}\sum^n_{i=1}x_i^2-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2}$
$s=\large\displaystyle\sqrt{\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2}$

4. 練習問題

4.1. 問題 1: 家庭の水使用量の偏差
- 平均水使用量を求めてください。
- 各家庭の水使用量の偏差を求めてください。
- 偏差の合計が0になることを確認してください。
家庭 | 使用量 (m³) |
---|---|
A | 25 |
B | 30 |
C | 28 |
D | 35 |
E | 27 |
平均水使用量は、以下の式で求めます。
\[ \text{平均} = \frac{25 + 30 + 28 + 35 + 27}{5} = \frac{145}{5} = 29 \, (\text{m³}) \]
各家庭の水使用量の偏差を求めます。
偏差は、各家庭の使用量から平均を引いたものです。
\[ \text{偏差}_{A} = 25 – 29 = -4 \]
\[ \text{偏差}_{B} = 30 – 29 = 1 \]
\[ \text{偏差}_{C} = 28 – 29 = -1 \]
\[ \text{偏差}_{D} = 35 – 29 = 6 \]
\[ \text{偏差}_{E} = 27 – 29 = -2 \]
偏差の一覧
家庭 | 使用量 (m³) | 偏差 |
---|---|---|
A | 25 | -4 |
B | 30 | 1 |
C | 28 | -1 |
D | 35 | 6 |
E | 27 | -2 |
偏差の合計は、以下の通りです。
\[ -4 + 1 – 1 + 6 – 2 = 0 \]
よって、偏差の合計が0になることが確認されました。
4.2. 問題 2: 水使用量の標準偏差
- 使用量の平均を求めてください。
- 使用量の分散を求めてください。
- 使用量の標準偏差を求めてください。
家庭 | 使用量 (m³) |
---|---|
F | 20 |
G | 32 |
H | 29 |
I | 34 |
J | 33 |
使用量の平均を求める。
平均使用量は、以下の式で求めます。
\[ \text{平均使用量} = \frac{20 + 32 + 29 + 34 + 33}{5} = \frac{148}{5} = 29.6 \, (\text{m³}) \]
使用量の分散を求める。
各家庭の使用量から平均を引いて偏差を求め、その二乗をとります。
\[ \text{偏差}{F} = 20 – 29.6 = -9.6 \quad \Rightarrow \quad \text{偏差}^2{F} = (-9.6)^2 = 92.16 \]
\[ \text{偏差}{G} = 32 – 29.6 = 2.4 \quad \Rightarrow \quad \text{偏差}^2{G} = (2.4)^2 = 5.76 \]
\[ \text{偏差}{H} = 29 – 29.6 = -0.6 \quad \Rightarrow \quad \text{偏差}^2{H} = (-0.6)^2 = 0.36 \]
\[ \text{偏差}{I} = 34 – 29.6 = 4.4 \quad \Rightarrow \quad \text{偏差}^2{I} = (4.4)^2 = 19.36 \]
\[ \text{偏差}{J} = 33 – 29.6 = 3.4 \quad \Rightarrow \quad \text{偏差}^2{J} = (3.4)^2 = 11.56 \]
分散は、偏差の二乗の平均で求めます。
\[ \text{分散} = \frac{92.16 + 5.76 + 0.36 + 19.36 + 11.56}{5} = \frac{129.2}{5} = 25.84 \, (\text{m³}^2) \]
標準偏差は、分散の平方根を取って求めます。
\[ \text{標準偏差} = \sqrt{25.84} \approx 5.08 \, (\text{m³}) \]
4.3. 問題 3: 年間水使用量の分析
- 年間の平均水使用量を求めてください。
- 使用量の分散と標準偏差を求めてください。
月 | 使用量 (m³) |
---|---|
1月 | 30 |
2月 | 28 |
3月 | 35 |
4月 | 29 |
5月 | 31 |
6月 | 32 |
7月 | 36 |
8月 | 34 |
9月 | 33 |
10月 | 30 |
11月 | 29 |
12月 | 31 |
年間の平均水使用量を求める。
年間の平均水使用量は、以下の式で求めます。
\[ \text{年間平均使用量} = \frac{30 + 28 + 35 + 29 + 31 + 32 + 36 + 34 + 33 + 30 + 29 + 31}{12} = \frac{378}{12} = 31.5 \, (\text{m³}) \]
使用量の分散と標準偏差を求める。
各月の使用量から年間平均使用量を引いて偏差を求め、その二乗をとります。
\[ \text{偏差}{1月} = 30 – 31.5 = -1.5 \quad \Rightarrow \quad \text{偏差}^2{1月} = (-1.5)^2 = 2.25 \]
\[ \text{偏差}{2月} = 28 – 31.5 = -3.5 \quad \Rightarrow \quad \text{偏差}^2{2月} = (-3.5)^2 = 12.25 \]
\[ \text{偏差}{3月} = 35 – 31.5 = 3.5 \quad \Rightarrow \quad \text{偏差}^2{3月} = (3.5)^2 = 12.25 \]
\[ \text{偏差}{4月} = 29 – 31.5 = -2.5 \quad \Rightarrow \quad \text{偏差}^2{4月} = (-2.5)^2 = 6.25 \]
\[ \text{偏差}{5月} = 31 – 31.5 = -0.5 \quad \Rightarrow \quad \text{偏差}^2{5月} = (-0.5)^2 = 0.25 \]
\[ \text{偏差}{6月} = 32 – 31.5 = 0.5 \quad \Rightarrow \quad \text{偏差}^2{6月} = (0.5)^2 = 0.25 \]
\[ \text{偏差}{7月} = 36 – 31.5 = 4.5 \quad \Rightarrow \quad \text{偏差}^2{7月} = (4.5)^2 = 20.25 \]
\[ \text{偏差}{8月} = 34 – 31.5 = 2.5 \quad \Rightarrow \quad \text{偏差}^2{8月} = (2.5)^2 = 6.25 \]
\[ \text{偏差}{9月} = 33 – 31.5 = 1.5 \quad \Rightarrow \quad \text{偏差}^2{9月} = (1.5)^2 = 2.25 \]
\[ \text{偏差}{10月} = 30 – 31.5 = -1.5 \quad \Rightarrow \quad \text{偏差}^2{10月} = (-1.5)^2 = 2.25 \]
\[ \text{偏差}{11月} = 29 – 31.5 = -2.5 \quad \Rightarrow \quad \text{偏差}^2{11月} = (-2.5)^2 = 6.25 \]
\[ \text{偏差}{12月} = 31 – 31.5 = -0.5 \quad \Rightarrow \quad \text{偏差}^2{12月} = (-0.5)^2 = 0.25 \]
分散は、偏差の二乗の平均で求めます。
\[ \text{分散} = \frac{2.25 + 12.25 + 12.25 + 6.25 + 0.25 + 0.25 + 20.25 + 6.25 + 2.25 + 2.25 + 6.25 + 0.25}{12} = \frac{71}{12} \approx 5.96 \, (\text{m³}^2) \]
標準偏差は、分散の平方根を取って求めます。
\[ \text{標準偏差} = \sqrt{5.96} \approx 2.44 \, (\text{m³}) \]