更新:2024/11/24

偏差、分散、標準偏差の意味と性質、練習問題について

はるか
はるか
今日は偏差と分散、そして標準偏差について。
ふゅか
ふゅか
まずは偏差からだね。

1. 偏差とは

偏差 とは、データの平均値からの差を表す指標です。各データから平均値を引いた値がそのデータの偏差となります。偏差を求めることで、各データがデータの平均からどの程度はなれているかを把握することができます。数式では以下のようにあらわします。データを$x_i$,平均を$\bar{x}$とすると、

$$x_i-\bar{x}$$

はるか
はるか
偏差とは、データの平均値からの差を表す指標。各データから平均値を引いた値。

1.1. 偏差の性質

偏差には各データの偏差の和は0になるという性質があります。以下にその具体例を示します。

1,2,3,4というデータが与えれているとします。このデータの平均$\bar{x}$は、$\bar{x}=\dfrac{10}{4}$です。

したがって、偏差の和は以下のようにあらわすことができる。

$1-\bar{x}+2-\bar{x}+3-\bar{x}+4-\bar{x}$

$=10-4\bar{x}$

$=10-4\cdot\dfrac{10}{4}$

$=0$

1.2. 偏差の性質の証明

n個のデータが$x_1,x_2・・・x_n$とあるとします。データの平均は、$\bar{x}=\dfrac{1}{n}\displaystyle\sum^n_{i=0}x_i$とあらわすことができます。

偏差の和を$S$として、以下で表すと、

$S=\left(\displaystyle\sum^n_{i=1} x_i\right)-n\bar{x}$

$=\left(\displaystyle\sum^n_{i=1}x_i\right)-\left(n\cdot\dfrac{1}{n}\displaystyle\sum^n_{i=1}x_i\right)$

$=0$

このように、偏差では、各データのばらつきはわかったとしても、全体のばらつき具合がわかりません。そのため、分散を用いることで、全体のばらつき具合を調べることができます。

2. 分散とは

分散 とは、偏差の二乗の平均値で求めることができます。各データから求めた偏差を2乗してその和をデータの個数で割ります。分散を求めることで、データのばらつきの大きさを数値化することができます。分散が大きいほど、データのばらつきが大きく、逆にばらつきが小さい場合は、データのばらつきが小さいです。

分散を$s^2$とすると、数式では以下のようにあらわすことができます。

$$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$$

2.1. 分散の式変形

分散は 二乗の平均$ \displaystyle\dfrac{1}{n}\sum^n_{i=1}{x_{i}^2} $と 平均の二乗$\displaystyle\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2$の差で計算できるように式変形ができます。分散を$s^2$とすると、以下のようにあらわすことができます。

$$s^2=\displaystyle\dfrac{1}{n}\sum^n_{i=1}{x_{i}^2}-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2$$

2.2. 式変形

$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$であるから、

$s^2=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2$

$=\large\left(\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2\right)-2\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}\overline{x}x_i+\overline{x^2}$

$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-2\overline{x}\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i+\overline{x^2}$

$\overline{x}=\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i$であるから、

$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-2\overline{x}\cdot\overline{x}+\overline{x^2}$

$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-\overline{x^2}$

$=\large\displaystyle\dfrac{1}{n}\sum^n_{i=1}x_i^2-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2$

となる。

分散は偏差の2乗の和であるため、データの単位が点であった場合、単位は$点^2$となります。

3. 標準偏差とは

標準偏差 は、分散の平方根で求めることができます。標準偏差は、分散の平方根を取ることで求められます。標準偏差を求めることで、データのばらつきの大きさをデータと同じ単位で表現することができます。また、標準偏差が小さいほど、データのばらつきが小さいことを意味します。標準偏差sを数式で表すと、以下のようになります。

$s=\large\displaystyle\sqrt{\dfrac{1}{n}\sum^n_{i=1}x_i^2-\left(\dfrac{1}{n}\sum^n_{i=1}{x_{i}}\right)^2}$

$s=\large\displaystyle\sqrt{\dfrac{1}{n}\sum^n_{i=1}( x_i-\bar{x})^2}$

ふゅか
ふゅか
標準偏差を求めることで、データのばらつきの大きさをデータと同じ単位で表現できるんだよね♪

4. 練習問題

ふゅか
ふゅか
偏差と分散を実際に計算してみよう!

4.1. 問題 1: 家庭の水使用量の偏差

ある町での家庭の月ごとの水使用量(立方メートル単位)のデータが以下の通りです。
  1. 平均水使用量を求めてください。
  2. 各家庭の水使用量の偏差を求めてください。
  3. 偏差の合計が0になることを確認してください。
家庭 使用量 (m³)
A 25
B 30
C 28
D 35
E 27

平均水使用量は、以下の式で求めます。

\[ \text{平均} = \frac{25 + 30 + 28 + 35 + 27}{5} = \frac{145}{5} = 29 \, (\text{m³}) \]

各家庭の水使用量の偏差を求めます。

偏差は、各家庭の使用量から平均を引いたものです。

\[ \text{偏差}_{A} = 25 – 29 = -4 \]

\[ \text{偏差}_{B} = 30 – 29 = 1 \]

\[ \text{偏差}_{C} = 28 – 29 = -1 \]

\[ \text{偏差}_{D} = 35 – 29 = 6 \]

\[ \text{偏差}_{E} = 27 – 29 = -2 \]

偏差の一覧

家庭 使用量 (m³) 偏差
A 25 -4
B 30 1
C 28 -1
D 35 6
E 27 -2

偏差の合計は、以下の通りです。

\[ -4 + 1 – 1 + 6 – 2 = 0 \]

よって、偏差の合計が0になることが確認されました。

4.2. 問題 2: 水使用量の標準偏差

町内の別の地域での水使用量(m³単位)のデータが次のように与えられています。
  1. 使用量の平均を求めてください。
  2. 使用量の分散を求めてください。
  3. 使用量の標準偏差を求めてください。
家庭 使用量 (m³)
F 20
G 32
H 29
I 34
J 33

使用量の平均を求める。

平均使用量は、以下の式で求めます。

\[ \text{平均使用量} = \frac{20 + 32 + 29 + 34 + 33}{5} = \frac{148}{5} = 29.6 \, (\text{m³}) \]

使用量の分散を求める。

各家庭の使用量から平均を引いて偏差を求め、その二乗をとります。

\[ \text{偏差}{F} = 20 – 29.6 = -9.6 \quad \Rightarrow \quad \text{偏差}^2{F} = (-9.6)^2 = 92.16 \]

\[ \text{偏差}{G} = 32 – 29.6 = 2.4 \quad \Rightarrow \quad \text{偏差}^2{G} = (2.4)^2 = 5.76 \]

\[ \text{偏差}{H} = 29 – 29.6 = -0.6 \quad \Rightarrow \quad \text{偏差}^2{H} = (-0.6)^2 = 0.36 \]

\[ \text{偏差}{I} = 34 – 29.6 = 4.4 \quad \Rightarrow \quad \text{偏差}^2{I} = (4.4)^2 = 19.36 \]

\[ \text{偏差}{J} = 33 – 29.6 = 3.4 \quad \Rightarrow \quad \text{偏差}^2{J} = (3.4)^2 = 11.56 \]

分散は、偏差の二乗の平均で求めます。

\[ \text{分散} = \frac{92.16 + 5.76 + 0.36 + 19.36 + 11.56}{5} = \frac{129.2}{5} = 25.84 \, (\text{m³}^2) \]

標準偏差は、分散の平方根を取って求めます。

\[ \text{標準偏差} = \sqrt{25.84} \approx 5.08 \, (\text{m³}) \]

4.3. 問題 3: 年間水使用量の分析

ある家庭の年間の月ごとの水使用量が次のように記録されています。
  1. 年間の平均水使用量を求めてください。
  2. 使用量の分散と標準偏差を求めてください。
使用量 (m³)
1月 30
2月 28
3月 35
4月 29
5月 31
6月 32
7月 36
8月 34
9月 33
10月 30
11月 29
12月 31

年間の平均水使用量を求める。

年間の平均水使用量は、以下の式で求めます。

\[ \text{年間平均使用量} = \frac{30 + 28 + 35 + 29 + 31 + 32 + 36 + 34 + 33 + 30 + 29 + 31}{12} = \frac{378}{12} = 31.5 \, (\text{m³}) \]

使用量の分散と標準偏差を求める。

各月の使用量から年間平均使用量を引いて偏差を求め、その二乗をとります。

\[ \text{偏差}{1月} = 30 – 31.5 = -1.5 \quad \Rightarrow \quad \text{偏差}^2{1月} = (-1.5)^2 = 2.25 \]

\[ \text{偏差}{2月} = 28 – 31.5 = -3.5 \quad \Rightarrow \quad \text{偏差}^2{2月} = (-3.5)^2 = 12.25 \]

\[ \text{偏差}{3月} = 35 – 31.5 = 3.5 \quad \Rightarrow \quad \text{偏差}^2{3月} = (3.5)^2 = 12.25 \]

\[ \text{偏差}{4月} = 29 – 31.5 = -2.5 \quad \Rightarrow \quad \text{偏差}^2{4月} = (-2.5)^2 = 6.25 \]

\[ \text{偏差}{5月} = 31 – 31.5 = -0.5 \quad \Rightarrow \quad \text{偏差}^2{5月} = (-0.5)^2 = 0.25 \]

\[ \text{偏差}{6月} = 32 – 31.5 = 0.5 \quad \Rightarrow \quad \text{偏差}^2{6月} = (0.5)^2 = 0.25 \]

\[ \text{偏差}{7月} = 36 – 31.5 = 4.5 \quad \Rightarrow \quad \text{偏差}^2{7月} = (4.5)^2 = 20.25 \]

\[ \text{偏差}{8月} = 34 – 31.5 = 2.5 \quad \Rightarrow \quad \text{偏差}^2{8月} = (2.5)^2 = 6.25 \]

\[ \text{偏差}{9月} = 33 – 31.5 = 1.5 \quad \Rightarrow \quad \text{偏差}^2{9月} = (1.5)^2 = 2.25 \]

\[ \text{偏差}{10月} = 30 – 31.5 = -1.5 \quad \Rightarrow \quad \text{偏差}^2{10月} = (-1.5)^2 = 2.25 \]

\[ \text{偏差}{11月} = 29 – 31.5 = -2.5 \quad \Rightarrow \quad \text{偏差}^2{11月} = (-2.5)^2 = 6.25 \]

\[ \text{偏差}{12月} = 31 – 31.5 = -0.5 \quad \Rightarrow \quad \text{偏差}^2{12月} = (-0.5)^2 = 0.25 \]

分散は、偏差の二乗の平均で求めます。

\[ \text{分散} = \frac{2.25 + 12.25 + 12.25 + 6.25 + 0.25 + 0.25 + 20.25 + 6.25 + 2.25 + 2.25 + 6.25 + 0.25}{12} = \frac{71}{12} \approx 5.96 \, (\text{m³}^2) \]

標準偏差は、分散の平方根を取って求めます。

\[ \text{標準偏差} = \sqrt{5.96} \approx 2.44 \, (\text{m³}) \]