平均(相加平均、算術平均)

要約統計量*1の中でも私たちの生活に身近である平均(相加平均または算術平均)についての自分用まとめです。

平均値一般

簡単な四則演算だけで定義される。

相加平均はn回の加算と1回の除算で計算することができます。その他の平均は相乗平均ならn回の乗算と累乗根、調和平均ならn+1回の除算などが必要となり、人力でもコンピューターでも計算が大変になります。

相加平均:\displaystyle \frac{a_1+a_2+...+a_n}{n}

相乗平均:\displaystyle \sqrt[n]{a_1\times a_2\times\cdots\times a_n}

調和平均:\displaystyle \frac{n}{\frac{1}{a_1}+\frac{1}{a_2}+...+\frac{1}{a_n}}

母集団が正規分布しない場合、必ずしも有意義ではない。

ヒストグラムを作成してピークが複数個あったり極端に左右へ傾いている場合、全体の平均値を取るよりも層別したりピークごとに分けて統計量を考えた方が良いかもしれません。例えばある集団の収入から税金を決定する場合、次図のように2つのピークに分離する集団の平均値を単純に適用しても良いでしょうか。

f:id:by-unknown:20200118221512p:plain

#install.packages("beeswarm", dependencies = TRUE)
library(beeswarm)

y1 <- rnorm(100, 10, 50)
y2 <- rnorm(10, 1000, 10)
y12 <- c(y1, y2)
y.mean <- mean(y12)

par(mfrow=c(1,2))

beeswarm(list(y1, y2), col=c("blue","red"))
abline(h=y.mean, lty="dotted")

plot(density(y12))
abline(v=y.mean, lty="dotted")

一般に中央値とは一致しない。

1、1、100→平均値34≠中央値1

(相加平均)≧(相乗平均)≧(調和平均)が成り立つ。

加重算術平均の特別な場合である。

加重算術平均の係数を全て1とすると平均(算術平均)と一致します。

標本平均

標本平均は不偏推定量かつ一致推定量である。

標本平均は期待値および極限が母平均と一致します。どちらも統計学的な扱いが簡単になる統計量の性質です。

不偏性:\displaystyle E[\overline{X}]=\mu

一致性:\displaystyle \lim_{n \to \infty} \overline{X}=\mu

母集団に正規分布を仮定する場合、標本平均は正規分布の左右対称軸と一致する。

母平均

母集団に正規分布を仮定できるか中心極限定理が適用できる場合は母平均を区間推定できる。

正規分布ポアソン分布以外の分布では一般にパラメーター(母数)ではない。

例えば正規分布N(μ, σ2)では母平均がパラメーターですが、二項分布B(n, p)などの分布ではパラメーターに含まれません。

*1:記述統計量、基本統計量、代表値