徒然メモ

日々のぼんやりした考えをそのまま書き綴ります。

統計メモ 平均・分散関係の統計量

素人による統計量のメモです。以下では標本は数値で表されるものとします。

\displaystyle \frac{1}{n}\sum_{i=1}^{n}{x_i}=\frac{x_1+x_2+...+x_n}{n}

  • 標本平均。
  • 標本の総和を標本サイズで割った数。
  • 統計学的に特殊な性質(不偏性、一致性)を持つため、パラメトリック検定でよく使われる。

\displaystyle  \frac{1}{n}\sum_{i=1}^{n}{f(x_i)}=\frac{f(x_1)+f(x_2)+...+f(x_n)}{n}

  • 標本 (f(x_i))の平均。
  • 平均という表現には違和感が残るが、標本 (x_i)の全要素に f(x)を適用した標本(f(x_1), f(x_2), ..., f(x_n))の標本サイズは元の標本と同じnなので、確かにこの標本の平均。
  • 標本平均と共に「~平均」「平均~」という言葉で参照される。

\displaystyle  \frac{1}{n}\sum_{i=1}^{n}{x_i^{2}}=\frac{{x_1}^2+{x_2}^2+...+{x_n}^2}{n}

  • 平均標本平方和。
  • 上で f(x_i)={x_i}^{2}としたもの。

\displaystyle  \frac{1}{n}\sum_{i=1}^{n}{f(x_i)^{2}}=\frac{f(x_1)^{2}+f(x_2)^{2}+...+f(x_n)^{2}}{n}

  •  f(x)^{2}の平均平方和。
  • 上で f(x_i)=f(x_i)^{2}としたもの。

\displaystyle  \sum_{i=1}^{n}{(x_i-\overline x)}=\frac{(x_1-\overline x)+(x_2-\overline x)+...+(x_n-\overline x)}{n}=\frac{1}{n} \sum_{i=1}^{n}{x_i}-\overline x

  • 偏差和(平均値の偏差和)。
  • 標本と標本平均の差の総和。
  • 符号は任意。

\displaystyle  \sum_{i=1}^{n}{(x_i-\overline x)^{2}}

  • 偏差平方和(平均値の偏差平方和)。
  • 標本と標本平均の差(偏差)の平方の総和。
  • 標本標準偏差の計算式に含まれる。
  • 符号は無または正。

\displaystyle  \sqrt{\frac{1}{n} \sum_{i=1}^{n}{(x_i-\overline x)}^{2}}

  • 標本標準偏差。
  • 平均偏差平方和の平方根。
  • 標本分散の平方根。

\displaystyle  \frac{1}{n} \sum_{i=1}^{n}{(x_i-\overline x)}^{2}

  • 標本分散。
  • 平均偏差平方和。

\displaystyle  \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i-\overline x)^{2}}

  • 不偏標準偏差。
  • 標本標準偏差の分母 n n-1に置き換えた統計量。

\displaystyle  \frac{1}{n-1} \sum_{i=1}^{n} (x_i-\overline x)^{2}

  • 不偏分散。
  • 不偏標準偏差の平方。
  • 標本分散の分母 n n-1に置き換えた統計量。

\displaystyle  \frac{1}{n-1}\sum_{i=1}^{n} f(x_i)

  • 不偏標準偏差や不偏分散で現れる式。不偏性の定義から導出される。
  • 特別な名前はない?

\displaystyle  E[X]

  • 確率変数 Xの期待値・平均。
  •  Xが標本の確率変数なら標本平均。
  •  Xが離散分布の確率変数なら\sum p(x)x
  •  Xが連続分布の確率変数なら\int p(x)dx

\displaystyle  V[X]

  • 確率変数 Xの分散。
  •  E\left[(X-E[X])^{2}\right]
  •  Xが標本の確率変数なら標本分散または不偏分散。
  •  Xが離散分布の確率変数なら E\left[(X-\sum p(x)x)^{2}\right]
  •  Xが連続分布の確率変数なら E\left[(X-\int p(x)dx)^{2}\right]