順序統計量について

順序統計量について

順序統計量数式だけだとわかりにくかったのと連続の分布から求めるより離散の分布の密度関数から求めた方が理解しやすかったので、画像付きで解説してみた。

 

密度関数


今回は具体例として、以下の分布をを考える。

f:id:ty070809390:20200525102258p:plain

distribution

たとえば、5回抽出するときの状況を考える。\
すると、
X_1,X_2\cdots X_5はその大きい順に決定されていく。
その時のそれぞれの確率
P(X_i = x)
を考える。

 

f:id:ty070809390:20200525102305p:plain


ここでは具体的にx = 7, i=3の場合について、つまり、抽出した中で3番に小さい値X_3が7以下になる確率を求める。
たとえば、以下の場合である

f:id:ty070809390:20200525102255p:plain


このことから、7以下に2つ7以上に3つあればいいことがわかる。この確率は、7以上が出る確率、7以上が出でない確率の二項分布になることがわかる。

P(X_3 = 7) = f(x = 7)(5{}_4C_2F(7)^2\{1-F(7)\}^{4-2})

先頭の5は、求めたい場所を移動させたときの個数。そのあとで、4つの場所を考えている。
これからを考えると

X_iの分布f_i(x)
f_i(x) = P(X_i = x) = f(x)\left(n{}_{n-1}C_{i-1}F(x)^{i-1}\{1-F(x)\}^{(n-1)-(i-1)}\right)\\=f(x)\left(i{}_{n}C_{i}F(x)^{i-1}\{1-F(x)\}^{(n-1)-(i-1)}\right)
連続の場合は、同じ形をとるが、分布関数の微分より求める。\

分布関数

P(X_3 < 7)
に関しては、シンプルに二項分布になり、7以下に抽出された点が2個以上になる確率となり、
P(X_3 \leq 7) = \sum_{r = 3}^{5} {}_5C_rF(7)^r\{1-F(7)\}^{5-r}


これからを考えると、
P(X_i \leq x) = \sum_{r = i}^{n} {}_nC_rF(x)^r\{1-F( x)\}^{n-r}