数理統計学 (著 稲垣宣生) 演習問題5 解答

 この本の解答

数理統計学 (数学シリーズ)

数理統計学 (数学シリーズ)

 

 ほかの演習問題の解答はこちら。

 

yosuke-programing.hatenadiary.com

 

  

5.1

この問題の気持ち

計算しよう!

(1)

\int_{-\infty}^\infty F(x)dx = \int_{-\infty}^\infty \sum_{i=0}c_iF_i(x)dx \\=\sum_{i=0}c_i\int_{-\infty}^\infty F_i(x)dx\\=\sum_{i=0}c_i = 1
よって、分布関数
E[X]=\int_{-\infty}^\infty xF(x)dx = \int_{-\infty}^\infty x\sum_{i=0}c_iF_i(x)dx \\=\sum_{i=0}c_i\int_{-\infty}^\infty xF_i(x)dx\\=\sum_{i=0}c_i\mu_i


V(X)=\int_{-\infty}^\infty (x-\mu)^2F(x)dx = \int_{-\infty}^\infty (x-\mu)^2\sum_{i=0}c_iF_i(x)dx \\=\sum_{i=1}^nc_i\int_{-\infty}^\infty (x-\mu_i+\mu_i-\mu)^2F_i(x)dx\\=\sum_{i=1}^nc_i\int_{-\infty}^\infty \left\{(x-\mu_i)^2-2(\mu_i-x)(\mu_i-\mu)+(\mu_i-\mu)^2\right\}F_i(x)dx\\=\sum_{i=1}^nc_i\left(\sigma^2-2(\mu_i-\mu)^2+(\mu_i-\mu)^2\right)\\=\sum_{i=1}^nc_i\sigma^2+\sum_{i=1}^nc_i(\mu_i-\mu)^2

5.2

この問題の気持ち

順序分布は少し考えるの好きじゃないけど、極値統計とかはやってみたい。\
厳密ではないが、密度分布の求め方を三項から求めるのが個人的にわかりにくかったので、わかりやすく書いてみた。

 

yosuke-programing.hatenadiary.com

 

(1)

この本で、あるkの分布密度分布を考えるときに、ある値と、それ以下とそれ以上の3項分布を考えた。また、2つの統計量の同時分布を考えるときは5項分布に従うことを考えた。今回は以下のようになる。
| 事象 |\{X_1 = x\} | \{x\leq X_1 \leq y \} | \{X_n = y\} |
| ------------------------------------------------------------------------
| 確率 | f(x)           | F(y)-F(x)                    | f(y)             |
今回の選び方は、橋二つの選び方が{}_nC_2であり、真ん中の値がどういう値の順でもいいのので、三項定理的に書くと、
f(x,y) = \frac{n!}{1!(n-2)!1!}f(x)(F(y)-F(x))^{n-2}f(y)=n(n-1)(y-x)^{n-2}

(2)

平均

E[X_{n:1}] = \int_0^1xf_1(x)dx = \int_0^1n{}_{n-1}C_{1-1}xF(x)^{1-1}\left(1-F(x)\right)^{n-1}f(x)dx\\=\int_0^1nx\left(1-x\right)^{n-1}dx\\=n\left\{\int_0^1\left(1-x\right)^{n-1}dx-\int_0^1\left(1-x\right)^{n}dx\right\}\\=n\left\{\frac{1}{n}[(1-x)^n]^1_0 - \frac{1}{n+1}[(1-x)^{n+1}]^1_0\right\} = \frac{1}{n+1}
E[X_{n:1}^2] = \int_0^1x^2f_1(x)dx \\=\int_0^1nx^2\left(1-x\right)^{n-1}dx\\=n\left\{\int_0^1\left(1-x\right)^2\left(1-x\right)^{n-1}dx+2\int_0^1x\left(1-x\right)^{n-1}dx-\int_0^1\left(1-x\right)^{n-1}dx\right\}\\=n\left\{\frac{1}{n+2}[(1-x)^{n+2}]^1_0 +2\frac{1}{n(n+1)} - \frac{1}{n}[(1-x)^{n}]^1_0\right\}\\=\frac{2}{(n+1)(n+2)}
Var(X_{n:1})=E[X^2] -E[X]^2 = \frac{n}{(n+1)^2(n+2)}
E[X_{n:n}] = \int_0^1yf_1(y)dy = \int_0^1n{}_{n-1}C_{n-1}yF(y)^{n-1}\left(1-F(y)\right)^{n-n}f(y)dy\\=\int_0^1ny^{n}dy\\=n\frac{1}{n+1}[y^{n+1}]^1_0 = \frac{n}{n+1}
E[X_{n:n}^2] = \int_0^1y^2f_1(y)dy \\=\int_0^1ny^{n+1}dy\\=n\frac{1}{n+2}[y^{n+2}]^1_0 \\= \frac{n}{n+2}
V(X_{n:n})= \frac{n}{n+2} - (\frac{n}{n+1})^2 = \frac{n}{(n+1)^2(n+2)}
E[XY] = n(n-1)\int\int(y-x)^{n-2}dydx \\= n\int(1-x)^{n-1} - (-x)^{n-1}dx\\= \left( (1-x)^{n-1} - (-x)^{n-1}dx\right) = \frac{1}{n+2}
Corr(X,Y) = \left(\frac{1}{n+2} - \frac{n}{n+1}\frac{1}{n+1}\right) / \frac{n}{(n+1)^2(n+2)} = \frac{1}{n}

5.3

この問題の気持ち

なんだかややこしいことが書かれているが、YがNで条件付いていることがわかれば難しくはない。\
ポアソン分布、指数分布の性質は既知のものとします。この本の後ろの付録をみると載ってます。

積立母関数

M(t) = E^{N}[E^{Y|N}[e^{tY}]] = \sum_{n}\int_Y e^{tY}f(y,N) \ dy \\= \sum^N_{n = 0}\left(\prod\int_X e^{tX_i}f(X_i)dy\right)f_N(n) = \sum^N_{n = 0}\left(\prod\int_X e^{tX_i}f(X_i)dy\right)f_N(n)
ここで、
X\sim Ex(\mu), \ N\sim Po(\lambda)
より
M(t) = \sum^N_{n = 0}\frac{1}{(1-t/\mu)^n}f_N(n)\\=exp(-\lambda)\sum^N_{n = 0}\frac{1}{(1-t/\mu)^n}\frac{\lambda^n}{n!}\\=exp(-\lambda)\sum^N_{n=0}\frac{(\lambda / (1-t/ \mu))^n}{n!} \\= exp\left(\lambda (\frac{1}{(1-t/ \mu)} -1)\right)\\=exp\left(\frac{\lambda t}{\mu-t }\right)

期待値と分散

積立母関数から求める流れだが普通に求めた方が楽。
E^{N}[E^{Y|N}[Y]] = \sum_{n}\int_Y yf(y|N) \ dyf(N) \\= 1/\mu \sum^N_{n = 0}nf_N(n) \\=\frac{\lambda}{\mu}
二つ目=は分布の再生性より、X一つの平均のn倍になる。
E^{N}[E^{Y|N}[Y^2]] = \sum_{n}\int_Y y^2f(y|N) \ dyf(N) \\= 2/\mu^2 \sum^N_{n = 0}n^2f_N(n) \\=\frac{2\lambda(\lambda+1)}{\mu^2}
Var(Y) = \frac{2\lambda(\lambda+1)}{\mu^2} - \left(\frac{\lambda}{\mu}\right)^2\\=\frac{\lambda^2 + \lambda}{\mu^2}

5.4

この問題の気持ち
情報を分布に落とし込む問題\
二項分布

(1)

Aを支持する人をXとすると、
真の分布は、
X\sim B_N(100, 0.55)
となる。
P(X>50) = 1- F(50)\\= 1 - \sum_{i}^{50} {}_{100}C_i(0.55)^i(0.45)^{(100-i)}\\=0.865423786811947
計算機で計算しました。

(2)

X\sim B_N(100, 0.55)
となる。
P(X>n/2) = 1- F(n/2) \\= 1 - \sum_{i}^{50} {}_{n}C_i(0.55)^i(0.45)^{(n-i)}
計算機で計算しました。
|248                              |  249                            |250                              |
|:----:                            |:----:                             |:----:                            |
|0.9498998482587498 | 0.9433496707528424 | 0.9505260452283145 |
解答には、248と書いてあったのは、四捨五入しているからだと思います。

5.5

この問題の気持ち
確率過程。\
いつかちゃんと勉強したいな。\
今回は単純な問題。
平均置換数
E[B(t)] = E[W(t)-tW(1)] = 0
分散関数
V(B(t)) = E[(W(t)-tW(1))^2] = E[W(t)^2] - 2tE[W(t)]E[W(1)]+t^2E[W(1)^2]\\=t(1-t)
平均ゼロナノでV(W(t)) = E[W(t)^2]
共分散関数
Cov(B(t), B(s)) = E[(W(t)-tW(1))(W(s)-sW(1))] \\= E[W(t)]E[W(s)] - E[W(1)](tE[W(s)]+sE[W(t)])+tsE[W(1)^2] \\= min(s,t)+st

5.6

この問題の気持ち

計算問題

(1)

E[(Z_1cost\lambda + Z_2sint\lambda)(Z_1cos(t+s)\lambda + Z_2sin(t+s)\lambda)] \\= E[Z_1^2]cost\lambda cos(t+s)\lambda + E[Z_1]E[Z_2] (cost\lambda sin(t+s)\lambda +sint\lambda cos(t+s)\lambda ) + E[Z_2^2]cos(t+s)\lambda cost\lambda\\=\sigma^2(cost\lambda cos(t+s)\lambda + cos(t+s)\lambda cost\lambda) = \sigma^2 cos(t - (t+s)) = \sigma^2cos(s)

5.7

この問題の気持ち

指数分布とカイ二乗分布はガンマ分布の特殊な形と覚えておくと便利

(1)

P(\sum^{n-1}_{i=0}T_i < t)
を考えると、ガンマ分布の再生性より、
\sum^{n-1}_{i=0}T_i \sim G_A(n, \lambda/2)

5.8

この問題の気持ち

冷静に考えれば、ねずみこうのように指数関数で増えるのがわかる。こういう分かりに杭問題は、図でも書くとイメージはつきやすい。

(1)

E[Y_n] = E[XY_{n-1}] = \sum_{i=0}^\infty XY_{n-1}f(X) = \mu Y_{n-1}
よって、
E[Y_n] = \mu^N
E[Y_n^2] = E[X^2]E[Y_{n-1}^2] =(\sigma^2 + \mu^2)E[Y_{n-1}^2] =(\sigma^2 + \mu^2)^n
V(Y_n) = (\sigma^2 + \mu^2)^n - \mu^n

5.9

この問題の気持ち

こういう問題はすごく苦手。答えもないし、合ってるかもわからないから一応書くだけ。

(1)

limP(|X_n-a|>\delta) = lim(1 - (F(\delta+a) - F(\delta-a) )) \\=lim(1 - (G(\delta+a) - G(\delta-a) ))lim\\=P(|f(X_n)-f(a)|>\varepsilon)

5.10

この問題の気持ち

カイ二乗は、ノンパラメトリック手法などで出るので期待値は覚えとくといい感じ。
(1)
この場合自由度k-1カイ二乗分布にしたがうので、
E[\mathscr{X}^2] = k-1
V(\mathscr{X}^2) =2(k-1)

5.11

この問題の気持ち

順序統計量のような問題は、条件を見て考えよう。
(1)と(2)が逆な気がする。

(1)平均

はじめに
\ \{n<x\}
ならば、\
nことってきたときに、それが、あるx以下である確率に従うので、つまり
\ \{n<x\}\sim Bin(n, F(x))
ということがわかる。つまり
nF_n(x)\sim Bin(n, F(x))\cdots(2)の答え
この時に二項分布Bin(n, p)の時、
E[X] = np\\V(X) = np(1-p)
より、
E_{F_n}[x] = F(x)\\V(X) = F(x)(1-F(x))/n

5.12

この問題の気持ち

以下を参考にして

 

yosuke-programing.hatenadiary.com

(1)

f_i(x) = P(X_i = x)\ = f(x)\left(n{}_{n-1}C_{i-1}F(x)^{i-1}\{1-F(x)\}^{(n-1)-(i-1)}\right)\\= n{}_{n-1}C_{i-1}x^{i-1}\{1-x\}^{(n-1)-(i-1)}\ \propto x^{i-1}\{1-x\}^{(n-1)-(i-1)} \sim Beta(i, n-i-1)

5.12

この問題の気持ち

なんだか極限が出ると嫌な気持ちだが、最大値とあるので、順序統計量だということがわかる。極値統計学

(1)

以下を参考にして、

 

yosuke-programing.hatenadiary.com

 

P(X_i \leq x) = \sum_{r = i}^{n} {}_nC_rF(x)^r\{1-F( x)\}^{n-r}
最大値なので、i=nとして、
P(X_i \leq x) = F(x)^n
よって、
Y_n \sim F(x)^n
また、
Y_n/n \sim G(x)
G(x) = F(nx)^n
ここで対数をとると。
logG(x) = nlog(1-(1-F(nx) ) )\rightarrow -x^{-a}
ここの矢印のつながりが後ろの回答ではこうなっているが何でなるのかわからない。誤植かな。
G(x) = exp(-x^{-a})

 

 ほかの演習問題の解答はこちら。

 

yosuke-programing.hatenadiary.com