数理統計学 (著 稲垣宣生) 演習問題4 解答

 この本の解答

数理統計学 (数学シリーズ)

数理統計学 (数学シリーズ)

 

 ほかの演習問題の解答はこちら。

 

yosuke-programing.hatenadiary.com

 

 

4.1

この問題の気持ち

順々に考えていかないと難しくなってしまう。わからないときは、累積分布を確率の基礎に立ち返って考えていくことが大切。

今回の問題は、\varepsilon, X, Y, Z
と複数の変数が出ているのでわかりにくいが、

コインと二つの袋(赤玉がそれぞれの確率で入っている)があり、
Zを赤玉が出る確率変数。X, Yがそれぞれの赤だまが出るものと考えると。
コインで表が出たらXの方の袋、裏ならばYの方の袋から抽出すると考えるとわかりやすい。

(1)


\varepsilon \sim Ber(p)
より、
\varepsilon \in (0,1)
コインを投げた後に、そのコインのでかたによって、
Zの確率変数は\varepsilonによって条件づけられているので、
P(Z<z) = P(\varepsilon X+(1-\varepsilon)Y<z|\varepsilon=1)P(\varepsilon=1)+P(\varepsilon X+(1-\varepsilon)Y<z|\varepsilon=0)P(\varepsilon=0)\\=P(X<z|\varepsilon=1)p+P(Y<z|\varepsilon=0)(1-p)

\\=P(X<z)p+P(Y<z)(1-p)

(\because (Y,\varepsilon),(X,\varepsilon) がそれぞれ独立 )

=F_X(z)p+F_{Y}(z)(1-p)

となる。

 

4.2

この問題の気持ち

ポアソン分布は、本に書いてある通り、再生性を持つので、ポアソン分布になることがわかる。こんな時は、積率母関数を使う

(1)

X\sim Po(\lambda)

\\E[e^{tX}]=e^{-\lambda}\sum^\infty_{x=0}e^{tx}\frac{\lambda^x}{x!}

\\=e^{-\lambda}\sum^\infty_{x=0}\frac{(e^t\lambda )^x}{x!}

\\=e^{e^t\lambda - \lambda} = e^{\lambda(e^t-1) }
今回の場合X,Y独立なので、

E[e^{t(X+Y)}]=E[e^{tX}]E[e^{tY}]=e^{\lambda_1(e^t-1) }e^{\lambda_2(e^t-1) }=e^{(\lambda_1+\lambda_2)(e^t-1) }

積率母関数と、分布の一対一対応より、
X+Y\sim Po( (\lambda+\mu ) )

(2)


P(X=r|X+Y = n) = \frac{P(X=r\cap X+Y=n)}{P(X+Y = n)}\\=\frac{e^{-\lambda}\frac{\lambda ^r}{r!}e^{-\mu}\frac{\mu ^{n-r}}{(n-r)!}}{e^{-(\lambda+\mu)}\frac{(\lambda+\mu )^n}{n!}}\\=\frac{n!}{r!(n-r)!}\frac{\lambda^r}{(\lambda+\mu)^{r}}\frac{\mu^{n-r}}{(\lambda+\mu)^{n-r}}

p = \frac{\lambda}{(\lambda+\mu)}
とすると、
P(X=r|X+Y = n)={}_nC_rp^r(1-p)^{n-r}

(3)

上の形を見ると、二項分布だということがわかる。二項分布の平均と分散より、
E^{X|X+Y =n}[X] = np
E^{X|X+Y =n}[X] = np(1-p)

 

4.3

この問題の気持ち

めんどくさい。うまい方法はあるかもしれない。。。が知識で押す。。\
計算で求められる方法教えてください。

(1)


はじめに
\mathscr{X}=\frac{(X-np)^2}{np}+\frac{(Y-nq)^2}{nq}+\frac{(Z-nr)^2}{nr}\\=\frac{X^2}{np}+\frac{Y^2}{nq}+\frac{Z^2}{nr}-n\\=\frac{X^2}{np}+\frac{Y^2}{nq}+\frac{Z^2}{nr}-n\\=X^2(\frac{1}{np}+\frac{1}{nr})+Y^2(\frac{1}{nq}+\frac{1}{nr})+2\frac{XY-nX+nY}{nr}+\frac{n}{r}-n
E[\mathscr{X}]=\sum_{x=0}^n\sum_{y=0}^{n-x}xy\mathscr{X}\\

となるここで、
\sum_{x=0}^n\sum_{y=0}^{n-x}x^3y=\sum_{x=0}^nx^3\frac{(n-x)(n-x+1)}{2}=\\ \cdots
という感じでゴリゴリ進めることもできるのかなぁ。
これは結構しんどいとおもう。5乗の和も計算しなければならない。。

なので知識で押す。(この問題にもそのページ数が書かれているので、悪くないかもしれない)
この統計量は、自由度n-1の\chi^2分布に従うことが知られている。なのでそれに従う。よって、
E[X] = 3-1 = 2\\V(X) = 2(3-1)=4

4.4

この問題の気持ち

計算しても図を考えても一様分布なので簡単。図のみを乗せとく

(1)(2)(3)

f:id:ty070809390:20200518094355p:plainf:id:ty070809390:20200518094358p:plainf:id:ty070809390:20200518094352p:plain

(1)白領域3/4

(2)緑領域

(3)オレンジ+緑中の緑領域 

4.5

この問題の気持ち

計算だけど、よく知られている分布を想像しつつ。
(1)なんかわガンマ分布だと気づけば計算しなくても簡単。

(1)

\int_{0}^\infty\int_{0}^\infty cx^3exp(-x(1+y))dxdy
ガンマ分布に近いことを考えると(一回積分して、$x^2$になることを考えると)
c = \frac{1}{\Gamma(3)} = \frac{1}{2}

(2)

xに関しては、すぐにガンマ分布であることがわかる。

f_1(x) = \frac{1}{2}x^2exp(-x)

yは計算すると

f_2(y) = \frac{1}{2}\int^{-\infty}_{0}cx^3exp(-x(1+y))dx
x(1+y)\rightarrow z\\
f_2(y) = \frac{1}{2}\frac{1}{(1+y)^4}\int^{\infty}_{0}z^3exp(-z)dz\\=f_2(y) = \frac{1}{2}\frac{1}{(1+y)^4}\Gamma(4) \\=\frac{1}{2}\frac{3!}{(1+y)^4}=\frac{3}{(1+y)^4}

(3)

E[X]=\frac{1}{2}\int^\infty_0 x^3 exp(-x)dx = \frac{1}{2}\Gamma(4)=3\\E[X^2]=\frac{1}{2}\Gamma(5) = 12\\Var(X) = 12 - 3^2 = 3

E[Y]=\int^\infty_0 \frac{3y}{(1+y)^4}dy \\= 3\left(\int^\infty_0 \frac{1+y}{(1+y)^4}dy - \int^\infty_0 \frac{1}{(1+y)^4}dy\right)\\=3(\frac{1}{2}-\frac{1}{3})=\frac{1}{2}
右の項は上の密度関数と近いことから、すぐにわかる。その流れで左もわかる
\int \frac{1}{(1+y)^n}dy = \frac{1}{n-1}

 

E[Y^2]= \int^\infty_0 \frac{3y^2}{(1+y)^4}dy \\= 3\left(\int^\infty_0 \frac{(1+y)^2}{(1+y)^4}dy - 2\int^\infty_0 \frac{y}{(1+y)^4}dy-\int^\infty_0 \frac{1}{(1+y)^4}dy\right)\\=3(1-\frac{1}{3}-\frac{1}{3})=1\\Var(Y)=\frac{3}{4}

E[XY] =\int\int xyf(x,y)dydx\\=\int\int yf(y|x)dy \ xf(x)dx\\=\int_{0}^\infty\int_{0}^\infty xyexp(-xy) \ dy\ \frac{1}{2}x^3exp(-x)dx\\=\int_{0}^\infty \frac{1}{2}x^2exp(-x)dx=1

よって、
Corr(X,Y) = \frac{Cov(X,Y)}{\sqrt{V(X)V(Y)}}\\=\frac{E[XY]-E[X]E[Y]}{\sqrt{V(X)V(Y)}}\\=\frac{1-3/2}{\sqrt{9/4}}=-\frac{1}{3}

 

4.6

この問題の気持ち

前問と同じ、ただの計算。\
形が似ているときは、その分布を意識して計算する。

(1)

f_x(x) = \frac{1}{\alpha\beta}exp\left(-x\left(\frac{1}{\alpha}-\frac{1}{\beta}\right)\right)\int^\infty_x exp\left(-\frac{y}{\beta}\right)dy\\ = \frac{1}{\alpha}exp\left(-\frac{x}{\alpha}\right)

f_y(y)=\frac{1}{\alpha\beta}exp\left(-\frac{y}{\beta}\right)\int^y_0 exp\left(-x\left(\frac{1}{\alpha}-\frac{1}{\beta}\right)\right)dy\\=\frac{1}{\beta-\alpha}\left\{exp\left(-\frac{y}{\beta}\right)-exp\left(-\frac{y}{\alpha}\right)\right\}

 

(2)

f(x,y)=f(y|x)f_x(x)
より、
f(x,y) = \frac{1}{\alpha}exp\left(-\frac{x}{\alpha}\right)* \frac{1}{\beta}exp\left(-\frac{y-x}{\beta}\right)
f(y|x)=\frac{1}{\beta}exp\left(-\frac{y-x}{\beta}\right)

(3)

f_xは指数分布なので、
E_X[X]=\alpha \\V_X(x)=\alpha^2

次に、f_yにかんして、計算する。\
指数分布を意識して、
たとえば、
g(x) = exp\left(-\frac{y}{\beta}\right)
の期待値(密度関数出ないので言いにくい)は、$\beta g(x)\frac{1}{\beta}$を考えると、\beta^2となることがわかる。
よって、
E_Y[Y]=\frac{\alpha^2+\beta^2}{\beta-\alpha}=\alpha+\beta
E_Y[Y^2]=\frac{2(\beta^3-\alpha^3)}{\beta-\alpha}=2(\beta^2+\alpha\beta+\alpha^2)\\Var(Y^2) = \beta^2+\alpha^2

E[XY] = \int_0^\infty\int_x^\infty yf(y|x) \ dy \ xf(x) \ dx\\=\int^\infty_0 (x+\beta)x\frac{1}{\alpha}exp\left(-\frac{x}{\alpha}\right)dx\\=\frac{1}{\alpha}\left(\int^\infty_0 x^2exp\left(-\frac{x}{\alpha}\right)+\beta x exp\left(-\frac{x}{\alpha}\right)dx\right)=2\alpha^2+\beta\alpha

Corr(X,Y)=\frac{E[XY]-E[X]E[Y]}{\sqrt{V(X)V(Y)}}=\frac{\alpha}{\sqrt{\alpha^2+\beta^2}}

.7

この問題の気持ち

確率分布をゆっくり考えよう。
よくわからない分布があるときは、原点にもどって、順をおってかんがえる。

(1)

何か知らのX,Yの発生確率により、p_x, p_yとなる。
P(Z<z)=p_xP(Z<z|Z=X, X<Y)+p_yP(Z<z|Z=Y, Y<X)
よって、
P(Z>z|Z=X, X<Y)= P(X<z, X<Y)\\= F_{XY}(X>z,X<Y)\\=\sum^\infty_{x=z}\sum^\infty_{y=x}p(1-p)^{x}q(1-q)^y\\=\sum^\infty_{x=z}p(1-p)^{x}q\left(\sum^\infty_{y=0}(1-q)^y - \sum^x_{y=0}(1-q)^y\right) \\=\sum^\infty_{x=z}p\left( (1-p)(1-q)\right)^x\\=\left( (1-p)(1-q)\right)^z
同様に、

P(Z>z|Z=Y, Y < X)=\left( (1-p)(1-q)\right)^z
等しいので、

P(Z>z)=\left( (1-p)(1-q)\right)^z

ここで、途中のqの合計の計算を考えると、幾何分の累積分布であることがわかる。よって、
f_z=Geo(1-\left( (1-p)(1-q)\right))
E[Z]=\frac{\left( (1-p)(1-q)\right)}{1-\left( (1-p)(1-q)\right)} \\V(Z)=\frac{\left( (1-p)(1-q)\right)}{(1-\left( (1-p)(1-q)\right))^2}

.8

この問題の気持ち

同時確率分布から、条件付き確率(YはXに条件づいてる)を思いつければ、できる。
ただ、ランダムにと書いてあるが、一様分布を仮定するのだろうが、そのランダムの在り方を分布と呼ぶ気がするので、なんだかきもちわるい。

(1)

f(x,y) = f(y|x)g(x) = \frac{1}{1-x}\frac{1}{1-0}=\frac{1}{1-x}

E[X] = \int^1_0\int^1_x xf(x,y)dxdy=1/2 \\E[X^2]= \int^1_0\int^1_x x^2f(x,y)dxdy=1/3\\Var(X) = 1/12

E[Y]= \int^1_0\int^1_x yf(x,y)dydx\\ =\int^1_0\frac{1}{1-x}\frac{1}{2}\left(1-x^2\right)dx\\=\frac{3}{4}\\E[Y^2]=\int^1_0\frac{1}{1-x}\frac{1}{3}\left(1-x^3\right)dx \\=\frac{1}{3}(1+1/2+1/3) =\frac{11}{18}\\Var(Y)=\frac{7}{144}

E[XY] = \int^1_0x\int^1_x yf(x,y)dydx=\frac{5}{12}

Corr(X,Y)=\frac{5/12 - 3/8}{\sqrt{1/12・76/144}}=\sqrt{\frac{3}{7}}

4.9

この問題の気持ち

前問と同様。

(1)

E[(Z-Y)] =\int^1_0 \int^x_0\int^1_x(z-y)f(y|x)f(z|x)f(x)dzdydx=\int^1_0\int^x_0\int^1_x(z-y)dzdy\frac{1}{1-x}\frac{1}{x}dx=\frac{1}{2}\\E[(Z-Y)^2]= \int^1_0 \int^x_0\int^1_x(z-y)^2dzdy\frac{1}{1-x}\frac{1}{x}dx=\frac{11}{36}\\V[(Z-Y)^2]=\frac{1}{18}

4.10

この問題の気持ち

(1)

X,Y\sim Geo(p)

P(Y>X)=\sum^\infty_{y=0}p^2(1-p)^{y}\sum^y_{x=0}(1-p)^{x}\\=p\sum^\infty_{y=0}(1-p)^{y}(1-(1-p)^y) = \frac{1-p}{2-p}

(2)

X,Y\sim Ex(\lambda)\\P(Y>X)=\lambda^2\int^\infty_{0}e^{-\lambda y}\int^y_{0}e^{-\lambda x}dxdy=\frac{1}{2}

4.11

この問題の気持ち

分散の線形性(?)をつかう。復習のため少し丁寧にやる。

(1)

V(Z) = V(wX+(1-w)Y)=E[(wX+(1-w)Y)^2] -E[(wX+(1-w)Y)]^2 \\=E[(wX)^2]-E[wX]^2 + E[(wY)^2]-E[wY]^2 +2w(1-w)(E[XY]-E[X]E[Y])\\=w^2\sigma_1^2+2w(1-w)\sigma_1\sigma_2\rho+(1-w)^2\sigma_2^2\\=(\sigma_1^2-2\sigma_1\sigma_2\rho+\sigma_2^2)w^2+2w(\sigma_1\sigma_2\rho-\sigma_2^2)+\sigma_2^2\\=(\sigma_1^2-2\sigma_1\sigma_2\rho+\sigma_2^2)\left(w+\frac{(\sigma_1\sigma_2\rho-\sigma_2^2)}{(\sigma_1^2-2\sigma_1\sigma_2\rho+\sigma_2^2)}\right)^2+\sigma_2^2 \frac{(\sigma_1\sigma_2\rho-\sigma_2^2)^2}{(\sigma_1^2-2\sigma_1\sigma_2\rho+\sigma_2^2)}
よって、
最小にするwは、
w = \frac{\sigma_2^2-\sigma_1\sigma_2\rho}{(\sigma_1^2-2\sigma_1\sigma_2\rho+\sigma_2^2)}

 

4.12

この問題の気持ち

Hello

(1)

E[T]=aE[X]+bE[Z]=0\\E[U]=cE[Y]+dE[Z]=0\\V(T)=a^2V(X)+b^2V(Z)=(a^2+b^2)\sigma^2\\V(U)=c^2V(Y)+d^2V(Z)=(c^2+d^2)\sigma^2\\Cov(T,U)=E[UT]=acE[XY]+bcE[YZ]+adE[XZ]+bdE[Z^2]\\=cdV(Z)=bd\sigma^2

(2)

P58を参考に上の結果を代入していく。

4.13 

この問題の気持ち

畳み込みの練習(ちょっとずるした。)

(1)

この本の書き方とは少し異なるが、こっちの方がわかりやすいので変数変換として考えるやり方としてやる。
Z = X+Y\\U = Y

J( (z,u)\rightarrow(x,y))=1

f(z, u) = f_{xy}(x,y)=f_x(z-u)f_y(u)\\=\frac{1}{\sqrt{2\pi}\sigma_y}exp\left(-\frac{(u-\mu_y)^2}{2\sigma_y^2}\right)\frac{1}{\sqrt{2\pi}\sigma_x}exp\left(-\frac{(z-u-\mu_x)^2}{2\sigma_x^2}\right)
よって

f_z(z)=\frac{1}{\sqrt{2\pi}\sigma_y}\frac{1}{\sqrt{2\pi}\sigma_x}I_u
畳み込み積分
I_u = \int^\infty_{-\infty} exp\left(-\frac{(u-\mu_y)^2}{2\sigma_y^2}\right)exp\left(-\frac{(z-u-\mu_x)^2}{2\sigma_x^2}\right)du\cdots

これを計算していく。大変なのでスキップ。 \
積率母関数でやると畳み込みの証明はもっと楽。
Mx(t) = E[e^{tX}] =\frac{1}{\sqrt{2\pi}\sigma_x}exp(t^2\sigma_x^2/2+\mu_xt)\int^\infty_{-\infty}exp\left(-\frac{(x^2-(\mu_x+t\sigma_x^2))^2}{2\sigma_x^2}\right)dx\\=exp(t^2\sigma_x^2/2+\mu_xt)
最後の積分は、ガウス分布を考えると計算しなくてもわかる。\
X,Y\sim\mathscr{N}(0,1)\\Z=X+Y\\M_z(t)=E[e^{tZ}]=E[e^{t(X+Y)}]=E[e^{tX}]E[e^{tY}]=exp(t^2\sigma_x^2/2+\mu_xt)exp(t^2\sigma_x^2/2+\mu_xt)\\=exp(t^2(\sigma_x^2+\sigma_y^2)/2+(\mu_x+\mu_y)t)\\ \mu_z = \mu_x+\mu_y\\ \sigma_z^2=\sigma_x^2+\sigma_y^2

よって、積率母関数と分布の一対一性より、示された。

4.14

この問題の気持ち

分布の再生性を用いる

(1)

E[X]=0.5*2+0.3*3=1.9\\V(X)=0.05^2*2+0.04^2*3=0.0098

4.15

この問題の気持ち

分布の再生性といっていいのかな、定数の掛け算の解き、上の積率母関数に影響しないことはわかるのでそのままできる。

(1)

T\sim\mathscr{N}(\mu,\sigma^2/2)\\U\sim\mathscr{N}(0,\sigma^2/2)
Cov(U,T)=E[UT]-E[U]E[T]=E[UT]
E[UT] = E[(X^2-Y^2)]/4=(E[X^2]-E[Y^2])/4=0
XとYは同じ分布なのでよって独立。

 

4.16

この問題の気持ち

とうとう最後になった。\ベータ分布とかガンマ分布はそれぞれ、ベータ関数・ガンマ関数に寄せていく。

(1)

f_1(x)=\frac{{}_nC_x}{B(\alpha,\beta)}\int_0^1\theta^{x+\alpha-1}(1-\theta)^{n-x+\beta-1} d\theta=\frac{{}_nC_xB(x+\alpha,n-x+\beta-1)}{B(\alpha,\beta)}

(2)

上のをつかって、ベイズの定理より、
\pi(\theta|x)=\frac{f(x|\theta)\pi({\theta})}{f(x)}

 

 

 

 ほかの演習問題の解答はこちら。

 

yosuke-programing.hatenadiary.com