多変量解析入門 解答 第10章
第10章
この本の解答がなかったので作っていく、
他の章の解答はこちら
yosuke-programing.hatenadiary.com
問10.1
書くのが大変なので、書き方のみ、
最長距離法は、最短距離法とは逆に長い方から決めていく。
群平均の時は、その長さがクラースたを作るときにながさが、そのクラスタに入っている個体数によって変わっていく。
問10.2
(1)
感覚的には、全体の中心から考えて、その重心から行っても、各クラスタの重心を通ってから個別のデータに行ってもベクトル的に変わらないよねっていう感じ。
(2)重心と相対に分けるというのは、高校でもやる物理の二体問題でよくある手。そんな感じの問題。
書くのにつかれた。あとは計算。
今回の問題は、絵にかくとすごくわかりやすく見えてくる。
問10.3
似たようなもん
問10.4
(1)期待値の中の和が期待値になるので
(2)まず期待値の中のを展開すると見える。
問10.5
上の考え方をつかう。
動物農場 読書日記
今回読んだのはこの本、短めで人間の皮肉が書かれている
あらすじ
農場の主人を追い出した動物たちは、全ての動物が平等に生活するための楽園を作った。その社会のために、賢いブタが主導で戒律を作り共和国となり、大統領にまでなった。そうして発展していくに従って、ブタの特権や権威が大きくなっていく。人間からの服従から解放された動物たちは、本当の自由を手に入れられるのか!!
感想
ブタがビール飲んでぶよぶよしたりと動物たちが面白かった。
現実社会でも、トップの人たちが有利に動くために、メディアを使い、大きなお祭りでごまかし、ラージスピーカーが大切な声をかき消すことがある。そのことが、面白い動物たちの行動となっていてよかった。社会のトップとかになるとはこういうこともあるんだろうなって思った。
多変量解析入門 解答 第8章 サポートベクトルマシン
第8章 サポートベクトルマシン
この本の解答がなかったので作っていく、
他の章の解答はこちら
yosuke-programing.hatenadiary.com
問8.1
直交ベクトルを用いて基本的に、2,3次元などでも用いられる方法で証明する。
は、平面の式を考えると、法線ベクトルである。
距離を求めたい今回の点をとし、
そこから、伸びた超平面の垂線と超平面との交点を 、
とすると、
ここで、kを求めるために、を消去する。
tは、超平面より、
を満たす。
また、 を考えて
よって、
問8.2
(1)の符号との符号が同符号より
(2)最大化することが目的で、スケールを無視できることを用いれる。
証明は、(8.12)あたりに書いてあるので省略
問8.3
(8.19)あたりに書いてあるので省略
問8.4
サポートベクトルとは、の点。
Kurush-Kuhn-Tucker条件の式(8.30)の初めに(3)(4)の代入である(8.32)を考える。
より、(4)の条件を満たすには、
になる。
問8.5
p208 あたりと同じ
問8.6
結構一緒
多変量解析入門 第6章 解答
第6章
この本の解答がなかったので作っていく、
他の章の解答はこちら
yosuke-programing.hatenadiary.com
問6.1
ほとんど(6.12)に書いてあるので省略
問6.2
をこの後使いたいので、この本内では、の式になっているが、にする。
を最大化する。
を の関数と見た時
(代入すると分かる)、つまり、 の尺度は関係ない。なので、
と制約条件を付けても一般性を欠かない。
制約条件があるので、ラグランジュの未定乗数法をもちいて、
よって、固有値問題に帰着した。
また、とは、スカラーであるので、\\
関数は の尺度に関係ないので、
ラグランジュの未定乗数法の簡単な説明はこちら
yosuke-programing.hatenadiary.com
問6.3
(1)計算するだけなので過程は省略。
(2)なぜか、x_1だけの線形結合に、、、
(3)より、
問6.4
代入するだけ
問6.5
省略
問6.6
結構詳しくこの本に書いてある
多変量解析入門 解答 第5章
第5章 モデル評価基準
各省でも少し扱ってきたAICなどに加えて、BIC(ベイズ型モデル評価基準)やクロスバリデーションなどの評価方法。
他の章の解答はこちら
yosuke-programing.hatenadiary.com
問5.1 K.L情報量
K.L情報量とは
平均的な良さ、真のモデルとの違いを計算するモデルである。
g(Z)が、真のモデル、が予測したモデル
解答
今回の問題は、性質を計算で確かめる問題
(i)
を示す。
$$g(Z)が、真のモデル、が予測したモデル
中身を考えると、
今回は離散でやる
これは、
を用いた。微分して極限とると分かる。
(ii)logの中身が1になるため
問5.2
今回は、KL情報量の具体例。計算大変
(1)
(2)
結構大変
(3)まとめるだけ
問5.3
また具体例。結構大変
(1)
(2)
を用いると示される
(3)(1)と(2)をまとめるだけ
問5.4
計算すると
となるので、の方がよい
問5.5
(5.39)に代入していって比較する。
問5.6
初めに対数尤度を求める
確率の制約条件があるので、ラグランジュの未定乗数法を用いる。
上の式が最小になるを考える。
の時である。すべてのについて言えるので、\\
\\
これを満たすのは、確率ということも考えると、\\
よって、最大尤度は、
よって、
ガウス・マルコフの定理
ガウス・マルコフの定理が多変量解析入門で出ていなかったので調べた。
ガウス・マルコフの定理とは
式はこう
\boldsymbol{b}]
これは、線形回帰モデルの時に、推定されたパラメータが最も分散も小さくなるということを言っている。
分散が小さいことは、推定する時には、ばらつきが少ないということなので、推定された時に、値が真の値に近くなるということ。
不偏推定量
まず、不偏推定量の確認。
推定量の平均が真の値となるときにそれが不偏推定量になる。
つまり、たくさんやって平均とっても真の値にならないものサンプリングしても意味ないので、
そのための考え方.
と表せるとする。
その一つが、最小2乗法で求まる,である。
よって不偏推定量であることがわかる。
では、一般に
が不偏推定量となる時を考えると
となるので、の時不偏推定量となる。
本題のガウス・マルコフの定理
が不変であるためには、CX = Iとなる必要があるので、\\
とする(最小2乗法のやつ)
また、
不偏性の条件より、
を用いた
よって、
統合成立条件は、
最小二乗法で用いた推定量は、
よって、最良線形不偏推定量ということが分かった。
多変量解析入問 解答 まとめ
この本の解答を作っていく
ばらばらだったので、まとめる記事を書いた。
解答
第2章 線形回帰モデル
yosuke-programing.hatenadiary.com
第3章 非線形回帰モデル
yosuke-programing.hatenadiary.com
第4章 ロジスティック回帰モデル
yosuke-programing.hatenadiary.com
第5章 モデル評価基準
yosuke-programing.hatenadiary.com
第6章 判別分析
yosuke-programing.hatenadiary.com
第7章 ベイズ判別
代入するだけなのと、本に載っているので省略
第8章 サポートベクトルマシン
yosuke-programing.hatenadiary.com
第9章 主成分分析
第10章 クラスター分析
yosuke-programing.hatenadiary.com
補足
第2章 線形回帰モデル
ガウス・マルコフの法則
yosuke-programing.hatenadiary.com