Python機械学習プログラミングの第7章までに紹介されている機械学習の本まとめ
Python機械学習プログラミングでは実装に重きを置いているので、数学的な十頃は他の本や論文に任せているので、ところどころで本が紹介されている。数学的な部分が知りたいときに、どの本を参考にしたらいいのか探すのはいちいち難しいのでまとめた。ぬけがあったらごめんなさい
[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)
- 作者: Sebastian Raschka,Vahid Mirjalili,福島真太朗,株式会社クイープ
- 出版社/メーカー: インプレス
- 発売日: 2018/03/16
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
- 第1章 「データから学習する能力」をコンピュータに与える
- 第2章 分類問題―単純な機械学習アルゴリズムのトレーニング
- 第3章 分類問題―機械学習ライブラリscikit-learnの活用
- 第4章 データ前処理―よりよいトレーニングセットの構築
- 第5章 次元削減でデータを圧縮する
- 第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス
- 第7章 アンサンブル学習 異なるモデルの組み合わせ
- 第10章 回帰分析 ー 連続値をとる目的変数の予測
第1章 「データから学習する能力」をコンピュータに与える
ノーフリーランチの紹介
ハンマーしか持ってなければ全てが釘に見える
第2章 分類問題―単純な機械学習アルゴリズムのトレーニング
線形代数
- 作者: 齋藤正彦
- 出版社/メーカー: 東京大学出版会
- 発売日: 1966/03/31
- メディア: 単行本
- 購入: 4人 クリック: 102回
- この商品を含むブログ (47件) を見る
- 作者: 松坂和夫
- 出版社/メーカー: 岩波書店
- 発売日: 1980/09/04
- メディア: 単行本
- 購入: 4人 クリック: 128回
- この商品を含むブログ (12件) を見る
まずはこの一冊から 意味がわかる線形代数 (BERET SCIENCE)
- 作者: 石井俊全
- 出版社/メーカー: ベレ出版
- 発売日: 2011/06/22
- メディア: 単行本
- 購入: 1人 クリック: 5回
- この商品を含むブログを見る
ライブラリ入門
以下の第2章
- 作者: 比戸将平,馬場雪乃,里洋平,戸嶋龍哉,得居誠也,福島真太朗,加藤公一,関喜史,阿部厳,熊崎宏樹
- 出版社/メーカー: 技術評論社
- 発売日: 2015/09/10
- メディア: Kindle版
- この商品を含むブログを見る
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Adaline
第3章 分類問題―機械学習ライブラリscikit-learnの活用
ロジスティック回帰
- 作者: Annette J.Dobson,田中豊,森川敏彦,山中竹春,冨田誠
- 出版社/メーカー: 共立出版
- 発売日: 2008/09/08
- メディア: 単行本
- 購入: 15人 クリック: 152回
- この商品を含むブログ (13件) を見る
SVM
The Nature of Statistical Learning Theory (Information Science and Statistics)
- 作者: Vladimir Vapnik
- 出版社/メーカー: Springer New York
- 発売日: 2010/10/21
- メディア: ペーパーバック
- この商品を含むブログを見る
サポートベクトルマシン (機械学習プロフェッショナルシリーズ)
- 作者: 竹内一郎,烏山昌幸
- 出版社/メーカー: 講談社
- 発売日: 2015/08/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
https://www.di.ens.fr/~mallat/papiers/svmtutorial.pdf
可視化 .dotファイル
Pydotplus
データ構造ありのアルゴリズム
scimitar-learnの文献
第4章 データ前処理―よりよいトレーニングセットの構築
L1正則化が疎な解につながる数学的理由
- 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman
- 出版社/メーカー: Springer
- 発売日: 2008/12/01
- メディア: ハードカバー
- 購入: 1人 クリック: 222回
- この商品を含むブログ (16件) を見る
- 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
- 出版社/メーカー: 共立出版
- 発売日: 2014/06/25
- メディア: 単行本
- この商品を含むブログ (6件) を見る
特徴選択
- 作者: 元田浩,山口高平,津本周作,沼尾正行
- 出版社/メーカー: オーム社
- 発売日: 2006/12/01
- メディア: 単行本
- 購入: 2人 クリック: 46回
- この商品を含むブログ (16件) を見る
特徴選択のアルゴリズム
http://www.jmlr.org/papers/v3/guyon03a.html
http://www.jmlr.org/papers/volume3/guyon03a/guyon03a.pdf
第5章 次元削減でデータを圧縮する
PCAがLDAより優れているとき
LDAの上から2分類多分類
次元削減ためのLDA
- 作者: リチャード・O.デューダ,ピーター・E.ハート,デイヴィット・G.ストーク,尾上守夫
- 出版社/メーカー: アドコム・メディア
- 発売日: 2001/07/03
- メディア: 大型本
- クリック: 24回
- この商品を含むブログ (13件) を見る
- 作者: Richard O. Duda,Peter E. Hart,David G. Stork
- 出版社/メーカー: Wiley-Interscience
- 発売日: 2000/10
- メディア: ハードカバー
- クリック: 2回
- この商品を含むブログ (3件) を見る
共分散の一般化
http://pca.narod.ru/scholkopf_kernel.pdf
Scikit-learnの非線形次元削減の最新の実装
非線形次元削減
カーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)
- 作者: 赤穂昭太郎
- 出版社/メーカー: 岩波書店
- 発売日: 2008/11/27
- メディア: 単行本
- 購入: 7人 クリック: 180回
- この商品を含むブログ (32件) を見る
第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス
バイアスとバリアンスのバランスが最も良いのは、k = 10について
クラスのバランスが悪い時、バリアンスとバイアスのバランスが改善される
http://ai.stanford.edu/~ronnyk/accEst.pdf
汎化性能のパリアンスが交差検証でどのように評価されるのか
http://www.jmlr.org/papers/volume6/markatou05a/markatou05a.pdf
dl.acm.org
ブーストラップ検証
https://pdfs.semanticscholar.org/8e30/f02d667163ff52223efd57c0b48a0a9a7873.pdf
グリツドサーチとランダムサーチの違い
http://www.jmlr.org/papers/volume13/bergstra12a/bergstra12a.pdf
誤差推定におけるバイアス
AUCと正解率がほぼ一致すること
トレーニングサンプルを人工的に生成するアルゴリズムSMOTE
https://arxiv.org/pdf/1106.1813
第7章 アンサンブル学習 異なるモデルの組み合わせ
スタッキングについて
- 作者: 元田浩,山口高平,津本周作,沼尾正行
- 出版社/メーカー: オーム社
- 発売日: 2006/12/01
- メディア: 単行本
- 購入: 2人 クリック: 46回
- この商品を含むブログ (16件) を見る
- 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内一郎,玉木徹,出口大輔,冨岡亮太,波部斉,前田新一,持橋大地,山田誠
- 出版社/メーカー: 共立出版
- 発売日: 2014/06/25
- メディア: 単行本
- この商品を含むブログ (6件) を見る
バギングについて
アダブースト
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.51.6252&rep=rep1&type=pdf
ブースティングでは、バギングと比べてバイアスとバリアンスが低くなることがある
https://www.stat.berkeley.edu/users/breiman/arcall96.pdf
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.1.9074
計算コストと予測性能のトレードオフ Netflix のアルゴリズムの大会で優勝
https://www.netflixprize.com/assets/GrandPrize2009_BPC_BigChaos.pdf
上のが複雑すぎて使えなかった声明文
第10章 回帰分析 ー 連続値をとる目的変数の予測
正規性の必要性について
Introduction to Linear Regression Analysis, 6th edition Solutions Manual Cloth
- 作者: Montgomery
- 出版社/メーカー: John Wiley & Sons Inc
- 発売日: 2020/04/21
- メディア: ハードカバー
- この商品を含むブログを見る
正規方程式の導出
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1992/08/01
- メディア: 単行本
- 購入: 26人 クリック: 308回
- この商品を含むブログ (22件) を見る
外れ値検出の方法
欠測データの統計科学――医学と社会科学への応用 (調査観察データ解析の実際 第1巻)
- 作者: 星野崇宏,岡田謙介
- 出版社/メーカー: 岩波書店
- 発売日: 2016/04/20
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
ロバスト回帰
正常値の閾値設定のアルゴリズム
決定計数について
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る