情報
はっきりわかるデータサイエンスと機械学習
「なぜ」を導くデータサイエンスでAIの透明化を実現する!
AIの要である機械学習は、結果を導き出す過程がブラックボックス化する問題があり、AI実用化の障害となっている。その解決策として、丹念なデータ分析によりデータの背景にある現象を統計モデルで表現する、本来の意味での「データサイエンス」の活用が期待されている。メカニズムが理解可能なモデルをAIの頭脳に使うことで、AIの透明化――すなわち説明可能なXAIも実現できる!
本書ではデータサイエンスの考えに基づく統計モデリングの解説に加え、機械学習の代表的な手法を Rを用いて体験していく。本書を読み込めば、探索的データ解析と機械学習、それぞれの本質を学ぶことができる。
電子書籍¥3,520 小売希望価格(税込)
紙の書籍¥3,520定価(税込)
基本情報
| 発売日 | 2020年5月29日 |
|---|---|
| 本体価格 | 3,200円 |
| ページ数 | 236 ページ ※印刷物 |
| サイズ | B5 変形 |
| ISBN | 9784764906129 |
| ジャンル | 情報 |
| タグ | プログラミング, データサイエンス, 機械学習・深層学習, 教科書 |
| 電子書籍形式 | 固定型 |
主要目次
1 データサイエンス入門
1.1 データにもとづく帰納的な推論
1.2 エンジニアリングとサイエンスの違い
1.3 データリテラシー
1.3.1 矩形データ
1.3.2 ドメインとデータベクトルの属性
1.3.3 リレーショナルデータの属性
1.3.4 データ浄化
1.4 モデリング
1.5 モデリングの 2つのアプローチ
1.6 過剰適合
1.7 モデリングのためのソフトウェア環境
2 データサイエンスによるモデリング
2.1 Kyphosis データ
2.2 データブラウジング
2.2.1 箱ひげ図
2.2.2 条件付き箱ひげ図による分類の診断
2.2.3 散布図における平滑化の活用
2.3 一般化線形モデルを使ったモデリングの検討
2.3.1 一般化線形モデルの基礎
2.3.2 R による一般化線形モデルのあてはめ
2.3.3 最尤推定法における代表的な残差
2.4 セミパラメトリックなモデルの検討
2.4.1 一般化加法モデル
2.4.2 R による一般化加法モデルの当てはめ
2.5 さらなるモデルの検討
3 教師あり機械学習の基礎
3.1 ロジスティック判別
3.1.1 ロジスティック判別の基礎
3.1.2 R によるロジスティック判別の実行
3.1.3 学習器の性能評価と検証法
3.2 サポートベクターマシン
3.2.1 基礎
3.2.2 R による実行
3.3 決定木
3.3.1 分類木の基礎
3.3.2 R による分類木の生成
3.3.3 決定木の問題点
3.4 バギングとブースティング
3.4.1 ブートストラップ法とバギングの基礎
3.4.2 R によるバギングの実行
3.4.3 ブースティングとアダブーストの基礎
3.4.4 R によるアダブーストの実行
3.5 ランダムフォレスト
3.5.1 基礎
3.5.2 R による実行
3.5.3 並列化
4 教師なし機械学習の基礎
4.1 クラスタリング
4.1.1 階層的クラスタリング
4.1.2 K-means法
4.1.3 混合分布によるクラスタリング
4.2 主成分分析
4.2.1 次元の削減
4.2.2 主成分分析と主軸変換
4.2.3 中心化と尺度基準化
4.2.4 主成分分析
4.2.5 特異値分解
4.2.6 主成分分析の解釈
5 ニューラルネットワーク入門
5.1 はじめに
5.2 層の追加(フィードフォワードニューラルネットワーク)
5.3 3層構造のニューラルネットワーク
5.4 活性化関数の変更
5.5 基本的なニューラルネットワークの導入
5.6 重みの推定方法(勾配降下法と誤差逆伝播法)
5.6.1 勾配降下法
5.6.2 誤差逆伝播法
5.7 R によるニューラルネットワークの利用
5.8 分類問題とニューラルネットワーク
5.8.1 ロジスティック回帰との比較
5.8.2 分析例
5.9 発展:多層型ネットワーク(ディープラーニングに向けて)
5.10 付録:跳びのあるネットワーク
A 付録
A.1 R のセットアップ
A.2 階層的クラスタリング
A.2.1 尺度と分類手法
A.2.2 距離の公理
A.2.3 重心法の式
A.2.4 ワルド法の式
A.2.5 ワルド法による更新式
A.3 主成分分析
A.3.1 ラグランジュの未定乗数法のイメージ
A.3.2 主成分導出の一般化
1.1 データにもとづく帰納的な推論
1.2 エンジニアリングとサイエンスの違い
1.3 データリテラシー
1.3.1 矩形データ
1.3.2 ドメインとデータベクトルの属性
1.3.3 リレーショナルデータの属性
1.3.4 データ浄化
1.4 モデリング
1.5 モデリングの 2つのアプローチ
1.6 過剰適合
1.7 モデリングのためのソフトウェア環境
2 データサイエンスによるモデリング
2.1 Kyphosis データ
2.2 データブラウジング
2.2.1 箱ひげ図
2.2.2 条件付き箱ひげ図による分類の診断
2.2.3 散布図における平滑化の活用
2.3 一般化線形モデルを使ったモデリングの検討
2.3.1 一般化線形モデルの基礎
2.3.2 R による一般化線形モデルのあてはめ
2.3.3 最尤推定法における代表的な残差
2.4 セミパラメトリックなモデルの検討
2.4.1 一般化加法モデル
2.4.2 R による一般化加法モデルの当てはめ
2.5 さらなるモデルの検討
3 教師あり機械学習の基礎
3.1 ロジスティック判別
3.1.1 ロジスティック判別の基礎
3.1.2 R によるロジスティック判別の実行
3.1.3 学習器の性能評価と検証法
3.2 サポートベクターマシン
3.2.1 基礎
3.2.2 R による実行
3.3 決定木
3.3.1 分類木の基礎
3.3.2 R による分類木の生成
3.3.3 決定木の問題点
3.4 バギングとブースティング
3.4.1 ブートストラップ法とバギングの基礎
3.4.2 R によるバギングの実行
3.4.3 ブースティングとアダブーストの基礎
3.4.4 R によるアダブーストの実行
3.5 ランダムフォレスト
3.5.1 基礎
3.5.2 R による実行
3.5.3 並列化
4 教師なし機械学習の基礎
4.1 クラスタリング
4.1.1 階層的クラスタリング
4.1.2 K-means法
4.1.3 混合分布によるクラスタリング
4.2 主成分分析
4.2.1 次元の削減
4.2.2 主成分分析と主軸変換
4.2.3 中心化と尺度基準化
4.2.4 主成分分析
4.2.5 特異値分解
4.2.6 主成分分析の解釈
5 ニューラルネットワーク入門
5.1 はじめに
5.2 層の追加(フィードフォワードニューラルネットワーク)
5.3 3層構造のニューラルネットワーク
5.4 活性化関数の変更
5.5 基本的なニューラルネットワークの導入
5.6 重みの推定方法(勾配降下法と誤差逆伝播法)
5.6.1 勾配降下法
5.6.2 誤差逆伝播法
5.7 R によるニューラルネットワークの利用
5.8 分類問題とニューラルネットワーク
5.8.1 ロジスティック回帰との比較
5.8.2 分析例
5.9 発展:多層型ネットワーク(ディープラーニングに向けて)
5.10 付録:跳びのあるネットワーク
A 付録
A.1 R のセットアップ
A.2 階層的クラスタリング
A.2.1 尺度と分類手法
A.2.2 距離の公理
A.2.3 重心法の式
A.2.4 ワルド法の式
A.2.5 ワルド法による更新式
A.3 主成分分析
A.3.1 ラグランジュの未定乗数法のイメージ
A.3.2 主成分導出の一般化