工学
Orange Data Miningではじめるマテリアルズインフォマティクス
非プログラマのための機械学習ソフト Orange!
物質科学・化学工学の研究開発に変革をもたらす技術として「マテリアルズインフォマティクス」が期待され、各分野でその取り組みが急速に進んでいる。
しかし機械学習を用いたデータマイニングである性質上、まずはプログラミング技術を習得しなければいけない実情がある。
本書ではGUIベースのフリーソフト「Orange Date Mining」を使用し、プログラミングを学んでいない人でも機械学習を実践する手法を紹介している。
著者によるサンプルスクリプトとデータファイルも準備しているため、手を動かし理解しながら読み進めることができる。
また各章の練習問題を解けば技術がより身につく構成となっている。マテリアルズインフォマティクスをこれから始める方に最適の一冊。
電子書籍¥3,410 小売希望価格(税込)
紙の書籍¥3,410定価(税込)
基本情報
| 発売日 | 2021年5月31日 |
|---|---|
| 本体価格 | 3,100円 |
| ページ数 | 200 ページ ※印刷物 |
| サイズ | B5 変形 |
| ISBN | 9784764906310 |
| ジャンル | 工学 |
| タグ | 計算科学, マテリアルズインフォマティクス, 教科書 |
| 電子書籍形式 | 固定型 |
主要目次
1 Orange Data Miningとは
1.1 Orange のインストール
1.2 サンプルスクリプトとデータファイル
2 機械学習の基礎概念
2.1 簡単な例における予測モデルの構築
2.1.1 事前に支配法則が分かっている世界での予測
2.1.2 事前に支配法則が分かっていない世界での予測
2.1.3 データ駆動型アプローチによる予測モデルの構築
2.2 機械学習手法の紹介
2.2.1 機械学習手法の目的による分類
2.2.2 データの規格化
2.2.3 教師あり学習 a:回帰
2.2.4 教師あり学習 b:分類
2.2.5 類似度と距離の定義
2.2.6 教師なし学習 a:次元圧縮
2.2.7 教師なし学習 b:クラスタリング
2.3 モデル学習と妥当性の評価
2.3.1 評価指標
2.3.2 訓練データとテストデータへの分割
2.3.3 交差検定
2.3.4 評価値最大化によるモデル選択
2.4 予測モデル学習の諸問題
2.5 機械学習の四過程
3 超基礎:簡単な観測データからの回帰モデルの学習
3.1 観測データと回帰モデルの定義
3.2 Orange操作の基礎知識
3.3 Orangeワークフロー作成の初歩
3.4 線形回帰モデルの学習と予測
3.4.1 訓練データとテストデータへの分割
3.4.2 線形回帰モデルの学習
3.4.3 テストデータによる性能評価
3.4.4 新規データ予測値の生成
3.5 Lassoによる線形回帰モデルの学習と予測
3.6 交差検定による性能評価と予測
3.6.1 交差検定による予測性能評価
3.6.2 モデル学習と新規データへの予測
3.7 学習済みモデルの保存と読み込み
3.8 Test and Score 部品の詳細
3.9 機械学習の四過程との比較
3.10 演習問題 1
3.11 回答
4 基礎:希土類コバルト二元合金のキュリー温度予測回帰モデル
4.1 観測データと探索的データ解析
4.1.1 観測データとデータ加工
4.1.2 探索的データ解析
4.2 Lassoによる予測性能評価
4.3 物質科学の視点からのモデル解釈
4.4 探索的データ解析
4.5 演習問題 2
4.6 回答
5 基礎:単体元素基底状態結晶構造の予測
5.1 観測データとデータ加工
5.2 ロジスティック回帰による分類モデル学習と評価
5.3 探索的データ解析
5.4 演習問題 3
5.5 回答
6 基礎:鉄結晶構造のクラスタリング
6.1 観測データとデータ加工
6.2 k-Means法によるクラスタリング
6.3 階層クラスタリング
6.3.1 データインスタンス間距離と説明変数間距離
6.3.2 データインスタンス間距離による階層クラスタリング
6.3.3 説明変数間距離による階層クラスタリング
6.4 演習問題 4
6.5 回答
6.6 演習問題 5
6.7 回答
7 応用:文字分類モデルの学習(文字認識)
7.1 手書き文字の観測データ
7.1.1 観測データの取得
7.1.2 観測データの可視化
7.2 全説明変数を用いた分類モデル学習
7.3 PCAによる次元圧縮と分類モデル
7.3.1 PCAによる探索的データ解析
7.3.2 PCA + ロジスティック回帰による分類
7.4 多様体学習による次元削減と分類モデル
7.4.1 探索的データ解析
7.4.2 次元圧縮+ロジスティック回帰
7.5 演習問題 6
7.6 回答
8 応用:トモグラフ像の復元
8.1 トモグラフィの原理
8.2 元画像可視化
8.3 Lassoによる復元
8.4 演習問題 7
8.5 回答
A 付録
A.1 Orange公式資料
A.2 Orange用CSVフォーマット変換
A.3 Preprocess・Predictions・Test and Score の接続方法
1.1 Orange のインストール
1.2 サンプルスクリプトとデータファイル
2 機械学習の基礎概念
2.1 簡単な例における予測モデルの構築
2.1.1 事前に支配法則が分かっている世界での予測
2.1.2 事前に支配法則が分かっていない世界での予測
2.1.3 データ駆動型アプローチによる予測モデルの構築
2.2 機械学習手法の紹介
2.2.1 機械学習手法の目的による分類
2.2.2 データの規格化
2.2.3 教師あり学習 a:回帰
2.2.4 教師あり学習 b:分類
2.2.5 類似度と距離の定義
2.2.6 教師なし学習 a:次元圧縮
2.2.7 教師なし学習 b:クラスタリング
2.3 モデル学習と妥当性の評価
2.3.1 評価指標
2.3.2 訓練データとテストデータへの分割
2.3.3 交差検定
2.3.4 評価値最大化によるモデル選択
2.4 予測モデル学習の諸問題
2.5 機械学習の四過程
3 超基礎:簡単な観測データからの回帰モデルの学習
3.1 観測データと回帰モデルの定義
3.2 Orange操作の基礎知識
3.3 Orangeワークフロー作成の初歩
3.4 線形回帰モデルの学習と予測
3.4.1 訓練データとテストデータへの分割
3.4.2 線形回帰モデルの学習
3.4.3 テストデータによる性能評価
3.4.4 新規データ予測値の生成
3.5 Lassoによる線形回帰モデルの学習と予測
3.6 交差検定による性能評価と予測
3.6.1 交差検定による予測性能評価
3.6.2 モデル学習と新規データへの予測
3.7 学習済みモデルの保存と読み込み
3.8 Test and Score 部品の詳細
3.9 機械学習の四過程との比較
3.10 演習問題 1
3.11 回答
4 基礎:希土類コバルト二元合金のキュリー温度予測回帰モデル
4.1 観測データと探索的データ解析
4.1.1 観測データとデータ加工
4.1.2 探索的データ解析
4.2 Lassoによる予測性能評価
4.3 物質科学の視点からのモデル解釈
4.4 探索的データ解析
4.5 演習問題 2
4.6 回答
5 基礎:単体元素基底状態結晶構造の予測
5.1 観測データとデータ加工
5.2 ロジスティック回帰による分類モデル学習と評価
5.3 探索的データ解析
5.4 演習問題 3
5.5 回答
6 基礎:鉄結晶構造のクラスタリング
6.1 観測データとデータ加工
6.2 k-Means法によるクラスタリング
6.3 階層クラスタリング
6.3.1 データインスタンス間距離と説明変数間距離
6.3.2 データインスタンス間距離による階層クラスタリング
6.3.3 説明変数間距離による階層クラスタリング
6.4 演習問題 4
6.5 回答
6.6 演習問題 5
6.7 回答
7 応用:文字分類モデルの学習(文字認識)
7.1 手書き文字の観測データ
7.1.1 観測データの取得
7.1.2 観測データの可視化
7.2 全説明変数を用いた分類モデル学習
7.3 PCAによる次元圧縮と分類モデル
7.3.1 PCAによる探索的データ解析
7.3.2 PCA + ロジスティック回帰による分類
7.4 多様体学習による次元削減と分類モデル
7.4.1 探索的データ解析
7.4.2 次元圧縮+ロジスティック回帰
7.5 演習問題 6
7.6 回答
8 応用:トモグラフ像の復元
8.1 トモグラフィの原理
8.2 元画像可視化
8.3 Lassoによる復元
8.4 演習問題 7
8.5 回答
A 付録
A.1 Orange公式資料
A.2 Orange用CSVフォーマット変換
A.3 Preprocess・Predictions・Test and Score の接続方法