工学
実践 マテリアルズインフォマティクスPythonによる材料設計のための機械学習
材料設計に新たな地平を!
化学分野の材料開発はこれまで経験と勘に裏打ちされた実験的手法が中心的な役割を果たしてきたが、新物質の発見から実用化までに長い時間とコストを要している。そこで近年では蓄積された多くのデータ・情報を駆使して所望の構造・材料候補を導き出すデータ駆動型科学――マテリアルズインフォマティクスの活用が始まっている。本書ではマテリアルズインフォマティクスを実践するための機械学習法、実験計画法、記述子計算を詳述。プログラムに必要なPythonとGoogle CoLabについても導入から解説している。これからデータ解析に取り組もうと考えている化学分野の方々にとって指南書となる一冊。
なお、本文中のプログラムソースは、著者のWebサイト等でダウロードできる。
電子書籍¥3,850 小売希望価格(税込)
紙の書籍¥3,850定価(税込)
基本情報
| 発売日 | 2020年7月30日 |
|---|---|
| 本体価格 | 3,500円 |
| ページ数 | 200 ページ ※印刷物 |
| サイズ | B5 変形 |
| ISBN | 9784764906150 |
| ジャンル | 工学 |
| タグ | 計算科学, マテリアルズインフォマティクス |
| 電子書籍形式 | 固定型 |
主要目次
序章 はじめに
逆引き索引
よくある質問
数式の表記
プログラムの表記とプログラミングのためのトラブルシューティング方法
そのほかプログラミングを始める際の注意事項
1 データに慣れよう
1.1 ファイルの読み出し
1.2 数値データ可視化 – 探索的データ解析(Exploratory Data Analysis)
1.3 データの可視化 – 次元削減
1.4 化合物構造の可視化
2 環境構築
2.1 Anaconda, Miniconda
2.2 Anacondaのインストール
2.3 Condaでの環境構築
2.4 エディタ
2.5 発展 – Bash
3 マテリアルズインフォマティクス概論
3.1 マテリアルズインフォマティクスの動向
3.2 マテリアルズインフォマティクスにおける機械学習モデルの考え方
3.3 解析の流れ
4 実験による効率的なデータの取り方 – 実験計画法
4.1 実験計画法の紹介
4.2 直交計画法
4.3 データのバリエーションの少なさとモデルの精度
4.4 D最適化法
5 記述子計算
5.1 Pythonスクリプトの実行
5.2 フラグメントカウントを自分で実装する
5.3 RDKitから呼び出すフラグメントカウントを使ってQSPR
5.4 RDKit記述子
5.5 Mordredに掲載の記述子
5.6 Pymatgenに掲載されている記述子
5.7 データ前処理(変数選択)
6 機械学習モデルの概略
6.1 線形モデル:PLS,LASSO,リッジ回帰
6.2 非線形モデル:ランダムフォレスト,サポートベクター回帰
7 モデルの解釈
7.1 予測モデルのバリデーションと予測指標
7.2 予測モデルを用いた記述子寄与度の計算
7.3 モデルの適用範囲評価手法
8 機械学習モデルと組み合わせた追加検討の方法
8.1 構造生成による構造提案
8.2 ベイズ最適化によるデータ取得
9 プロジェクトの例
9.1 解析時のフォルダ構成
9.2 解析例 1:触媒データを使った複数モデルの適用
9.3 解析例 2:水溶解度データと構造生成
9.4 解析例 3:分類モデルの構築とパイプライン
10 シェルを用いたデータ加工
10.1 シェルを使ったデータ前処理
10.2 シェルを使ったデータ加工例
A 付録
A.1 PCAの導出
A.2 PLS1の導出
A.3 PLS2の導出
A.4 サポートベクターマシン
A.5 1クラスSVM
A.6 サポートベクター回帰
A.7 ガウス過程回帰
A.8 Stochastic Neighbor Embedding
A.9 Generative Topographic Mapping
A.10 ラグランジュ未定定数法
A.11 数学のトレーニング
A.12 プログラミングのスタートライン:ブラインドタッチ
逆引き索引
よくある質問
数式の表記
プログラムの表記とプログラミングのためのトラブルシューティング方法
そのほかプログラミングを始める際の注意事項
1 データに慣れよう
1.1 ファイルの読み出し
1.2 数値データ可視化 – 探索的データ解析(Exploratory Data Analysis)
1.3 データの可視化 – 次元削減
1.4 化合物構造の可視化
2 環境構築
2.1 Anaconda, Miniconda
2.2 Anacondaのインストール
2.3 Condaでの環境構築
2.4 エディタ
2.5 発展 – Bash
3 マテリアルズインフォマティクス概論
3.1 マテリアルズインフォマティクスの動向
3.2 マテリアルズインフォマティクスにおける機械学習モデルの考え方
3.3 解析の流れ
4 実験による効率的なデータの取り方 – 実験計画法
4.1 実験計画法の紹介
4.2 直交計画法
4.3 データのバリエーションの少なさとモデルの精度
4.4 D最適化法
5 記述子計算
5.1 Pythonスクリプトの実行
5.2 フラグメントカウントを自分で実装する
5.3 RDKitから呼び出すフラグメントカウントを使ってQSPR
5.4 RDKit記述子
5.5 Mordredに掲載の記述子
5.6 Pymatgenに掲載されている記述子
5.7 データ前処理(変数選択)
6 機械学習モデルの概略
6.1 線形モデル:PLS,LASSO,リッジ回帰
6.2 非線形モデル:ランダムフォレスト,サポートベクター回帰
7 モデルの解釈
7.1 予測モデルのバリデーションと予測指標
7.2 予測モデルを用いた記述子寄与度の計算
7.3 モデルの適用範囲評価手法
8 機械学習モデルと組み合わせた追加検討の方法
8.1 構造生成による構造提案
8.2 ベイズ最適化によるデータ取得
9 プロジェクトの例
9.1 解析時のフォルダ構成
9.2 解析例 1:触媒データを使った複数モデルの適用
9.3 解析例 2:水溶解度データと構造生成
9.4 解析例 3:分類モデルの構築とパイプライン
10 シェルを用いたデータ加工
10.1 シェルを使ったデータ前処理
10.2 シェルを使ったデータ加工例
A 付録
A.1 PCAの導出
A.2 PLS1の導出
A.3 PLS2の導出
A.4 サポートベクターマシン
A.5 1クラスSVM
A.6 サポートベクター回帰
A.7 ガウス過程回帰
A.8 Stochastic Neighbor Embedding
A.9 Generative Topographic Mapping
A.10 ラグランジュ未定定数法
A.11 数学のトレーニング
A.12 プログラミングのスタートライン:ブラインドタッチ