近代科学社

書籍検索
ジャンル選択

工学

実践 マテリアルズインフォマティクスPythonによる材料設計のための機械学習

著者 船津 公人
著者 柴山 翔二郎

著者紹介

材料設計に新たな地平を!

化学分野の材料開発はこれまで経験と勘に裏打ちされた実験的手法が中心的な役割を果たしてきたが、新物質の発見から実用化までに長い時間とコストを要している。そこで近年では蓄積された多くのデータ・情報を駆使して所望の構造・材料候補を導き出すデータ駆動型科学――マテリアルズインフォマティクスの活用が始まっている。本書ではマテリアルズインフォマティクスを実践するための機械学習法、実験計画法、記述子計算を詳述。プログラムに必要なPythonとGoogle CoLabについても導入から解説している。これからデータ解析に取り組もうと考えている化学分野の方々にとって指南書となる一冊。
なお、本文中のプログラムソースは、著者のWebサイト等でダウロードできる。

電子書籍¥3,850 小売希望価格(税込)

紙の書籍¥3,850定価(税込)

基本情報

発売日 2020年7月30日
本体価格 3,500円
ページ数 200 ページ ※印刷物
サイズ B5 変形
ISBN 9784764906150
ジャンル 工学
タグ 計算科学, マテリアルズインフォマティクス
電子書籍形式 固定型

主要目次

序章 はじめに
逆引き索引
よくある質問
数式の表記
プログラムの表記とプログラミングのためのトラブルシューティング方法
そのほかプログラミングを始める際の注意事項

1 データに慣れよう
1.1 ファイルの読み出し
1.2 数値データ可視化 – 探索的データ解析(Exploratory Data Analysis)
1.3 データの可視化 – 次元削減
1.4 化合物構造の可視化

2 環境構築
2.1 Anaconda, Miniconda
2.2 Anacondaのインストール
2.3 Condaでの環境構築
2.4 エディタ
2.5 発展 – Bash

3 マテリアルズインフォマティクス概論
3.1 マテリアルズインフォマティクスの動向
3.2 マテリアルズインフォマティクスにおける機械学習モデルの考え方
3.3 解析の流れ

4 実験による効率的なデータの取り方 – 実験計画法
4.1 実験計画法の紹介
4.2 直交計画法
4.3 データのバリエーションの少なさとモデルの精度
4.4 D最適化法

5 記述子計算
5.1 Pythonスクリプトの実行
5.2 フラグメントカウントを自分で実装する
5.3 RDKitから呼び出すフラグメントカウントを使ってQSPR
5.4 RDKit記述子
5.5 Mordredに掲載の記述子
5.6 Pymatgenに掲載されている記述子
5.7 データ前処理(変数選択)

6 機械学習モデルの概略
6.1 線形モデル:PLS,LASSO,リッジ回帰
6.2 非線形モデル:ランダムフォレスト,サポートベクター回帰

7 モデルの解釈
7.1 予測モデルのバリデーションと予測指標
7.2 予測モデルを用いた記述子寄与度の計算
7.3 モデルの適用範囲評価手法

8 機械学習モデルと組み合わせた追加検討の方法
8.1 構造生成による構造提案
8.2 ベイズ最適化によるデータ取得

9 プロジェクトの例
9.1 解析時のフォルダ構成
9.2 解析例 1:触媒データを使った複数モデルの適用
9.3 解析例 2:水溶解度データと構造生成
9.4 解析例 3:分類モデルの構築とパイプライン

10 シェルを用いたデータ加工
10.1 シェルを使ったデータ前処理
10.2 シェルを使ったデータ加工例

A 付録
A.1 PCAの導出
A.2 PLS1の導出
A.3 PLS2の導出
A.4 サポートベクターマシン
A.5 1クラスSVM
A.6 サポートベクター回帰
A.7 ガウス過程回帰
A.8 Stochastic Neighbor Embedding
A.9 Generative Topographic Mapping
A.10 ラグランジュ未定定数法
A.11 数学のトレーニング
A.12 プログラミングのスタートライン:ブラインドタッチ

目次をさらに表示する

著者紹介

船津 公人 (ふなつ きみと)
1978 年 九州大学理学部化学科卒
1983 年 九州大学大学院理学研究科化学専攻博士課程修了 (理学博士)
1984 年 豊橋技術科学大学物質工学系助手,1992 年 同知識情報工学系助教授.
2004 年 東京大学大学院工学系研究科化学システム工学専攻教授,現在に至る.
2017 年 10 月より奈良先端科学技術大学院大学・データ駆動型サイエンス創造センター研究ディレクターを兼務.
2011 年 ストラスブール大学招聘教授.
学位は有機反応機構研究で取得.専門分野はケモインフォマティクス.
1984 年からケモインフォマティクスの分野に身を投じでいる.
ケモインフォマティクス利用による分子・薬物設計,材料設計(プロセス条件も含む),構造解析,合成経路設計,化学プラントなどを対象とした監視と制御のためのソフトセンサー開発に取り組む.
著書に
『コンピュータ・ケミストリーシリーズ 1 CHEMICS—コンピュータによる構造解析—』(共著,共立出版)
『コンピュータ・ケミストリーシリーズ 2 AIPHOS—コンピュータによる有機合成経路探索—』(共著,共立出版)
『ソフトセンサー入門 基礎から実用的研究例まで』(共著,コロナ社)
『ケモインフォマティクス 予測と設計のための化学情報学』(共訳,丸善・Wiley)など.
日本科学技術情報センター 丹羽賞・学術賞 (1988 年)
日本コンピュータ化学会学会賞(2003 年)
また 2019 年 8月アメリカ化学会より,当該分野のノーベル賞とされる Herman Skolnik 賞を受賞.

柴山 翔二郎 (しばやま しょうじろう)
2015 年 東京大学工学部化学システム工学科卒
2020 年 東京大学大学院工学系研究科博士課程修了.
在学中にフランスストラスブール大学に研究留学し,ケモインフォマティクス研究に従事.
現在,学術振興会特別研究員としてソフトセンサー研究に従事.博士(工学).
専門分野は化学工学,ソフトセンサー,ケモインフォマティクス,ベイズ最適化を用いた実験計画法など.
情報科学を用いた自動化・効率化に興味があり,化学工学・化学と機械学習の融合に取り組む.

著者紹介をさらに表示する

読者サポート

類似書籍