近代科学社

ニュースリリース impressG
  
   
     

化学の分野でデータ駆動型研究を始めよう!

実践 マテリアルズインフォマティクス
―Pythonによる材料設計のための機械学習― 』発行

 

2020年7月30日
株式会社近代科学社

 
 インプレスグループで理工学分野の専門書出版事業を手掛ける株式会社近代科学社は、2020年7月30日に、『実践 マテリアルズインフォマティクス―Pythonによる材料設計のための機械学習―』(著者:船津 公人・柴山 翔二郎)を発行いたしました。
book
●書誌情報
【書名】 実践 マテリアルズインフォマティクス
-Pythonによる材料設計のための機械学習-
【著者】 船津 公人・柴山 翔二郎
【仕様】 B5変型判・並製・200頁
【本体価格】 3,500円(税込3,850円)
【ISBN】 978-4-7649-0615-0 C3043
【商品URL】 https://www.kindaikagaku.co.jp/information/kd0615.htm

●内容紹介
 化学分野における従来の材料開発のメインプロセスは「実験」と「理論計算」の二つです。
この二つは研究者の直観と経験による部分が大きく作用していると言われ、材料探索から製品開発まで時間とコストがかかることが課題とされています。
こうした背景から、情報科学のアルゴリズムを材料設計に応用したマテリアルズインフォマティクスがにわかに注目を集め始めました。
 本書ではマテリアルズインフォマティクスの実践に必須となる機械学習法、実験計画法、記述子計算を基礎の部分から詳細に解説しています。
プログラミング言語にはPythonを使い、ツールとしてGoogle CoLabを用いながら化学分野におけるデータ解析の事例を紹介しています。
 「ニューノーマル」時代の到来で研究開発の現場でもデジタル化の流れが加速しています。
 この潮流を捉え、いち早くデータ駆動型研究の手法を取り入れようと考える方々の意欲を満たす、充実の一冊です。

●著者紹介

船津 公人 (ふなつ きみと)

1978年 九州大学理学部化学科卒
1983年 九州大学大学院理学研究科化学専攻博士課程修了(理学博士)
1984年 豊橋技術科学大学物質工学系助手,1992年 同知識情報工学系助教授
2004年 東京大学大学院工学系研究科化学システム工学専攻教授、現在に至る
2017年10月より奈良先端科学技術大学院大学・データ駆動型サイエンス創造センター研究ディレクターを兼務。
2011年 ストラスブール大学招聘教授。学位は有機反応機構研究で取得。

専門分野はケモインフォマティクス。1984年からケモインフォマティクスの分野に身を投じでいる。ケモインフォマティクス利用による分子・薬物設計、材料設計(プロセス条件も含む)、構造解析、合成経路設計、化学プラントなどを対象とした監視と制御のためのソフトセンサー開発に取り組む。
著書に『コンピュータ・ケミストリーシリーズ1  CHEMICS−コンピュータによる構造解析−』(共著、共立出版)、『コンピュータ・ケミストリーシリーズ2  AIPHOS−コンピュータによる有機合成経路探索−』(共著、 共立出版)、『ソフトセンサー入門 基礎から実用的研究例まで』(共著、コロナ社)、『ケモインフォマティクス予測と設計のための化学情報学』(共訳、丸善・Wiley)など。
日本科学技術情報センター丹羽賞・学術賞(1988年)、日本コンピュータ化学会学会賞(2003年)、また2019 年8月アメリカ化学会より、当該分野のノーベル賞とされるHerman Skolnik賞を受賞。

 

柴山 翔二郎 (しばやま しょうじろう)

2015年 東京大学工学部化学システム工学科卒
2020年 東京大学大学院工学系研究科博士課程修了。
在学中にフランスストラスブール大学に研究留学し、ケモインフォマティクス研究に従事。現在、学術振興会特別研究員としてソフトセンサー研究に従事。博士(工学)。
専門分野は化学工学、ソフトセンサー、ケモインフォマティクス、ベイズ最適化を用いた実験計画法など。情報科学を用いた自動化・効率化に興味があり、化学工学・化学と機械学習の融合に取り組む。


●目次

序章 はじめに
逆引き索引
よくある質問
数式の表記
プログラムの表記とプログラミングのためのトラブルシューティング方法
そのほかプログラミングを始める際の注意事項

1 データに慣れよう
1.1 ファイルの読み出し
1.2 数値データ可視化−探索的データ解析(Exploratory Data Analysis)
1.3 データの可視化−次元削減
1.4 化合物構造の可視化

2 環境構築
2.1 Anaconda、Miniconda
2.2 Anacondaのインストール
2.3 Condaでの環境構築
2.4 エディタ
2.5 発展−Bash

3 マテリアルズインフォマティクス概論
3.1 マテリアルズインフォマティクスの動向
3.2 マテリアルズインフォマティクスにおける機械学習モデルの考え方
3.3 解析の流れ

4 実験による効率的なデータの取り方−実験計画法
4.1 実験計画法の紹介
4.2 直交計画法
4.3 データのバリエーションの少なさとモデルの精度
4.4 D 最適化法

5 記述子計算
5.1 Pythonスクリプトの実行
5.2 フラグメントカウントを自分で実装する
5.3 RDKitから呼び出すフラグメントカウントを使ってQSPR
5.4 RDKit記述子
5.5 Mordredに掲載の記述子
5.6 Pymatgenに掲載されている記述子
5.7 データ前処理(変数選択)

6 機械学習モデルの概略
6.1 線形モデル: PLS、LASSO、リッジ回帰
6.2 非線形モデル:ランダムフォレスト、サポートベクター回帰

7 モデルの解釈
7.1 予測モデルのバリデーションと予測指標
7.2 予測モデルを用いた記述子寄与度の計算
7.3 モデルの適用範囲評価手法

8 機械学習モデルと組み合わせた追加検討の方法
8.1 構造生成による構造提案
8.2 ベイズ最適化によるデータ取得

9 プロジェクトの例
9.1 解析時のフォルダ構成
9.2 解析例1:触媒データを使った複数モデルの適用
9.3 解析例2:水溶解度データと構造生成
9.4 解析例3:分類モデルの構築とパイプライン

10 シェルを用いたデータ加工
10.1 シェルを使ったデータ前処理
10.2 シェルを使ったデータ加工例

A 付録
A.1 PCAの導出
A.2 PLS1の導出
A.3 PLS2の導出
A.4 サポートベクターマシン
A.5 1クラスSVM
A.6 サポートベクター回帰
A.7 ガウス過程回帰
A.8 Stochastic Neighbor Embedding
A.9 Generative Topographic Mapping
A.10 ラグランジュ未定定数法
A.11 数学のトレーニング
A.12 プログラミングのスタートライン:ブラインドタッチ

 


【株式会社 近代科学社】
株式会社近代科学社(本社:東京都新宿区、代表取締役社長:井芹昌信)は、1959年創立。
数学・数理科学・情報科学・情報工学を基軸とする学術専門書や、理工学系の大学向け教科書等、理工学専門分野を広くカバーする出版事業を展開しています。自然科学の基礎的な知識に留まらず、その高度な活用が要求される現代のニーズに応えるべく、古典から最新の学際分野まで幅広く扱っています。また、主要学会・協会や著名研究機関と連携し、世界標準となる学問レベルを追求しています。

【インプレスグループ】
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:松本大輔、証券コード:東証1部9479)を持株会社とするメディアグループ。「IT」「音楽」「デザイン」「山岳・自然」「モバイルサービス」「学術・理工学」「旅・鉄道」を主要テーマに専門性の高いメディア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。

【お問い合わせ先】
株式会社近代科学社  TEL:03-3260-6161  電子メール: reader@kindaikagaku.co.jp

 
 
 

本サイトのご利用についてお問合せプライバシーについて | 会社概要 | インプレスグループサイト | インプレスグループTop |
 Copyright © 2007 Kindai kagaku sha Co.,Ltd, an Impress Group company. All rights reserved.