近代科学社

書籍検索
ジャンル選択

工学

Orange Data Miningではじめるマテリアルズインフォマティクス

著者 木野 日織
著者 ダム ヒョウ チ

著者紹介

非プログラマのための機械学習ソフト Orange!

物質科学・化学工学の研究開発に変革をもたらす技術として「マテリアルズインフォマティクス」が期待され、各分野でその取り組みが急速に進んでいる。
しかし機械学習を用いたデータマイニングである性質上、まずはプログラミング技術を習得しなければいけない実情がある。
本書ではGUIベースのフリーソフト「Orange Date Mining」を使用し、プログラミングを学んでいない人でも機械学習を実践する手法を紹介している。
著者によるサンプルスクリプトとデータファイルも準備しているため、手を動かし理解しながら読み進めることができる。
また各章の練習問題を解けば技術がより身につく構成となっている。マテリアルズインフォマティクスをこれから始める方に最適の一冊。

電子書籍¥3,410 小売希望価格(税込)

紙の書籍¥3,410定価(税込)

基本情報

発売日 2021年5月31日
本体価格 3,100円
ページ数 200 ページ ※印刷物
サイズ B5 変形
ISBN 9784764906310
ジャンル 工学
タグ 計算科学, マテリアルズインフォマティクス, 教科書
電子書籍形式 固定型

主要目次

1 Orange Data Miningとは
1.1 Orange のインストール
1.2 サンプルスクリプトとデータファイル

2 機械学習の基礎概念
2.1 簡単な例における予測モデルの構築
 2.1.1 事前に支配法則が分かっている世界での予測
 2.1.2 事前に支配法則が分かっていない世界での予測
 2.1.3 データ駆動型アプローチによる予測モデルの構築
2.2 機械学習手法の紹介
 2.2.1 機械学習手法の目的による分類
 2.2.2 データの規格化
 2.2.3 教師あり学習 a:回帰
 2.2.4 教師あり学習 b:分類
 2.2.5 類似度と距離の定義
 2.2.6 教師なし学習 a:次元圧縮
 2.2.7 教師なし学習 b:クラスタリング
2.3 モデル学習と妥当性の評価
 2.3.1 評価指標
 2.3.2 訓練データとテストデータへの分割
 2.3.3 交差検定
 2.3.4 評価値最大化によるモデル選択
2.4 予測モデル学習の諸問題
2.5 機械学習の四過程

3 超基礎:簡単な観測データからの回帰モデルの学習
3.1 観測データと回帰モデルの定義
3.2 Orange操作の基礎知識
3.3 Orangeワークフロー作成の初歩
3.4 線形回帰モデルの学習と予測
 3.4.1 訓練データとテストデータへの分割
 3.4.2 線形回帰モデルの学習
 3.4.3 テストデータによる性能評価
 3.4.4 新規データ予測値の生成
3.5 Lassoによる線形回帰モデルの学習と予測
3.6 交差検定による性能評価と予測
 3.6.1 交差検定による予測性能評価
 3.6.2 モデル学習と新規データへの予測
3.7 学習済みモデルの保存と読み込み
3.8 Test and Score 部品の詳細
3.9 機械学習の四過程との比較
3.10 演習問題 1
3.11 回答

4 基礎:希土類コバルト二元合金のキュリー温度予測回帰モデル
4.1 観測データと探索的データ解析
 4.1.1 観測データとデータ加工
 4.1.2 探索的データ解析
4.2 Lassoによる予測性能評価
4.3 物質科学の視点からのモデル解釈
4.4 探索的データ解析
4.5 演習問題 2
4.6 回答

5 基礎:単体元素基底状態結晶構造の予測
5.1 観測データとデータ加工
5.2 ロジスティック回帰による分類モデル学習と評価
5.3 探索的データ解析
5.4 演習問題 3
5.5 回答

6 基礎:鉄結晶構造のクラスタリング
6.1 観測データとデータ加工
6.2 k-Means法によるクラスタリング
6.3 階層クラスタリング
 6.3.1 データインスタンス間距離と説明変数間距離
 6.3.2 データインスタンス間距離による階層クラスタリング
 6.3.3 説明変数間距離による階層クラスタリング
6.4 演習問題 4
6.5 回答
6.6 演習問題 5
6.7 回答

7 応用:文字分類モデルの学習(文字認識)
7.1 手書き文字の観測データ
 7.1.1 観測データの取得
 7.1.2 観測データの可視化
7.2 全説明変数を用いた分類モデル学習
7.3 PCAによる次元圧縮と分類モデル
 7.3.1 PCAによる探索的データ解析
 7.3.2 PCA + ロジスティック回帰による分類
7.4 多様体学習による次元削減と分類モデル
 7.4.1 探索的データ解析
 7.4.2 次元圧縮+ロジスティック回帰
7.5 演習問題 6
7.6 回答

8 応用:トモグラフ像の復元
8.1 トモグラフィの原理
8.2 元画像可視化
8.3 Lassoによる復元
8.4 演習問題 7
8.5 回答

A 付録
A.1 Orange公式資料
A.2 Orange用CSVフォーマット変換
A.3 Preprocess・Predictions・Test and Score の接続方法

目次をさらに表示する

著者紹介

木野 日織 (きの ひおり)
1991 年 東京大学理学部物理学科卒
1996 年 東京大学大学院理学系研究科博士課程卒(理学博士)
1996 年 東京大学物性研究所物性理論部門助手などを経て 2002 年から(国)物質・材料研究機構に勤務する.
2015 年からの国立研究開発法人科学技術振興機構(JST)イノベーションハブ構築支援事業の一環として(国)物質・材料研究機構に情報統合型物質・材料開発イニシアティブ (MI2I) 発足時からデータマイニングを行う.
データ駆動 AI では物性物理の知識を活かした説明・解釈可能な AI 技術,第一原理計算によるデータ生成,そのための知識駆動 AI 技術などに興味を持つ.

DAM Hieu-Chi (だむ ひょう ち)
1998 年 東京大学理学部物理学科卒
2003 年 北陸先端科学技術大学院大学材料科学研究科物性科学専攻博士号
2005 年 10 月から北陸先端科学技術大学院大学知識科学研究科講師.
2011 年 4 月から同テニュア付准教授.
2020 年 10 月から北陸先端科学技術大学院大学知識科学系教授.学位は材料科学で取得.
2005 年から材料科学とデータマイニングの融合に身を投じている.
専門分野は材料科学,知識科学,計算材料科学,データサイエンス,マテリアルズインフォマティクス.
データ駆動型アプローチを用いた知識抽出など,証拠理論を用いた類似度評価に興味があり,材料科学研究のための説明・解釈可能な AI 技術の開発に取り組む.

著者紹介をさらに表示する

類似書籍