近代科学社

書籍検索
ジャンル選択

情報

データサイエンスの作法データを活かし切る科学のツボ

著者 柴田 里程

著者紹介

データ活用を失敗しないための基礎を学ぶ!

データサイエンスの社会的需要が高まる中、データサイエンティストにはデータを的確に把握する能力が求められる。
そのためには、データ全体をさまざまな角度から丹念に調べ理解することから始めなければいけない。
本書ではデータの形式や属性、型などの骨子を解説し、データを扱う上で抑えるべき基本についても著者が開発した視覚表示ソフトウェア「TRAD」(無償)を通して自然に身に着くよう組み立てられている。
20年以上に渡り「サイエンスとしてのデータサイエンス」を追い求めてきた著者が贈る、データの時代に迷わないための必読書。

電子書籍¥2,200 小売希望価格(税込)

紙の書籍¥2,200定価(税込)

基本情報

発売日 2020年12月24日
本体価格 2,000円
ページ数 128 ページ ※印刷物
サイズ A5
ISBN 9784764906273
ジャンル 情報
タグ データサイエンス
電子書籍形式 固定型

主要目次

第1章 資料,情報,データ
1.1 データの利用と活用
1.2 データ倫理
1.2.1 データの価値評価
1.2.2 データの権利
1.3 データ形式
1.4 データベクトル
1.5 データテーブル
1.6 本章で示した作法

第2章 データの視覚表示
2.1 視覚表示
2.2 豊かな視覚表示
2.2.1 データベクトルの属性
2.2.2 データテーブルの属性
2.3 経軸の並べ替え
2.3.1 バラツキ
2.3.2 クラスタリング
2.4 プレゼンテーション
2.5 本章で示した作法

第3章 フィルタリング
3.1 変量のフィルタリング
3.1.1 脊柱後弯症データ
3.2 機能による変量の分類
3.3 変量のフィルタリングと記録のフィルタリング
3.3.1 車の評価
3.4 視点と視野
3.5 本章で示した作法

第4章 型
4.1 数値
4.2 非数値
4.3 型の視覚表現
4.4 型変更
4.5 型変更の及ぼす効果
4.6 本章で示した作法

第5章 データの読込み
5.1 大学ランキングデータ
5.2 宿泊旅行統計調査
5.2.1 第1表
5.2.2 第2表
5.3 患者調査
5.4 LIBORデータ
5.5 本章で示した作法

第6章 射影
6.1 民力データ
6.2 宿泊旅行統計調査
6.2.1 第1表
6.2.2 第2表
6.3 本章で示した作法

第7章 変容
7.1 正規化
7.1.1 宿泊旅行統計調査第1表
7.1.2 宿泊旅行統計調査第2表
7.1.3 患者調査
7.2 論理型の正規化
7.3 結合と分解
7.3.1 マーク型や基数系の結合
7.4 本章で示した作法

第8章 Rとその利用
8.1 R
8.2 Rのインタフェース
8.3 TADとR
8.4 Rの役割
8.4.1 アイリスデータ
8.4.2 脊柱後弯症データ
8.4.3 車の基本スペック
8.4.4 民力データ
8.4.5 実験データ
8.5 本章で示した作法

目次をさらに表示する

著者紹介

柴田里程 (シバタ リテイ)
慶應義塾大学 名誉教授
(株)データサイエンスコンソーシアム 代表取締役
URL: datascience.jp, ltd.datascience.jp
1973 年 東京工業大学大学院理工学研究科修士課程修了
1974 年 東京工業大学理学部数学科助手
1981 年 理学博士(東京工業大学)取得
1984 年 慶應義塾大学理工学部助教授
1997 年~2014 年 同教授
2013 年 (株)データサイエンスコンソーシアム設立
2006 年 日本統計学会賞受賞
 学生時代に国澤清典先生の講義で「データからこれまで見えなかったものが見えてくる面白さ」を教わり,この道に進むことを決意した.
しかし,研究を進めれば進めるほど「本当に見えなかったものが見えてきているのだろうか」という疑問は大きくなるばかりであった.
そこに訪れたブレークスルーが,本書でも紹介した視覚表示によるデータとの直接対話である.
ここに至るまでには,世界中の先進的な研究者との様々なめぐり合いがあり,企業の方々とのコラボレーションも大きな触媒の役割を果たしてくれた.
この僥倖には感謝するしかない.
最近の著書
『データ分析とデータサイエンス』,近代科学社,2015.
『時系列解析』,共立出版,2017.

著者紹介をさらに表示する