データ解析手法の入門書としてはうってつけである.
このテキストはR言語を学びながら現代のデータ解析の手法を概観できる.これ以外にも同類のR言語のテキストを持っているが,説明の記述,例題等を含めて一番わかりやすいと思う.
手法の数理的なことを学ぶためにはこのテキストではなく,別の専門書が必要であるが.
ところで,データサイエンスとは何?
故林知己夫先生が提唱した「データの科学」という用語が統計科学の分野で存在し,それは「データに語らせる」ということを根底とするものである.本書で「データサイエンス」とは「統計的データ分析手法+近年のデータマイニング手法」として使用しているが,手元のデータを分析し有意な情報を引き出す手法群という観点では,その考え方の根底は,単なる訳語という意味ではなく,同じ用語とみて良いだろう.