書影
辻真吾・矢吹太朗『ゼロからはじめるデータサイエンス入門』(講談社, 2021)

書店へのリンク集(版元ドットコム)

サポートサイト

ネットのない時代,欲しいものが近所で見つからないとき,どうしてました?

小学生の頃,近所では売っていない(正確には,近所のお店のは子供には高すぎて買えない)おもちゃを安く売る店を友達と見つけて,通ったことがあります.

玉ノ井駅の近くにあったその店までは,自転車で30分くらいだったと思います.それだけ遠いと,偶然見つけたということはなさそうなのですが,見つけた経緯を思い出せません.

「玉ノ井に行ってくる」と小学生が言えば驚きそうなものですが,家族からは何も言われませんでした.常識がなかっただけかもしれません.

欲しかったのは,ビーカー,試験管,アルコールランプなどの実験器具です.♪こーこーろやーさしー,ラララ,科学↗の子↗♪

『ゼロからはじめるデータサイエンス入門』は,玉ノ井通いの友達の一人,辻真吾君(@tsjshg)と書いた本です.

データサイエンスの入門書はすでにたくさん出版されていますから,何を今さらと思われるかもしれません.差別化の工夫はいろいろあるのですが,ここでは一つだけ紹介します.

この本は「R・Python 対照データサイエンス」です.

↓こういうことです.

別の例を使って少し詳しく説明します.有名な「アヤメのデータセット」の,sepal lengthのヒストグラムです(画像でクリックでソースコード表示.ちなみに,全ての例に完全なコードを付けました).

左がRの結果,右がPythonの結果です.ヒストグラムではデータのだいたいの様子がわかればいいので,これで終わりでいいかもしれません.しかしよく見ると,両者はかなり違います.

本書では,結果をそろえるために,R・Pythonともに設定を三つ追加しました(範囲,階級数,あと一つは?).

複数の言語を比べてみると,ふだんあまり気にしないことに気付きます.結果をそろえようとすると,一つの言語だけのときプラスアルファの勉強ができます.このプラスアルファの価値を認められる方には,本書を楽しんでもらえるはずです.

このプラスアルファの価値を認められないとか,そこに価値を見出している場合ではないという方にも,別の楽しみを提供できるかもしれません.雰囲気を見てもらえるように,ドラフト段階の画像を,サポートサイトに掲載しています(こちら).

よろしくお願いします.