新刊のご案内:辻真吾・矢吹太朗『ゼロからはじめるデータサイエンス入門』
辻真吾・矢吹太朗『ゼロからはじめるデータサイエンス入門』(講談社, 2021)
ネットのない時代,欲しいものが近所で見つからないとき,どうしてました?
小学生の頃,近所では売っていない(正確には,近所のお店のは子供には高すぎて買えない)おもちゃを安く売る店を友達と見つけて,通ったことがあります.
玉ノ井駅の近くにあったその店までは,自転車で30分くらいだったと思います.それだけ遠いと,偶然見つけたということはなさそうなのですが,見つけた経緯を思い出せません.
「玉ノ井に行ってくる」と小学生が言えば驚きそうなものですが,家族からは何も言われませんでした.常識がなかっただけかもしれません.
欲しかったのは,ビーカー,試験管,アルコールランプなどの実験器具です.♪こーこーろやーさしー,ラララ,科学↗の子↗♪
『ゼロからはじめるデータサイエンス入門』は,玉ノ井通いの友達の一人,辻真吾君(@tsjshg)と書いた本です.
データサイエンスの入門書はすでにたくさん出版されていますから,何を今さらと思われるかもしれません.差別化の工夫はいろいろあるのですが,ここでは一つだけ紹介します.
この本は「R・Python 対照データサイエンス」です.
↓こういうことです.
RとPythonの「対訳・対照」とは具体的にどういうことなのか,ご覧に入れましょう. https://t.co/w2YkUljuKW pic.twitter.com/gyJNt87BHO
— Taro Yabuki (@yabuki) December 7, 2021
別の例を使って少し詳しく説明します.有名な「アヤメのデータセット」の,sepal lengthのヒストグラムです(画像でクリックでソースコード表示.ちなみに,全ての例に完全なコードを付けました).
左がRの結果,右がPythonの結果です.ヒストグラムではデータのだいたいの様子がわかればいいので,これで終わりでいいかもしれません.しかしよく見ると,両者はかなり違います.
本書では,結果をそろえるために,R・Pythonともに設定を三つ追加しました(範囲,階級数,あと一つは?).
複数の言語を比べてみると,ふだんあまり気にしないことに気付きます.結果をそろえようとすると,一つの言語だけのときプラスアルファの勉強ができます.このプラスアルファの価値を認められる方には,本書を楽しんでもらえるはずです.
このプラスアルファの価値を認められないとか,そこに価値を見出している場合ではないという方にも,別の楽しみを提供できるかもしれません.雰囲気を見てもらえるように,ドラフト段階の画像を,サポートサイトに掲載しています(こちら).
よろしくお願いします.