Pythonによるあたらしいデータ分析の教科書 (AI&TECHNOLOGY)
- 作者: 寺田学,辻真吾,鈴木たかのり,福島真太朗
- 出版社/メーカー: 翔泳社
- 発売日: 2018/09/19
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
動機
- 著者・編集者からサインを貰ったまま積読になっていた
- データ分析をちゃんと勉強していきたいと思い立ったため
- kaggleに参加できるようになりたい
感想
データ分析の学びはじめに手頃な、Pythonを使った基本的なツールおよび分析に必要な数学の解説本がないと感じ始めました。それであれば本を作ろうと思い立ち、
本書「はじめに」に書かれている通り、データ分析をはじめるにあたって最初に読むべき教科書的な良書。
- 一冊でまるっと学べてお得感ある
- まずは用語や雰囲気を掴むのに最適で、次の勉強へのきっかけになる
- 第3章をまるごと数学にふっているのが特徴的で、とてもわかりやすかった
読書メモ
Chapter1 データ分析エンジニアの役割
- 用語説明や機械学習の処理の手順があって親切
Chapter2 Pythonと環境
- もちろんAnacondaについても説明
Chapter3 数学の基礎
- 大学初等クラスまで
- ギリシャ文字の読み方から説明してるの新鮮だった
- ネイピア数(自然定数の底)
- 自然対数の底(ネイピア数) e の定義と覚え方。金利とクジの当選確率から分かるその使い道 | アタリマエ!
- 底がeのときは、微分しても形が変わらない
- シグモイド関数
- 双曲線関数
- ハイパボリックサイン(sinhx)
- 双曲線関数にまつわる重要な公式まとめ | 高校数学の美しい物語
- 行列の分解は説明変数の次元を小さくするのに活用できる
- 主成分分析
- 非負値行列因子分解
- 相関関数
- ビアソンの積率相関関数
- 共分散/2つの変数の標準偏差
- ピアソンの積率相関係数 | 統計用語集 | 統計WEB
- スピアマンの順位相関関数
- スピアマンの順位相関係数 | 統計用語集 | 統計WEB
- ビアソンの積率相関関数
- 正規分布
Chapter4 ライブラリによる分析の実践
- NumPy, pandas, Matplotlib, scikit-learn の使い方をざっと学べる
- 個人的にscikit-learnのところが怪しかったので、Python 機械学習プログラミング を読んで勉強したい
Chapter5 応用:データ収集と加工
スクレイピング
- RequestsとBeautifulSoup4を使う
- JavaScript対応のためにもrequests-htmlを推奨したほうがいいのかな?