【書評】Python機械学習クックブック

スポンサーリンク
【書評】Python機械学習クックブックAIの書籍

機械学習に関する実用的な入門書である「Python機械学習クックブック 」の書評を書きました。

基本的な機械学習の知識と200を超える実用的なTIPSが分かりやすく書かれています。

 

ジャンル機械学習
評価5.0
難易度3.0
対象者初級エンジニア
ページ数B5・374ページ
一言コメントAIエンジニアを目指す初級エンジニアにオススメの本です。
実装方法の記述が多いので、実務をしたい人に向けた書籍となります。
前提知識は不要で、比較的読み進めやすいです。

 

どんな人におすすめか

AIエンジニアやデータサイエンティストを目指す初級エンジニアにオススメできる書籍です。

  • AIエンジニアやデータサイエンティストを目指している人
  • 初級エンジニア

実用的な内容なので、機械学習のプログラムを書く人が対象になります。

データを与えられても手を動かせないのならば読んでおくべきだと思います。

 

本の構成

scikit-learnを使った機械学習の実装方法が分かりやすく書かれた書籍です。

関数の使い方だけでなく、どんなときにどうやって使うのかがしっかり記されています。

 

Python機械学習クックブックの目次
  • 1章 ベクトル、行列、配列
  • 2章 データのロード
  • 3章 データラングリング
  • 4章 数値データの取り扱い
  • 5章 カテゴリデータの取り扱い
  • 6章 テキストの取り扱い
  • 7章 日時データの取り扱い
  • 8章 画像の取り扱い
  • 9章 特徴量抽出による次元削減
  • 10章 特徴量選択による次元削減
  • 11章 モデルの評価
  • 12章 モデル選択
  • 13章 線形回帰
  • 14章 決定木とフォレスト
  • 15章 k-最近傍法
  • 16章 ロジスティック回帰
  • 17章 サポートベクタマシン
  • 18章 ナイーブベイズ
  • 19章 クラスタリング
  • 20章 ニューラルネットワーク
  • 21章 訓練済みモデルのセーブとロード
  • 付録A 日本語テキストの取り扱い

 

本の内容を少し紹介

どんなことが書いてあるのか、概要を紹介します。

ベクトル、行列、配列

1章・2章・3章では、ベクトル、行列、配列をpythonでどうやって計算するかを説明しています。

numpypandasを使って、csvファイルの読み込みや行や列の削除など基本的な操作をシンプルな実例を使って解説しています。

 

最大値や最小値を見つけたり、平均・分散・標準偏差の計算はデータ分析では本当によく使いますし、

ディープラーニングで必要な行列のフラット化についても説明されています。

 

データの取り扱い

4~8章では、様々なデータの取扱方法が説明されています。

4,5章ではテーブルデータの外れ値の取り扱い欠損値の補完方法について記されています。

概念的な話ではなく、実際にどうやって処理するのか具体的なコード例があるので、すぐに実践で使うことができます。

 

6章はテキストデータの取り扱いです。

テキストデータの句読点を除去したり、品詞に分けたりする手法が記載されています。

6章では英語のテキストデータを扱っていますが、付録で日本語データの処理方法まで説明されています。

 

7章は日時データの取り扱いです。

日付データを年・月・日・曜日の特徴量に分けるなど、データ分析でよく使う処理が記載されています。

 

8章は画像データの取り扱いです。

画像の読み込みから始まり、クロップ、ぼかし、色の分離などの基礎的な編集をしていきます。

エッジやコーナーの抽出、平均色を算出して特徴量を作成するといったことも説明されています。

特徴量の削減

9,10章は、有用な特徴量のみを取り出す方法となります。

特徴量抽出特徴量選択という2つのアプローチ方法について、それぞれの具体的な手順が解説されています。

特徴量抽出は複数の特徴量を1つにまとめるといった考え方で、特徴量選択は意味のない特徴量を捨てるといった考え方となります。

 

モデル評価

11,12章は、どの機械学習手法を使えばよいかを判断する内容となります。

アルゴリズムについて書かれている本はたくさんあるのですが、どの手法を使うか判断する方法が書いてある本は珍しいと思います。

交差検証やハイパーパラメータをチューニングする方法が具体的に書かれているので、実務ですぐに使えるような説明がされています。

 

機械学習アルゴリズム

13~21章では、機械学習アルゴリズムの利用方法に関する内容です。

scikit-learnKeras(tensorflow)を使って、実際に機械学習を行う具体的な手法が説明されています。

機械学習アルゴリズムは、線形回帰・決定木・k-最近傍法・ロジスティック回帰・サポートベクタマシン・ナイーブベイズなど幅広く扱っています。

 

ただ、Deeplearningについては、モデルの作り方がメインだったため実用性としてはいまいちな内容になっています。

実務で独自のモデルを構築することは殆どなく、既存のモデルを流用することが多いです。

もちろん研究的な分野では有用な内容であることは変わりありません。

 

感想

本のタイトル通り、機械学習の実用例がたくさん紹介されていました。

あまり有名な書籍ではないですが、良書だったと思います。

 

内容は初級者向けなので、これからデータサイエンティストやAIエンジニアを目指し始めた駆け出しエンジニアにおすすめできる内容です。

pythonの文法を覚えたら、次のステップとしてこの本を読むとちょうどよいと思います。

 

汎用的な内容が多かったので、何度か読み直すことになりそうなので手元においておきたい本でした。

 

書籍の情報

 
出版社オライリージャパン
著者Chris Albon (著), 中田 秀基 (翻訳)
発売日2018年12月15日
定価3,400円(税別)
ISBN-104873118670
判型B5・374ページ

コメント

タイトルとURLをコピーしました