秀和システムが出版しているデータ分析に関する書籍について感想を書いていきます。
こちらの本では機械学習システムを構築するまでを100本ノック形式で記されています。
- 機械学習の手法等の知識ではなく、機械学習を実際の現場ではどうやって使えばいいか知ることができます。
- 課題設定が実際のビジネスに沿った内容なので、実務でデータ分析がどのように使われているのかイメージをつかめます。
- 前処理やデータの加工など、機械学習を行う前の事前準備についてのノウハウを知ることができます。
- 難易度は易しいので、データ分析や機械学習の初心者にオススメです。
どんな人におすすめか
- pythonを使ってデータ分析をやってみたい人
- データサイエンティストになりたいと思っている初学習者
- 機械学習を使った問題解決力を習得したい人
100個の課題を通して、実業務でのデータ分析がどのように行われているのか知り、継続的に分析できるようなシステムを作ることができます。
実際に自分の手を動かして一つずつ学んでいく形式なので、初心者向けの書籍となっています。
これからデータ分析や機械学習をやってみたい人や実際に手を動かしたことがない人のはじめのステップに最適だと思います。
本の構成
第1章 分析に向けた準備を行う10本ノック
第2章 データを可視化し分析を行う10本ノック
第3章 可視化の仕組みを構築する10本ノック
第4章 レポーティングする仕組みを構築する10本ノック
第5章 分析システムを構築する10本ノック
第6章 機械学習のためのデータ加工をする10本ノック
第7章 機械学習モデルを構築する10本ノック
第8章 構築した機械学習モデルで新規データを予測する10本ノック
第9章 小規模機械学習システムを作成する10本ノック
第10章 機械学習システムのダッシュボードを作成する10本ノック
1章あたり10本ノックとなっていて、100本全て終わらせると10個の問題を解くことができます。
1章ごとに切りの良いところまで進み、全ての章がうまく繋がって最終的に立派なシステムを構築することができます。
各章の出力結果が予め用意されているので、興味のない章を飛ばして進めることもできます。
同じシリーズの「python実践データ分析100本ノック」の続編かと思いましたが、この書籍だけで独立した内容になっていました。
若干内容がかぶっていましたが、今回紹介している「機械学習システム100本ノック」の方がうまくまとめられていて勉強になりました。
同シリーズの書評はこちら
感想
データサイエンティストが現場で使うような生きた知識を得ることができる
このシリーズの本のウリは、現場のノウハウが凝縮されていることです。
内容をしっかり身につければ、いきなりデータ分析を依頼されたとしても何かしら手を動かすことができるようになると思います。
書籍の難易度は易しめなので、スラスラ読むことができます。
易しめといっても、しっかりした結果を見せることはできます。
【機械学習100本ノック】11日目
80本目まで進みました。
前章で作った決定木のモデルに、新しく取得したデータで推定し、結果をヒートマップにしました。
実際の業務でもどんどん新しいデータが追加されるので、データ分析に携わるならよく使うであろう内容でした。#100本ノック #機械学習 pic.twitter.com/sDYUIKQaHQ— shining(AIエンジニア) (@shining25436390) January 16, 2021
一方で、データサイエンティストとしてある程度の経験を積んでいる中・上級者にとっては物足りない内容になってしまいます。
あくまで初級者向けの書籍だと感じました。
現場での業務経験を元にリアルな情報が記載されているので、データサイエンティストになりたい人が想像とギャップを感じないためにも読んでおくと良いかと思います。
データ可視化部分は汎用的なスキルとして身につく
自分がデータを見るだけでなく、お客さんにもデータを見てもらうケースを想定した内容なので、データが見やすく簡単にカスタマイズできるようなシステムを作っています。
データサイエンティストも最初に可視化できるようにしてから分析するので、このプログラムは汎用的に使える便利なものだと感じました。
【機械学習100本ノック】13日目
100本目まで進みました。
最終章は機械学習のダッシュボード作成でした。
分析した内容を可視化し、結果をきれいにまとめました。
非常に見やすいので、今後もこの方法を流用していきます。#100本ノック #機械学習 pic.twitter.com/AVAWBCBvml— shining(AIエンジニア) (@shining25436390) January 18, 2021
機械学習の本だと思って読むと期待はずれ
この書籍のメインの内容は、データの前処理となります。
機械学習の分析は数種類しか出てきません。
【機械学習100本ノック】9日目
60本目まで進みました。
機械学習をするために生データを特徴量に変更したり、目的変数と特徴量に変換していきました。
ここでもデータの前処理を行い、つくづくデータサイエンティストはデータをきれいにする業務が大半だと感じました。#100本ノック #機械学習— shining(AIエンジニア) (@shining25436390) January 14, 2021
あくまで機械学習で分析するまでの一連の流れをできるようになることがこの書籍の目的であるので、複雑な分析方法を知りたい場合には他の書籍を読みましょう。
書籍の情報
出版社 | 秀和システム |
著者 | 下山輝昌、三木孝行、伊藤淳二 |
発売日 | 2020年12月1日 |
定価 | 2,400円(税別) |
ISBN | 9784798063416 |
判型 | A5・316ページ |
コメント