と。

Github: https://github.com/8-u8

【流し読みレビュー】『データ分析のための数理モデル入門』

数理モデル本、Again。

ちょっと前にこんな記事を書きました。

socinuit.hatenablog.com

そして今回はこちらです。

www.socym.co.jp

数理モデル本、最近多く出ていますね。とてもいい流れだと思います。

偶然にも出版される日が近く、著者の江崎さんが慌てたことでも話題になりましたね。

すでに界隈では書評も書かれているので *1 書こうか迷いましたが、
書かないより書いたほうが(ブログ年間50記事書くという目標のためには)良かろうと思い、書きます*2

もくじ

本はフルカラーで、全四部、14章です。壮大です*3

第一部 数理モデルとは

第1章 データ分析と数理モデル

第2章 数理モデルの構成要素・種類

第二部 基礎的な数理モデル

第3章 少数の方程式によるモデル

第4章 少数の微分方程式によるモデル

第5章 確率モデル

第6章 統計モデル

第三部 高度な数理モデル

第7章 時系列モデル

第8章 機械学習モデル

第9章 強化学習モデル

第10章 多体系モデル・エージェントベースモデル

第四部 数理モデルを作る

第11章 モデルを決めるための要素

第12章 モデルを設計する

第13章 パラメータを推定する

第14章 モデルを評価する

何が書いているの?

数理モデルについて書かれています(あたりまえ)
全体として「入門」という点が強く意識されており、
図表がかなりわかりやすく、また全体から個々のモデルに自然と降りていきます。
二部は順を追って読み進めると理解が進みます。
三部も基本は順を追う形でも良いかもしれませんが、
高度な数理モデルは利用する場面がある程度特化されていたり、
適用可能な条件がきつかったりするため、
必要なときに必要な章を追うスタイルでも理解できると思います。

いいところ① 数理モデルの「作り方」が書いてある。

本書のいいところは何より四部だと思っています。
モデルを作るにあたって「そもそもなんでモデルを作るんだっけ?」とか、
「何を見ればいいんだっけ?」と言ったところは、実務においても曖昧になったり、
妥当な手続きを持って決定されなかったりする場面が少なくありません(4敗)。
統計学・データ分析の分野ではモデリングの本はいっぱいありますが、
いざ作ろうとなると、目的や「モデルをこう置きましょう」「結果はこんな感じでした」と、
アドホック気味にモデルが現れ、評価されることもしばしばあります*4
本書では具体的に「どうモデルを作ればいいのか」にとどまらず
「作ったモデルってどう評価すればいいのか」にも紙面を割いている点がありがたいです。

いいところ② 図が分かりやすい

特に一部の数理モデルそのものの説明や目的に応じた数理モデルの類型について、
二部の数学的な操作の幾何学的な説明についてはとても分かりやすいです。
特に筆者は、微分方程式モデルについてはあまり詳しくなく、
ロトカ・ヴォルテラ方程式は「シンプルに肉食・草食動物の個体数の増減を説明するなあ」という理解でしたが、
変数のもつ意味や、なぜこの方程式がシンプルに現象を説明できるのかは、本書で理解を深められたところがあります。
確率・統計モデル(5・6章)では待ち行列や確率過程の振る舞い方についての図や、数式の操作とそれがもたらす結果について
図が多く用いられており、とてもわかり易いです。ありがたい……。

『データ活用のための数理モデリング入門』との違い

以前流し読みした『データ活用のための数理モデリング入門』(以下(「モデリング本」))とは、
数理モデルを作り、実用する」という共通の目的があり、出版時期も重なります。
ただ、個人的には、両者は目的は同じでもいくつか違うアプローチになっていると考えています。
ここで重要なのは「優劣とかそういうんじゃないぞ」という話です。
このブログ読んでる人はそのあたりご理解いただいていると思うのですが、
以下はあくまで「きぬいとが感じた違い」であって「だからこっちがいい」みたいな話ではないです。
そのあたりご理解の上で読んでいただけると(炎上しなくて)いいかなと思います。

主語が違う

本書と「モデリング本」は、第一に主語が違います。
どちらも「数理モデルとは」という部分は記述されていますが、
本書は数理モデルが主語、「モデリング本」は「解くべき課題」が主語になっています。
その違い故に、本書は多くの数理モデルを紹介し、その運用・構築を事例として記述します。
また、モデリングにおいて、分野や領域を問わずに注意される必要のあるポイントについて、四部が構成されています。
モデリング本」は「こういう問題があります。この問題にはこのモデルによってアプローチします」という記述になります*5
章もモデリングの「目的」がタイトルになっており、この点が大きな違いになるかなと感じています。

対象が違う

本書と「モデリング本」では、対象となる読者が若干違うように感じます。
これは主語が違う件とも関連するお話ですが、何を期待して本を選ぶかというのは個人的には重要だと考えます。
本書は「データを使って現状を記述できるが、その一般化や構造の説明に応用することを難しく思っている人」が対象になっているように読めました。
例えば「売上データを可視化でき、法則性が見えているが、それをどう定式化するべきかがわからない」というような問題意識を持つ人にはおすすめできます。
一方「モデリング本」は、「回帰分析など簡単めなデータ分析は理屈として分かるが、応用先がよくわからない人」に刺さる本じゃないかと感じています。
詳細は過去のブログ記事を参照いただければと思いますが、「モデリング本」はデータ分析に関する前提知識をある程度必要とする本だと思いました。

おわりに

適切にデータを使ってモデリングして、
気持ちよく会社とクライアントに貢献して、
気持ちよく自分の市場価値を上げていきましょう。

*1:「街角データサイエンス!疫学と統計 」さんの書評:データ分析のための数理モデル入門

*2:本当は先週の予定だったんですけど昼寝したら寝過ごしたので今日になりました。ゆるして。

*3:4部までなら僕はジョジョ3部が好きです。

*4:もちろん、モデリングする対象について予め書かれていることがほとんどですが。

*5:その問題は往々にしてマーケティング文脈が多いです