と。

Github: https://github.com/8-u8

【献本】『Rが生産性を高める 〜データ分析ワークフロー効率化の実践』

登山本、届く。

技術評論社さま、並びに著者の皆様(igjitさん、Atusyさん、hanaoriさんに、
『Rが生産性を高める〜データ分析ワークフロー効率化の実践』を献本いただきました。
自費で買おうと思っていた矢先にお声がけいただき、うれしい限りです。
仕事では早速使っており、少なくとも上司は手元においています。
私も置いています。
なぜ置くべきかは続きで書きます。

目次など

こちらからご覧ください。

gihyo.jp

どんな本?

少なくとも僕はこの本の位置づけについて「自動化できる仕事を広げる本だなあ」と思いました。
「単純作業は自動化できる」ということは理解していますが、問題なのは常に「どうすれば?」という問題です。
この本では様々なRパッケージを活用しながら「手を動かさないための方法」を丁寧に解説しています。

Rは統計解析に特化した言語として知られていて、ユーザ層がソフトウェアエンジニアやプログラマよりも広く、 Rでの分析をRprjという形式で管理したり、gitなどでの管理を進めたりというお話は、 意外と定着しづらい場面も多いのかな、と思っています。
このあたりは以下のブログ記事でも課題観として過去とりあげました。

socinuit.hatenablog.com

また、最近のRは、パイプ演算子を使って「前向き」に処理を実行するtidyverseライブラリ群によって、 プログラミングに不慣れな人であっても習得しやすいコーディングが可能なことも相まって、 同じ処理を別の場面で適用する場合でも、新しくコードを書くといった場面は特に多いと思います。
簡単な処理でも、同じことを書くというのは基本的には避けたいなあ、と思っている人もいるのではないでしょうか??

登山本は、こうした「データ分析にRを使う人」にはぜひ読んで欲しい本です。
「はじめに」にも以下の2文が強調されて記載されています。

作業を自動化すれば、それにかかる時間を自由に使えるようになるのです
一度自動化してしまえば、あとは機械が何回でも同じ作業を正しくこなしてくれます。

きぬいとはどういう場面で登山本の知識を使っているのか??

僕はこの本を「仕事をしないため」に使っていて、実際便利になっています。
最近僕は「仕事で成長する」という考えから「好きなことを仕事に還元する」という考えに改めるようになりました。
理由などはポエムが満載なnoteにも書いているのですが、
仕事やキャリアについて必要以上に気をもむよりも、数理モデル統計学を楽しんでいたあの頃の気持ちを思い出そうな、
という動きが自分の中で高まったのが理由です。
そのためには日々の業務に存在する手作業を可能な限り排除する必要がありました。
話を戻しましょう。この本でとりあげられるトピックにWebスクレイピング(6章)があります。
僕もスクレイピングは関数で実行できるようにしていますが、関数を実行するために毎回Rstudioを開くのは非常に面倒くさいなあと思っていました。
どうにかしてRstudioを開かずに、なんならコマンドすら実行せずに、時間が来たら勝手に実行してくれないものだろうか。
そんなときに登山本7章では「定期実行」という解決策について記載があり、それを組み込むことで自由な時間を数理統計学の理解に割けるようになった、というわけです。
他の章ではレポートの定型化について「こうすればかんたん!」が目白押しで、これも導入したいなあと思う一方、 大きな壁に組織アカウントでのMSOfficeに支配されたレポートフォーマットがあり、この壁を乗り越えるにはいくつもの困難を乗り越える必要があるなあと感じます。

どんな人に読んでほしいか??

「現状、Rの利用場面がデータ分析や統計モデリングだけ」という人には特に読んで欲しい本です。
もっといえば「データ分析や統計モデリング以外で機械に任せたいことがある」人の強い味方だと思います。
登山本はRで仕事の効率化を行うための様々な方法が載っており、 これらはデータ分析・統計モデリングとは異なる、難しい話では決してないと思います。
例えば重回帰分析やクラスター分析は手計算でも実行できますが、 「機械のほうが効率的にできる」ため、Rを中心に様々な言語で実装されています。
仕事の上で「機械の方が効率的にできる」ことは、データ分析以外にも山ほどありますが、 それを実際に「機械に任せる」ために動くには、「知らないことが多すぎる」と感じる人もいるかなあと思います。
この本を通して、今まで「自動化できてここまでだろう」と思っていたことの更に先まで、 考え方次第で自動化できてしまうという事に気づくことができるんじゃないかなと思います。

最近何やってんの?

最近は統計検定1級の対策と趣味の延長で、仕事の合間に以下の2冊を追っかけていますが、
微分積分について、高校と大学で勉強したはずの記憶が無く、
演習問題以前に本編のギャップを埋めることができておりません!!!1

www.gakujutsu.co.jp

www.kyoritsu-pub.co.jp

合わせて以下も読んでいます。同じ概念について並行して読んでウオオオとなる作戦。大体詰む。

www.kyoritsu-pub.co.jp

www.kyoritsu-pub.co.jp

仕事ではあんまりコードを書かなくなりました。
ほぼほぼ自動化ができてしまい、あとは自分以外にも使いやすいように改善する動きだけが加速しています。
転職活動などは相変わらず緩く続けているものの、
熱意を持って取り組める仕事が「数理統計学を金になる形で仕事にすること」に落ち着いてしまい、
どこでそれが実現できるのかわからない状況。加えてこれを達成するためには「力」がたりないので、力を得ようと思います。