IEEEは完敗しました
それ以上に申し上げることはありません。
TokyoRに行ってきました。相変わらずアットホームな感じで楽しかったです。
資料とかはここにも上がるんじゃないかな
会場はAbema Towers。渋谷にあります。
そして世の中はハロウィーン……渋谷 + ハロウィーン……皆さんご存知。
「行きはよいよい帰りは怖い」とはよく言ったものです。
無事に帰宅できました。
久しぶりのTokyoRでした。
7月に体調を崩して参加できず、8月は開催がなく、9月はSendaiRに……あれ、SendaiRに行った話しましたっけ。
9月28日にSendaiRに顔を出しました。
所属していた大学の話がLTで出てきてテンション上がりました。楽しかったです。
LTしました。
実はこの2日前にもData Gateway Talk #3でLTをしましたが大事故になったので記事にはしません*1。
でも発表資料は上げておきます。今となってはクソッタレ理想論を話したんやなあ
今回のレポ
基本的に応用セッションが軒並みRおじさんのお話で、個人的には本当にためになりました。
@ill-identified アクチュアリーの技術をマーケティング (離脱予測) に応用してみる / Applying Actuarial Method to Marketing Science
研究者気質の強いill-identifiedさんのお話です。
既存研究に基づき、自身のアイデアをRで実装するすごい方です。
論理だった資料、統計モデリングを理論に基づいて構築していく手腕、そして独特の報告スタイル……そしてときおり肝心な結果が間に合わない茶目っ気
今回はユーザーの離脱予測を、アクチュアリー職界隈では有名な技術を応用できないかという試みでした。
ユーザーのLTV(Life Time Value)を予測することは、マーケティングでは非常に重要なタスクとなっていて、きぬいともよく仕事で直面する話です。
一方であまり理論だった話を知らず*2、
それでも何かしら妥当な方法論で予測できないかといろいろ調べていました。
そんな中のこの報告だったので、とても参考になります……
@u_ribo データ分析者のためのRStudio活用術
Rで作る状態空間モデルの本などの執筆も行っているuriboさんのお話。
R言語というのはプログラミング言語の中ではかなり特殊で、ユーザー層がエンジニアリングに強い人たちとは限らないところがあります。
良く言えば、統計処理というタスクに対して、比較的エンジニアリングに疎い人たちにも使えるツールである一方で、
昨今の仮想環境の利用価値の向上、オープンソース開発やチームでの開発などの潮流から、ライブラリのバージョンの管理の重要性がR言語の中でも考慮されるようになってきているようです。
RstudioがVer.1.3になるとrenv
というパッケージでのバージョン管理がデフォルト?になるようで、うまく設定するとDocker上でのバージョン管理や、処理の再現性を担保したエンジニアリング寄りのR運用が可能になるようです。
きぬいとも開発・バージョン管理などについてはめっぽう疎く、一瞬packratなどの話を聞いた気がするものの必要性を見出だせないまま放置していました。
環境が変わり、なんとなく必要性が見えてきているので、ちゃんと追いかけたいなあと思います。
@kazutan 週次KPIレポートをconfluenceへUpするためにやったこと
福岡から馳せ参じた「ぞうさん」ことkazutanさんのお話
kazutanさんのお勤め先で、KPIの算出や予測・モデリング、レポーティングに至るまでをRで自動化したというお話です。
最近、Rは前処理や解析の他にも、レポーティングやこれらのプロセスのパイプライン化についてのTipsが増えてきたなあと思います。
Rではモデリングや前処理はほとんど関数化され、それらのパイプライン化も割と柔軟にできるようになってきており、お困りごとの中心がレポーティング・あるいは全体の自動化に推移している印象です。
特に「複数回同じ処理が起きたら関数で定義する」ところや「ステップごとに関数化したスクリプトを作成し、それらを呼び出して実行するスクリプトから実行する」という、
エンジニアリングの実務面でのTipsがとても参考になりました。
実務面ではよく直面しがちな問題なので、こういうところの運用・開発のコツについては貪欲に吸収したいですね。
何よりも「Rじゃなくてもいいじゃん?」に対して「そうですね。でもRでやりたいんです。」というところにRへの愛着を感じて感動の涙が。
感想
LTの内容も含めると大分長文になりそうなので応用セッションの感想だけを記録します。
LTは特に仮説選択バイアスのお話や、初めてbullet chartという可視化の方法を見たこと、
国際カンファレンスで報告されたレポート、実験レポートの実行を自動化し思考と睡眠時間を確保した報告、
ライザのアトリエはRユーザなら必ずやらなければならない話おすすめRパッケージの話など、とても面白かったです。
次回は11月。JapanRというわけで、なにか発表しようと思ったら20分枠しかない。困ったなあ。
運営メンバーに誘われたり、LT発表に誘われたりしていますが、まずは7分枠で7分で喋れるようになってからにしようと思います。
たびのきろくでした。