と。

Github: https://github.com/8-u8

JapanRに行ってきました

JapanRに行ってきました.

japanr.connpass.com

なぜか今日12月1日はデータ関連がざわついており,複数のデータ関連のイベントがありました *1

JapanRは初めての参加ですが,その規模,人数,参加者の変態度優秀さ,どれをとっても年に1回あるかないかの濃厚な一日でした. connpassで全参加者のタイトル,そして公開されてるプレゼンはyoutubeでも流れるようにするとのお話だったので,この記事では僕が興味深いと思った話を取り上げようと思います.

一応取り上げた皆さんのTwitterリンクと,資料を公開されている人は資料のリンクを張ってますが「おいやめろ」ってときは僕のTwitterまでリプライください.

R によるシステム開発入門 (@kos59125)

Rユーザーの多くはデータ分析をメインにしていて,システム開発の経験がある人は相対的に多くないのではないでしょうか(体感). 僕もシステム開発経験はなく,今後のキャリア的にも「システム開発のためにDjangoとかPHPとかJavaとかJavascriptとかRuby on Railsとかグワァー!!!!」と思っていたのですが「Rでもできるぞい」という話でした.

システムとは?ITとは?から始まる丁寧なお話で,ITシステムにおけるデータとデータサイエンスにおけるデータの違いを意識しながら,バッチ処理とリアルタイム処理におけるRのパッケージやプログラム*2に関するお話を聞けました.

「『Rはシステム開発できない』という他言語ユーザの主張はただマウンティングが取りたいだけ」という金言,肝に銘じます. そんなkos59125氏は本を出版されていますので是非.

gihyo.jp

GUIで簡単!モダンなデータ解析(@efprime_jp)

R AnalyticFlow という製品を公開する企業様のお話でした.

GUIで前処理から基礎集計,分析に至るまで*3が分析フローの形そのままで実装できてしまっているという恐ろしいツールです.

使いこなせれば僕の1週間の仕事が3時間で終わってしまいます.これはいけませんすぐに導入して仕事を減らさないと!

同時に「分析は知識がなくても誰でもできる仕事」になりつつあるので,僕の得意とする仕事は本当にシステム化されてやることがなくなってしまうんだな,という焦燥感も生まれました.道は2つ,「新しい方法をいち早くスクリプトで実装する」か「GUIベースで分析をして結果をビジネスに活かす,コミュニケートするほうに重きを置く」かかなあ.どちらかといえば実装方面を軸にしたいなあ.でもJava書けないしなあ……

と,いろいろ考えさせられるお話でした.

スポーツチームでのR活用の可能性(ラグビーでの実例を通して)(Koichi Kinoshita)

これがはじめてのLT,R仕様歴も1年ちょっとというKoichi Kinoshitaさんの報告です.

昨今データ分析をスポーツの場で活かそうという流れは色んな所から耳にします*4

内容は基礎的な散布図や相関を使って,ラグビーにおける防衛線突破率と得点・勝敗との関連を考えようとするものでした. ggplot2を使った可視化を進めている点はもちろん,散布図や相関で「ここ以下は負ける」「ここ以上は勝てる」「この間の分散が大きい」など,解析や戦略決定につながるようなファインディングを最大限見出している部分がとてもおもしろかったです.

アラサーエンジニア シティボーイ化計画 - 都会のお得物件を統計的に探してみる -(@hana_orin)

私個人は過去に以下の記事を拝見し,興味深く読んでおりました.

もともとエンジニアの方で,Rを始めたのはここ最近とのこと.R初心者みんなggplot使いこなしてる……怖い……

note.mu

勤務先のCTOの引越し先を提案するためにRで可視化・分析・結果を地図にマッピング……マーケティングとして丁寧なフローで話が運んでおります.

自分の足も使ってデータとの整合を見る部分も非常に丁寧で感服いたしました……

ここではRでの重回帰分析をしておりましたが,データの標準化(係数を見てるとしてそう?)や地理情報をモデルに加味した分析*5など,いろいろ追加で分析したくなる,統計屋として心躍る内容でした……

Rで書くコンパイラ(igjit)

「文字列を読み,文字列を書けばコンパイラは作れる」という事実のもと,R言語R言語コンパイラを作ったという変態天才の報告です.

github.com

個人的にコンパイラとかアセンブラとかよく知らないので,正直「やばい」ということしかわからないのですが,やばいことがわかりました.

コンパイラアセンブラ一般を含めて反芻して理解して,何か今のR生活が豊かになれば最高ですね……

関数魔改造講座 (formals編)(Atusy)

10月にggplot2による図の並べ方について変態的な執念を燃やして徹底的に拘ったお話をしたAtusy氏ですが,今回はRで組んだ関数の引数を魔改造するというお話です.

Rの関数の引数はbase::formals関数で表示できるのですが,そこから引数のデフォルト値の改変,新しい引数の定義などができてしまう……しかも公式のヘルプでは"Dangerous coding"と書いている……どこまでも変態すごい……

しかもAtusy氏,この報告のために1つRパッケージを作って挑んでおります.本当に変態すごい……

懇親会

懇親会では寿司が振る舞われ,いろいろな人と楽しくお話できました.

僕は陰キャなので会話した後に一人反省会するんですが,明るい話ができなかったので,次はもっと未来のある話をみなさんとしたいですね.

*1:例えばkaggler-meetupとかです.upuraさんがLT参加しているので,きっとブログで書いてくれるでしょう.

*2:と言って良いのか分かりませんが

*3:回帰からエラスティックネットまで全部回せる

*4:テニスの報告もありましたが,私が知る範囲ではフェンシング,バレーボール,モータースポーツなどで実際にデータ分析が活かされているとか

*5:例えばマルチレベルモデルとかがあったりします