と。

Github: https://github.com/8-u8

入社して8ヶ月が経とうとしている話

入社から8ヶ月が経とうとしています.

最近はTokyoRのLTの順序決めるルーレット関数とか,

仕事で直面したデータ変換の関数とか,

そういう

「どうせパッケージであるんだろうけど探すより作ったほうが早いんじゃね?」

みたいなモノを自前で作っています.

Rはいろいろなパッケージがあり,日本でのコミュニティ結束が強いのが大きなメリットです.「探す手間と作る手間」のトレードオフ関係が拮抗しているというのも良いことだとは思います.僕は作る手間を取るというだけです.

これでRのデータの持ち方とか計算の仕方とかアルゴリズムとかが少しでも理解できればいいかなあとか思ってます.

github.com

続きを読む

1日で美術館3箇所回った話

昨日の10月27日に,上野公園にある東京都美術館国立西洋美術館上野の森美術館に行きました.

東京都美術館では「ムンク」展,西洋美術館では「ルーベンス」展と「ローマの景観」展,上野の森美術館では「フェルメール」展が開催中です.私は「せっかく近いところにあるんだから1日で全部制覇してしまおう」と,謎のテンションで回りきりました.

東京には美術館が多くあるので,社会人になってから美術館を回るのがちょっとした趣味になっており,ソシャゲで必要な世界史の知識*1を引っさげて回ったわけです.

もともと絵に詳しいとかそういうのはまったくないんですけど*2,せっかくなので感想文を書き残しておきます

*1:主にFGOとかですが

*2:むしろそういう感性がないので,養っていかなければと思っています

続きを読む

TokyoR #73 で発表しました

#72でも発表しましたがそれはそれ.

 

4月に東京へ引っ越して以来,TokyoRにはほぼ毎月参加しておりまして,

誰かに見せる機会を作らないと勉強も分析もしない怠け者なので,9月あたりからLightning Tableに出ることで無理やり勉強しています.

仕事でも私事でも追われるのは締切.世知辛い.

続きを読む

これを読みます

以下の書籍を読もうと思います.

ハッカーの学校』はこちらの書籍です.

悪いことをするつもりはないです

モチベーションは普通に「そういえば小さい頃ハッカーになりたかったな」というもので,きっとハッカーと呼ばれる人にはnoobと呼ばれる程度なんだろうなあと思っています. ただ,インターネット使ってる割にネットワークの話とかよく知らないなあという思いもあり,そういうお勉強になればいいなあと思っているところです. データ分析と関係ないかと言われるとそうでもなく,Web系のデータ集めるにはいろいろこの辺の知識もいるんじゃないかと.わかんないっすけど.

本そのものは結構前に買っていたんですけど, 労働者になってからゴリゴリ自分の時間を奪われていてなかなか読めておりませんです.

 

Gini係数と機械学習系手法のImportanceについて

先日,KaggleのSantanderコンペティションがクローズしました.やれるだけやってみたんですが全体の半分くらいの成績にしかならなりませんでした. 正直会社のコンペで負けるより悔しいところです.会社でコンペなんてめったにないですけど.

とはいえ,機械学習系の手法(randomForestとかXGBoostとか)を使ってKaggleのコンペに真面目に参加したのは初めてなので, ここで何をやったかという話を今度のTokyoRのLTでやろうかなあって思います. どういうプレゼンをすると笑いが取れるのかも踏まえてプロットを練っているところであります.

さて,今回ブログを1ヶ月ぶりに更新する理由は「Gini係数」についてです. 社会科学系の大学院出身の私はGini係数といったら「不平等の指標だ!!!」っていう反応をしていましたが,実は機械学習の分野でも「特徴量の重要度」の評価に大きな寄与をしているらしいです.

続きを読む

アニメ公式Twitterアカウントのフォロワーの推移について

はじめに

MrUnadon先生の書かれたこんな記事があります. 6月9日に開催されたTokyoRにて,(Mr. Unadon氏)https://twitter.com/mrunadonが2018年冬に放送されたアニメ,『ヴァイオレット・エヴァーガーデン』のTwitter公式アカウントのフォロワー数の推移をベイズモデリングで明らかにしたということがありました. 僕もオタクなので,アニメ系のデータ分析とかしたいけど「どうやってデータ集めるんだ?」という部分から結構苦しんでいたのですが,Mr. Unadon氏はデータの取得元までまるっと教えてくださいました……素敵です……
ヴァイオレット・エヴァーガーデン』を語るUnadon氏は同志だという気持ちが強まり,「わかる……」っていいながらお話を伺っていました.テーマ設定とは裏腹に綿密に組まれたモデリングに舌を巻き,同志Unadonはデータ屋さんとしてははるか雲の上の存在だと感じました.
……そんなMr. Unadon氏ですが,同じクールで放映されていたあの神アニメ『ラーメン大好き小泉さん』をよく知らない,ということだったので「あの 美少女がラーメンを食べるアニメ を知らないままこれからの人生を過ごしていただきたくない」という 一方的な思いやり を,この記事に投下しておきたいと思います.

この記事でやること

  1. ラーメン大好き小泉さん』について
  2. データ元について
  3. データの前処理について
  4. データの傾向について
  5. おわりに

なお,ここで使っているコードの多くはMrUnadon氏の成果に依るもので,部分的に編集したものです.

続きを読む

就職活動では見えない会社の側面の話.

――賢い人はもしかしたら見えているのかもしれない.

前回の記事では就活RTAの感想ということで就活で見える部分について話した.

僕は就職活動を通して,企業の「カルチャー」を見ることはできても,その企業で働く人によって構築される「文化」を見抜くことができなかった.以下は,そんな話.

 

続きを読む