TokyoR #73 で発表しました
#72でも発表しましたがそれはそれ.
4月に東京へ引っ越して以来,TokyoRにはほぼ毎月参加しておりまして,
誰かに見せる機会を作らないと勉強も分析もしない怠け者なので,9月あたりからLightning Tableに出ることで無理やり勉強しています.
仕事でも私事でも追われるのは締切.世知辛い.
続きを読むこれを読みます
以下の書籍を読もうと思います.
悪いことをするつもりはないです
モチベーションは普通に「そういえば小さい頃ハッカーになりたかったな」というもので,きっとハッカーと呼ばれる人にはnoobと呼ばれる程度なんだろうなあと思っています. ただ,インターネット使ってる割にネットワークの話とかよく知らないなあという思いもあり,そういうお勉強になればいいなあと思っているところです. データ分析と関係ないかと言われるとそうでもなく,Web系のデータ集めるにはいろいろこの辺の知識もいるんじゃないかと.わかんないっすけど.
本そのものは結構前に買っていたんですけど, 労働者になってからゴリゴリ自分の時間を奪われていてなかなか読めておりませんです.
Gini係数と機械学習系手法のImportanceについて
先日,KaggleのSantanderコンペティションがクローズしました.やれるだけやってみたんですが全体の半分くらいの成績にしかならなりませんでした. 正直会社のコンペで負けるより悔しいところです.会社でコンペなんてめったにないですけど.
とはいえ,機械学習系の手法(randomForestとかXGBoostとか)を使ってKaggleのコンペに真面目に参加したのは初めてなので, ここで何をやったかという話を今度のTokyoRのLTでやろうかなあって思います. どういうプレゼンをすると笑いが取れるのかも踏まえてプロットを練っているところであります.
さて,今回ブログを1ヶ月ぶりに更新する理由は「Gini係数」についてです. 社会科学系の大学院出身の私はGini係数といったら「不平等の指標だ!!!」っていう反応をしていましたが,実は機械学習の分野でも「特徴量の重要度」の評価に大きな寄与をしているらしいです.
続きを読むアニメ公式Twitterアカウントのフォロワーの推移について
はじめに
MrUnadon先生の書かれたこんな記事があります.
6月9日に開催されたTokyoRにて,(Mr. Unadon氏)https://twitter.com/mrunadonが2018年冬に放送されたアニメ,『ヴァイオレット・エヴァーガーデン』のTwitter公式アカウントのフォロワー数の推移をベイズモデリングで明らかにしたということがありました.
僕もオタクなので,アニメ系のデータ分析とかしたいけど「どうやってデータ集めるんだ?」という部分から結構苦しんでいたのですが,Mr. Unadon氏はデータの取得元までまるっと教えてくださいました……素敵です……
『ヴァイオレット・エヴァーガーデン』を語るUnadon氏は同志だという気持ちが強まり,「わかる……」っていいながらお話を伺っていました.テーマ設定とは裏腹に綿密に組まれたモデリングに舌を巻き,同志Unadonはデータ屋さんとしてははるか雲の上の存在だと感じました.
……そんなMr. Unadon氏ですが,同じクールで放映されていたあの神アニメ『ラーメン大好き小泉さん』をよく知らない,ということだったので「あの 美少女がラーメンを食べるアニメ を知らないままこれからの人生を過ごしていただきたくない」という 一方的な思いやり を,この記事に投下しておきたいと思います.
この記事でやること
- 『ラーメン大好き小泉さん』について
- データ元について
- データの前処理について
- データの傾向について
- おわりに
なお,ここで使っているコードの多くはMrUnadon氏の成果に依るもので,部分的に編集したものです.
続きを読む結局「文系学問での修士課程」の進路ってアリなの?
私はアリだと思う
結局「興味のあることについて考えること」を続けたい,それを成果として残したいという意志があれば,大学院進学は,修士課程までなら,文理を問わずアリな選択だと思う.
私自身勉強は嫌いではなかったし,考えることが苦でなかったことは,(少なくとも修士課程までは)大学院進学に向いていたと思う*1.「興味のあることについて考え続けたい」と思ったら,あとは金次第だと思う.金策については別で書くとして,文系で大学院進学を渋っている学部生が,一人でもこれを読んで参考にしてくれればそれで十分である.誰も参考にしなくても,電子の海に消えるだけである.
特定の条件で強くなるのが修士卒の社会人
まず「就職を前提とした修士進学」について考えよう.
結論から言えば,「文系学問の院へ行くと就職が不利になる」という俗説は信用しなくてもいいと思う.文系学問の修士課程で得られる知識や技能を活かせる会社は間違いなく存在する.たとえば私であれば統計分析と人間行動への関心を評価された(のだと思う).友人には教師や,学術書の出版社に就職した人がいる.要は適材適所,ということである.「自分は何をもっていて,相手が何を欲しがっているか」ということが分かれば,文系院生でも学部生と変わらず就職は叶う.
院生であることはむしろ有利にはたらくこともある.これは業界・企業によるが,修士卒は学士卒よりも初任給が高いことがある.業種によっては昇給も早かったりする.2年間の人的資本の蓄積を評価してくれる企業は意外に多い.
一方「理系学問の院生」と比べれば不利かもしれない.これは業種の幅による.技術職や研究職の枠を持つ企業ではそうした理系院生への枠を設けている場合がある.しかしそれも文系院生と理系院生では立つ土俵が違うというだけである.気にするだけ無駄なので,自分の土俵を見つけよう.
……とは言っても,この考えは私が就職活動を通して思い至ったことなので,実際に働いている修士卒の先輩に話を聞くのが一番かもしれない.私がこれを語るまでには,1年待って欲しい.
博士課程は文理問わず壮絶な世界である
一方,博士への進学はそれなりに覚悟がいる.これは文理を問わず,学者として生き残ることは相当な苦労がある.つまるところ,修士では成立するような「興味のあることについて考え続けたい」という動機だけで生き残れる場所ではないと私は考える.
結局私はそういう覚悟ができなかった.博士で失敗した場合の損失を埋め合わせるだけの余裕がないと判断した.
相応の覚悟を持っているなら,文系学問でも博士課程へ進学することは悪いことではない.それを「悪い選択だ」という人とは住む世界が違うので,認識から外して構わない.
以上です.
*1:博士に行かなかった理由はまた別のエントリで書こうと思う.