これを読みます
以下の書籍を読もうと思います.
悪いことをするつもりはないです
モチベーションは普通に「そういえば小さい頃ハッカーになりたかったな」というもので,きっとハッカーと呼ばれる人にはnoobと呼ばれる程度なんだろうなあと思っています. ただ,インターネット使ってる割にネットワークの話とかよく知らないなあという思いもあり,そういうお勉強になればいいなあと思っているところです. データ分析と関係ないかと言われるとそうでもなく,Web系のデータ集めるにはいろいろこの辺の知識もいるんじゃないかと.わかんないっすけど.
本そのものは結構前に買っていたんですけど, 労働者になってからゴリゴリ自分の時間を奪われていてなかなか読めておりませんです.
Gini係数と機械学習系手法のImportanceについて
先日,KaggleのSantanderコンペティションがクローズしました.やれるだけやってみたんですが全体の半分くらいの成績にしかならなりませんでした. 正直会社のコンペで負けるより悔しいところです.会社でコンペなんてめったにないですけど.
とはいえ,機械学習系の手法(randomForestとかXGBoostとか)を使ってKaggleのコンペに真面目に参加したのは初めてなので, ここで何をやったかという話を今度のTokyoRのLTでやろうかなあって思います. どういうプレゼンをすると笑いが取れるのかも踏まえてプロットを練っているところであります.
さて,今回ブログを1ヶ月ぶりに更新する理由は「Gini係数」についてです. 社会科学系の大学院出身の私はGini係数といったら「不平等の指標だ!!!」っていう反応をしていましたが,実は機械学習の分野でも「特徴量の重要度」の評価に大きな寄与をしているらしいです.
続きを読むアニメ公式Twitterアカウントのフォロワーの推移について
はじめに
MrUnadon先生の書かれたこんな記事があります.
6月9日に開催されたTokyoRにて,(Mr. Unadon氏)https://twitter.com/mrunadonが2018年冬に放送されたアニメ,『ヴァイオレット・エヴァーガーデン』のTwitter公式アカウントのフォロワー数の推移をベイズモデリングで明らかにしたということがありました.
僕もオタクなので,アニメ系のデータ分析とかしたいけど「どうやってデータ集めるんだ?」という部分から結構苦しんでいたのですが,Mr. Unadon氏はデータの取得元までまるっと教えてくださいました……素敵です……
『ヴァイオレット・エヴァーガーデン』を語るUnadon氏は同志だという気持ちが強まり,「わかる……」っていいながらお話を伺っていました.テーマ設定とは裏腹に綿密に組まれたモデリングに舌を巻き,同志Unadonはデータ屋さんとしてははるか雲の上の存在だと感じました.
……そんなMr. Unadon氏ですが,同じクールで放映されていたあの神アニメ『ラーメン大好き小泉さん』をよく知らない,ということだったので「あの 美少女がラーメンを食べるアニメ を知らないままこれからの人生を過ごしていただきたくない」という 一方的な思いやり を,この記事に投下しておきたいと思います.
この記事でやること
- 『ラーメン大好き小泉さん』について
- データ元について
- データの前処理について
- データの傾向について
- おわりに
なお,ここで使っているコードの多くはMrUnadon氏の成果に依るもので,部分的に編集したものです.
続きを読む結局「文系学問での修士課程」の進路ってアリなの?
私はアリだと思う
結局「興味のあることについて考えること」を続けたい,それを成果として残したいという意志があれば,大学院進学は,修士課程までなら,文理を問わずアリな選択だと思う.
私自身勉強は嫌いではなかったし,考えることが苦でなかったことは,(少なくとも修士課程までは)大学院進学に向いていたと思う*1.「興味のあることについて考え続けたい」と思ったら,あとは金次第だと思う.金策については別で書くとして,文系で大学院進学を渋っている学部生が,一人でもこれを読んで参考にしてくれればそれで十分である.誰も参考にしなくても,電子の海に消えるだけである.
特定の条件で強くなるのが修士卒の社会人
まず「就職を前提とした修士進学」について考えよう.
結論から言えば,「文系学問の院へ行くと就職が不利になる」という俗説は信用しなくてもいいと思う.文系学問の修士課程で得られる知識や技能を活かせる会社は間違いなく存在する.たとえば私であれば統計分析と人間行動への関心を評価された(のだと思う).友人には教師や,学術書の出版社に就職した人がいる.要は適材適所,ということである.「自分は何をもっていて,相手が何を欲しがっているか」ということが分かれば,文系院生でも学部生と変わらず就職は叶う.
院生であることはむしろ有利にはたらくこともある.これは業界・企業によるが,修士卒は学士卒よりも初任給が高いことがある.業種によっては昇給も早かったりする.2年間の人的資本の蓄積を評価してくれる企業は意外に多い.
一方「理系学問の院生」と比べれば不利かもしれない.これは業種の幅による.技術職や研究職の枠を持つ企業ではそうした理系院生への枠を設けている場合がある.しかしそれも文系院生と理系院生では立つ土俵が違うというだけである.気にするだけ無駄なので,自分の土俵を見つけよう.
……とは言っても,この考えは私が就職活動を通して思い至ったことなので,実際に働いている修士卒の先輩に話を聞くのが一番かもしれない.私がこれを語るまでには,1年待って欲しい.
博士課程は文理問わず壮絶な世界である
一方,博士への進学はそれなりに覚悟がいる.これは文理を問わず,学者として生き残ることは相当な苦労がある.つまるところ,修士では成立するような「興味のあることについて考え続けたい」という動機だけで生き残れる場所ではないと私は考える.
結局私はそういう覚悟ができなかった.博士で失敗した場合の損失を埋め合わせるだけの余裕がないと判断した.
相応の覚悟を持っているなら,文系学問でも博士課程へ進学することは悪いことではない.それを「悪い選択だ」という人とは住む世界が違うので,認識から外して構わない.
以上です.
*1:博士に行かなかった理由はまた別のエントリで書こうと思う.
日本での貧困に関する言説による"推察"
はじめに
就職するのでどうせ研究することもない(が,雑誌論文として世に出るかもしれない)し,自分の研究に関連しつつも修論では捨象したことについてまとめておく.
私が卒業論文や修士論文で取り扱ったのは「社会的排除」とくに「貧困」の一側面である.テーマ的にも実際に執筆した成果的にもありふれており,別段面白いものでもないのだが,それはそれ*1.
捨象したこととは,突き詰めて言えば「貧困の定義」である.よく絶対的貧困,相対的貧困がある,ということはWikipediaを見ればわかる.絶対的貧困はおいておいて,相対的貧困の話をすると「相対的貧困は本当に貧困なのか?」という話で賛否両論である.今回はこの話について,人の言説を質的に見ることで考えてみたい.
インターネットの海を漂うこの記事が,どんな知識背景の人に読まれるかわからないので,とりあえずレギュレーションを述べておく.
この記事にあることが貧困の全てではない
この記事での考察は,「貧困」という社会現象の全てを記述・説明するためのものではない.そもそも,(これは貧困に限らず社会にあるあらゆる概念に対していえるのだが)貧困という社会現象に対して良い記述・説明を与える理論について同意が得られているわけではない*2*3.
したがって,ここで推察する事柄を世の中の貧困に広く適用して考えることは賢い人間がすることではない.あくまで修士学生という若造が,自身の研究の残り物で考えた「論考の残滓」であることを忘れずに読んでいただきたい.
具体的な議論ではない
この記事は「どうすれば貧困がなくなるか」という問いに答えるものではない.この点で「実際に問題解決のために動く」ことからも「政策を問う」ことからも遠い.「貧困」を純粋に社会という場で発生する「現象」として,学術的対象として貧困を捉えようとする試みである*4.「今ある貧困をどうにかする」ための議論ではない.
つまるところ,ここに書くことはまさに「机上の空論」である.
……これくらい書いておけば分かる人にはわかってもらえるだろうか.
正直ここから長いので続きを読む機能を使う(最初から使え).
*1:私の知る「ちょっと厄介な」社会学の人には「なぜ私がこの研究テーマを選んだのか」ということにこだわるタイプが一定数いる.正直な話,そんなことを語るのは飲みの席で十分であるにも関わらず,フォーマルな場でそれを語りたがるのはなぜだろう.至極無意味だと思う.
*2:たとえばこの論文(Callens and Croux 2009)でもそのように前置きをした上で,限定的な記述・説明を可能にする社会理論を提示している
*3:どのような記述・説明が「良い」かはまた別の記事で書きたい話なので,今回は「単純明快に」程度の意味合いでとどめておく
*4:このあたりの立場はDurkheimの方法論を過大に解釈した結果こういうことになった.