統計数理研究所のリーディングDAT養成コースを修了しました
強い刺激を受けました
11月から東京都立川市にある統計数理研究所で、統計思考院のリーディングDAT(Data Analytics Talents)養成コースを受講し、
無事修了しました。
何勉強したの
11月と12月に講義が開かれました。ざっくり言えばこんな感じです。
11月勉強したこと
- 一般化線形モデルの理論とその拡張
- ベイズ統計に基づく回帰モデルと縮小推定
- 状態空間モデルの実装と解釈、チューニング
もともと研究していたこととも近いところからスタートし、
自然にベイズモデリングや状態空間モデルへの拡張・展開されました。
どちらかというと仮説構造の統計モデル化というところに重点がおかれ、
モデルの評価や比較、実装後の解釈、異常値の原因特定など、
アルゴリズムに閉じない、データ生成過程の事情をどうモデルで吸収するか、
という部分を多く学べたと思います。
12月勉強したこと
12月は主に画像認識で用いられている特異値分解アルゴリズムを皮切りに、
深層学習、決定木、カーネル法、ガウス過程など、最近流行している機械学習の手法についての
数理的な部分と一部実装についての講義でした。
私はどちらかというとモデリング畑なので、画像を扱うことも初めてだし深層学習もチュートリアルくらいだし、
決定木はkaggleで使うけど……みたいな感じで、脳みそフル回転でした*1。
1月の特別講演
今日は主にデータ分析でホットトピックスになっている、因果推論(交絡要因の分解)とベイズモデリングのお話を伺いました。
両氏ともに世界で活躍する研究者で、アツかったです。内容も面白かったです*2。
それからどしたの?
それぞれレポートを提出するのですが、無事に合格と相成りました。
個別に講評もいただき*3、特に優秀な解答は講師の方から逆に紹介されており、参加者のレベルも十分に高かったなあと思います *4。
でもまだ「養成」されただけ
そう、まだ「養成」されただけです。私は何も、どこにも、還元できていません。
受講料は決して安くはなく、今回は所属元の予算を拠出して受講しています。
まずは所属元で還元しつつ、こういうブログのかたちでも、学んだことを活かした記事を書きながら、
謙虚に精進していきます。
レポートでした。
*1:カーネル法についてはお気持ちを学んだ程度で、いきなり再生核Hilbert空間の話が出てきてなんもわからなくなりました。今はGraphical Lassoの論文読みながらまたHilbert空間が出てきたので泣いています。
*2:https://www.ism.ac.jp/shikoin/training/leadingdat/2019/index.html#course
*3:良かった点と改善点、理解が十分でない部分について丁寧に書いてくださっていてありがてえという気持ちです。
*4:ただ、11月の統計モデルの回と12月の機械学習系の回では、質問の質や視点が大きく違うなあという気持ちもあります。 具体的には数理統計的・統計モデルの理解を飛び越して、機械学習・最適化といった部分を学んでいる方が多い印象でした。 良い悪いではなく、流行りだからなあって思いつつ、やはり数理統計的な要素を個人的には大事にしたいと思いました。