と。

統計学は趣味、マーケティングは義務。

07_R言語

RstudioでProjectを作ったらWorkspaceの設定をしろ。`setwd()`を使うな

すごく短い 前提 Rでデータを読み込む方法がわかる ローカルのRstudioを使っている(Rstudio serverでの挙動はわからない) Rプロジェクトを作っている エラー文から逃げない精神力がある

回帰モデルと内生性とR

この記事は R言語 Advent Calendar12日目の記事です 書いていること 回帰分析の話 なぜなら私が文字に起こす上で一番楽しいのが回帰分析だから。 その中でも「内生性」に関する話をする MMMでも内生性に関する課題があり、しっかり理解できたほうが良いのだ…

TokyoR #105で登壇しました

3年ぶり 最後はコロナ禍直前の1月の報告以来、3年ぶりに勉強会で報告しました。 スライドはこちら 8-u8.github.io connpassはこちら。面白い資料がいっぱいあります。 tokyor.connpass.com

RでOne-hot Encodingをする with tidyverse

あけまして おめでとうございます。今年もよろしくお願いします。 新年の抱負は以下に書きました。 note.com One-hot Encodingをやるパッケージが使えない 過去にこんな記事を書きました。 socinuit.hatenablog.com 最近気づいたことにここで使っているパッ…

Rに育てられて、Rと生きている話

この記事は R Advent Calendar 2022の24日めの記事ですが期日前投稿します。 Rのコードが出てこないAdvent Calendar記事 今回は僕のキャリアとRとの付き合い方に関して語ります。 なぜこのタイミングかというと、年末で現職を退職し、 2023年からは別の会社…

Marketing Mixed ModelとRobyn with R

R Advent Calendar 2022の11日目の記事です。

【献本】『Rが生産性を高める 〜データ分析ワークフロー効率化の実践』

登山本、届く。 技術評論社さま、並びに著者の皆様(igjitさん、Atusyさん、hanaoriさんに、 『Rが生産性を高める〜データ分析ワークフロー効率化の実践』を献本いただきました。 自費で買おうと思っていた矢先にお声がけいただき、うれしい限りです。 仕事で…

線形混合モデルを理解したい

この記事は R Advent Calendar 2021の12日目の記事になるらしいです。 昨日の記事はしょこさんのLasso回帰スクラッチ実装です。 これはガチガチにすごいので正則化回帰完全理解を試みる勢は必読。 そして明日もしょこさんがロジスティック回帰をスクラッチ実…

一般化線形混合モデルとマルチレベルモデルって同じモデル指していたんですね

やること 一般化線形混合モデルを使った個体別のパラメータの縮小効果についてかきました。 過去に書いた以下の記事の続きです。 socinuit.hatenablog.com githubは以下。 github.com

データ分析をちゃんと管理しよう【コーディング編】

今月10記事も書けるのか? ううう……がんばりましゅ…… フォルダ構成編 socinuit.hatenablog.com ファイル名編 socinuit.hatenablog.com

データ分析をちゃんと管理しよう with R 【ファイル名編】

年間50記事書くにはあと3ヶ月で32記事書かないといけない ……マジで?算数できないにも程がある。 ここから3ヶ月で30記事書くってことは、1ヶ月10記事…… ネタを探さないとなあと思いましたが、直近はいくつかあるのであんしん!

データ分析をちゃんと管理しよう with R 【フォルダ構成編】

年間50記事執筆から逃げるな はい…… Rは統計解析に特化した言語で、統計解析に特化した人間がよく用います。 ただR言語を使用する人は必ずしもコンピュータサイエンスに特化した人間とは限りません。 きぬいとはRを使って統計解析をしますが、お世辞にもエン…

Rprojectを立てるのがめんどくさくて勝手にプロジェクト立てるパッケージ作った話

始めてRのパッケージをつくった RStudioを使い慣れている人は「案件や研究テーマ別にプロジェクトを立てる」ということはもはや呼吸と同義だと思いますし、 kaggleをはじめ、機械学習や統計モデルの構築プロジェクトを繰り返している経験がある人は、 プロジ…

多重共線性ってどれくらいのあたりから問題になりそうなのか?という話

今月まだ1個も書いてないので書きます。 こんなツイートをみました。 【急募】多重共線性が発生してないことを調べる方法VIF>10の説明変数は除いたが、これらの変数で回帰しても多重共線性が発生してない保証はないよね...— 必要の用 (@chunozyou) 2020年6月…

一般線形モデルから一般化線形混合モデルにたどり着くまで

この記事こそが! R Advent Calendar 22日目の記事です! このノリがわからない人は前の記事を読んでください。 この前の記事が知る人ぞ知るRおじさんのAtsusyさんなのでこの記事では上がったハードルをくぐっていきます。 皆さん読んできました?省略できち…

Lasso回帰で選択される変数が実行するたびに変わる話

この記事も! R Advent Calendar 22日目の記事ではありません! 記事は書いてます!読後メモも書いてます!でもしょうがない。問題にぶち当たったので。 どんな問題? Rのglmnet::cv.glmnet()関数で実行するL1正則化回帰(Lasso)において、 set.seed()でシー…

2019年もJapan.R に行ってきました。

7〜8回目らしいですよ きぬいとは今年で2回目です。 いつものイベント記事はこちらから japanr.connpass.com 国内最大規模のRの勉強会として毎年開かれています。今年広い会場が全部埋まる参加者が集まり大盛り上がりでした。

Sparse Group LassoをやるためのRライブラリ{SGL}を使ってみた

この記事は 別にR Advent Calendarの記事ではありません(え?) 22日目に書くので、許してください。 仕事で使うかどうかも微妙なのですが、いくつかのグループごとにネストされた説明変数を使った回帰問題にぶち当たりました。 普通のLassoをするとグルー…

TokyoR Vol.82に行ってきました。

IEEEは完敗しました それ以上に申し上げることはありません。 TokyoRに行ってきました。相変わらずアットホームな感じで楽しかったです。 資料とかはここにも上がるんじゃないかな tokyor.connpass.com 会場はAbema Towers。渋谷にあります。 そして世の中は…

TokyoR Vol.79に参加しました

難しかったり簡単だったりする回 初心者セッションで公理的確率論がでてきたので楽しかったです。 サイトはこちら。 tokyor.connpass.com きぬいとさんもLTをしましたが、実在する社名とか普通に出しちゃっているので検閲が必要です。ごめんね。

TokyoR vol. 78に行ってきました

「いい感じ」「ためになるなあ」回 今回も勉強になりました。参加者の1/3程が初参加ということで、とても良いなあという感じでありました。 資料やコンテンツは以下。 tokyor.connpass.com 今回はLTをしてきました。 資料は以下。 主に残留を決意した現職で…

九捨十入(年代変数の簡単な作り方)

シチュエーション 卒業論文やお仕事でアンケートをとった. 年齢の選択肢つけるのめんどくさかったので実年齢入れてもらった 年齢と何かのクロス集計をかけたいが,実年齢は整数なのでめんどい 10歳刻みの年代でくくりたいなあ. 関数 こんな感じ.関数にし…

TokyoR#76に行ってきました

理論と実装のバランスがいい回 でした. 応用セッションもLTもなかなか活気があり,面白かったです. 今回は資料の多くが以下からアクセスできます. tokyor.connpass.com 今回特に面白かったのはkato_kohakuさんの機械学習モデルの横断的な比較評価について…

Rでone-hot encodingするときに便利なパッケージ{dummies}

はじめに 私生活でも仕事でも「カテゴリ変数を[0,1]実数で表現したい」という欲望に駆られる. どういうことか?下のように入っているデータがあるとする. Category A B C これを,下のように変換したい. Category_A Category_B Category_C 1 0 0 0 1 0 0 …

TokyoR #75に行ってきました

哲学回だった(?) ここ1年はこれを楽しみに生きるという苦しみを耐え忍んできています(誇張表現) 今回は私が神話の話をして,ほかの方がパラレルワールドの話や存在意義の話をするというなかなか哲学な話が多かったのでは?という印象でした. みんななにか…

JapanRに行ってきました

JapanRに行ってきました. japanr.connpass.com なぜか今日12月1日はデータ関連がざわついており,複数のデータ関連のイベントがありました *1. JapanRは初めての参加ですが,その規模,人数,参加者の変態度優秀さ,どれをとっても年に1回あるかないかの濃…

TokyoR #73 で発表しました

#72でも発表しましたがそれはそれ. 4月に東京へ引っ越して以来,TokyoRにはほぼ毎月参加しておりまして, 誰かに見せる機会を作らないと勉強も分析もしない怠け者なので,9月あたりからLightning Tableに出ることで無理やり勉強しています. 仕事でも私事で…

アニメ公式Twitterアカウントのフォロワーの推移について

はじめに MrUnadon先生の書かれたこんな記事があります. 6月9日に開催されたTokyoRにて,(Mr. Unadon氏)https://twitter.com/mrunadonが2018年冬に放送されたアニメ,『ヴァイオレット・エヴァーガーデン』のTwitter公式アカウントのフォロワー数の推移をベ…