00_データ分析(全般)
統計学はやはり人類には早いと思う 仕事で数理統計学を勉強していて、趣味で統計検定1級を取ろうとしているのですが、 今日は統計的検定の話をしようと思っています。 というのも、これが僕の無知によるものなのか、それとも世間一般に言われる誤解なのかは…
今回はインターネット大丈夫だった 次回も大丈夫だといいな…… 次回がいつなのかはお待ちください。 connpassはこちら。 資料などはこちらでも反映していきます。 ※ 一部SpeakerDeck等のサービスの不良で上手くアップロードできていないものもあるようですが …
あけましておめでとうございます 2021も早くてもう2月も半ば!という感じでね。 皆さんお元気でしたでしょうか。きぬいとはそうでもないです。 メンタルをやられて3ヶ月が経とうとしていますが、ここに来て繁忙度が加速しています。 大変ですね。 今年の目標…
今月10記事も書けるのか? ううう……がんばりましゅ…… フォルダ構成編 socinuit.hatenablog.com ファイル名編 socinuit.hatenablog.com
年間50記事書くにはあと3ヶ月で32記事書かないといけない ……マジで?算数できないにも程がある。 ここから3ヶ月で30記事書くってことは、1ヶ月10記事…… ネタを探さないとなあと思いましたが、直近はいくつかあるのであんしん!
年間50記事執筆から逃げるな はい…… Rは統計解析に特化した言語で、統計解析に特化した人間がよく用います。 ただR言語を使用する人は必ずしもコンピュータサイエンスに特化した人間とは限りません。 きぬいとはRを使って統計解析をしますが、お世辞にもエン…
始めてRのパッケージをつくった RStudioを使い慣れている人は「案件や研究テーマ別にプロジェクトを立てる」ということはもはや呼吸と同義だと思いますし、 kaggleをはじめ、機械学習や統計モデルの構築プロジェクトを繰り返している経験がある人は、 プロジ…
今月まだ1個も書いてないので書きます。 こんなツイートをみました。 【急募】多重共線性が発生してないことを調べる方法VIF>10の説明変数は除いたが、これらの変数で回帰しても多重共線性が発生してない保証はないよね...— 必要の用 (@chunozyou) 2020年6月…
UbuntuにOSを変えました Windows使いづらいな!!!! ふと「kaggleやRとかのコミュニティにはいるけどあまり数理統計学の基礎っぽい話のできるコミュニティに属してないなあ」 とおもったので、せっかくなのでDiscordに鯖を立てました。 有言実行シリーズで…
理論と実装のバランスがいい回 でした. 応用セッションもLTもなかなか活気があり,面白かったです. 今回は資料の多くが以下からアクセスできます. tokyor.connpass.com 今回特に面白かったのはkato_kohakuさんの機械学習モデルの横断的な比較評価について…
はじめに 私生活でも仕事でも「カテゴリ変数を[0,1]実数で表現したい」という欲望に駆られる. どういうことか?下のように入っているデータがあるとする. Category A B C これを,下のように変換したい. Category_A Category_B Category_C 1 0 0 0 1 0 0 …
はじめに MrUnadon先生の書かれたこんな記事があります. 6月9日に開催されたTokyoRにて,(Mr. Unadon氏)https://twitter.com/mrunadonが2018年冬に放送されたアニメ,『ヴァイオレット・エヴァーガーデン』のTwitter公式アカウントのフォロワー数の推移をベ…
はじめに 修士論文は無事書き終えました. そんなことよりも「これ,面白さはあるんだけど一体どういう局面で使えばいいんだ」という事実を見つけ,見たところ日本語での証明方針はなさそうだったので(いくつかヒントはありましたが),備忘録的に残しておき…