と。

統計学は趣味、マーケティングは義務。

2020-01-01から1年間の記事一覧

年末なのでなにか書いとく話

お気持ちを壊して1ヶ月 11月はじめに「あ、きもちがだめだ」って思ってメンタルクリニックに行き「適応障害」と診断され、 担当医からは「3~4ヶ月かけてゆっくり治していこう」と言われました。 その際薬の処方に問題がないか確認するために血液検査を行った…

【流し読みレビュー】『超図解 新しいマーケティング入門』

メンタルを壊しました。 といっても、多くの皆さんには関係のないことです。 が、わずかなりにも「サポートしたい」というやさしい方には、ほしい物リストを公開しています。 どれを買っていただいても嬉しいです。よろしくおねがいします。 ほしい物リスト…

Lifetime Value(LTV)を予測する(2)

前回の続き socinuit.hatenablog.com あといくつ記事を書けば年間50記事になるかな……

【Statistician-ja】勉強会を開催します

設立から1年半 socinuit.hatenablog.com 各位の協力に伴い勉強会の運営を進められるようになりました。 connpassサイトプロトタイプを作成くださっているkur0ckyさん、 会場のZoomを提供いただく予定のutakaさん、ご協力にマジで感謝します。

データ分析をちゃんと管理しよう【コーディング編】

今月10記事も書けるのか? ううう……がんばりましゅ…… フォルダ構成編 socinuit.hatenablog.com ファイル名編 socinuit.hatenablog.com

Lifetime Value(LTV)を予測する(1)

またシリーズもんか マーケティングは正直苦手なんですが書かないことには苦手も得意もないので書くことにします。 今回はLife Time Valueという概念とその統計的な推測についてのモデルについてガバガバと書こうと思います。 というのも、最近は以下のよう…

私のデータサイエンスは人類を幸福にできたか?

閑話休題 並行して記事がいくつか進んでいてブロガーになるか〜〜〜になっています。嘘です。 仰々しいタイトルですが結局きぬいとの自己満足なので、「ふーん」で終わりです。

データ分析をちゃんと管理しよう with R 【ファイル名編】

年間50記事書くにはあと3ヶ月で32記事書かないといけない ……マジで?算数できないにも程がある。 ここから3ヶ月で30記事書くってことは、1ヶ月10記事…… ネタを探さないとなあと思いましたが、直近はいくつかあるのであんしん!

データ分析をちゃんと管理しよう with R 【フォルダ構成編】

年間50記事執筆から逃げるな はい…… Rは統計解析に特化した言語で、統計解析に特化した人間がよく用います。 ただR言語を使用する人は必ずしもコンピュータサイエンスに特化した人間とは限りません。 きぬいとはRを使って統計解析をしますが、お世辞にもエン…

2値変数だけのデータにk-meansをすると詰む

ブログ執筆から逃げるな まだgitには上げてません。 さっき上げました♨ github.com 教師なし学習で大変に代表的な手法であるところのk-means(K平均法)ですが、 2値変数にたいして適用すると悲しいことが起きるので注意が必要です。

AdKDD2020に提出された論文とかを読み始めた話

英語が読めなくなって2億年経過した Twitterミームです。27年しか生きていません。 8月24日にAdKDDが開催され、そこでAcceptされた論文について公開されていました。 PDFで公開されている論文が9本ほどあり、読み進めようと努力しています。 広く見て、Web広…

Rprojectを立てるのがめんどくさくて勝手にプロジェクト立てるパッケージ作った話

始めてRのパッケージをつくった RStudioを使い慣れている人は「案件や研究テーマ別にプロジェクトを立てる」ということはもはや呼吸と同義だと思いますし、 kaggleをはじめ、機械学習や統計モデルの構築プロジェクトを繰り返している経験がある人は、 プロジ…

M5 Forecasting - AccuracyであたりまえなShake upしました。

銀メダルでした。 在宅勤務しながら取り組めたので相対的にコミットする時間は作れたのかもしれません。 www.kaggle.com Rコンペ、Elo以来なので、1年ぶり(!)のメダルです。 一応、今年始めのShake downのリベンジが叶ったのでしょうか。 socinuit.hatenabl…

多重共線性ってどれくらいのあたりから問題になりそうなのか?という話

今月まだ1個も書いてないので書きます。 こんなツイートをみました。 【急募】多重共線性が発生してないことを調べる方法VIF>10の説明変数は除いたが、これらの変数で回帰しても多重共線性が発生してない保証はないよね...— 必要の用 (@chunozyou) 2020年6月…

27歳の戯言

感動もへったくれもないですね 誕生日です。無事に27歳になりました*1 お誕生日おめでとうございます!(@0_u0)お誕生日おめでとうございます!(@0_u0)お誕生日おめでとうございます!(@0_u0)お誕生日おめでとうございます!(@0_u0)お誕生日おめでとうござい…

【流し読みレビュー】『データ分析のための数理モデル入門』

数理モデル本、Again。 ちょっと前にこんな記事を書きました。 socinuit.hatenablog.com そして今回はこちらです。 www.socym.co.jp 数理モデル本、最近多く出ていますね。とてもいい流れだと思います。 偶然にも出版される日が近く、著者の江崎さんが慌てた…

在宅勤務が続きそうなので自宅作業環境を改善した話

いろいろ買いました GW明けてすぐに出勤できるなら良かったんですけどね。 世間はどうもまだ混乱しているようで、所属先からも「まだ在宅推奨」と言われたので、 そういうことならいっそのこと環境を揃えちゃいますか、ということになりました。

【流し読みレビュー】『データ活用のための数理モデリング入門』

統計学にある程度習熟し、モデリングを通して価値を出したい人向け gihyo.jp 水上ひろき,熊谷雄介,高野雅典,藤原晴雄 著 『データ活用のための数理モデリング入門』 流し読みした感想を書きます。 統計モデリングを中心に、実務(特に著者陣の主戦場のマー…

非IT系企業で在宅勤務を2週間続ける呼吸法に関するお話

M5やるやるつってまだsubmitしてません 積読の消化が忙しい……でもM5は面白そう…… みたいな感じで、いつの間にかやるやる詐欺で2ヶ月が経とうとしています。 kernelは読んでいるんですけど。 毎月2本書かないと目標達成できないのにもう4月も折り返してしまい…

労働者2年目の終わり、流行病とこれから

感慨もなく、気づいたら3月末 ぼくたちは「労働者」だ。社会人とは社会を構成する人すべてを指すので。 あんなに「転職したい」と言って、辞めるとまで言ったのに、 昇給するから現職にとどまったという「現職エントリー」から、間もなく11ヶ月。 socinuit.h…

COVID-19の日本の感染者数の推移を曜日単位で眺めてみた話

編集履歴 2020/04/22現在で、下記で行っている分析に用いたデータは削除されている模様です。 (gitリンクは更新しました) 現在のデータで再現する記事はきぬいとの気分次第で書きますので、気長にお待ちください。 今日は2本上げます 昨今国内でも猛威を振る…

【流し読みレビュー】Rによる実践的マーケティングリサーチと分析(原著第二版)

R言語使ってて、マーケティングやってる人なら天井から降ってくると思う www.kyoritsu-pub.co.jp そんな1冊です。

pipelineライブラリKedroを使ってみた話

「パイプラインって何?」 仕事でも機械学習の案件がちょっと増えてきたというのと、 kaggleもベースラインくらいは自動的にsubmitできるところまで持っていきたいって思ったので、 pipelineを作ろうと言うことになりました。 ただ、私はエンジニアリング畑…

統計数理研究所のリーディングDAT養成コースを修了しました

強い刺激を受けました 11月から東京都立川市にある統計数理研究所で、統計思考院のリーディングDAT(Data Analytics Talents)養成コースを受講し、 無事修了しました。

Data Science Bowl 2019で思い切りShake downしました

なんかすごい悔しい のでここに残すことにします。 最初はdiscussionにするかとも思いましたが、 トップ層のSolutionをみて日和ったのでここに残します。 結果はアレなんですが、個人的にはいろいろ学ぶところが多かったので、 そういうのも含めてまとめてい…

2020年になった話

東京オリンピックは自宅で見ます 今年もよろしくおねがいします。 socinuit.hatenablog.com 今年もこれをやります。