Sports Analyst Meetup Vol. 2に行ってきました
おじゃましました
Sports Analyst Meetupにお邪魔してきました!
昨今話題のスポーツ×データアナリティクスのMeetupで、第1回も参加表明したのですが
やはり昨今話題なだけあって枠が秒で埋まり参加できず……
今回も補欠枠となり万事休すかと思いきや、金曜に繰り上がり2秒で会場に馳せ参じました。
Connpassはここ
資料はこちら
続きを読む数理統計学勉強のためのDiscordサーバを立てました
UbuntuにOSを変えました
Windows使いづらいな!!!!
ふと「kaggleやRとかのコミュニティにはいるけどあまり数理統計学の基礎っぽい話のできるコミュニティに属してないなあ」
とおもったので、せっかくなのでDiscordに鯖を立てました。
有言実行シリーズです。
数理統計学を統計検定1級準拠で勉強とかアウトプットとかする会の趣旨や内容を詰めるためのTwitterDMランドをGW中に作りますか。
— Kien Y. Knot (@0_u0) April 21, 2019
参加の仕方
① 下をクリック
② メールアドレス認証
とりあえず人間かどうかを確認しています。
③ ようこそ
ルールなど
基本無法地帯です(!?)
ただ、誰かが悲しんだり、つらい思いをしたりしうる発言をしたら追い出すと思います。
もともとはは統計検定1級対策目的でしたが想定以上の規模なので「数理統計学に関わるあらゆる知識の集約」を目的に
みなさんと交流できればいいなあと思っています。
そんなわけで。
九捨十入(年代変数の簡単な作り方)
シチュエーション
- 卒業論文やお仕事でアンケートをとった.
- 年齢の選択肢つけるのめんどくさかったので実年齢入れてもらった
- 年齢と何かのクロス集計をかけたいが,実年齢は整数なのでめんどい
- 10歳刻みの年代でくくりたいなあ.
関数
こんな感じ.関数にしなくても別にいい.
thFunc <- function(Vec){ Vec[Vec%%10 != 0] <- Vec[Vec%%10 != 0] %%10 *10 return(Vec) } thFunc(c(14,15,99,40,56,22)) > [1] 40 50 90 40 60 20
解説
%%
演算子は剰余を返す.また,%/%
演算子は整数部の商を返す.
ここでは10歳刻みの年代がほしいので,10で割った時の剰余を判定し,
剰余が0でない場合は10で割った際の商の10倍を返す.
5歳刻みにしたいなら10としている部分を5とすればよい.
ちなみに
Rにはround
関数があり,digits = -1
とすると整数部第1位を丸めてくれるが,IEEE式で数値を丸めるため,
例えば25歳は20歳に丸められてしまい,26歳は30歳に丸められてしまう.違う,そうじゃない.
なおpythonでは以下のようにかけば同じような結論を得られる.
def thFunc(lst): for i in range(0, len(lst)): if lst[i] % 10 != 0: lst[i] = lst[i] // 10 * 10 return lst thFunc([34,55,63,55,20,19]) [30, 50, 60, 50, 20, 10]
あるいは
def thFunc(lst): return [lst[i] //10 *10 for i in range(0,len(lst)) if lst[i] % 10 != 0] thFunc([34,55,63,55,20,19]) [30, 50, 60, 50, 20, 10]
小話でした.
追記
floor(x/10)*10 じゃあかんのでしたっけ
— Kumakichi (@BlackBigBridge) 2019年4月9日
あえて小数にしてからfloor
(床関数)使って10倍すれば同じ結果が得られる上短く済むじゃん……
くまきち氏に感謝.
floor(c(14,15,99,40,56,22)/10)*10 [1] 10 10 90 40 50 20
さらに
こんな手も.ベンチとってないですが,最速なんじゃないかなあ.
— atusy (@Atsushi776) April 9, 2019
> c(14,15,99,40,56,22) %/% 10 * 10
[1] 10 10 90 40 50 20
Atsusy氏「多分コレが一番早いと思います」
ぼく「ミ゜」
> c(14,15,99,40,56,22) %/% 10 * 10 [1] 10 10 90 40 50 20
さすがRおじさん……
結論,別に剰余という情報はいらず,「10の位だけ残す」ことができればいいコトがわかってきた.
シンプルな方がバグもなくていいので,ライブラリ使わないPythonだと
lst = [34,55,63,55,20,19] [lst[i] //10*10 for i in range(0,len(lst))]
年度末だし年収っぽいのを晒す話
現職については詳しくは言えません
言えるのはこの国の8割を占める典型的なJapanese Traditional Companyであること……くらいですかね……
Twitter有言実行シリーズです.
帰宅後新卒一年目の年収を公開できる範囲で公開
— Kien Y. Knot (@0_u0) March 26, 2019
とりあえず有言実行だけしますが,別に今の会社を非難するつもりはなく
ただ「ヴァターシ1年でこれだけ稼いだんだな」という実感を持ちたいというモチベーションです.
続きを読むxonshを使ってkaggle APIでkernelにpushする
はじめに
- kaggle APIはローカルPCのターミナル(コマンドプロンプト)からshellコマンドでkaggleの環境を操作することができる呪文.Pythonで実装されている
- xonshはPythonで実装されている(?)shell
- kaggle APIをxonshで動かせばxonsh人口もkaggle API人口も増えて幸せなのではないか?
というわけでkaggle APIをxonshから使ってみましょう. ただ,1から書いていくとアレなので主に
の部分を記録します.kaggle APIやxonshの導入については以下を参照してください. また,installationには日本語の記事もありますので参照してください*1
xonsh
日本語による紹介記事
kaggle API
日本語による紹介記事
前提
続きを読むData Driven Meetup #5に行ってきました
今回も視聴者参加
でした.しかも仕事がおして遅刻して. 資料等はこちらから
LTとかで報告したいモチベーションはあるのですが, 事業会社ではなく,自分たちでプロダクト開発しているわけでもないので,うーん,というかんじです. 無理やり探すか,LTできるネタを公開できる場所に移るか……
続きを読む