Poisson分布でどう使えばいいかわからない性質の話
はじめに
修士論文は無事書き終えました.
そんなことよりも「これ,面白さはあるんだけど一体どういう局面で使えばいいんだ」という事実を見つけ,見たところ日本語での証明方針はなさそうだったので(いくつかヒントはありましたが),備忘録的に残しておきます.
Poisson分布の地味な性質
Poisson分布の話です.ある確率変数が
で表されるとき(はパラメータ,はネイピア数です),確率変数XはPoisson分布に従っています.
Poisson分布単体は色々な応用先があります.たとえばブログの1日あたりの閲覧数とか,1日にあのレストランを訪れる来客数とか,駅周辺にあるコーヒーチェーンの数とかがPoisson分布に従うことが知られており,ビジネスでも大活躍の確率分布です.すごいね!
Poisson分布は実現値が自然数である場合に有効です.正の連続値であればGamma分布とかErlang分布とかがよい近似を与えます.
地味な性質の簡単な証明
最近知ったPoisson分布の悩ましい性質というのは
「ポアソン分布に従う確率変数の実現確率は,奇数より偶数のほうが高い」
という性質です.へぇ~ボタンがあれば8へぇ~くらいの驚き度合いでした.
一応証明もメモ程度に書きなぐっておきます.せっかく記法が使えるので.数式の展開はガバガバかもしれませんが,その点はコメント等でご指摘いただければ僕の勉強にもなりますんで,よろしくお願いします.
ポアソン分布に従う確率変数のうち,偶数の出る確率と奇数の出る確率は独立です(証明は省きます).
すなわち,ポアソン分布において「奇数かつ偶数が出る確率」は0,ということです.
ここで,「偶数が出る確率」は,偶数の実現確率の総和なので
で表現できます.逆に「奇数の出る確率」は
「偶数の出る確率」(2)を書き下すと,
という形で書き下せます.
ネイピア数は偉大です.についての指数関数をのまわりでテイラー展開すると
一方,についての指数関数も同様にの周りでテイラー展開すると
でそれぞれ表現できます. ん~?
どうやら式(4)は(5),(6)を使って
と表現できそうです.すなわちポアソン分布に従う確率変数の実現値が偶数である確率がである,ということです.
式(3)に代入すれば,奇数が出る確率はとなります.
命題は数式で表せば
<
ですが,ここまでくればもう分かる通り,(左辺)-(右辺)は負になります.
つまり「奇数の出る確率」より「偶数の出る確率」のほうが高いことが確認できました.
で?
Poisson分布において,「奇数の出る確率」より「偶数の出る確率」のほうが高いことがわかった……んですけど,これって何に応用できるんですかね?
怠惰な人間なので,テイラー展開とか久しぶりに使ったこともあり計算そのものは楽しかったんですけど,たとえば統計分析のPoisson回帰だとか,Poisson過程でとか,応用できる性質なのでしょうか.思い浮かびません.やっぱり8へぇ~くらいですね.
【2019年6月3日追記】
この記事の執筆から1年が経過して、また思い返したかのように記事を紹介したら思った以上の皆さんに見ていただいて恐縮しています。
西さんより、証明の誤りをご指摘いただきました。
ff外からすみません、私の勘違いなら恐縮なのですが、exp(2λ)の部分、exp(-2λ)ではないでしょうか。感覚的にはλが小の時はゼロで切断されてるので偶数の方が出る確率が高い、λが大きくなると差がなくなるといった具合な気がします。
— 西 (@firipinbanana) June 3, 2019
リプライありがとうございます。ご指摘の部分を直しました(つもり)。
注意深く読んでいただいたことにとても感謝しています……。