ベルヌーイ分布からベータ分 布までを関係づける @ito_yan E-mail: 1mail2itoh3 [at] gmail.com 2016.10.01 NagoyaStat #2
自己紹介
• TwitterID: @ito_yan
•統計検定1級(2012年)合格
•既に昔話になりつつある
•現在はサーバ管理が主業務
• VMware、XenServerの利用
•アプリケーション開発も少々
• 「まずはスモールデータより始めよ」派
•スモールデータを経由せずにビッグデータを勧めない
•統計ファンダメンタリスト
3
今回の話題
•ベイズ統計によく出てくる確率分布を紹介
•確率分布がどのような現象を表しているか
•確率分布の関連はどうなっているか
• 2つの独立な確率変数の和の確率分布
•再生性、モーメント母関数
4
確率変数
•どのような値となるかが、ある確率法則によって決まる変数
•通常大文字で表し、その実現値は小文字で書く
•今回のスライドでは大文字を省略している
•例えば、1~6が同様に確からしく出るサイコロを振った場合の出た目を考える。出た目の確率変数をXとすれば、P(X=1) = 1/6 のように書ける
• Pを使うのは具体的な確率、fなどP以外の文字を使うのは、確率分布を考える場合となる
5
二項分布 Bin(N, p)
•確率pで成功する互いに独立な試行をN回繰り返し、成功回数を表す離散型の確率分布
•同一(pが一定)なベルヌーイ試行を独立にN回繰り返したことに相当する
•期待値と分散はベルヌーイ分布のN倍
• 2つの独立な確率変数XとYに対し、V[X+Y]はV[X]+V[Y]で与えられるという性質を利用する
7
ポアソン分布 Po(λ)
•緑本の2~3章でも登場
•確率分布は以下のようになる(xは非負、λは正)
•期待値と分散は で与えられる
•これは第1回の緑本第2章の紹介時に導出済
•特定の期間でランダムな事象が起こる回数の分布
•緑本第2章では応答変数の値の範囲や離散という性質からポアソン分布を選択していた
8
二項分布とポアソン分布の関係
• を保ったまま、 とすると二項分布がポアソン分布になる
• 「ポアソンの少数の法則」と呼ばれる
•稀にしか起こらない(確率p)事象を大量観測(回数N)したら、ポアソン分布に従うと解釈される
•プロイセンで1年間で馬に蹴られて死んだ兵士の数がポアソン分布が使われた最初の例
• 大勢の兵士の中で、それで死ぬのは1年に数人なので、ポアソン分布の性質を満たしていると考えられる
9
ポアソン分布と指数分布の関係
•単位時間あたりに平均 回ランダムに起こる事象を考える
•ポアソン分布
•ある事象が単位時間に観測される回数が平均 回
•指数分布
•ある事象が発生してから、次に起きるまでの期間が平均
•ポアソン分布の見方を変えたら指数分布になる
14
指数分布の導出(1)
• t単位時間内に事象がx回起こる確率は、パラメータλのポアソン分布を用いると、
•ある事象が初めて起こるまでの時間をTとすると、tまでに一度も事象が起こらない確率はfにx=0を代入した場合であり、それはP(T > t)である
15
指数分布の導出(2)
•ある事象がtまでに初めて起こる確率は、
•上式の左辺は累積分布関数であるので
•確率密度関数を得るには、Gを微分すればよく、これで指数分布が得られる
•指数分布はあるランダムに発生する事象が観測される間隔を表す
16
指数分布の無記憶性
•直前に事象が起きてから、次に発生するまでの時間は過去に依存しないという性質
•連続型の確率分布で無記憶性があるのは指数分布のみである
17
とおいて、
となるSを求めれば
確率分布を求めることができる
指数分布とガンマ分布の関係
•互いに独立な指数分布(Ex(λ))の確率変数α個の和がガンマ分布(Ga(λ, α))に従う
•期待値と分散は指数分布のα倍になっている
•特にα=1ならば指数分布そのものになっている
19
確率変数の和の確率分布
• 2つの確率変数XとYが独立なとき、Z=X+Yの確率分布は次のようにして計算できる
•離散型
•連続型
• X=x、Y=z-xとなれば、X+Yがzになると考える
•すべての組合せを集めればzになる確率となる 22
簡単な例:サイコロの目の和
• 2つの1~6の目が同様に確からしく出るサイコロがある(出目の確率分布はf、gとする)。これらを投げ、出た目の和が3になる確率はいくらか。
23
という制約から和を取る範囲が狭まる
Ga(λ, 2)の確率密度関数の導出
24
•確率分布を定義に従って計算する
指数分布(Ex(λ))の確率密度関数、iは和を取った数を表す添字
指数分布に従う確率変数i個の和の確率変数が従う確率分布(つまりGa(λ, i))
再生性
• 2つの独立な確率変数XとYに対し、Z=X+YもまたX、Yと同じ確率分布になることを再生性という
•分野によっては、畳み込みと呼ぶこともある
•代表的な再生性の例
•正規分布
•ポアソン分布
•二項分布
26
再生性の導出方法
•確率分布の式に基づいて、地道に計算
•先ほどの例がこれに該当する
•モーメント母関数を用いた計算
•特性関数というモーメント母関数の拡張もあるが、計算は大変なので省略
•確率分布と1:1対応する関数のことを指す
•モーメント母関数が存在するならば、期待値や分散の計算も容易にできる
28
ベータ分布の性質
•何らかの現象を記述するために使われることは少ないが、ベイズ統計学ではよく使われる
• α=1、β=1とすると一様分布 U(0, 1)になる
• のようにガンマ関数と結びつく
• αとβの値によって、形状が変わってくる
32