このシリーズではE資格対策として、シラバスの内容を項目別にまとめています。
多項分布の概要
多項分布は、二項分布を一般化したもので、複数のカテゴリーまたはイベントに対する確率分布です。n回の独立した試行でk種類の結果がそれぞれ特定の回数だけ出る確率を計算します。
多項分布の確率質量関数は次のように定義されます:
$$
P(X_1 = x_1, X_2 = x_2, …, X_k = x_k) = \frac{n!}{x_1!x_2!\ldots x_k!} p_1^{x_1}p_2^{x_2}\ldots p_k^{x_k}
$$
ある袋が赤、青、緑の3種類の球で満たされていて、それぞれの色の球の出る確率が p = [0.2, 0.3, 0.5]であるとします。袋から10回球を取り出すとき、各色が何回出る確率を求める問題を考えます。これが多項分布です。
例えば、赤4回、青3回、緑3回という結果が得られる確率は次のように計算できます:
$$
P(X_{\text{赤}} = 4, X_{\text{青}} = 3, X_{\text{緑}} = 3) = \frac{10!}{4!3!3!} \times (0.2^4) \times (0.3^3) \times (0.5^3)
$$
多項分布の期待値と分散
多項分布における期待値(平均)は、各試行での出現回数の期待値となります。これは次のように定義されます:
$$
E[X_i] = np_i
$$
n回の試行中で、特定のイベントが発生する回数の期待値は、試行回数とそのイベントが発生する確率の積となります。
多項分布の分散は、個々の結果の分散となります。これは以下のように定義されます:
$$
Var[X_i] = np_i(1 – p_i)
$$
n回の試行中で、特定のイベントが発生する回数の分散は、試行回数、そのイベントが発生する確率、そのイベントが発生しない確率(1 – $p_i$)の積となります。
先ほどの赤、青、緑の3種類の球がある袋を再び考えます。それぞれの色の球の出る確率が p = [0.2, 0.3, 0.5]であるとします。袋から10回球を取り出すとき、各色が何回出る確率を求める問題を考えます。
赤の球が出る回数の期待値と分散は次のように計算できます:
$$
E[X_{\text{赤}}] = 10 \times 0.2 = 2,
$$
$$
Var[X_{\text{赤}}] = 10 \times 0.2 \times (1 – 0.2) = 1.6.
$$
青の球が出る回数の期待値と分散は次のように計算できます:
$$
E[X_{\text{青}}] = 10 \times 0.3 = 3,
$$
$$
Var[X_{\text{青}}] = 10 \times 0.3 \times (1 – 0.3) = 2.1.
$$
緑の球が出る回数の期待値と分散は次のように計算できます:
$$
E[X_{\text{緑}}] = 10 \times 0.5 = 5,
$$
$$
Var[X_{\text{緑}}] = 10 \times 0.5 \times (1 – 0.5) = 2.5.
$$
多項分布の尤度関数
尤度関数は、確率分布のパラメータの推定に使われる関数です。具体的には、与えられたデータに対して各パラメータがどの程度それを「説明」するかを評価します。多項分布の尤度関数は、以下のように表されます:
$$
L(p; x) = \frac{n!}{x_1!\ldots x_k!}p_1^{x_1}\ldots p_k^{x_k}
$$
赤、青、緑の3種類の球がある袋を考えましょう。袋から10回球を取り出すとき、各色が何回出る確率を求める問題を考えます。各色が何回出るかの観測結果が次のように得られたとします:x = (赤4回、青3回、緑3回)。
この観測データに基づいて、それぞれの色の球が出る確率を
$$
p = (p_{\text{赤}}, p_{\text{青}}, p_{\text{緑}})
$$
とすると、尤度関数は次のように計算できます:
$$
L(p; x) = \frac{10!}{4!3!3!} p_{\text{赤}}^{4} p_{\text{青}}^{3} p_{\text{緑}}^{3}
$$
この尤度関数を最大化する
$$
p = (p_{\text{赤}}, p_{\text{青}}, p_{\text{緑}})
$$
を求めることで、観測データを最もよく説明するパラメータを推定することができます。
マルチヌーイ分布
マルチヌーイ分布は、多項分布の特殊なケースで、試行回数が1回(n=1)の場合の確率分布を表します。すなわち、k種類の結果から1つだけを選ぶ際の確率分布です。
マルチヌーイ分布の確率質量関数は次のように定義されます:
$$
P(X = x_i) = p_i
$$
ある袋が赤、青、緑の3種類の球で満たされていて、それぞれの色の球の出る確率が p = [0.2, 0.3, 0.5]であるとしましょう。袋から1回球を取り出すとき、各色が出る確率を求める問題を考えます。これがマルチヌーイ分布です。
例えば、赤の球が選択される確率は次のようになります:
$$
P(X = \text{赤}) = 0.2
$$
マルチヌーイの期待値と分散
マルチヌーイ分布の期待値は、各イベントが発生する確率そのものとなります。これは次のように定義されます:
$$
E[X_i] = p_i
$$
マルチヌーイ分布の分散は、以下のように定義されます:
$$
Var[X_i] = p_i(1 – p_i)
$$
赤、青、緑の3種類の球がある袋を再び考えます。それぞれの色の球の出る確率が p = [0.2, 0.3, 0.5]であるとします。袋から1回球を取り出すとき、各色が出る確率を求める問題を考えます。赤の球が出る確率の期待値と分散は次のように計算できます:
$$
E[X_{\text{赤}}] = 0.2,
$$
$$
Var[X_{\text{赤}}] = 0.2 \times (1 – 0.2) = 0.16.
$$
青の球が出る確率の期待値と分散は次のように計算できます:
$$
E[X_{\text{青}}] = 0.3,
$$
$$
Var[X_{\text{青}}] = 0.3 \times (1 – 0.3) = 0.21.
$$
緑の球が出る確率の期待値と分散は次のように計算できます:
$$
E[X_{\text{緑}}] = 0.5,
$$
$$
Var[X_{\text{緑}}] = 0.5 \times (1 – 0.5) = 0.25.
$$
マルチヌーイの尤度関数
マルチヌーイ分布の尤度関数は、以下のように表されます:
$$
L(p; x) = p_1^{x_1}\ldots p_k^{x_k}
$$
赤、青、緑の3種類の球がある袋を考えましょう。袋から1回球を取り出すとき、各色が何回出る確率を求める問題を考えます。各色が何回出るかの観測結果が次のように得られたとします:x = (赤0回、青1回、緑0回)。
この観測データに基づいて、それぞれの色の球が出る確率を$p = (p_{\text{赤}}, p_{\text{青}}, p_{\text{緑}})$とすると、尤度関数は次のように計算できます:
$$
L(p; x) = p_{\text{赤}}^{0} p_{\text{青}}^{1} p_{\text{緑}}^{0}
$$
まとめ
最後までご覧いただきありがとうございました。