確率変数が分布に「従う」とは

確率統計に出てくる「よく分からない言葉」を、多少は「分かる言葉」にしようと詮索した記事を、過去に幾つか書きました。そのリストはこの記事の最後に載せることにして、扱った「よく分からない言葉」は:

  • 確率変数
  • 分布
  • 母集団
  • 標本

これらは「意味不明な用語の四天王」と言えます(「超曖昧語「母集団」「標本」にケリをつける」)。

四天王の2つを含むフレーズに「確率変数が分布に従う」という言い回しがあります。これはどんな意味なのでしょう?

内容:

実例は:

復習:確率変数と確率分布

過去記事を参照しなくて済むように、手みじかに復習します。確率測度、可測写像、確率空間の定義はハッキリしているので、これらをもとにして、意味不明な用語を解釈することにします。目的は意味をハッキリさせることで、教育的配慮とかは無視します。

確率空間は、A = (ΩA, ΣA, μA) のように書きます。ここで、

  • ΩA は、台集合。単なる集合。
  • ΣA は、集合ΩA上のσ代数。
  • μA は、可測空間 (ΩA, ΣA) 上の確率測度。

記号の乱用で、A = (A, ΣA, μA) とも書きます。

Aを確率空間、V = (V, ΣV) を可測空間として、(ここでは)確率変数とは、f:A→V という可測写像です。fにより、A上の確率測度 μA は前送りできるので、前送りされた測度を f*A) と書きます。

(V, ΣV, f*A)) は確率空間になります。f*A) を μV と置くと、確率変数 f:A→V は、(A, ΣA, μA)→(V, ΣV, μV) という確率空間のあいだの準同型写像(確率測度を保存する可測写像)とみなせるので、「確率変数とは確率空間のあいだの準同型写像だ」という定義も(必要に応じて)使います。

確率分布は、基本的には確率測度のことです。すべての確率測度ではなくて、その一部分だけを考えるときに、「測度」より「分布」を使う傾向があるようです。例えば、密度関数を持つ確率測度だけを考えるなら、「確率分布=確率密度関数」となります。離散確率測度だけを考えるなら、「確率分布=確率質量関数」となります。「確率分布」という言葉には、暗黙の制約が含まれているわけです。

また、確率変数 f:A→V に対して、fによる前送り測度 f*A) を、fの確率分布と呼びます。この場合は、可測写像fと、その余域上の確率測度の関係を「確率分布」という言葉で表現しています。ここでも、「確率分布」という言葉が背後にある確率変数を暗示していることになります。

混乱の恐れがなければ、確率分布を単に分布といいます。これは、単に横着した略称に過ぎず、特別な意味はないです。

「従う」とは

「確率変数fが分布νに従う」という言い方に特に新しい意味はなくて、次の言い方と同じです。

  • 確率変数fの分布はνである。
  • 確率変数fによる前送り測度はνである。
  • f:(A, ΣA, μA)→(V, ΣV, μV) は確率空間のあいだの準同型写像で、ν = μV = f*A)

ただし、特定の分布(確率測度)νを出さずに、モヤッと「従う」を使うことがあります。「確率変数fが正規分布に従う」のような言い方です。このときは、特定の正規分布ではなくて、正規分布の族に「従う」ということになります。

「族」は「集合」のことですが、パラメータ表示される集合を「族」と呼ぶ傾向があります。実数Rを台集合とする正規分布の族は、R×R>0 = {(μ, δ)∈R2 | δ > 0} でパラメータ表示されます。

  • NR:R×R>0→Meas(R)

Meas(R)は、R上の(標準的な可測構造に関する)測度の全体です。パラメータ (μ, δ) は、平均と分散の組です。通常は、なぜかδの正平方根をσとして、NR(μ, σ2) と書かれます(そういう習慣)。

パラメータ表示 NR:R×R>0→Meas(R) の像集合が、正規分布の集合になります。

と置きます。

さて、確率変数 f:A→R がモヤッと「正規分布に従う」と言った場合、その意味は次のことでしょう。

  • f*A)∈ND

集合NDにはパラメータ表示があったので、次のように言えます。

  • f*A) は、適当なパラメータ (μ, σ2)∈R×R>0 により、f*A) = NR(μ, σ2) と書ける。

多くの場合、背後にある確率空間 (A, ΣA, μA) に明示的には言及しないので、結局のところ、「R上で、とある正規分布(と呼ばれる確率測度)を考えましょう」と言っているのと同じです。

もともと意味不明な用語法なので、「ほんとのところ」は分かりませんが、「従う」という特殊な言葉を使うのは、言及してない背後の構造の存在を暗示しているのかも知れません。

関連する過去記事

「確率変数」について:

「分布」について:

「母集団」「標本」について: