このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

確率変数が分布に「従う」とは

確率・統計に出てくる「よく分からない言葉」を、多少は「分かる言葉」にしようと詮索した記事を、過去に幾つか書きました。そのリストはこの記事の最後に載せることにして、扱った「よく分からない言葉」は:

  • 確率変数
  • 分布
  • 母集団
  • 標本

これらは「意味不明な用語の四天王」と言えます(「超曖昧語「母集団」「標本」にケリをつける」)。

四天王の2つを含むフレーズに「確率変数が分布に従う」という言い回しがあります。これはどんな意味なのでしょう?

内容:

実例は:

復習:確率変数と確率分布

過去記事を参照しなくて済むように、手みじかに復習します。確率測度、可測写像、確率空間の定義はハッキリしているので、これらをもとにして、意味不明な用語を解釈することにします。目的は意味をハッキリさせることで、教育的配慮とかは無視します。

確率空間は、A = (ΩA, ΣA, μA) のように書きます。ここで、

  • ΩA は、台集合。単なる集合。
  • ΣA は、集合ΩA上のσ代数。
  • μA は、可測空間 (ΩA, ΣA) 上の確率測度。

記号の乱用で、A = (A, ΣA, μA) とも書きます。

Aを確率空間、V = (V, ΣV) を可測空間として、(ここでは)確率変数とは、f:A→V という可測写像です。fにより、A上の確率測度 μA は前送りできるので、前送りされた測度を f*A) と書きます。

(V, ΣV, f*A)) は確率空間になります。f*A) を μV と置くと、確率変数 f:A→V は、(A, ΣA, μA)→(V, ΣV, μV) という確率空間のあいだの準同型写像(確率測度を保存する可測写像)とみなせるので、「確率変数とは確率空間のあいだの準同型写像だ」という定義も(必要に応じて)使います。

確率分布は、基本的には確率測度のことです。すべての確率測度ではなくて、その一部分だけを考えるときに、「測度」より「分布」を使う傾向があるようです。例えば、密度関数を持つ確率測度だけを考えるなら、「確率分布=確率密度関数」となります。離散確率測度だけを考えるなら、「確率分布=確率質量関数」となります。「確率分布」という言葉には、暗黙の制約が含まれているわけです。

また、確率変数 f:A→V に対して、fによる前送り測度 f*A) を、fの確率分布と呼びます。この場合は、可測写像fと、その余域上の確率測度の関係を「確率分布」という言葉で表現しています。ここでも、「確率分布」という言葉が背後にある確率変数を暗示していることになります。

混乱の恐れがなければ、確率分布を単に分布といいます。これは、単に横着した略称に過ぎず、特別な意味はないです。

「従う」とは

「確率変数fが分布νに従う」という言い方に特に新しい意味はなくて、次の言い方と同じです。

  • 確率変数fの分布はνである。
  • 確率変数fによる前送り測度はνである。
  • f:(A, ΣA, μA)→(V, ΣV, μV) は確率空間のあいだの準同型写像で、ν = μV = f*A)

ただし、特定の分布(確率測度)νを出さずに、モヤッと「従う」を使うことがあります。「確率変数fが正規分布に従う」のような言い方です。このときは、特定の正規分布ではなくて、正規分布の族に「従う」ということになります。

「族」は「集合」のことですが、パラメータ表示される集合を「族」と呼ぶ傾向があります。実数Rを台集合とする正規分布の族は、R×R>0 = {(μ, δ)∈R2 | δ > 0} でパラメータ表示されます。

  • NR:R×R>0→Meas(R)

Meas(R)は、R上の(標準的な可測構造に関する)測度の全体です。パラメータ (μ, δ) は、平均と分散の組です。通常は、なぜかδの正平方根をσとして、NR(μ, σ2) と書かれます(そういう習慣)。

パラメータ表示 NR:R×R>0→Meas(R) の像集合が、正規分布の集合になります。

と置きます。

さて、確率変数 f:A→R がモヤッと「正規分布に従う」と言った場合、その意味は次のことでしょう。

  • f*A)∈ND

集合NDにはパラメータ表示があったので、次のように言えます。

  • f*A) は、適当なパラメータ (μ, σ2)∈R×R>0 により、f*A) = NR(μ, σ2) と書ける。

多くの場合、背後にある確率空間 (A, ΣA, μA) に明示的には言及しないので、結局のところ、「R上で、とある正規分布(と呼ばれる確率測度)を考えましょう」と言っているのと同じです。

もともと意味不明な用語法なので、「ほんとのところ」は分かりませんが、「従う」という特殊な言葉を使うのは、言及してない背後の構造の存在を暗示しているのかも知れません。

関連する過去記事

「確率変数」について:

「分布」について:

「母集団」「標本」について: