まだ「確率変数」が分からない - 檜山正幸のキマイラ飼育記 (はてなBlog)

ここんところ何度か、「確率変数」という言葉が何を意味するか理解できない、と愚痴を書いています。分かりにくい理由として、用語や記号の使い方なんて所詮イイカゲンなものだ、ということもあるでしょう。そのへんの事情は次のエントリーに書きました。

しかし、どうもそれだけじゃない気がするのです。ちゃんと言葉を使っていても、それでもなお「確率変数」が意味するモノが何種類もあるとしか思えないのです。

内容：

確率変数と確率空間
確率変数と期待値
圏論の言葉で整理

確率変数と確率空間

「確率変数とは可測写像」という定義を出発点に話を進めます。この解釈では、確率変数は、確率とは何の関係もないのですよね。奇妙といえば奇妙ですが、定義に確率は出てこないです。

しかしもちろん、ずっと確率変数と確率が無関係ということじゃありません。例えば、2つの確率変数が独立だ、というとき、確率なしに独立性は定義できません。暗黙に、次が仮定されていることが多いでしょう。

確率変数の定義域は、単なる可測空間ではなくて、確率空間である。

Aを集合、Σ_Aをσ代数、μ_Aを確率測度として、A = (A, Σ_A, μ_A) を確率空間とします。B = (B, Σ_B) は可測空間とします。文字通りの定義だと、確率変数fは、f:(A, Σ_A)→(B, Σ_B) ですが、A側には確率測度μ_Aが載っていて、f:(A, Σ_A, μ_A)→(B, Σ_B) というのが実状でしょう。（注意：通常、確率変数は大文字（XとかY)で書かれますが、この記事ではその習慣に従いません。）

この時点では、確率変数fが値をとる (B, Σ_B) のほうに測度を仮定していません。が、いつまでも測度不在かというと、そんなわけはなくて、μ_A をfで前送りした測度を考えます。前送り測度（像測度）は、習慣的に分布と呼ぶのでした。μ_Aの前送り測度 f_*(μ_A) は次のように定義されます。

μ_B := f_*(μ_A) と置く；
Y∈Σ_B に対して、μ_B(Y) := μ_A(f^-1(Y))

B上の測度μ_Bを構成した後は、(B, Σ_B, μ_B) は確率空間になります。ここで、μ_B は最初からあったとみなすとどうなるでしょう。確率変数fは、f:(A, Σ_A, μ_A)→(B, Σ_B, μ_B) という可測写像で、さらに f_*(μ_A) = μ_B を満たすことになります。

つまり確率変数は、「確率空間のあいだの可測写像で、測度を保存するもの」となります。これは、確率空間のあいだの準同型写像（homomorphism）といっていいでしょう。

まとめると：

確率変数の意味その1： 単なる可測写像、つまり可測空間のあいだの準同型写像
確率変数の意味その2： 確率測度を保存する可測写像、つまり確率空間のあいだの準同型写像

確率変数と期待値

確率変数の値を実数に限るときがあります。つまり、f:(A, Σ_A, μ_A)→R であるfを確率変数と呼ぶのです。この場合、A上の確率変数 f, g に対して f + g, fg を作れます（足したり掛けたりできます）。さらにfの期待値（平均値）を取ることができます。期待値はA上の積分なので、確率変数は被積分関数になれる、と言っても同じです。

確率空間 A = (A, Σ_A, μ_A) 上の有界な実数値確率変数の全体を L(A) = L(A, Σ_A, μ_A) とします。L(A) は実数係数のベクトル空間で、掛け算もできます。そして、期待値 τ:L(A)→R を備えています。

テレンス・タオの記事"Algebraic probability spaces"に、期待値（トレースと呼んでる）を持つ可換環が公理化されています。トレースの条件だけ抜き出すと：

τ:L(A)→R は実係数の線形写像
τ(1) = 1、左辺の1は、L(A)内の掛け算の単位
τ(f²) ≧ 0 （τ(f²) の正平方根が意味を持つ）
sup_k≧1(τ(f^2k)^1/2k) ＜ ∞

最後の条件は「技術的に必要だ」ということですが、僕はその意味合いがよく分かりません。

テレンス・タオの記事では、確率空間 A = (A, Σ_A, μ_A) に対してトレース付きの可換環を対応させるだけでなく、トレース付き可換環を最初に与えて、そこから通常の確率空間を構成することが主眼です。そこまで抽象化しないまでも、確率空間には「確率変数の代数」が付随するという発想はけっこう使われているのでしょう。

L(A)の要素としての確率変数は、系の観測量（observable）とか座標に近いものです。この意味の確率変数は足したり掛けたり平均したりすることができます。

確率変数の意味その3： 適当な条件を満たす実数値可測関数であり、トレース（期待値）付き可換環の要素

圏論の言葉で整理

可測空間の圏をMeas、確率空間の圏をProb、トレース付き可換環として定式化される代数的確率空間の圏をAlgProbとします。それぞれの圏の概要は：

Meas：可測空間が対象、可測写像が射
Prob：確率空間が対象、確率測度を保存する可測写像が射
AlgProb：トレース付き可換環が対象、トレースを保存する可換環の準同型が射

今まで述べたことを、圏論の言葉で言えば：

圏Measの射を確率変数と呼ぶことがある。
圏Probの射を確率変数と呼ぶことがある。
圏AlgProbの対象（の台集合）の要素を確率変数と呼ぶことがある。

Prob→Meas という忘却関手があるので、一番目とニ番目の用法を神経質に区別する必要はないでしょう。でも、三番目の用法はかなり違います。圏Probを圏AlgProbに反変に埋め込めるので、ProbとAlgProbを重ねて（ある程度同一視して）語るときがあります。このとき、「圏の射」と「圏の対象の要素」を同じ言葉で指すのはさすがに混乱するでしょう。

ハッキリとしたモデルがある場合でも、異なるモデル内で同じ言葉が使われていて、当然に意味（denotation）は違います。それに加えて、言葉の運用上の多義性・曖昧さもあるので、これの解釈はムズカシイ。

やっぱり、「確率変数」と言うのはやめたほうがいいかも。