このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

まだ「確率変数」が分からない

ここんところ何度か、「確率変数」という言葉が何を意味するか理解できない、と愚痴を書いています。分かりにくい理由として、用語や記号の使い方なんて所詮イイカゲンなものだ、ということもあるでしょう。そのへんの事情は次のエントリーに書きました。

しかし、どうもそれだけじゃない気がするのです。ちゃんと言葉を使っていても、それでもなお「確率変数」が意味するモノが何種類もあるとしか思えないのです。

内容:

確率変数と確率空間

「確率変数とは可測写像」という定義を出発点に話を進めます。この解釈では、確率変数は、確率とは何の関係もないのですよね。奇妙といえば奇妙ですが、定義に確率は出てこないです。

しかしもちろん、ずっと確率変数と確率が無関係ということじゃありません。例えば、2つの確率変数が独立だ、というとき、確率なしに独立性は定義できません。暗黙に、次が仮定されていることが多いでしょう。

  • 確率変数の定義域は、単なる可測空間ではなくて、確率空間である。

Aを集合、ΣAをσ代数、μAを確率測度として、A = (A, ΣA, μA) を確率空間とします。B = (B, ΣB) は可測空間とします。文字通りの定義だと、確率変数fは、f:(A, ΣA)→(B, ΣB) ですが、A側には確率測度μAが載っていて、f:(A, ΣA, μA)→(B, ΣB) というのが実状でしょう。(注意:通常、確率変数は大文字(XとかY)で書かれますが、この記事ではその習慣に従いません。)

この時点では、確率変数fが値をとる (B, ΣB) のほうに測度を仮定していません。が、いつまでも測度不在かというと、そんなわけはなくて、μA をfで前送りした測度を考えます。前送り測度(像測度)は、習慣的に分布と呼ぶのでした。μAの前送り測度 f*A) は次のように定義されます。

  • μB := f*A) と置く;
  • Y∈ΣB に対して、μB(Y) := μA(f-1(Y))

B上の測度μBを構成した後は、(B, ΣB, μB) は確率空間になります。ここで、μB最初からあったとみなすとどうなるでしょう。確率変数fは、f:(A, ΣA, μA)→(B, ΣB, μB) という可測写像で、さらに f*A) = μB を満たすことになります。

つまり確率変数は、「確率空間のあいだの可測写像で、測度を保存するもの」となります。これは、確率空間のあいだの準同型写像(homomorphism)といっていいでしょう。

まとめると:

  • 確率変数の意味その1: 単なる可測写像、つまり可測空間のあいだの準同型写像
  • 確率変数の意味その2: 確率測度を保存する可測写像、つまり確率空間のあいだの準同型写像

確率変数と期待値

確率変数の値を実数に限るときがあります。つまり、f:(A, ΣA, μA)→R であるfを確率変数と呼ぶのです。この場合、A上の確率変数 f, g に対して f + g, fg を作れます(足したり掛けたりできます)。さらにfの期待値(平均値)を取ることができます。期待値はA上の積分なので、確率変数は被積分関数になれる、と言っても同じです。

確率空間 A = (A, ΣA, μA) 上の有界な実数値確率変数の全体を L(A) = L(A, ΣA, μA) とします。L(A) は実数係数のベクトル空間で、掛け算もできます。そして、期待値 τ:L(A)→R を備えています。

テレンス・タオの記事"Algebraic probability spaces"に、期待値(トレースと呼んでる)を持つ可換環が公理化されています。トレースの条件だけ抜き出すと:

  1. τ:L(A)→R は実係数の線形写像
  2. τ(1) = 1、左辺の1は、L(A)内の掛け算の単位
  3. τ(f2) ≧ 0 (τ(f2) の正平方根が意味を持つ)
  4. supk≧1(τ(f2k)1/2k) < ∞

最後の条件は「技術的に必要だ」ということですが、僕はその意味合いがよく分かりません。

テレンス・タオの記事では、確率空間 A = (A, ΣA, μA) に対してトレース付きの可換環を対応させるだけでなく、トレース付き可換環を最初に与えて、そこから通常の確率空間を構成することが主眼です。そこまで抽象化しないまでも、確率空間には「確率変数の代数」が付随するという発想はけっこう使われているのでしょう。

L(A)の要素としての確率変数は、系の観測量(observable)とか座標に近いものです。この意味の確率変数は足したり掛けたり平均したりすることができます。

  • 確率変数の意味その3: 適当な条件を満たす実数値可測関数であり、トレース(期待値)付き可換環の要素

圏論の言葉で整理

可測空間の圏をMeas、確率空間の圏をProb、トレース付き可換環として定式化される代数的確率空間の圏をAlgProbとします。それぞれの圏の概要は:

  • Meas: 可測空間が対象、可測写像が射
  • Prob: 確率空間が対象、確率測度を保存する可測写像が射
  • AlgProb: トレース付き可換環が対象、トレースを保存する可換環の準同型が射

今まで述べたことを、圏論の言葉で言えば:

  1. Measの射を確率変数と呼ぶことがある。
  2. Probの射を確率変数と呼ぶことがある。
  3. AlgProbの対象(の台集合)の要素を確率変数と呼ぶことがある。

ProbMeas という忘却関手があるので、一番目とニ番目の用法を神経質に区別する必要はないでしょう。でも、三番目の用法はかなり違います。圏Probを圏AlgProbに反変に埋め込めるので、ProbAlgProbを重ねて(ある程度同一視して)語るときがあります。このとき、「圏の射」と「圏の対象の要素」を同じ言葉で指すのはさすがに混乱するでしょう。

ハッキリとしたモデルがある場合でも、異なるモデル内で同じ言葉が使われていて、当然に意味(denotation)は違います。それに加えて、言葉の運用上の多義性・曖昧さもあるので、これの解釈はムズカシイ。

やっぱり、「確率変数」と言うのはやめたほうがいいかも。