確率変数について2つの記事を書きました。
「確率変数」という概念をもう少し一般化できそうな気がしてきました。
内容:
- ニ項関手をカリー化したら確率変数
- バナッハ空間に値を取る確率変数
- プロ関手を楽観的に捉える
- 確率変数の圏論的構造
ニ項関手をカリー化したら確率変数
「「確率変数」の変種:測度に縛られない確率変数」で述べたことを手っ取り早く復習すると:
- ニ項関手 HomProb:Probop×Prob→Set のカリー化(ラムダ抽象)Λ(HomProb)は、「確率変数」概念の実体とみなせる。
- ニ項関手 H:Probop×Meas→Set のカリー化(ラムダ抽象)ΛHは、「無制約確率変数」概念の実体とみなせる。ここで、H(A, M) := Meas((Aの台となる可測空間), M)/(測度0の集合を除いて一致する)。
この2つで共通しているのは、Probop×C→Set という二項関手があり、その二項関手のカリー化として確率変数概念が得られることです。1番目では C = Prob、2番目では C = Meas となっています。Cをもっと別な圏に取り替えると、確率変数(の概念)の変種がもっと作れるでしょう。
Cだけでなくて、ニ項関手の値の圏であるSetも他の圏に変更してもよさそうです。実際に、Setも取り換えて第3の例を作ってみます(次節)。
バナッハ空間に値を取る確率変数
以下に述べる例は「モノイド自然変換としての積分: 大雑把に」の例とよく似たものです。
Banをバナッハ空間と連続線形写像(=有界線形写像)の圏とします。バナッハ空間はノルムから距離が入り位相空間となるので、ボレルσ集合代数を作れます。バナッハ空間Vのボレルσ集合代数をBorel(V)と書くことにします。
圏Probの対象Aは確率空間なので、A = (ΩA, ΣA, μA) と書きます。確率空間Aもバナッハ空間Vも可測空間とみなせるので、可測写像全体の集合Meas((ΩA, ΣA), (V, Borel(V))を作れます。確率空間Aは測度空間なので、A上でバナッハ空間値関数の積分(ボホナー積分)ができます。可測写像 u∈Meas((ΩA, ΣA), (V, Borel(V)) のノルムを取った実数値関数がA上で積分できて値が有限値のとき、u∈L1(A, V) だと決めます -- これは、確率空間Aとバナッハ空間Vに対して新しいバナッハ空間L1(A, V)を定義したことになります。
f:A→B in Prob と ψ:V→W in Ban に対して、L1(f, φ):L1(B, V)→L1(A, W) も定義できて、L1は Probop×Ban→Ban という二項関手になります。
二項関手 L1:Probop×Ban→Ban をカリー化(ラムダ抽象)すると、ΛL1:Ban→[Probop, Ban]です。この[Probop, Ban]は、“Banに値を取る前層の圏”と言っていいでしょうから、PShBan(Prob) と書くことにします。すると:
- ΛL1:Ban→PShBan(Prob)
ΛL1は確率変数概念と呼んでいいでしょう。確率変数概念ΛL1に、値の空間であるバナッハ空間Vを渡すと、(ΛL1)(V)というBan値前層ができます。さらにこの前層(関手)に確率空間Aを渡すと、A上のV値可測関数の全体 (ΛL1)(V)(A) = L1(A, V) が生じます。(ΛL1)(V)(A)は単なる集合ではなくてバナッハ空間です。バナッハ空間(ΛL1)(V)(A)の要素が狭義のV値確率変数(=測度論的確率変数)です。
次のステップを踏んで「確率変数」が具体化・特定化されていきます。
- 二項関手 L1
- 確率変数概念 ΛL1
- 値の空間を特定した確率変数概念 (ΛL1)(V)
- 測度論的確率変数の集合 (ΛL1)(V)(A) (単なる集合ではなくてバナッハ空間)
- 特定の測度論的確率変数 X∈(ΛL1)(V)(A) (可測写像からなるバナッハ空間の要素)
プロ関手を楽観的に捉える
一般に、C, Dを圏として、Dop×C→Set という形の二項関手をプロ関手(profunctor)と呼びます。プロ関手 F:Dop×C→Set を、F:C+→D と書くことがあります。そのココロは、Fを“CからDへの何らかの射”とみなしているのです。プロ関手が射であるとは、2つのプロ関手 F:C+→D, G:D+→E に対して、結合(図式順結合を'*'で表す) F*G:C+→E や、恒等プロ関手IdCが定義できるということです。
小さい圏を対象として、そのあいだのプロ関手を射とする圏Profがチャンと定義できることは知られています。大きな圏を認めるとどうなんでしょう? 大きな圏を無条件に許すのはたぶんダメでしょう。"accessible category"とか"locally presentable category"とかの議論が必要なんでしょう、よく知らんけど。
楽観的に考えて、ProbやMeasを対象としてもいいようなプロ関手の圏PROFがあるとしましょう。すると、確率変数概念のモト(源泉)である二項関手は、HomProb:Prob+→Prob, H:Meas+→Prob in PROF と書けます。さらに楽観的な大風呂敷を広げると、超巨大な圏PROFは、前層構成PSh(-)をモナド乗法、米田埋め込みy-をモナド単位とする超巨大なモナド(米田モナドと呼ぶべきかな)のクライスリ圏のはずです。したがって、プロ関手 F:C+→D を二項関手とみなしてカリー化したΛFは、プロ関手としてのFをクライスリ射として表現した形 C→PSh(D) です。
前段落の楽観的法螺を完全に実現するのは難しいでしょうが、ProbやMeasを扱う最小限のメカニズムは整備できると思います。一般論は夢想の彼方でも、具体的な圏に対する具体的な構成ができれば、とりあえずはOKです。
F:C+→D in PROF とは、F:Dop×C→Set in CAT のことでした。Setを別な圏Eに変えた F:Dop×C→E in CAT も(広義の)“プロ関手”と言ってもいいでしょう。ただし、Eとして任意の圏を取れるわけではありません。おそらく、Eとしてベナボー・コスモス(Bénabou cosmos)あたりを選べばいいんでしょう。
このEは、豊饒圏(enriched category)を作るときの豊饒化ベース圏(enriching category)と同じ役割を担います。なので、SetをEに変えたプロ関手はE-豊饒プロ関手と呼んでよいかと。そのことは次の記事に書きました。
前節の二項関手 L1:Probop×Ban→Ban は、プロ関手 L1:Ban+→Prob とみなせるでしょうが、単なるプロ関手ではなくて、Ban-豊饒プロ関手です。別な書き方をすると、L1∈Ban-PROF(Ban, Prob)。
確率変数の圏論的構造
C, Dが大きいかも知れない(が、タチの良い)圏、Eはコスモス的条件を満たす圏だとして、次の3つは同じものを表現しています。
- 二項関手 F:Dop×C→E in CAT
- 前層の圏への単項関手 ΛF:C→PShE(D) in CAT
- 豊饒プロ関手 F':C+→D in E-PROF
今まで出した確率変数概念の3つの例では:
C | D | E | F |
Prob | Prob | Set | HomProb |
Meas | Prob | Set | H |
Ban | Prob | Ban | L1 |
確率の話なので、D = Prob は固定されてますが、Probにもバリエーションはあります。例えば、確率空間の台を集合ではなくてポーランド空間にすれば、D = PolishProb(ポーランド空間上の確率空間の圏) となるでしょう。リーマン多様体上の確率論なんてのもあるみたいですから、D = RieManProb(リーマン多様体上の確率空間の圏)という設定もアリでしょう。あるいは、順列組み合わせだけで解ける確率的問題を定式化するなら、有限集合を台とする確率空間の圏FinProbが相応しい場となるでしょう。
さまざまな確率変数概念の一般的枠組には次の3つの圏が出てきます。
- C : 対象が、確率変数の値の領域である圏
- D : 対象が、確率空間である圏
- E : 対象が、(速度論的)確率変数の集合である圏
この三組のあいだに二項関手 F:Dop×C→E in CAT があれば、それをカリー化して確率変数概念(notion of random variable)を定義できます。必要があれば、Fを豊饒プロ関手とみなすこともできます。
以上の枠組を用いれば、「確率変数」の謎で多様な用法に解釈を与え整理することが(ある程度は)できるでしょう -- そう、「確率変数」の一般論は可能なように思います。