このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

「確率変数」の一般論は可能か

確率変数について2つの記事を書きました。

「確率変数」という概念をもう少し一般化できそうな気がしてきました。

内容:

  1. ニ項関手をカリー化したら確率変数
  2. バナッハ空間に値を取る確率変数
  3. プロ関手を楽観的に捉える
  4. 確率変数の圏論的構造

ニ項関手をカリー化したら確率変数

「確率変数」の変種:測度に縛られない確率変数」で述べたことを手っ取り早く復習すると:

  • ニ項関手 HomProb:Probop×ProbSet のカリー化(ラムダ抽象)Λ(HomProb)は、「確率変数」概念の実体とみなせる。
  • ニ項関手 H:Probop×MeasSet のカリー化(ラムダ抽象)ΛHは、「無制約確率変数」概念の実体とみなせる。ここで、H(A, M) := Meas((Aの台となる可測空間), M)/(測度0の集合を除いて一致する)。

この2つで共通しているのは、Probop×CSet という二項関手があり、その二項関手のカリー化として確率変数概念が得られることです。1番目では C = Prob、2番目では C = Meas となっています。Cをもっと別な圏に取り替えると、確率変数(の概念)の変種がもっと作れるでしょう。

Cだけでなくて、ニ項関手の値の圏であるSetも他の圏に変更してもよさそうです。実際に、Setも取り換えて第3の例を作ってみます(次節)。

バナッハ空間に値を取る確率変数

以下に述べる例は「モノイド自然変換としての積分: 大雑把に」の例とよく似たものです。

Banをバナッハ空間と連続線形写像(=有界線形写像)の圏とします。バナッハ空間はノルムから距離が入り位相空間となるので、ボレルσ集合代数を作れます。バナッハ空間Vのボレルσ集合代数をBorel(V)と書くことにします。

Prob対象Aは確率空間なので、A = (ΩA, ΣA, μA) と書きます。確率空間Aもバナッハ空間Vも可測空間とみなせるので、可測写像全体の集合Meas((ΩA, ΣA), (V, Borel(V))を作れます。確率空間Aは測度空間なので、A上でバナッハ空間値関数の積分ボホナー積分)ができます。可測写像 u∈Meas((ΩA, ΣA), (V, Borel(V)) のノルムを取った実数値関数がA上で積分できて値が有限値のとき、u∈L1(A, V) だと決めます -- これは、確率空間Aとバナッハ空間Vに対して新しいバナッハ空間L1(A, V)を定義したことになります。

f:A→B in Prob と ψ:V→W in Ban に対して、L1(f, φ):L1(B, V)→L1(A, W) も定義できて、L1Probop×BanBan という二項関手になります。

二項関手 L1:Probop×BanBan をカリー化(ラムダ抽象)すると、ΛL1:Ban→[Probop, Ban]です。この[Probop, Ban]は、“Banに値を取る前層の圏”と言っていいでしょうから、PShBan(Prob) と書くことにします。すると:

  • ΛL1:Ban→PShBan(Prob)

ΛL1は確率変数概念と呼んでいいでしょう。確率変数概念ΛL1に、値の空間であるバナッハ空間Vを渡すと、(ΛL1)(V)というBan値前層ができます。さらにこの前層(関手)に確率空間Aを渡すと、A上のV値可測関数の全体 (ΛL1)(V)(A) = L1(A, V) が生じます。(ΛL1)(V)(A)は単なる集合ではなくてバナッハ空間です。バナッハ空間(ΛL1)(V)(A)の要素が狭義のV値確率変数(=測度論的確率変数)です。

次のステップを踏んで「確率変数」が具体化・特定化されていきます。

  1. 二項関手 L1
  2. 確率変数概念 ΛL1
  3. 値の空間を特定した確率変数概念 (ΛL1)(V)
  4. 測度論的確率変数の集合 (ΛL1)(V)(A) (単なる集合ではなくてバナッハ空間)
  5. 特定の測度論的確率変数 X∈(ΛL1)(V)(A) (可測写像からなるバナッハ空間の要素)

プロ関手を楽観的に捉える

一般に、C, Dを圏として、Dop×CSet という形の二項関手をプロ関手(profunctor)と呼びます。プロ関手 F:Dop×CSet を、F:C+→D と書くことがあります。そのココロは、Fを“CからDへの何らかの射”とみなしているのです。プロ関手が射であるとは、2つのプロ関手 F:C+→D, G:D+→E に対して、結合(図式順結合を'*'で表す) F*G:C+→E や、恒等プロ関手IdCが定義できるということです。

小さい圏を対象として、そのあいだのプロ関手を射とする圏Profがチャンと定義できることは知られています。大きな圏を認めるとどうなんでしょう? 大きな圏を無条件に許すのはたぶんダメでしょう。"accessible category"とか"locally presentable category"とかの議論が必要なんでしょう、よく知らんけど。

楽観的に考えて、ProbMeasを対象としてもいいようなプロ関手の圏PROFがあるとしましょう。すると、確率変数概念のモト(源泉)である二項関手は、HomProb:Prob+→Prob, H:Meas+→Prob in PROF と書けます。さらに楽観的な大風呂敷を広げると、超巨大な圏PROFは、前層構成PSh(-)をモナド乗法、米田埋め込みy-モナド単位とする超巨大なモナド(米田モナドと呼ぶべきかな)のクライスリ圏のはずです。したがって、プロ関手 F:C+→D を二項関手とみなしてカリー化したΛFは、プロ関手としてのFをクライスリ射として表現した形 C→PSh(D) です。

前段落の楽観的法螺を完全に実現するのは難しいでしょうが、ProbMeasを扱う最小限のメカニズムは整備できると思います。一般論は夢想の彼方でも、具体的な圏に対する具体的な構成ができれば、とりあえずはOKです。

F:C+→D in PROF とは、F:Dop×CSet in CAT のことでした。Setを別な圏Eに変えた F:Dop×CE in CAT も(広義の)“プロ関手”と言ってもいいでしょう。ただし、Eとして任意の圏を取れるわけではありません。おそらく、Eとしてベナボー・コスモス(Bénabou cosmos)あたりを選べばいいんでしょう。

このEは、豊饒圏(enriched category)を作るときの豊饒化ベース圏(enriching category)と同じ役割を担います。なので、SetEに変えたプロ関手はE-豊饒プロ関手と呼んでよいかと。そのことは次の記事に書きました。

前節の二項関手 L1:Probop×BanBan は、プロ関手 L1:Ban+→Prob とみなせるでしょうが、単なるプロ関手ではなくて、Ban-豊饒プロ関手です。別な書き方をすると、L1Ban-PROF(Ban, Prob)。

確率変数の圏論的構造

C, Dが大きいかも知れない(が、タチの良い)圏、Eはコスモス的条件を満たす圏だとして、次の3つは同じものを表現しています。

  1. 二項関手 F:Dop×CE in CAT
  2. 前層の圏への単項関手 ΛF:C→PShE(D) in CAT
  3. 豊饒プロ関手 F':C+→D in E-PROF

今まで出した確率変数概念の3つの例では:

C D E F
Prob Prob Set HomProb
Meas Prob Set H
Ban Prob Ban L1

確率の話なので、D = Prob は固定されてますが、Probにもバリエーションはあります。例えば、確率空間の台を集合ではなくてポーランド空間にすれば、D = PolishProbポーランド空間上の確率空間の圏) となるでしょう。リーマン多様体上の確率論なんてのもあるみたいですから、D = RieManProb(リーマン多様体上の確率空間の圏)という設定もアリでしょう。あるいは、順列組み合わせだけで解ける確率的問題を定式化するなら、有限集合を台とする確率空間の圏FinProbが相応しい場となるでしょう。

さまざまな確率変数概念の一般的枠組には次の3つの圏が出てきます。

  1. C : 対象が、確率変数の値の領域である圏
  2. D : 対象が、確率空間である圏
  3. E : 対象が、(速度論的)確率変数の集合である圏

この三組のあいだに二項関手 F:Dop×CE in CAT があれば、それをカリー化して確率変数概念(notion of random variable)を定義できます。必要があれば、Fを豊饒プロ関手とみなすこともできます。

以上の枠組を用いれば、「確率変数」の謎で多様な用法に解釈を与え整理することが(ある程度は)できるでしょう -- そう、「確率変数」の一般論は可能なように思います。