このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

何故にあえて確率を学ぶのか?

昨日の記事「何故にあえてJ言語を学ぶのか?」のタイトルの「J言語」を、「確率」に置換してみました。J言語のマイナーさに比べれば、確率論はメジャーな学問です。でも、僕にとっては難解という点では共通です。

確率論の枠組もよく分かりませんが、個々の具体例も難しい! 「ベルトランの箱」「バナッハのマッチ箱」「ポリアの壺」「エーレンフェストの壺」とか、なぜか「人名+容器」で命名された著名な問題群がありますが、理解も計算も出来ません、苦手だ。

そんな僕の確率学習に対する動機は、超フィルター(ultrafilter)と確率遷移系(stochastic/probabilistic transition system)です。

集合X上の超フィルターは、標本空間X上の確率測度との類似性があります(「超フィルター(ultrafilter)って何なんだ: 点? 確率測度?」参照)。そして、集合Xにその超フィルター拡張UF(X)を対応させる関手をベースにモナドを作れます(「超フィルターモナドの位相的な解釈」参照)。UF(X)はXの拡張なので、X⊆UF(X) とみなすことができて、もともとのXには存在しなかった超準な点を追加したのがUF(X)です。

可測空間X上の確率測度の全体をPM(X)とすると、PM(X)は超フィルター拡張モナドと似た性質を持つのではないか? と期待できます。実際、三十数年前、1981年にミシェル・ジリィ(M. Giry)がポーランド空間*1の圏の上に、現在、ジリィ・モナドと呼ばれるモナドを構成しています。

また、それよりさらに二十年ほど前の1962年、ローヴェル(Lawvere)は、公開はされなかった論文 "The category of probabilistic mappings" で、確率写像の圏を定義しているようです。ローヴェルの確率写像の圏は、ジリィ・モナドのクライスリ圏だと思ってもいいようです(たぶん)。

なんらかの条件を付けて扱いやすくした可測空間&可測写像の圏をMとして、M上のジリィ・モナドが構成できたとして、それを G = (PM, μ, η) とします。ジリィ・モナドGのモナド単位 ηX:X→PM(X) は、Xの点をディラック測度として確率測度とみなすものです。モナド乗法 μX:PM(PM(X))→PM(X) は、あんまりよく分からんのですが、関数空間上の積分のようなものかと。ともかく、圏M上のジリィ・モナドGによるクライスリ圏をPとします。

Pの射が、(おそらくは)ローヴェルの言う確率写像(probabilistic mappings)です。確率写像確率関係(stochastic relations)と呼ばれることもあります。なぜなら、Pの射は、集合のあいだの関係を測度化・確率化したものとみなせるからです。おおよそ、次の対応関係があります。(確率関係と確率写像は同義です。)

普通の関係圏 確率関係圏
集合 測度空間
写像 可測写像
部分集合 確率測度
べき集合モナド ジリィ・モナド
関係 確率関係

単なるべき集合モナドより、空集合を除いたべき集合を考えたほうがジリィ・モナドに近いかも知れません。一方、ジリィ・モナドを拡張して、未定義を許す確率部分写像(確率部分関係)を定義することもできます。

関係圏Relが、集合圏Setの上の共変べき集合モナドPowのクライスリ圏(と圏同値)であるのと同様に、確率関係圏(=確率写像圏)PM上のジリィ・モナドGのクライスリ圏なのです。

Sを関係圏Relの対象(単なる集合)として、自己射 f:S→S in Rel は、非決定性遷移系の生成作用素となります。f0 = idS, f1 = f, f2 = f;f, f3 = f;f;f, ... という系列が、離散時間パラメータ 0, 1, 2, 3... に沿った非決定性の時間発展を表します。同様に、確率関係圏Pにおける自己射fは確率遷移系の生成作用素となります。fの繰り返し結合(iteration)f0, f1, f2, f3, ... は離散時間マルコフ過程を表すはずです。

特にSがn個の要素からなる有限集合のときは、圏Pの自己射 f:S→S は、n次の確率遷移行列となります。通常のモナドの理論では、ジリィ・モナドGが有限集合の圏からはみ出すのでうまくないですが、アルテンキルヒ等の相対モナドを使うと、有限集合の圏だけで自己完結的に(正方行列とは限らない)確率遷移行列の圏を構成できるかもしれません(未確認、アヤシイ)。

ところで、確率遷移行列の列ベクトルは、成分が非負で総和ノルムが1のベクトルです。つまり、ノルム球と正錐(非負錐と言うべきか?)の共通部分、正球面とでも呼ぶべき図形に入るベクトルです。そういう正単位ベクトルを何個か並べると(正方行列とは限らない)確率遷移行列が出来るわけです。

ここで、総和ノルム以外、二乗和ノルム(ユークリッドヒルベルト・ノルム)とか最大値ノルムでも同じような議論ができるでしょう。ノルムの変更を、「マスロフ式算数がやたらに面白いんですけど」で述べたプランク定数(の逆数)でパラメトライズしたらなんか面白いような気もします(面白くなくてもワタシャ知らないけど)。

確率遷移行列の積の公式を連続化すると、チャップマン-コルモゴロフの公式でしょうが、これを確率関係圏の枠組みで考えるとどうなるのでしょうかね? 離散時間マルコフ過程の1ステップが圏の射ですから、連続時間なら無限小な射が必要そうです。「無限小な射」って、それなに?

なんだかよく分からないことばかりですが、少しでも分かると楽しいかも知れないので、確率の勉強をしようかな、と。

最後に参考文献:

*1:ポーランド空間とは、第二可算公理を満たす、孤立点を持たない、完備距離化可能空間だそうで。