このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

有限離散マルコフ核に関する注意

マルコフ核: 確率計算のモダンな体系」にて:

積分記号 \int と“微分”記号  dx を使って書いてますが、離散の場合でも通用する話なので、離散の場合は和分記号〈総和記号〉 \sum と“差分”記号 \delta x または \Delta x に書き換えてください。

これを実行するときの注意を幾つか述べておきます。

内容:

有限離散確率圏

最初に、集合圏Setを可測空間の圏Measに埋め込む関手 Disc:SetMeas を定義します。

  • For A∈|Set|, Disc(A) := (A, Pow(A))

ここで、Pow(A) はAのベキ集合をシグマ集合代数とみなしたものです。(A, Pow(A)) の形の可測空間を、台集合がAである離散可測空間〈discrete measurable space〉と呼びます。任意の写像 f:A→B in Set は、離散可測空間のあいだの写像 f:Disc(A)→Disc(B) in Meas とみなせるので、Disc(f) = f と定義することで、関手 Disc:SetMeas が得られます。

有限集合の圏をFinSet、台集合が有限集合である可測空間の圏をFinMeasとします。当然に FinMeasMeas。関手DiscをFinSet上に制限した関手を同じ記号で Disc:FinSetFinMeas と書きます。

Discは埋め込み関手なので、Disc(FinSet) は FinMeas の部分圏になりますが、広い部分圏〈wide subcategory〉にはなりません。例えば、可測空間 ({1, 2}, {{}, {1, 2}}) は、Discの像(つまり離散可測空間)にはなりません。

FinMeasの“広くはない”部分圏 Disc(FinMeas) を有限離散可測空間〈finite discrete measurable space〉と呼び、FinDiscMeas := Disc(FinMeas) と置きます。

Meas上に作ったジリィ確率圏(ジリィモナドのクライスリ圏)をStocとして、対象を|FinDiscMeas|に制限したStocの充満部分圏を、FinDiscStocとします。

FinDiscStocの射はマルコフ核ですが、対象が有限離散可測空間なので、通常の行列・テンソルの計算で処理できます。行列・テンソルのサイズが小さいなら手計算も可能です。

有限離散の場合の書き方

マルコフ核とその被積分形式〈integrand form〉を同一視はしませんが、名前のオーバーロードはします。つまり:

  •  F = \lambda (x, B)\in X\times \Sigma Y. {\displaystyle \int_{y \in B\subseteq Y} F(dy \mid x)}

もう一度言います。 F = F(dy \mid x) と書いたり考えたりはしません -- 安易な同一視は事故のもと。

一般論では積分記号と被積分形式を使いますが、有限離散の場合は和分記号〈総和記号〉と被和分形式〈summand form〉を使うのが自然でしょう。

一般の場合 有限離散の場合
変数 x, y 変数  i, j
積分形式 F(dy \mid x) 被和分形式  F(\delta j \mid i)
積分形式 F(dz \mid x, y) 被和分形式  F(\delta k \mid i, j)
積分 \int_{x\in X} 和分 \sum_{i \in I}
一部分での積分 \int_{x\in A\subseteq X} 一部分での和分 \sum_{i \in A\subseteq I}

これは常識的な記号の運用ルールだと思いますが、僕は、集合(可測空間)の名前や変数名は、一般の場合も有限離散の場合も区別していません。別な名前に分けようとすると、アルファベット文字をすぐ消費してしまうので。

有限離散の場合で変更しているのは、積分記号→和文記号、d→δ だけです。

  •  F = \lambda (x, B)\in X\times \Sigma Y. {\displaystyle \sum_{y \in B\subseteq Y} F(\delta y \mid x)}

[補足]
 \delta x でδを使ってしまうと、ディラックのデルタやクロネッカーのデルタとの記号衝突が置きます。Δにすると、今度は対角射の記号と衝突します。ディラッククロネッカーのデルタも対角射もめちゃくちゃよく使うので困ります。が、どうやっても記号衝突は避けられないので、「しょうがない」と諦めるしかありません。

和分も積分の一種なので、いっそのこと有限離散を特別扱いしないで、 \int, \; dx だけで押し通すのも良いと思います。
[/補足]

点引数と事象引数

dx に対応する書き方 \delta x を使ってますが、この書き方は見かけないでしょう。しかし、マルコフ核を有限離散で考えているときは、是非使ってください。そうでないと、測度と関数の区別が付かずに混乱と誤解の原因になります。

積分形式に現れる dx の直感的解釈は無限小事象で、ほんとのところ意味不明です(とりあえずは記号的存在物と考える)。しかし、有限離散の場合の  \delta x は実体として意味付け可能です。

有限離散可測空間 (X, ΣX) において、ΣX = Pow(X) でした。単元集合〈singleton set〉の集合を Σ1X とします。例えば、X = {1, 2} のとき Σ1X = {{1}, {2}} です。 \delta x は、Σ1X 上を走る変数と解釈します。X = {1, 2} だとして:

  • 変数 x の取る値は、x = 1 または x = 2
  • 変数 δx の取る値は、δx = {1} または δx = {2}

大事なことは、点(集合の要素)と単元集合(ベキ集合の要素)を同一視しないことです。変数の運用法は:

  • 変数 x は、Xの点を表す。
  • 変数 δx は、Σ1X の要素=基本事象 を表す。
  • 変数 A は、ΣX の要素=事象 を表す。

δx の意味は無限小事象じゃなくて基本事象〈根本事象〉なので、ハッキリとした実体があります。

被和分形式  F(\delta y \mid x) では、 \delta y が基本事象引数、x が点引数です。基本事象とは限らない事象を引数に入れてもよくて、その場合は:

  •  F(B \mid x) = {\displaystyle \sum_{y \in B \subset Y} F(\delta y \mid x) }

テンソル計算の上下添字を使いたいなら、点引数を下付き、事象引数を上付きにします。

  •  F^B_x = {\displaystyle \sum_{y \in B \subset Y} F^{\delta y}_x }

チャップマン/コルモゴロフ結合は:

  •  (G\odot F)^C_x = {\displaystyle \sum_{y \in Y} G^C_y F^{\delta y}_x }

基本事象 \delta z に関してなら:

  •  (G\odot F)^{\delta z}_x = {\displaystyle \sum_{y \in Y} G^{\delta z}_y F^{\delta y}_x }

対角線位置に y と δy が出現したら和分〈総和〉するという“アインシュタインの規則”を採用するなら:

  •  (G\odot F)^{\delta z}_x =  G^{\delta z}_y F^{\delta y}_x

アインシュタインの規則は便利ですが、混乱もしますからホドホドに。