このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

マルコフ核: 確率計算のモダンな体系

この記事は、5年前(2015-06-04)に書いた次の記事を再整理・敷衍したものです。もとの過去記事を参照する必要はありません*1

まず、「マルコフ核」の同義語が山のように(少なくとも20個は)あることは、次の記事を参照:

同義語が何十個もあるということは、歴史的に何度も再発見・再認識されていることを示唆します。それだけ重要な概念なのです。にも関わらず、今でも名前はバラバラのままで、まとまった情報源も少ないようです。

確率の計算は、離散の場合も連続の場合も、マルコフ核の計算だと言えます。マルコフ核の計算が出来れば、たいてい間に合います。すげー便利よ、マルコフ核。

この記事は、マルコフ核のちゃんとした解説ではなくて、チートシート、公式集という位置付けです。短い節から構成されるので目次は長いですが、それに比べて全体の分量は少ないです(ブログ記事としては長いけど) -- 説明が雑だからね。現時点〈2020-06-24〉では書き残しがあります、「To Be Described」参照。

積分記号 \int と“微分”記号  dx を使って書いてますが、離散の場合でも通用する話なので、離散の場合は和分記号〈総和記号〉 \sum と“差分”記号 \delta x または \Delta x *2に書き換えてください。

使っている文字修飾の凡例:

  • 重要語: 定義した用語、または定義はしてないが初出の重要語
  • 既出の語: 既に定義している、または出現している用語 (この修飾の使用は全然徹底してなくてイイカゲンです。後で見直したい。)
  • 強調: その他の強調

内容:

予備知識

測度論的積分の知識が必要です。が、定義と概念をザッと知ってるくらいでも大丈夫です。この節で言葉と記法の確認をしますが、定義はだいたい省略してます。この「予備知識」節に書いてあることを知らないとマルコフ核の計算ができないわけではありません。より詳しいことは、必要に応じて、Wikipediaや次のようなサイトを手がかりに調べることができます。

可測空間と可測写像

可測空間〈measurable space〉は (X, ΣX) のように書きます。Xは台集合〈uderlying set〉で、ΣXシグマ集合代数sigma algebra of subsets〉です。記号の乱用で X = (X, ΣX) とも書きます。X が可測空間なのか、それとも台集合なのかは文脈で判断してください。Xのシグマ集合代数 ΣX を、Σ(X) または ΣX とも書きます*3

ΣX の要素は可測集合〈measurable {set | subset}〉ですが、事象〈event〉とも呼びます。「事象とはなんぞや」とか考え込まないで、単に可測集合(ΣX の要素)の同義語だと割り切りましょう。いつでも「事象←→可測集合」と交換可能〈interchangeable〉です*4

可測空間と可測写像〈measurable map〉の圏をMeasと書きます。Measには、扱いにくい可測空間も含まれるので、“たちの良い”可測空間だけに制限しましょう。たちの良い可測空間の圏として、次の2つが考えられます(他にもあるかも知れないが*5)。

  1. 標準ボレル空間〈standard Borel spaces〉と可測写像の圏 SBorel
  2. 可算生成可測空間〈countably generated measurable spaces〉と可測写像の圏 CGMeas

この記事では、Measを使うことはなく、SBorelCGMeasのどちらかを使います。以下、Mは、SBorelCGMeasのどちらかを表す記号とします -- Mは変数記号ですが、任意の圏を表すわけではありません。

有界可測関数環/半環

R(可測空間とみなす)に値を持つ可測関数 f:X→R in M有界(絶対値が有界)なもの全体からなる集合を Φ(X) とします。Φ(X) を L(X) と書く人もいますが、Lp記法は p = ∞ 以外では意味がない(Xに標準測度が載ってない)ので、ここでは L(X) は使いません。

Rが持っている順序と代数演算から、Φ(X) も順序可換環の構造を持ちます。Φ(X) は、(必要に応じて)順序可換環とみなすことにします。また、最大値ノルムを取れるので、(必要に応じて)可換ノルム環ともみなします*6。適宜、必要となった構造を付与したΦ(X)を有界可測関数環〈bounded measurable function ring〉と呼ぶことにします(ちょっと曖昧な言葉です)。Φ(X) を ΦX とも書きます。

f∈ΦX で、∀x∈X.(0 ≦ f(x)) を満たすもの全体を Φ≧0(X) = Φ≧0X と書きます。Φ≧0(X) はR上のベクトル空間にはなりませんが、ベクトル錐〈vector cone〉にはなります。順序可換半環R≧0を係数半環とする可換半環構造を持ちます。

適当な構造を付与したΦ≧0(X)を非負値有界可測関数半環〈non-negative-valued bounded measurable function semiring〉と呼ぶことにします。今回は、だいたいΦXを使ってますが、ΦXよりΦ≧0Xを考えたほうが相応しい状況もあります。

ファジー述語代数

f∈ΦX で、∀x∈X.(0 ≦ f(x) ≦ 1) を満たすもの全体を Φ[0, 1](X) = Φ[0, 1]X と書きます。Φ[0, 1]X の要素をファジー述語〈fuzzy predicate〉と呼びます。

ファジー述語の集合 Φ[0, 1]X では、掛け算と部分演算としての足し算以外に、∧(小さいほう), ∨(大きいほう), ¬(1との差)により論理演算を導入できます。

Φ[0, 1]X は、効果代数effect algebra〉の構造も持ちます。が、効果代数の標準的な記法では、∨ が制限された足し算(部分演算)なので、記号の意味・運用には注意してください。今回は、効果代数に関する議論は出てきません、紹介しただけ。

論理代数、または効果代数としての構造を備えた Φ[0, 1]X をファジー述語代数〈fuzzy predicate algebra〉と呼ぶことにします。これも、代数構造をハッキリとは指定してないので曖昧な言葉です(ファジーだけに -- って、違うわい)。

値が0か1に限られる(中間の値を取らない)ファジー述語を{決定性 | シャープ | クリスプ}述語〈{deterministic | sharp | crisp} predicate〉と呼びます。古典論理で使っている述語はこのタイプの述語です。決定性述語の全体を Φ{0, 1}X と書きます。下付きの [0, 1] と {0, 1} は判読しにくいのでご注意(別な記法にしろってハナシはある)。

指示関数=指示述語

A∈ΣX に対して、χA:X→R指示関数〈indicator function | characteristic function | 特性関数〉とします(文字'χ'はギリシャ文字カイ)。確率論では、別な意味の特性関数があるので、「指示関数」のほうを使いましょう。χA を χ[A] とも書きます。

(A \mapsto χ[A]) は、ΣX→ΦX という写像を定義しますが、χ[A] の値は0か1なので、決定性述語です。したがって、χ:ΣX→Φ{0, 1}X とみなせます。指示関数は指示述語〈indicator predicate〉でもあります。「事象は決定性述語なり」と言えます。

ラムダ記法

ラムダ計算/ラムダ記法〈lambda calculus / lambda notation〉については、このブログ内にいっぱい記事がありますが、例えば、次の記事から幾つか参照されています。

ここで使うことは; 写像 f:X→Y in Set に対して次のように書けることです。

  • f = λx∈X.f(x)

二変数〈ニ引数〉関数 f:X×Y→Z in Set ならば、次のように書けます。

  • f = λ(x, y)∈X×Y.f(x, y)

変数を含む(含まなくてもいいのだけど)式 E から λx∈X.E のような“関数を表す式”を作ることをラムダ抽象〈lambda abstraction〉といいます。

カリー化、反カリー化

f:X×Y→Z in Set に対して、X∋x \mapsto λy∈Y.f(x, y) で定義される関数〈写像〉をfのカリー化〈currying〉と呼びます*7。fのカリー化のプロファイル(域と余域)は X→[Y→Z] です。ここで、[Y→Z] は Set(Y, Z) をSetの対象(つまり集合)とみなしたものです*8

f:X×Y→Z のカリー化を f:X→[Y→Z] と書きます。f と書くこともあります。ハット()もキャップ()も帽子なので、「カリー化は帽子をかぶる」と憶えましょう。帽子は頭にかぶるので上付きです。

g:X→[Y→Z] に対して、λ(x, y)∈X×Y.g(x)(y) で定義される X×Y→Z という関数〈写像〉を、gの反カリー化〈uncurrying〉と呼びます。gの反カリー化は g または g と書きます。「反カリー化は帽子を脱ぐ」と憶えましょう。脱いだ帽子は逆さまにして足元に置きます。

カリー化/反カリー化の操作それ自体は、Curry:[X×Y→Z]→[X→[Y→Z]], Uncurry:[X→[Y→Z]]→[X×Y→Z] という関数になります*9。カリー化と反カリー化は互いに逆な関数です。つまり、(f) = f, (g) = g *10

SetではなくてMでも同様にカリー化/反カリー化を定義できます。ただし、[X→Y] が可測空間になる必要がありますが、いつでもうまく [X→Y] が作れるとは限りません*11。うまくいく範囲でやりくりします。

書字順記法と反書字順記法

射の結合の書き方には、図式順記法(例えば f;g)と反図式順記法(例えば g\circf)があります。引数渡しも同じく図式順記法(例えば x.f)と反図式順記法(例えば f(x))があります。

複数の引数を渡すときは、引数達をリストにしますが、引数の順番を書いたまま(左から右)に解釈する場合は書字順記法〈script order notation〉、書いた順と逆順(右から左)に見る場合は反書字順記法〈anti-script order notation〉と呼ぶことにします。

反書字順記法には、引数区切り記号に縦棒を使うことにします。例えば:

  • f(y | x) = f(x, y)
  • g(z | y | x) = g(x, y, z)

書字順記法と反書字順記法を混ぜることもあります。

  • f(z | x, y) = f((x, y), z)
  • g(y, z | x) = g(x, (y, z))
ジリィ関手

X∈|M| に対して、Giry(X) = {P | PはX上の確率測度} と定義します。確率測度〈probability measure〉とは、P(X) = 1 である測度です。

可測写像 f:X→Y in M に対して、Giry(f):Giry(X)→Giry(Y) を次のように定義します。

  • For given P∈Giry(X), Giry(f)(P) := λB∈ΣY.P(f-1(B))

ここで、'λ'はラムダ計算のラムダで、f-1 は(逆写像ではなくて!)逆像です。

Giryは、とりあえず MSet という関手になります。がんばってゴニョゴニョすると、Giry(X)に可測空間の構造を入れられるので、Giry:MM という自己関手とみなせます。この自己関手をジリィ関手〈Giry functor〉と呼びます。

ジリィ関手は、ジリィモナド〈Giry monad〉の台関手〈underlying functor〉ですが、今回、そのことは気にしなくていいです。

記号のだいたいの約束

  • X, Y, Z など: 可測空間
  • f, g, h など: 可測写像
  • A, B, C など: 事象〈可測集合〉
  • F, G, H など: マルコフ核
  • P, Q, R など: ランダム要素〈確率測度〉
  • φ, ψ, ρ など: 実数値、または非負実数値有界可測関数
  • α, β, γ など: ファジー述語(今回使ってないな)
  • M : 可測空間と可測写像の圏、M = SBorel または M = CGMeas
  • S : 可測空間とマルコフ核の圏、S = SBorelStoc または S = CGMeasStoc

マルコフ核の定義

マルコフ核の直感的な意味は、「分布から拡散へ: ミシェル・ジリィを巡って // 分布を寄せ集めると」で説明しています。拡散する粒子に例えています。以下にフォーマルな定義。

X, Y∈|M| として、XからYへのマルコフ核〈Markov kernel from X to Y〉とは、F:X×ΣY→[0, 1] という写像で、次を満たすものです。

  1. x∈X を固定すると、ΣY∋B \mapsto F(x, B)∈[0, 1] は、Y上の確率測度になる。
  2. B∈ΣY を固定すると、X∋x \mapsto F(x, B)∈[0, 1] は、X→[0, 1] の可測写像になる。

FがXからYへのマルコフ核のとき、F:X →* Y と書きます。ただし、後でマルコフ核は圏MStocSBorelStocまたはCGMeasStoc)の射だとわかるので、F:X→Y in MStoc普通の矢印で書かれることも多いです。この記事では、なるべく「→*」を使います。

マルコフ核の一番目の条件から、マルコフ核Fをカリー化すると、F:X→Giry(Y) という写像になります。二番目の条件を考慮すると、Fは、可測構造を備えたGiry(Y)への可測写像になります。つまり、

  • F:X→Giry(Y) in M

マルコフ核のラムダ記法表示

ラムダ記法の一般的規則から、マルコフ核を次のように書けます。

  • F = λ(x, B)∈X×ΣY.F(x, B) : X×ΣY→[0, 1]

Fのカリー化は次のようです。

  • F = λx∈X.λB∈ΣY.F(x, B) : X→Giry(Y)

xとBという2つの引数渡しを反書字順記法で書くと:

  • F = λ(x, B)∈X×ΣY.F(B | x) : X×ΣY→[0, 1]
  • F = λx∈X.λB∈ΣY.F(B | x) : X→Giry(Y)

xとBの順番はどうであれ:

  • xをマルコフ核の点引数〈point argument〉と呼びます。(xは空間Xの点だから。)
  • Bをマルコフ核の事象引数〈event argument〉と呼びます。(Bは空間Y上の事象だから。)

マルコフ核は、域側の点引数と余域側の事象引数を持ちます。

積分表示と被積分形式

マルコフ核 F:X →* Y の、x∈X, B∈ΣY に対する値 F(x, B) = F(B | x) = F(x)(B) を次のように積分表示〈integral representation〉します。

{\displaystyle
F(B | x) = \int_{y\in B \subseteq Y} F(dy | x) = \int_{y\in Y} \chi[B](y)F(dy | x)
}

F(dy | x) を、マルコフ核Fの積分形式〈integrand form〉と呼ぶことにします。もともと「マルコフ核」の「核」は積分核に由来しますが、現在のオフィシャルな定義は既に述べたとおりです。よって、「マルコフ核の積分核」でも意味的には問題ないのですが、同語反復の印象があるので、「被積分形式」とします。

積分形式に出てくる“微分”dy は、直感的には無限小事象を表します。ある範囲の無限小事象に渡って無限小量が積分されて有限量が出てくるわけです。

積分記号/積分表示は、F(B | x) に対する単なる便宜的な記法ではなく、Y上の関数 1 (値が1な定数関数)や χ[B] を、Y上の測度 F(- | x) によりほんとに積分しています。

ラムダ記法積分表示を組み合わせると次のようになります。


{\displaystyle
F = \lambda\,(x, B)\in X\times\Sigma Y.\int_{y\in B \subseteq Y} F(dy | x)
}\\{\displaystyle
F^\wedge = \lambda\, x\in X.\lambda\, B \in \Sigma Y.\int_{y\in B \subseteq Y} F(dy | x) \\
}

積分記号とラムダ抽象を外した裸の被積分形式 F(dy|x) を、マルコフ核Fと同一視することもありますが、安易な同一視は混乱のもとなので当面はやめたほうがいいです(慣れたらやってもいいけど*12)。

ランダム要素

集合 1 = {0} に対して、Σ1 = {{}, {0}} とした可測空間 (1, Σ1) を再び1と書きます(記号の乱用)。1からXへのマルコフ核を、Xのランダム要素〈random element〉と呼びます。

ランダム要素はランダム点〈random point〉とも呼びます。Xがベクトル空間なら、Xのランダム要素はランダム・ベクトル、Xが関数の集合なら、Xのランダム要素はランダム関数です。ただし、ランダム関数〈ランダム写像〉はランダム性を持つ関数、つまりマルコフ核の意味で使われる可能性があります、要注意。

マルコフ核の定義から、1からXへのマルコフ核Pは、ΣX∋A \mapsto P(A|0) で決まります。P(A|0) を単に P(A) と書けば、マルコフ核PはX上の確率測度と同一視できます。この同一視により、次は同義語になります。

  1. Xのランダム要素
  2. X上の{確率的}?状態(「ベイズ確率論、ジェイコブス達の新しい風」参照)
  3. X上の確率測度
  4. X上の確率分布
  5. Xを台可測空間〈underlying measurable space〉とする確率空間

意味不明な語「確率変数」(「「確率変数」と言うのはやめよう」参照)も、しばしばランダム要素の意味で使われます。

ランダム要素の事象への所属度

a∈X と A⊆X に対して、命題(単なる文でホントかどうかはわからない)"a∈A" の真偽値を 〚a∈A〛 と書くことにします。

  • 実際に a∈A ならば、〚a∈A〛 = 1
  • そうでないならば、〚a∈A〛 = 0

通常の要素 a に対する所属度は0か1の二値ですが、ランダム要素の所属度〈membership value〉は中間の値をとります。次のように定義します。

  • 〚P∈A〛 := P(A)

F:X →* Y がマルコフ核のとき、F(x) はYのランダム要素〈確率測度〉なので、〚F(x)∈B〛 = F(B|x) と書けます。

  • F(B|-) = λx∈X.〚F(x)∈B〛

から、Bを固定してxを動かした関数 F(B|-) は、値であるランダム要素 F(x) のBへの所属度を表すX上のファジー述語になります。

「ランダム要素Pの事象Aへの所属度」と「事象Aの確率測度Pによる確率」は同じことです。言い回しが違うだけです。

ディラック測度

a∈X に対して、ディラック測度Dirac measure〉 δa は次のように定義します。

  • For given A∈ΣX, δa(A) := (if a∈A then 1 else 0)

δaは、X上のランダム要素〈確率測度〉になります。δaは、ランダム要素のなかで特殊なもの、すなわち{決定性 | シャープ}ランダム要素〈{deterministic | sharp} random element〉です。「決定性ランダム」は、語感としては矛盾した形容詞ですが、定義の上からは何も矛盾していません。

ランダム要素としての δa の事象への所属度は、単なる要素 a の所属度に一致します。

  • 〚δa∈A〛 = 〚a∈A〛

言い方を換えれば:

  • δa(A) = 1 ⇔ a∈A

ディラック測度 δa を δ[a] とも書きます。下付き添字とブラケット引数は同義とみなす場合が多いです(χA と χ[A] もそう)。

実数値関数 φ∈ΦX のディラック測度による積分は次のようになります。


{\displaystyle \int_{x\in X} \phi(x) (\delta[a](dx)) = \phi(a) }

これは、測度による関数の積分の定義から出ますが、見てナルホドと思えればOK。

ディラック測度と指示関数のあいだに次の関係があります。


{\displaystyle \int_{t\in A\subseteq X} \delta[x] (dt) = \chi[A](x) }

チャップマン/コルモゴロフ結合

マルコフ核に関する最も重要な概念はチャップマン/コルモゴロフ結合です。F:X →* Y, G:Y →* Z が2つのマルコフ核のとき、新しいマルコフ核 G\odotF:X →* Z を作る演算(反図式順中置演算子記号を \odot とした)がチャップマン/コルモゴロフ結合です。

FとGのチャップマン/コルモゴロフ結合〈Chapman-Kolmogorov composition〉 G\odotF は、積分表示により次のように書けます。


\mbox{For given }x\in X, C\in \Sigma Z, \\
\:\: (G\odot F)(C|x) :=
{\displaystyle \int_{y\in Y} G(C | y)F(dy | x) }

定義の右辺の積分は通常の積分です。例えば、 \psi(y) := G(C|y) ,\; Q(dy) := F(dy|x) と置くと、マルコフ核の条件から、ψは可測関数(ファジー述語)、Qは確率測度になります。定義の右辺は次の積分です。

\:\: {\displaystyle \int_{y\in Y} \psi(y)Q(dy) }

チャップマン/コルモゴロフ結合を定義する等式をチャップマン/コルモゴロフ方程式〈Chapman-Kolmogorov equation〉と呼びます*13

可測空間Xに対してマルコフ核 IdX:X →* X を、被積分形式 δ[x](dt) で定義します。


\mbox{For given }x\in X, A\in \Sigma X, \\
\:\: \mathrm{Id}_X(A|x) :=
{\displaystyle \int_{t\in A\subseteq X} \delta[x](dt) } =
{\displaystyle \int_{t\in X} (\chi[A](t)) (\delta[x](dt)) }

チャップマン/コルモゴロフ結合とIdに関して次が成立します。

  1.  F \odot \mathrm{Id}_X = F
  2.  \mathrm{Id}_Y \odot F = F

これは、チャップマン/コルモゴロフ結合の定義とディラック測度の性質から直ちに示せます(練習問題)。

チャップマン/コルモゴロフ結合の結合律  H\odot (G\odot F) = (H\odot G)\odot F は後で話題にしますが、結論を言えば成立します。結局、マルコフ核を射とする圏が構成できます。その圏をSとすると:

  1. |S| = |M|
  2. Sの射はマルコフ核
  3. dom(F:X →* Y) = X, cod(F:X →* Y) = Y
  4. Xの恒等射は IdX:X →* X
  5. Sの結合はチャップマン/コルモゴロフ結合

SMM = SBorel または M = CGMeas)から決まるので MStoc とも書きます(S = SBorelStoc または S = CGMeasStoc*14)。

デルタ関手

f:X→Y in M を可測写像とします。fに対応するマルコフ核 δ[f]:X →* Y を次のように定義します。


\mbox{For given }x\in X, B\in \Sigma Y, \\
\:\: \delta[f](B | x) := \delta[f(x)](B)

δ[f] を定義するために、Y上のディラック測度 δ[f(x)]:ΣY→[0, 1] を使っています。

f:X→Y, g:Y→Z in M に関して次が成立します(練習問題)。

  1.  \delta[g\circ f] = \delta[g]\odot \delta[f]
  2.  \delta[\mathrm{id}_X] = \mathrm{Id}_X

これは、δが圏Mから圏Sへの関手であることです。関手としてのδをデルタ関手〈Delta functor〉と呼ぶことにします。

デルタ関手 δ:MS により、MSに埋め込まれます。F = δ[f] と書けるマルコフ核Fを、{決定性 | シャープ}マルコフ核〈{deterministic | sharp} Markov kernel〉と呼びます。

暗黙のデルタ

デルタ関手 δ:MS は、対象を変えない〈identity-on-objects〉忠実関手です。δによる像圏を δ(M) = δM とします。δMSの広い部分圏〈wide subcategory〉になります。

しばしば、MとδMを同一視します。その場合、Mの射(可測写像) f:X→Y をSの射(マルコフ核) f:X →* Y とみなします。このときは、fを包む δ[-] が省略されている、あるいは暗黙のデルタ〈implicit delta〉があると考えられます。

  • 例: f\odotg は、δ[f\circg] = δ[f]\odotδ[g] のδが省略されている。
  • 例: f\odotP は、δ[f]\odotP のδが省略されている。

別な考え方として、最初から MS と定義します。部分圏としてのMを特定する〈分出する〉条件は後述のシャープネス定理で与えられます。最初から MS とするなら、暗黙のデルタという略記法や概念はありません。

ペアリング記法

X上の測度で、どんな可測集合 A⊆ Xに対しても L(A) < ∞ である測度を有界測度有限測度 | finite measure〉といいます。P(A) := L(A)/L(X) とすると確率測度Pが得られる*15ので、有界測度は確率測度と大差ありません。X上の有界測度の全体を Π(X) とします。

非負実数値有界可測関数 φ∈Φ≧0(X) と任意の有界測度(確率測度でなくてもよい)L ∈Π(X) に対して、関数φの測度Lによる積分\newcommand{\la}{\langle}\newcommand{\ra}{\rangle} \la \phi \mid L\ra_X と書きます。


{\displaystyle \la \phi \mid L\ra_X = \int_{x\in X}\phi(x)L(dx) }

この書き方の縦棒は、半書字順記法の縦棒とは何の関係もありません。スカラー積を表す伝統的記法です。用語・記号の衝突は避けられないことです。

 \la \mbox{-} \mid \mbox{-} \ra_X : \Phi_{\ge 0}(X)\times \Pi(X) \to {\bf R}_{\ge 0} は、2つの引数を持ちますが、R≧0係数で双線形(半双線形というのが正確)になります。測度の足し算や非負実数倍が許されるのは、右側引数を確率測度に限定してないからです。

確率測度の制限を外した場合の積分を、 \la \mbox{-} \mid \mbox{-} \ra_X を使って書く記法をペアリング記法〈pairing notation〉と呼びます。もちろん、右側引数に確率測度を入れてもかまいません。

ペアリング記法を使うと、積分に関する命題が見やすくコンパクトに記述できます。

測度の前送り -- 写像の場合

X上の有界測度(確率測度に限らない)L∈Π(X) と、可測写像 f:X→Y in M に対して、Lのfによる前送り〈pushforward〉f*(L) を、次のように定義します。


\mbox{For }B\in \Sigma Y, \\
\:\: f_\ast(L)(B) := (f_\ast L)(B) := L(f^{-1}(B))

なお、逆写像と逆像を区別したいときは、 f^\dashv TeX で "f^\dashv")と書くのがおすすめです。

X上の確率測度 P の場合、確率測度とマルコフ核(ランダム要素) 1 →* X を同一視した場合に次が成立します。

  •  f_\ast(P) = \delta[f]\odot P

暗黙のデルタを使えば:

  •  f_\ast(P) = f\odot P

fによる前送りは、チャップマン/コルモゴロフ結合に関するfの後結合〈post-composition〉操作です。

関数の引き戻し -- 写像の場合

Y上の非負実数値有界関数ψと、可測写像 f:X→Y in M に対して、ψのfによる引き戻し〈pullback〉f*(ψ) を、次のように定義します。


\mbox{For }x\in X, \\
\:\: f^\ast(\psi)(x) = (f^\ast \psi)(x) := \psi(f(x)) = (\psi\circ f)(x)

fによる引き戻しは、写像の結合に関するfの前結合〈pre-composition〉操作です。

随伴公式 -- 写像の場合

可測写像 f:X→Y in M による“測度の前送り”と“関数の引き戻し”のあいだには次の関係があります。


\la f^\ast \psi \mid L \ra_X = \la \psi \mid f_\ast L \ra_Y

これは、“測度の前送り”f* と“関数の引き戻し”f* が、ペアリングに関して随伴になっていることを主張しています。なのでこれを随伴公式〈adjunction formula〉と呼びます*16

積分記号を使って書けば:


{\displaystyle \int_{x\in X} \psi(f(x)) L(dx) = \int_{y\in Y} \psi(y) (f_\ast L)(dy) }

こう書くと、積分の変数変換公式〈change-of-variable formula〉です。証明は積分論の教科書を参照。

測度の前送り -- マルコフ核の場合

X上の有界測度(確率測度に限らない)Lと、マルコフ核 F:X →* Y in S に対して、LのFによる前送り〈pushforward〉f*(L) を、次のように定義します。

  •  F_\ast(L) := F \odot L

チャップマン/コルモゴロフ結合 \odot は、確率測度以外でも定義可能です。積分を使って書けば:


\mbox{For }B\in \Sigma Y, \\
\:\: F_\ast(L)(B) :=
{\displaystyle \int_{x\in X} F(B | x)L(dx)}

これは、F = δ[f] の場合と形式上は同じ定義で、Fによる前送りは、チャップマン/コルモゴロフ結合に関するFの後結合〈post-composition〉操作です。

実は、マルコフ核(値が確率測度)でなくても、一般的な測度的積分核でも前送り/引き戻し/随伴公式は定義/証明可能です。が、ここではマルコフ核について記述します*17

関数の引き戻し -- マルコフ核の場合

Y上の非負実数値有界関数 ψ∈Φ≧0(X) と、マルコフ核 F:X →* Y in S に対して、ψのFによる引き戻し〈pullback〉F*(ψ) を、次のように定義します。


\mbox{For }x\in X, \\
\:\: F^\ast(\psi)(x) := {\displaystyle \int_{y\in Y} \psi(y) F(dy|x) }

随伴公式 -- マルコフ核の場合

マルコフ核 F:X →* Y in S による“測度の前送り”と“関数の引き戻し”のあいだには次の関係があります。


\la F^\ast \psi \mid L \ra_X = \la \psi \mid F_\ast L \ra_Y

これは、“測度の前送り”F* と“関数の引き戻し”F* が、ペアリングに関して随伴になっていることを主張しています。なのでこれを随伴公式〈adjunction formula〉と呼びます。

積分記号を使って書けば:


{\displaystyle
\int_{x\in X} \left(\int_{y\in Y} \psi(y)F(dy|x) \right)L(dx)
=
\int_{y\in Y} \psi(y) \left(\int_{x\in X} F(dy|x)L(dx) \right)
}

式の形の上では自明に見えますが、等式の厳密な証明には測度論的議論が必要です。

F = δ[f] と置くと、写像の場合の随伴公式が出てきます(練習問題)。

テンソル

テンソル積についてまず言いたいことは「テンソル積を使え」です。例えば、可測空間とマルコフ核のテンソル積をちゃんと使えば、IID〈 independent and identically distributed〉な確率変数列のようなワケのわからない技工は不要になります。

可測空間 (X, ΣX) と (Y, ΣY) のテンソルtensor product〉は (X×Y, ΣX\otimesΣY) と書きます。シグマ集合代数 ΣX\otimesΣY は、集合 X×Y 上のシグマ集合代数で、A∈ΣX, B∈ΣY に対する A×B⊆X×Y をすべて含む最小のシグマ集合代数です。

X = (X, ΣX), Y = (Y, ΣY) と記号の乱用をするとして、XとYのテンソル積はどう書くべきでしょうか?

  1. X×Y = (X×Y, ΣX\otimesΣY)
  2. X\otimesY = (X×Y, ΣX\otimesΣY)

以前は一番の書き方してましたが、最近は二番のほうがしっくり来ます。好みの問題ですけどね。いずれにしても、Σ(X×Y) = ΣX\otimesΣY または Σ(X\otimesY) = ΣX\otimesΣY が成立します。

次に、2つのマルコフ核 F:X→* Y, G:Z→* W in Sテンソルを定義します。F\otimesG:X\otimesZ→* Y\otimesW in S となります。最初の定義に戻って、

  • F\otimesG:(X×Z)×Σ(Y\otimesW)→R≧0

の形で定義します。Σ(Y\otimesW) = ΣY\otimesΣW は、B×D⊆Y×W where B∈ΣY, D∈ΣW で生成されるので、生成元での値だけ定義すれば十分です。その定義は:

  • F\otimesG((x, z), B×D) := F(x, B)G(z, D)

これを、習慣により次のようにも書きます。

  • F\otimesG(B, D | x, z) := F(B | x)G(D | z)

積分形式による表現は:

  •  (F\otimes G)( (x, z), dy \times dw) := F(x, dy)G(z, dw)
  •  (F\otimes G)(dy, dw \mid x, z) := F(dy \mid x)G(dw \mid z) (習慣的)

習慣的・伝統的な書き方は不正確で好ましくありませんが、習慣的・伝統記法はだいたい腐っているものなので諦めましょう。

テンソル積に関する法則が幾つかありますが、それらは、可測空間とマルコフ核の圏がテンソル積により対称モノイド圏〈symmetric monoidal category〉になることを主張するものです

チャップマン/コルモゴロフ結合の結合律

随伴公式 -- マルコフ核の場合」の随伴公式を再掲します。


\la F^\ast \psi \mid L \ra_X = \la \psi \mid F_\ast L \ra_Y

ここで:

  •  F: X \to\ast Y \mbox{ in  } \mathcal{S} : XからYへのマルコフ核
  •  \psi : Y上の関数
  •  L : X上の測度

チャップマン/コルモゴロフ結合の結合律は、マルコフ核の場合の随伴公式に帰着されます。F:X→* Y, G:Y→* Z, H:Z→* W を3つのマルコフ核だとして、a∈X と D∈ΣW を任意に固定して次のように置きます。

  •  \phi(z) := H(D | z) : Z上の関数
  •  M(dy) := F(dy | a) : Y上の測度

マルコフ核G、関数φ、測度Mに関して随伴公式を書き下すと:


\la G^\ast \phi \mid M \ra_Y = \la \phi \mid G_\ast M \ra_Z

この等式は、次の結合律を意味します(積分記号で書いて確認してみてください)。


( (H\odot G) \odot F)(D|a) = ( H\odot (G \odot F) )(D|a)

To Be Described

予定していた記述項目で、残ってしまったものが幾つかあります。「これも書いてから」とかいうと、投稿が一週間後、一ヶ月後、あるいは忘れて投稿しない事態*18が想定されるので、とりあえずここで投稿します。

残りの項目が多いわけではないので、気が向いたときに書き足します。

測度前送り関手と関数引き戻し関手
  • X \mapsto Π(X) と f \mapsto f* が、共変関手 SSet を定義する。
  • X \mapsto Φ≧0(X) と f \mapsto f* が、反変関手 SSet を定義する。
チャップマン/コルモゴロフ結合の結合律 済み

Sが圏になるためには必要。書きました(Tue Aug 18 2020)。

テンソル積 済み

書きました(Sat Jul 4 2020)。

シャープネス定理

SのなかでδMを特徴づける条件。

*1:過去記事を読み返して誤字脱字を発見したので、後で直します(忘れなければ)。

*2:'δ'を使うとディラック測度と混同しがちだし、'Δ'を使うと対角射と混同しがちです。どうにもなりません。

*3:Σは、関手 Measσ-Alg になります。σ-Algは、抽象的に定義されたシグマ代数の圏です。

*4:ちなみに檜山は、漢字4文字の「可測集合」より漢字2文字の「事象」のほうが短くてよい、という理由で「事象」を使います。

*5:準ボレル空間〈quasi-Borel space〉は、たちが良く、しかも可測空間の拡張になっている空間のクラスです。有望だと思います。

*6:連続とは限らない可測関数に対してノルムが役立つ気があまりしないのですけど、何かのはずみで使うかも知れません。

*7:右カリー化〈right currying〉と呼んだほうが正確だけど、直積は対称だから、左右をあまり区別しなくてもいいでしょう。左カリー化は f または f と書きます。

*8:内部ホム、または指数と呼ばれ、[Y→Z] 以外に、[Y, Z], hom(Y, Z), ZY とも書かれます。

*9:さらには、自然変換になります。

*10:この等式には絵図的な意味があって、ニョロニョロを引き伸ばすことになります。「絵算の威力をお見せしよう」参照

*11:準ボレル空間の圏では、常に [X→Y] が作れるようです。

*12:積分記号を省略する書き方については「ライプニッツの微分記法とアインシュタインの総和規約を測度に使ってみる」参照。

*13:[追記]コルモゴロフの発音で噛んでしまうので、口頭では「チャップマン結合」でもいいとしましょう。[/追記]

*14:フリッツ〈Tobias Fritz〉はSBorelStocBorelStoc、フォング〈Brendan Fong〉はCGMeasStocCGStocと短く書いています。

*15:L(X) ≠ 0 の場合

*16:随伴性を表す等式の意味ですが、その意味だと、色々な分野/色々な状況で随伴公式があります。

*17:マルコフ核とは限らない測度的積分核の一般論をしてから、マルコフ核を定義するほうがスッキリするかも知れません。

*18:僕の場合、そういうことがよくあります。いきなり気力が萎えてしまい捨て置き。