ライプニッツの微分記法とアインシュタインの総和規約を測度に使ってみる

思い付きの話で、一部イイカゲンな概念と説明が含まれます。合理化可能・正当化可能なイイカゲンさだとは思いますが、とりあえず記法だけ紹介するので、今はイイカゲンです。ライプニッツの微小な量dx, dyと、総和記号Σを省略するというアインシュタインのモノグサ規約を、測度による関数の積分に使ってみます。

「測度的積分核と随伴構造」で述べた内容をもとにしています。

内容：

状況の設定
測度的積分核
測度的微分形式
積分記号の省略
フビニの定理
測度と関数の随伴性
変数変換の公式
ラドン／ニコディム微分
記述と計算が短くなる

状況の設定

X = (Ω_X, Σ_X, Λ_X) は測度空間とします。つまり：

Ω_Xは、台集合。
Σ_Xは、台集合Ω_X上のσ集合代数。
Λ_Xは、可測空間(Ω_X, Σ_X)上のσ-有限測度。

記号の乱用で、台集合Ω_Xを単にXと書くことがあります。また、下付き添字のXを省略することがあります。

Λ_XはX上の標準的な測度です。標準として変な測度は避けたいので、σ-有限性の条件を付けています。R上で点の個数を勘定する測度（数え上げ測度）はσ-有限ではないので、標準測度Λ_Rにはなれません。単にRと書いたら、常識的な可測構造と常識的な標準測度を考えます。

可測空間(Ω_X, Σ_X)には、色々な条件を付けることがあります。例えば：

Σ_Xは高々可算の生成系（generating system/set）を持つ。
Ω_Xは位相空間で、Σ_XはΩ_Xのボレルσ代数。
Ω_Xは有限集合で、Σ_Xはベキ集合の代数。
Ω_Xは位相空間で、稠密な可算部分集合を持つ。
Ω_Xは距離空間、または距離付け可能な空間。
Ω_Xは完備距離空間、または完備距離付け可能な空間。

ポーランド空間とのそのボレルσ代数をとると、何かと都合がいいと言われています。必要なら適当な条件は仮定することにして、このテの条件はあまり気にしないことにします。

2つの測度空間X, Yがあるとき、このあいだの準同型写像をどう決めるかも選択肢があります。

可測写像を準同型写像とする。
台集合に位相が入っているとして、連続写像を準同型写像とする。

これも、用途によってどっちか（他の候補もあるかも）を選ぶ、という態度にします。準同型写像 f:X→Y が標準測度を保存すること（f_*(Λ_X) = Λ_Y）は要求しません。

扱う測度空間のクラスと、そのあいだの準同型写像の概念がハッキリすれば、空間達と写像達は圏をなします。その圏をMとします。今回は、圏論的議論はしないので、表立ってMには言及せず、次のような記法を使うことにします。

Map(X, Y) := Hom_M(X, Y) = M(X, Y)
Func(X) := Map(X, R)
FMeas(X) := (X上の有限測度の全体; X上の測度μが有限測度 ⇔ μ(X) ＜ ∞)

Func(X)とFMeas(X)には、足し算とスカラー乗法を考えます。Func(X)はベクトル空間になりますが、FMeas(X)はベクトル錘空間（「心が安らぐ「分布の空間」を定義してみる」参照）にしかなりません。この非対称性がイヤなら次にようにすればいいでしょう。

符号付き測度（signed measures）を考えて、FMeas(X)もベクトル空間にする。
Func(X)を非負実数値関数に限定して、Func(X)もベクトル錘空間にする。

選択肢は色々ありますが、特定の選択を固定すると、写像、関数、測度の概念が決まります。なお、Xの標準測度Λ_XはFMeas(X)に含まれなくてもいいことに注意してください。

測度的積分核

測度的積分核は、「測度的積分核と随伴構造」で導入した概念です。KがXからYへの測度的積分核だとは、次のことです。

Kは、K:X×Σ_Y→R_≧0 という写像である。
x∈X を固定した λB.K(x, B) : Σ_Y→P は、Y上の測度になる。
B∈ΣY を固定した λx.K(x, B) : X→R_≧0 は、X上の可測関数になる。

'λ'は（非形式的）ラムダ計算のラムダです。無名のラムダ変数をハイフンで表せば、次のようにも書けます。

K(x, -) : Σ_Y→P は、Y上の測度になる。
K(-, B) : X→R_≧0 は、X上の可測関数になる。

このハイフン（またはアンダースコア）記法は世間も僕もよく使います。

測度的積分核は、“積分”核というくらいなので、積分記号の中に入れて使うことを想定しています。例えば：

$\int_{x\in X} f(x)K(x, B)dx$

もっと複雑な場合をどう書くか、がこの記事の主題です。

ここでは、x∈X に対するK(x, -)を“任意の（有限）測度”にしてますが、K(x, -)を“確率測度”に制限したものをマルコフ核と呼びます。「マルコフ核」以外にも呼び名がたくさんあります。僕が見たことがあるものだけでも：

stochastic map
stochastic kernel
stochastic relation
stochastic matrix （台集合が有限のとき）
probabilistic mapping
probabilistic relation
probabilistic matrix （台集合が有限のとき）
regular conditional probability
conditional probability density
Markov kernel
Markov matrix （台集合が有限のとき）
transition kernel
transition matrix （台集合が有限のとき）
probabilistic/stochastic channel

写像の値が確率的な非決定性を持つことを表現する手段がマルコフ核（別名いっぱい）です。マルコフ核では、値が“比率の分布”ですが、測度的積分核は、値が“任意の非負量の分布”である状況を表現します。

測度的微分形式

f(x)dx のような書き方を、積分記号なしでも許したものが微分形式です。微分形式は、接ベクトル空間の線形代数を使って定式化されるのが普通です。となると、接ベクトルを考えられないような空間では微分形式も考えられないのでしょうか？

ライプニッツ時代の直感に従えば、dxは空間Xの微小な部分を表す変数です。「微小な部分」でまさに「微分」です。接ベクトルがなくても、空間Xの“微分＝微小な部分”は直感的には考えることができます。微分変数dxに、関数f(x)を係数にした形式がf(x)dxです。積分操作で微小な部分／微小な量を寄せ集めれば積分値が得られます。

いま説明したような、関数係数を持つ（かも知れない）微小部分／微小量を表現する形式を測度的微分形式と呼ぶことにします。もちろん、これはマトモな定義になっていません。とりあえずは、測度的微分形式は表記法の約束だと思ってください。

μがX上の測度（必ずしも有限でなくてもよい）とするとき、測度μによる関数fの積分を次のように書きましょう。

$\int_{x\in X} f(x)\mu(dx)$

積分記号の内側にあるf(x)μ(dx)は測度的微分形式とみなします。Xの微小部分dxを測度μで測った微小量がμ(dx)です。裸のdxも、Xの標準測度Λによって、dx := Λ(dx) と考えます。Λは標準なので省略してもよいという約束です。

KはXからYへの測度的積分核とします。つまり、K:X×Σ_Y→R_≧0 です。測度的積分核の定義から、K(x, -)はY上の測度になります。この測度をν_xとすると、ν_xによるY上の積分は次のように書けます。

$\int_{y\in Y} g(y)\nu_{x}(dy)$

積分記号の中に出てきたg(y)ν_x(dy)もY上の測度的微分形式です。ν_x = K(x, -) だったので、g(y)ν_x(dy) = g(y)K(x, -)(dy)。ここで出てきたK(x, -)(dy)をK(x, dy)と書くことにしましょう、これはY上の測度的微分形式です。この記法を使うと：

$\int_{y\in Y} g(y)K(x, dy)$

測度的積分核Kの第二変数を微分変数に置き換えたK(x, dy)は、Y上の測度的微分形式となり、Y上の関数の積分に使えます。

積分記号の省略

古典的なテンソル計算では、総和記号Σ（σ代数じゃないシグマ）がたくさん出てきます。「あーめんどくせーな、シグマ省略しちゃえ！」と言い出したのはアインシュタインです。例えば、ベクトル(xⁱ)を行列(a^j_i)で変換したベクトルが(y^j)であることは、次のように書けます。

$y^j = \sum_{i = 1}^n a^j_i x^i$

総和記号シグマを省略すると、

$y^j = a^j_i x^i$

スッキリします。同じ名前（この場合はi）の添字が上下に現れたら総和を取ると約束します。慣れないと分かりにくいし、iの動く範囲の情報は落ちますが、そのあたりは習慣と想像で補えるだろう、ということです。

積分計算（測度計算）でも同じ規約を適用できないでしょうか。上下の添字は使わないので、通常の変数（例えばx）と微分変数（dx）が現れたら積分を取るとしてはどうでしょう。そうなると、f(x)dxは微分形式じゃなくて積分値になってしまいます。さすがにこれは具合が悪い。

修正案として、積分される関数と積分する測度のあいだをドットで区切ることにします。f(x)dx なら、f(x)・dx = f(x)・Λ(dx) です。このドットが現れたら積分することにします。ドットは、関数と測度のスカラー積（スカラー乗法じゃないよ）の演算子記号のように考えます。

ドットを使うと、関数と測度を明白に区別できるメリットもあります。例えば、f(x)p(x)dxに対して、f(x)p(x)・dxだと、関数f(x)p(x)を標準測度dxで積分したことになり、f(x)・p(x)dxだと、関数f(x)を密度関数p(x)による測度p(x)dxで積分したことになります。g(y)・K(x, dy)は、空間Y上の関数g(y)を、測度的積分核Kが定義するY上の測度K(x, dy)で積分したことになります。

積分であることをもっと明示したいときは、[f(x)・dx]のようにブラケットで囲むことにします。ブラケットを使うと、次のメリットがあります。

積分領域を明示したいときに、[X|f(x)・dx]と書ける（そう約束する）。
被積分関数を省略してもいいとして、そのときは定数関数1を積分する。[μ(dx)] = [1・μ(dx)]

上記の約束を組み合わせると、[B|K(x, dy)] のような書き方ができます。この意味は：

$\int_{y\in B, B \subseteq Y} 1 K(x, -)(dy)$

先のg(y)・K(x, dy)はxをパラメータにしているので、xに関して積分すれば、(g(y)・K(x, dy))・dxですが、ブラケットを使うとより明確になります（より長くなってしまうが）。

[X| [Y|g(y)・K(x, dy)]・dx]

通常の記法だと：

$\int_{x\in X}\biggl(\int_{y\in Y} g(y) K(x, -)(dy)\biggr)dx$

フビニの定理

dx以外に、d(x, y), (dx, dy)という記号も使います。これを説明するために、フビニの定理を素材にします。フビニの定理のステートメントは次のように書けます。

$\int_{y\in Y}\biggl(\int_{x\in X} f(x, y)dx\biggr)dy \, = \int_{(x, y)\in X\times Y} f(x, y)d(x, y)$

これを、今までに説明した短縮記法で書いてみます。表記は短くなりますが、概念的にはむしろ精密化されます。

[f(x, y)・dx]・dy = f(x, y)・d(x, y) = f(x, y)・(dx, dy)

記号 dx, dy, d(x, y), (dx, dy) が出てきてます。これらの定義は全て違います。

dxは、Λ_X(dx)の略記で、X上の標準測度を表す。
dyは、Λ_Y(dy)の略記で、Y上の標準測度を表す。
d(x, y)は、Λ_X×Y(d(x, y))の略記で、X×Y上の標準測度を表す。タプル(x, y)を、X×Y上を走るひとつの変数とみなす。
(dx, dy)は、Λ_X(dx) $\otimes$ Λ_Y(dy)の略記で、テンソル積測度を表す。

フビニの定理の場合は、d(x, y) = (dx, dy) です。X×Y上の測度Λ_X×Yが、もともとテンソル積測度Λ_X $\otimes$ Λ_Yとして定義されているからです。

測度と関数の随伴性

「測度的積分核と随伴構造」で述べた随伴性を短縮記法で書くと次のようです。

g(y)・Kμ(dy) = gK(x)・μ(dx)

ここで、Kμ(dy) = (Kμ)(dy) = (K.μ)(dy), gK(x) = (gK)(x) = (g.K)(x) で、K.μとg.Kの定義は「測度的積分核と随伴構造」に書いてあります。その定義を短縮記法で書けば：

(K.μ)(B) := K(x, B)・μ(dx)
(g.K)(x) := g(y)・K(x, dy)

随伴性をイイカゲンだが直感には訴える計算で確認(?)すると：

  g(y)・Kμ(dy)
= g(y)・[K(x, dy)・μ(dx)]
= [g(y)・K(x, dy)]・μ(dx)
= gK(x)・μ(dx)

途中で使っている式変形の法則は、がんばれば合理化できるでしょう。

この随伴性は、測度的積分核Kが定義する2つの写像が随伴関係にあることを主張しています。Kが定義する2つの写像は：

K^∧ := K.(-) : FMeas(X)→FMeas(Y)
K_∨ := (-).K : Func(Y)→Func(X)

積分は、一種のスカラー積とみなせます。

[X|(-)・(-)] : Func(X)×FMeas(X)→R_≧0
[Y|(-)・(-)] : Func(Y)×FMeas(Y)→R_≧0

積分に関するK^∧とK_∨の随伴性は：

[Y|g(y)・K^∧(μ)(dy)] = [X|K_∨(g)(y)・μ(dy)]

もっと簡略に書けば：

[g・K^∧(μ)] = [K_∨(g)・μ]

K^∧とK_∨はスカラー積[(-)・(-)]に関して随伴ですね。

変数変換の公式

変数変換（change of variables）または置換積分（integration by substitution）の公式を簡略記法で書いてみます。ψ:X→Y をMap(X, Y)に属する写像（可測写像とか連続写像とか）とします。μ∈FMeas(Y), g∈Func(Y) として、

g(ψ(x))・μ(dx) = g(y)・(ψ_*μ)(dy) （変数変換の公式）

ここで、ψ_*μ = ψ_*(μ) は前送り測度で、次のように定義されます。

(ψ_*(μ))(B) := μ(ψ^-1(B))

上記の変数変換の公式を、簡単な一変数の場合と比較してみます。

$\int_{x = a}^{b} g(\psi(x))\psi'(x)dx = \int_{y = \psi(a)}^{\psi(b)} g(y)dy$

ここで、区間[a, b]をX, 区間[ψ(a), ψ(b)]（ψ(a) ＜ ψ(b) だとして）をYとします。また、μ(dx) = ψ'(x)Λ_X(dx) = ψ'(x)dx とすると、dy = Λ_Y(dy) = ψ_*(μ)(dy) となるので、

$\int_{x\in X} g(\psi(x)) \mu(dx) = \int_{y\in Y} g(y) \psi_{*}(\mu)(dy)$

被積分関数と測度をドットで区切ると、

$\int_{x\in X} g(\psi(x)) \cdot \mu(dx) = \int_{y\in Y} g(y) \cdot \psi_{*}(\mu)(dy)$

積分記号を省略すると先の「変数変換の公式」です。

さて、Y上の関数の写像ψによる引き戻し ψ^*:Func(Y)→Func(X) を次のように定義しましょう。

(ψ^*(f))(x) := f(ψ(x))

変数変換公式のg(ψ(x))を(ψ^*g)(x)に書き換えると：

(ψ^*g)(x)・μ(dx) = g(y)・(ψ_*μ)(dy)

積分を明示するブラケットを書き足せば：

[X|(ψ^*g)(x)・μ(dx)] = [Y|g(y)・(ψ_*μ)(dy)]

簡略にすると：

[ψ^*(g)・μ] = [g・ψ_*(μ)]

つまり、変数変換公式は、ψ^*とψ_*が随伴であることを示しています。

一般に、写像 ψ:X→Y があると、ψ^~:X→FMeas(Y) を作れます。FMeas(Y)⊆SetMap(Σ_Y, R_≧0) であることから、ψ^~:X→SetMap(Σ_Y, R_≧0) とみなしたψ^~をアンカリー化して ψ^♭:X×Σ_Y→R_≧0 が得られます。ψ^♭を具体的に書くと：

$\psi^{\flat}(x, B)\, := \int_{y\in Y} \chi_{B}(y)\cdot \delta_{\psi(x)}(dy)$

ここで、χ_Bは集合Bの指示関数（indicating/characteristic function）で、δ_ψ(x)は、一点ψ(x)を台とするディラック測度です。

このψ^♭は測度的積分核となり、ψに関する変数変換公式は、測度的積分核ψ^♭の随伴性と同じことです。

ラドン／ニコディム微分

X上の測度μが、標準測度Λ_Xに関して完全連続（μ ≪ Λ_X）ならば、μのラドン／ニコディム導関数が存在します。ラドン／ニコディム微分操作をDとすると、DはFMeas(X)上で全域的には定義されませんが、部分写像としてなら D:FMeas(X)→Func(X) とみなせます。一方、p∈Func(X) に対して、pを密度関数とする測度p(x)Λ(dx)が定義できるので、p|→p(x)Λ(dx) という対応を J:Func(X)→FMeas(X) とします。DとJはおおよそ逆の操作です。

今述べた状況を短縮記法で表しましょう。通常、測度μの測度νに関するラドン／ニコディム導関数はdμ/dνと書きますが、μ/ν(dx) という割り算だけの形式にします。分母が標準測度のときは、μ/Λ(dx) = μ/dx と略記します。

上記の記法だと、μ(dx) = (μ/ν(dx))ν(dx), μ(dx) = (μ/dx)dx, f(x) = (f(x)dx)/dx のような測度的微分形式の等式が成立します。これらは、ラドン／ニコディム微分操作Dと密度関数による測度Jが互いに逆であることを、（ほぼ）分数計算の形で示しています。