ふー、やっと見つかった。
条件付き確率の計算に積分が出てくるのですが、行列計算(古典テンソル計算)と同じように計算したかったのです。なんかポイントになる公式があるのだろうと探ってみて、随伴性がミソらしいと見当が付きました。
定式化を見つける試行錯誤はウロウロ・モタモタでしたが、形が分かってしまえば、割と自然な事実でした。
内容:
概要
次のアナロジーについて説明します。
ベクトルと行列 | 測度と積分 |
---|---|
スカラー | 非負実数 |
添字の集合 | 可測空間 |
横ベクトル | 測度 |
縦ベクトル | 関数 |
行列 | 積分核 |
スカラー積 | 積分 |
目的とする随伴の公式を先に述べておきます。後で定義される用語・記号を先走って使っています。記号「λ」は、ラムダ計算の意味のラムダ抽象です。以下、「λ」はしばしば使います。
- P = (非負実数の全体) = {x∈R | x ≧ 0}
- X = (X, ΣX) と Y = (Y, ΣY) は可測空間とする。
- μはX上の測度とする。 μ = λA.μ(A) : ΣX→P
- Kを測度的積分核とする。K = λ(x, B).K(x, B) : X×ΣY→P
- gはY上の可測関数とする。g = λy.g(y) : Y→P
以上のμ, K, gを与えられたものとして:
- x∈X に対して、Y上の測度 Kx を、Kx = λB.K(x B) として定義する。
- X上の関数 g.K を次のように定義する。
- B∈ΣY に対して、X上の関数 KB を、KB = λx.K(x B) として定義する。
- Y上の測度 K.μ を次のように定義する。
以上の設定のもとで、次の等式が成立します。
後で導入する略記を使うと、[g, K.μ] = [g.K, μ] と短く書けます。
用語と記法の準備
可測空間と測度については既知とします。Xが集合、ΣXがX上のσ代数として、可測空間を (X, ΣX) とします。下付きのXが面倒なので、ΣX = ΣX とも書きます。記号を乱用して、X = (X, ΣX) も許容します。
X = (X, ΣX) が可測空間のとき、X上の有界測度の全体を Π(X, ΣX) とします。μ∈Π(X, ΣX) なら、μ(X) < ∞ です。以下、有界測度しか考えないので、単に測度と言ったらそれは有界測度です。Π(X, ΣX) = ΠX と略記します。
P = {x∈R| x ≧ 0} として、Pと標準的σ代数ΣPを組にして、可測空間 P = (P, ΣP) を考えます。関数f と言ったらそれは可測写像 f :X→P のことだとします。X上の関数(非負実数値可測なものに限る)の全体をΦXとします。
ここまでに出てきた記号:
- 可測空間 X
- Xのσ代数 ΣX
- X上の測度の全体 ΠX
- X上の関数の全体 ΦX
関数(非負実数値可測写像)は、単関数(simple function)列の極限なので、任意の測度 μ∈ΠX に対してfは積分可能です。この事実は後の定義の際に使います。
X, Yが可測空間のとき、K:X×ΣY→P で次の条件を満たすものを測度的積分核と呼びます。
- x∈X を固定した λA.K(x, B) : ΣY→P はY上の測度になる。
- B∈ΣY を固定した λx.K(x, B) : X→P はX上の可測関数になる。
一般に、関数fから関数gへの変換を
として定義したとき、kをその変換の積分核と呼びます。上記の測度的積分核は、第二変数がY上を走るのではなくて、ΣYに属する集合を渡ることに注意してください。以下では、測度的積分核を単に積分核と呼びます。積分核には山のように別名があります。とりあえず、条件付き確率の表現になっているとだけ言っておきます(でも、今は気にしなくていいです)。
まとめると:
ベクトルと行列の場合
vを長さnの横ベクトル(行ベクトル)、tを同じ長さnの縦ベクトル(列ベクトル)とすると、行列としての積 vs はスカラーとなります。Aをn行m列の行列、tを長さmの縦ベクトルとすると、v, A, t の積 vAt が定義できますが、行列の積の結合法則から、
- (vA)t = v(At)
この等式の「測度と積分」版が冒頭に挙げた等式です。(vA)t = v(At) は、あまりにも簡単すぎて、「測度と積分」版との対応が想像しにくいので、少し形を変えましょう。
横ベクトルvはベクトル空間Vnの要素で、縦ベクトルsはベクトル空間Vnの要素だとします。VnとVnは双対の関係になります。双対性はスカラー積(評価射)で与えられます。vとsのスカラー積=行列としての積 vs を、<v, s> と書くことにします。この記法はデカルトペアと紛らわしいので <v|t> が望ましいでしょうが、縦棒は別な用途で使うので、カンマで区切っておきます。
vとtは同じ長さですが、スカラー積に長さを明示するときは、<v, t>n とします。下付きを避けたいときは <v, t|n>。これは、vとtの共通の添字集合が {1, 2, ..., n} であることを示します。
スカラー積を用いると、(vA)t = v(At) は次の形に書けます。
- <vA, t|m> = <v, At|n>
この等式の測度的対応物が目的となる公式です。添字集合 {1, 2, ..., n}, {1, 2, ..., m} を可測空間X, Y、スカラー積 <v, s> を積分 ∫f(x)dμ に置き換えることを考えます。
積分核による変換
横ベクトルvと行列Aの積 vA に相当する演算を導入します。μを可測空間X上の測度、Kを X×ΣY→P の形の積分核とします。Kが X×ΣY→P であることを、「Kは type X to Y である」といい、K: X to Y と書くことにします。
可測空間Y上の測度 ν = K.μ を定義します。もう一度アナロジーを確認すると:
ベクトルと行列 | 測度と積分 |
---|---|
添字の集合 {1, 2, ..., n} | 可測空間 X |
添字の集合 {1, 2, ..., m} | 可測空間 Y |
長さnの横ベクトル v | X上の測度 μ |
n行m列の行列 A | 積分核 K: X to Y |
v と A の積 vA | Kのよるμの変換 K.μ |
ν = K.μ は、Y上の測度なので、B∈ΣY に対する値 ν(B) を定義すればνを定義できます。次の通りです。
Bを固定したとき、λx.K(x, B) はX上の非負実数値可測関数なので、測度μに関してX上で積分できます。その値が ν(B) を与えます。ν = K.μ が実際にY上の測度になることは、積分核Kの定義と積分の性質から出ます。
次に、行列Aと縦ベクトルtの積 At に相当する演算を導入します。gを可測空間Y上の関数、Kは積分核とします。可測空間X上の関数 f = g.K を定義します。次のアナロジーに基づきます。
ベクトルと行列 | 測度と積分 |
---|---|
添字の集合 {1, 2, ..., n} | 可測空間 X |
添字の集合 {1, 2, ..., m} | 可測空間 Y |
長さnの縦ベクトル t | Y上の関数 g |
n行m列の行列 A | 積分核 K: X to Y |
A と t の積 At | Kのよるgの変換 g.K |
f = g.K. は、X上の関数で、x∈X に対する値 f(x) を次のように定義します。
Kx = λB.K(x, B) はY上の測度になるので、これを使ってY上の関数gを積分できます、その積分値をxの関数とみなしたものが f = g.K です。実はΠYに測度空間の構造を与えること(ΣΠXの定義)ができて、x|→Kx : X→ΠY は可測になります。g∈ΦY を固定して測度を動かした積分 ν|→ ∫g dν は、ΠY→P という可測写像になるので、λx.Kx と λν.∫g dν の結合である f = g.K も可測になります。
以上から、積分核 K: X to Y に対して次のことが言えます。
- X上の測度μに対して、K.μはY上の測度である。
- Y上の関数gに対して、g.KはX上の関数である。
K∧(μ) := K.μ、K∨(g) := g.K と置くと:
- K∧ : ΠX→ΠY
- K∨ : ΦY→ΦX
行列との対応で言うと、K∧は行列が定義する線形写像に対応し、K∨は随伴線形写像に対応します。
スカラー積としての積分と随伴性
長さnの横ベクトルv(v∈Vn)と同じ長さの縦ベクトルs(s∈Vn)のスカラー積を <v, s>、長さを明示するときは <v, s|n>と書くことにしました。同様に、X上の測度μ(μ∈ΠX)によるX上の関数f(f∈ΦX)の積分を [f, μ] と書くことにします。測度空間Xを明示するときは [X|f, μ] とします。<v, s|n> と並び順を合わせるなら [μ, f|X] ですが、通常の積分の書き方のほうに合わせたので、並び順には食い違いがあります。
<vA, t|m> = <v, At|n> に相当する公式は、[Y|g, K.μ] = [X|g.K, μ] です。通常の積分の記法で書くと:
これを示すために、g(g∈ΦY)に対して定義される2つの汎関数I, Jを考えます。
任意の g∈ΦY に対して I(g) = J(g) を示せれば目的の等式を得られます。そのためには、
- Iが線形で列の極限を保存することを示す。
- Jが線形で列の極限を保存することを示す。
- gが可測集合の特性関数のときに I(g) = J(g) を示す。
三番目のステップだけ示すと、次のような計算になります。
g(y) = if (y∈B) then 1 else 0 とする。 K(x) = λB.K(x, B) として、K(x)(B) = K(x, B)。 I(g) = ∫Y g(y) d(K.μ) = ∫B d(K.μ) = (K.μ)(B) = ∫X K(x, B) dμ (g.K)(x) = ∫Y g(y) d(K(x)) = ∫B d(K(x)) = K(x)(B) = K(x, B) J(g) = ∫X (g.K)(x) dμ = ∫X K(x, B) dμ
任意の g∈ΦY は、可測集合の特性関数の線形結合の極限として書けます。IとJが線形結合と列の極限を保存するので、任意のgに対して I(g) = J(g) となります。
K∧:ΠX→ΠY、K∨:ΦY→ΦX を使って書くと、[Y|g, K∧(μ)] = [Y|K∨(g), μ] なので次のように書いてもいいでしょう。
- K∨ -| K∧
記号「-|」は、左右が互いに随伴であることを示します。「K∨はK∧の左随伴」、「K∧はK∨の右随伴」と読めますが、左右の別は恣意的で人により食い違ったりするので気にしてもしょうがありません。「K∨とK∧は、随伴ペアを形成する」ことが重要です。
応用:積分核の合成
K: X to Y と L: Y to Z を2つの積分核だとします。L・K: X to Z を次のように定義します。
L・Kは行列の積に対応するもので、積は線形写像の合成を定義するのが望ましく、次の等式が期待されます。(白丸は写像の反図式順結合です。)
このためには、次が示せればOKです。
計算が見やすくなるように、M = L・K : X to Z、ν = K.μ と置いて計算してみます。
K(x) = λB.K(x, B) として、K(x)(B) = K(x, B)。 M.μ(C) = ∫X M(x, C) dμ = ∫X (∫Y L(y, C) d(K(x)) dμ // g(y) = L(y, C) と置くと、 = ∫X (∫Y g(y) d(K(x)) dμ // ∫Y g(y) d(K(x)) = (g.K)(x) なので = ∫X (g.K)(x) dμ = [X|g.K, μ] L.ν(C) = ∫Y L(y, C)dν = ∫Y L(y, C) d(K.μ) // g(y) = L(y, C) と置くと、 = ∫Y g(y) d(K.μ) = [Y|g, K.μ]
[X|g.K, μ] = [Y|g, K.μ] なので、M.μ(C) = L.ν(C) となり、(L・K).μ = L.(K.μ) が示せました。