フランツによる統計的独立性の定義 - 檜山正幸のキマイラ飼育記 (はてなBlog)

「統計的独立性と線形独立性を共通に語ることは出来るのか？」では、シンプソン〈Alex Simpson〉による独立性構造を紹介しました。シンプソンの独立性は、かなり広い範囲の“独立性”概念をカバーするものです。もうひとつの独立性であるフランツ〈Uwe Franz〉による独立性は、モノイド積を持つ圏をベースに統計的独立性を定式化したものです。この記事では、フランツの独立性をザッと紹介します。

内容：

確率変数の独立性
確率空間のテンソル積
射影付きモノイド圏とフランツ独立性
フランツ独立性に関する注意
統計的独立性とフランツ独立性
おわりに

確率変数の独立性

確率空間を A = (Ω_A, Σ_A, μ_A) のように書きます。Ω_Aは台集合、Σ_AはΩ_A上のσ代数、μ_Aは確率測度です。記号の乱用で Ω_A = A として、A = (A, Σ_A, μ_A) とも書きます。

(A, Σ_A, μ_A) が確率空間、(B, Σ_B) が可測空間のとき、可測写像 f:(A, Σ_A)→(B, Σ_B) を（ここでは）確率変数〈{random | stochastic} variable〉と呼びます。台集合のあいだの写像を同じ文字 f:A→B で表し、逆像を対応させる写像を Σ_f:Σ_B→Σ_A または f^*:Σ_B→Σ_A と書きます。

確率変数 f:(A, Σ_A)→(B, Σ_B) があると、B上に前送り測度〈誘導測度〉 f_*(μ_A) を構成できます。前送りされた測度を使って (B, Σ_B, f_*(μ_A)) を作ると、これは確率空間です。よって、確率変数は、確率空間のあいだの測度を保存する写像 f:(A, Σ_A)→(B, Σ_B, f_*(μ_A)) とみなせます。

確率空間と測度を保存する可測写像からなる圏をProbとします。上の議論から、確率変数はProbの射とみなせます。そこで、以下では「確率変数＝圏Probの射」だとします。

同一の域〈domain〉を持つ2つの確率変数、つまり2つの射 f:A→B, g:A→C in Prob が（統計的に）独立であることを定義しましょう。確率変数 f, g から、σ代数のあいだの射 f^*:Σ_B→Σ_A, g^*:Σ_C→Σ_A が誘導されます。f^*, g^* はσ代数のあいだの準同型写像になります。そして、f^*, g^* による像 Im(f^*)⊆Σ_A, Im(g^*)⊆Σ_A はσ代数Σ_Aの部分σ代数になります。この状況で：

f:A→B, g:A→C in Prob が統計的に独立〈statistically independent〉であるとは、σ代数Σ_Aの部分σ代数 Im(f^*) と Im(g^*) が確率測度μ_Aに関して独立なこと。

ここで、“部分σ代数の確率測度に関する独立性”概念が必要になります。S, T がσ代数Σ_Aの部分σ代数だとして、これらが確率測度μ_Aに対して独立〈independent〉だとは：

任意の ξ∈S, η∈T に対して、μ_A(ξ∩η) = μ_A(ξ)μ_A(η) が成立すること。

ここで、ξとηはσ代数の要素なので“事象”です。上で言っていることは、Sの事象とTの事象に関して、“確率の積の公式”が成立することです。

2つの像σ代数 Im(f^*), Imf(g^*) ⊆Σ_A が確率測度μ_A に関して独立であることを丁寧に述べれば：

任意の β∈Σ_B, γ∈Σ_C に対して、μ_A(f^*(β)∩g^*(γ)) = μ_A(f^*(β))μ_A(g^*(γ)) が成立する。

これは、fとgの統計的独立性の定義です。

確率空間のテンソル積

A = (A, Σ_A, μ_A) と B = (B, Σ_B, μ_B) が確率空間、つまり圏Probの対象のとき、そのテンソル積 A $\otimes$ B を定義できます。（以下で、Pow(X) はXのベキ集合です。）

A $\otimes$ B の台集合は、直積集合 A×B とする。
A $\otimes$ B のσ代数は、α∈Σ_A, β∈Σ_A に対する α×β∈Pow(A×B) から生成される Pow(A×B) の部分σ代数で最小なもの*1として定義する。このσ代数を Σ_A $\otimes$ Σ_B と書く。
A $\otimes$ B の確率測度は、μ_A⊗B(α×β) = μ_A(α)μ_B(β) を満たすように定義された Σ_A $\otimes$ Σ_B 上の測度。この測度を μ_A $\otimes$ μ_B と書く。

定義を簡単に書けば：

A $\otimes$ B := (A×B, Σ_A $\otimes$ Σ_B, μ_A $\otimes$ μ_B)

以上で、Probの対象に対するテンソル積は定義できたので、次に、射に対するテンソル積を定義します。

f:A→B, g:C→D in Prob として、f $\otimes$ g:A $\otimes$ C→B $\otimes$ D in Prob を次のように定義します。

f $\otimes$ g の台写像は、f×g:A×C→B×D in Set、(f×g)(a, b) := (f(a), g(b)) 。
f $\otimes$ g のσ代数準同型写像 f^* $\otimes$ g^*:Σ_B $\otimes$ Σ_D→Σ_A $\otimes$ Σ_C は、Σ_B $\otimes$ Σ_D を生成する β×δ（β∈Σ_B, δ∈Σ_D）に対して、(f^* $\otimes$ g^*)(β×δ) := f^*(β)×g^*(δ) として定義される準同型写像。ここで、'×'は部分集合の直積。

Σ_A $\otimes$ Σ_C 上に載っている確率測度 μ_A $\otimes$ μ_C のf $\otimes$ gによる前送り測度 (f×g)_*(μ_A $\otimes$ μ_C) が、Σ_B $\otimes$ Σ_D 上の確率測度 μ_B $\otimes$ μ_D と一致することは、別に証明が必要です（割愛、比較的簡単）。

Probのテンソル単位対象〈モノイド単位対象〉Iは次のように定義します。

Iの台集合は、単元集合 1 = {0} 。
Iのσ代数は、Σ_I := { $\emptyset$ , {0}}
Iの確率測度は、μ_I( $\emptyset$ ) = 0, μ_I({0}) = 1 。

以上で、対象に対する演算 (- $\otimes$ -)、射に対する演算 (- $\otimes$ -)、特定された対象Iが決まりました。これらがProbのモノイド構造であるためには、まだ定義すべきこと／証明すべきことがあります。

( $\otimes$ ):Prob×Prob→Prob が二項関手〈双関手〉であることを示す。
結合律子（結合律の一貫性同型射の族） α_A,B,C:(A $\otimes$ B) $\otimes$ C→A $\otimes$ (B $\otimes$ C) を定義する。
左単位律子（左単位律の一貫性同型射の族） λ_A:I $\otimes$ A→A を定義する。
右単位律子（右単位律の一貫性同型射の族） ρ_A:A $\otimes$ I→A を定義する。
結合律子のあいだのマックレーンの五角形等式を示す。
結合律子／単位律子のあいだのマックレーンの三角形形等式を示す。

これらの作業をすれば、(Prob, $\otimes$ , I, α, λ, ρ) が、テンソル積に関してモノイド圏となることが分かります。面倒ではありますが、やれば出来ることなので省略します*2。

射影付きモノイド圏とフランツ独立性

Cを（Probとは限らない）モノイド圏とします。記号の乱用で C = (C, $\otimes$ , I, α, λ, ρ) と書きます。C×C は直積圏だとします。Π¹:C×C→C, Π²:C×C→C は直積の第1成分, 第2成分をとる関手とします。

Π¹(x, y) = x
Π²(x, y) = y

モノイド圏C上の射影系〈projections〉とは、2つの自然変換 π¹::( $\otimes$ )⇒Π¹:C×C→C, π²::( $\otimes$ )⇒Π²¹:C×C→C です。π¹, π² には、自然変換であること以外に特に条件はありません。π¹, π² を成分で書けば：

π¹_A,B:A $\otimes$ B→A
π²_A,B:A $\otimes$ B→B

射影系を備えたモノイド圏を、射影付きモノイド圏〈monoidal category with projections〉と呼びます。射影付きモノイド圏のよく知られた例は、モノイド積が直積を与えるデカルト・モノイド圏です。デカルト・モノイド圏には、標準的な射影が備わっています。

(C, π¹, π²) が射影付きモノイド圏のとき、同じ域を持つ2つの射 f:A→B, g:A→C （スパンと呼ぶ）に対してフランツの意味の独立性を定義できます。fとgがフランツ独立〈Franz independent〉だとは：

h:A→B $\otimes$ C が存在して、f = h;π¹_B,C, g = h;π²_B,C が成立すること。

デカルト・モノイド圏では、すべてのスパンがフランツ独立になります。

フランツ独立性に関する注意

フランツ独立性は、任意の射影付きモノイド圏 (C, π¹, π²) に関して定義できます。「独立である」の主語は、Cのスパンです。ただし、前節の定義では、2-スパン（同じ域を持つ2本の射）だけが対象物で、一般的なn-スパン（同じ域を持つn本の射）の独立性は定義されません。

n-スパンに対する独立性を定義するには、n個の射影の族 π_n¹, π_n², ..., π_nⁿ が必要になります。n ≧ 3 に対しては、π¹ = π₂¹, π² = π₂² を組み合わせて構成できます。例えば：

π₃¹_A,B,C := π₂¹_(A⊗B),C;π₂¹_A,B : (A $\otimes$ B) $\otimes$ C→A
π₃²_A,B,C := π₂¹_(A⊗B),C;π₂²_A,B : (A $\otimes$ B) $\otimes$ C→B
π₃³_A,B,C := π₂²_(A⊗B),C : (A $\otimes$ B) $\otimes$ C→C

n = 1 に関しては：

π₁¹_A := id_A : A→A

辻褄を合わせるために n = 0 では：

π₀ := id_I : I→I

これらの射影の系があれば、n-スパンのフランツ独立性が定義できます。Aから出る1-スパン f:A→B は常に独立で、Aから出る0-スパンA（対象のみ）は、A→I という射が在れば独立になります。

有限のインデックスセットIを持つn-スパン (f_i:A→B_i | i∈I) がフランツ独立であることは、スパンの射達／射影達と可換図式を構成する射hが存在することです。

h:A→ $\bigotimes_{i\in I}$ B_i

このhを、n-スパンの独立タプル〈independent tuple〉と呼ぶことにします。2-スパンの場合は独立ペア〈independent pair〉です。0-スパンの独立タプルは A→I という射です。

n-スパンが独立でも、その独立タプルが一意的に存在することは保証されません。「存在するなら一意的である」という条件を付けると話が簡単になることもあるので、射影付きモノイド圏が一意存在の性質を持つとき、シャープ〈sharp | 鋭利〉であるということにします。

射影付きモノイド圏 (C, π¹, π²) がシャープ :⇔ n-スパンの独立タプルが存在するなら一意的である。

n-スパンには0-スパンも入ります。射影付きモノイド圏がシャープであり、すべてのn-スパンが独立である（独立タプルを持つ）とき、その射影付きモノイド圏はデカルト・モノイド圏になります。デカルト・モノイド圏は、射影付きモノイド圏のなかで、独立タプルの存在と一意性において最も“強い”圏として特徴付けられます。

統計的独立性とフランツ独立性

2-スパンのケースで、最初に述べた確率変数の統計的独立性と、射影付きモノイド圏Probのフランツ独立性が同じであることを示します。

ここで、念の為繰り返し注意をします； (A, Σ_A, μ_A) という書き方は記号の乱用で、ほんとは (Ω_A, Σ_A, μ_A) と書くべきです。f:(A, Σ_A, μ_A)→(B, Σ_B, μ_B) の構成素は、Ω_f:Ω_A→Ω_B と Σ_f:Σ_B→Σ_A ですが、台写像（台集合のあいだの写像）Ω_fを単にfと書き、σ代数の準同型写像Σ_fをf^*と書きます（もちろん、記号の乱用で）。

圏Probには、確率空間のテンソル積（と可測写像のテンソル積）によりモノイド構造が入ります。射影 π¹_A,B:A $\otimes$ B→A, π²_A,B:A $\otimes$ B→B in Prob は、台集合の射影（集合圏の射影）と対応するσ代数の準同型写像（部分集合の引き戻し）で定義します。こうして定義された射影が、確率測度を保存することは容易に示せます（つうか、そうなるようにテンソル積を定義している）。

いま定義した射影により、(Prob, π¹, π²) は射影付きモノイド圏になります。確率空間にその台集合を対応させる忘却関手 Ω:Prob→Set は、Setも射影付きモノイド圏とみなして“射影付き圏のあいだの関手”になります。確率空間のテンソル積を集合の直積に移し、テンソル積確率空間の射影を直積集合の射影に移します。

Probが射影付きモノイド圏になったので、フランツ独立性を定義できます。まず、後で使う補題として、次の等式を示します； f:A→B, g:A→C in Prob に対して、h:A→B $\otimes$ C in Prob がfとgの独立ペア（のひとつ）だとして：

[補題] α∈Σ_A, γ∈Σ_C に対して、h^*(β×γ) = f^*(α)∩g^*(γ)

hがfとgの独立ペアなので、

π¹ $\circ$ h = f : A→B in Prob
π² $\circ$ h = g : A→C in Prob

これより、

h^* $\circ$ (π¹)^* = f^* : Σ_B→Σ_A
h^* $\circ$ (π²)^* = g^* : Σ_C→Σ_A

α∈Σ_A, γ∈Σ_C に対して、

(h^* $\circ$ (π¹)^*)(β) = f^*(β)
(h^* $\circ$ (π²)^*)(γ) = g^*(γ)

(π¹)^*(β) = β×C, (π²)^*(γ) = B×γ なので、

h^*(β×C) = f^*(β)
h^*(B×γ) = g^*(γ)

h^*(β×γ) = h^*(β×C ∩ B×γ) = h^*(β×C)∩h^*(B×γ) に、すぐ上の等式を代入すると：

h^*(β×γ) = f^*(β)∩g^*(γ)

これで補題の等式が示せました。

次に、fとgがフランツ独立（独立ペアを持つ）ならば、fとgは、確率変数として統計的に独立なことを示しましょう。

任意の β∈Σ_B, γ∈Σ_C に対して、μ_A(f^*(β)∩g^*(γ)) を計算します。補題から：

μ_A(f^*(β)∩g^*(γ)) = μ_A(h^*(β×γ))

hが確率測度を保存することから、μ_A(h^*(-)) は μ_BC(-) に等しいので、

μ_A(f^*(β)∩g^*(γ)) = μ_BC(β×γ)

μ_BCの定義から、μ_BC(β×γ) = μ_B(β)μ_C(γ) なので、

μ_A(f^*(β)∩g^*(γ)) = μ_B(β)μ_C(γ)

fもgも確率測度を保存することから、μ_A(f^*(β)) = μ_B(β) かつ μ_A(g^*(γ)) = μ_C(γ) なので、

μ_A(f^*(β)∩g^*(γ)) = μ_A(f^*(β))μ_A(g^*(γ))

これは、確率変数fとgが統計的に独立なことです。以上で、フランツ独立性から確率変数の統計的独立性が従うことが分かりました。

逆方向の命題「確率変数fとgが統計的に独立なら、fとgはフランツ独立である」も示す必要がありますが、台写像のデカルト・ペア <f, g> : A→B×C in Set を台写像とする確率空間のあいだの射 h:A→B $\otimes$ C を作って、それがfとgの独立ペアになることを示せばOKです。