このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

フランツによる統計的独立性の定義

統計的独立性と線形独立性を共通に語ることは出来るのか?」では、シンプソン〈Alex Simpson〉による独立性構造を紹介しました。シンプソンの独立性は、かなり広い範囲の“独立性”概念をカバーするものです。もうひとつの独立性であるフランツ〈Uwe Franz〉による独立性は、モノイド積を持つ圏をベースに統計的独立性を定式化したものです。この記事では、フランツの独立性をザッと紹介します。

内容:

確率変数の独立性

確率空間を A = (ΩA, ΣA, μA) のように書きます。ΩAは台集合、ΣAはΩA上のσ代数、μAは確率測度です。記号の乱用で ΩA = A として、A = (A, ΣA, μA) とも書きます。

(A, ΣA, μA) が確率空間、(B, ΣB) が可測空間のとき、可測写像 f:(A, ΣA)→(B, ΣB) を(ここでは)確率変数〈{random | stochastic} variable〉と呼びます。台集合のあいだの写像を同じ文字 f:A→B で表し、逆像を対応させる写像を ΣfB→ΣA または f*B→ΣA と書きます。

確率変数 f:(A, ΣA)→(B, ΣB) があると、B上に前送り測度〈誘導測度〉 f*A) を構成できます。前送りされた測度を使って (B, ΣB, f*A)) を作ると、これは確率空間です。よって、確率変数は、確率空間のあいだの測度を保存する写像 f:(A, ΣA)→(B, ΣB, f*A)) とみなせます。

確率空間と測度を保存する可測写像からなる圏をProbとします。上の議論から、確率変数はProbの射とみなせます。そこで、以下では「確率変数=圏Probの射」だとします。

同一の域〈domain〉を持つ2つの確率変数、つまり2つの射 f:A→B, g:A→C in Prob が(統計的に)独立であることを定義しましょう。確率変数 f, g から、σ代数のあいだの射 f*B→ΣA, g*C→ΣA が誘導されます。f*, g* はσ代数のあいだの準同型写像になります。そして、f*, g* による像 Im(f*)⊆ΣA, Im(g*)⊆ΣA はσ代数ΣAの部分σ代数になります。この状況で:

  • f:A→B, g:A→C in Prob統計的に独立〈statistically independent〉であるとは、σ代数ΣAの部分σ代数 Im(f*) と Im(g*) が確率測度μAに関して独立なこと。

ここで、“部分σ代数の確率測度に関する独立性”概念が必要になります。S, T がσ代数ΣAの部分σ代数だとして、これらが確率測度μAに対して独立〈independent〉だとは:

  • 任意の ξ∈S, η∈T に対して、μA(ξ∩η) = μA(ξ)μA(η) が成立すること。

ここで、ξとηはσ代数の要素なので“事象”です。上で言っていることは、Sの事象とTの事象に関して、“確率の積の公式”が成立することです。

2つの像σ代数 Im(f*), Imf(g*) ⊆ΣA が確率測度μA に関して独立であることを丁寧に述べれば:

  • 任意の β∈ΣB, γ∈ΣC に対して、μA(f*(β)∩g*(γ)) = μA(f*(β))μA(g*(γ)) が成立する。

これは、fとgの統計的独立性の定義です。

確率空間のテンソル

A = (A, ΣA, μA) と B = (B, ΣB, μB) が確率空間、つまり圏Probの対象のとき、そのテンソル積 A\otimesB を定義できます。(以下で、Pow(X) はXのベキ集合です。)

  1. A\otimesB の台集合は、直積集合 A×B とする。
  2. A\otimesB のσ代数は、α∈ΣA, β∈ΣA に対する α×β∈Pow(A×B) から生成される Pow(A×B) の部分σ代数で最小なもの*1として定義する。このσ代数を ΣA\otimesΣB と書く。
  3. A\otimesB の確率測度は、μA⊗B(α×β) = μA(α)μB(β) を満たすように定義された ΣA\otimesΣB 上の測度。この測度を μA\otimesμB と書く。

定義を簡単に書けば:

  • A\otimesB := (A×B, ΣA\otimesΣB, μA\otimesμB)

以上で、Probの対象に対するテンソル積は定義できたので、次に、射に対するテンソル積を定義します。

f:A→B, g:C→D in Prob として、f\otimesg:A\otimesC→B\otimesD in Prob を次のように定義します。

  1. f\otimesg の台写像は、f×g:A×C→B×D in Set、(f×g)(a, b) := (f(a), g(b)) 。
  2. f\otimesg のσ代数準同型写像 f*\otimesg*B\otimesΣD→ΣA\otimesΣC は、ΣB\otimesΣD を生成する β×δ(β∈ΣB, δ∈ΣD)に対して、(f*\otimesg*)(β×δ) := f*(β)×g*(δ) として定義される準同型写像。ここで、'×'は部分集合の直積。

ΣA\otimesΣC 上に載っている確率測度 μA\otimesμC のf\otimesgによる前送り測度 (f×g)*A\otimesμC) が、ΣB\otimesΣD 上の確率測度 μB\otimesμD と一致することは、別に証明が必要です(割愛、比較的簡単)。

Probテンソル単位対象〈モノイド単位対象〉Iは次のように定義します。

  1. Iの台集合は、単元集合 1 = {0} 。
  2. Iのσ代数は、ΣI := {\emptyset, {0}}
  3. Iの確率測度は、μI(\emptyset) = 0, μI({0}) = 1 。

以上で、対象に対する演算 (-\otimes-)、射に対する演算 (-\otimes-)、特定された対象Iが決まりました。これらがProbのモノイド構造であるためには、まだ定義すべきこと/証明すべきことがあります。

  1. (\otimes):Prob×ProbProb が二項関手〈双関手〉であることを示す。
  2. 結合律子(結合律の一貫性同型射の族) αA,B,C:(A\otimesB)\otimesC→A\otimes(B\otimesC) を定義する。
  3. 左単位律子(左単位律の一貫性同型射の族) λA:I\otimesA→A を定義する。
  4. 右単位律子(右単位律の一貫性同型射の族) ρA:A\otimesI→A を定義する。
  5. 結合律子のあいだのマックレーンの五角形等式を示す。
  6. 結合律子/単位律子のあいだのマックレーンの三角形形等式を示す。

これらの作業をすれば、(Prob, \otimes, I, α, λ, ρ) が、テンソル積に関してモノイド圏となることが分かります。面倒ではありますが、やれば出来ることなので省略します*2

射影付きモノイド圏とフランツ独立性

Cを(Probとは限らない)モノイド圏とします。記号の乱用で C = (C, \otimes, I, α, λ, ρ) と書きます。C×C は直積圏だとします。Π1:C×CC, Π2:C×CC は直積の第1成分, 第2成分をとる関手とします。

  • Π1(x, y) = x
  • Π2(x, y) = y

モノイド圏C上の射影系〈projections〉とは、2つの自然変換 π1::(\otimes)⇒Π1:C×CC, π2::(\otimes)⇒Π21:C×CC です。π1, π2 には、自然変換であること以外に特に条件はありません。π1, π2 を成分で書けば:

  • π1A,B:A\otimesB→A
  • π2A,B:A\otimesB→B

射影系を備えたモノイド圏を、射影付きモノイド圏〈monoidal category with projections〉と呼びます。射影付きモノイド圏のよく知られた例は、モノイド積が直積を与えるデカルト・モノイド圏です。デカルト・モノイド圏には、標準的な射影が備わっています。

(C, π1, π2) が射影付きモノイド圏のとき、同じ域を持つ2つの射 f:A→B, g:A→C (スパンと呼ぶ)に対してフランツの意味の独立性を定義できます。fとgがフランツ独立〈Franz independent〉だとは:

  • h:A→B\otimesC が存在して、f = h;π1B,C, g = h;π2B,C が成立すること。

デカルト・モノイド圏では、すべてのスパンがフランツ独立になります。

フランツ独立性に関する注意

フランツ独立性は、任意の射影付きモノイド圏 (C, π1, π2) に関して定義できます。「独立である」の主語は、Cのスパンです。ただし、前節の定義では、2-スパン(同じ域を持つ2本の射)だけが対象物で、一般的なn-スパン(同じ域を持つn本の射)の独立性は定義されません。

n-スパンに対する独立性を定義するには、n個の射影の族 πn1, πn2, ..., πnn が必要になります。n ≧ 3 に対しては、π1 = π21, π2 = π22 を組み合わせて構成できます。例えば:

  • π31A,B,C := π21(A⊗B),C21A,B : (A\otimesB)\otimesC→A
  • π32A,B,C := π21(A⊗B),C22A,B : (A\otimesB)\otimesC→B
  • π33A,B,C := π22(A⊗B),C : (A\otimesB)\otimesC→C

n = 1 に関しては:

  • π11A := idA : A→A

辻褄を合わせるために n = 0 では:

  • π0 := idI : I→I

これらの射影の系があれば、n-スパンのフランツ独立性が定義できます。Aから出る1-スパン f:A→B は常に独立で、Aから出る0-スパンA(対象のみ)は、A→I という射が在れば独立になります。

有限のインデックスセットIを持つn-スパン (fi:A→Bi | i∈I) がフランツ独立であることは、スパンの射達/射影達と可換図式を構成する射hが存在することです。

  • h:A→\bigotimes_{i\in I}Bi

このhを、n-スパンの独立タプル〈independent tuple〉と呼ぶことにします。2-スパンの場合は独立ペア〈independent pair〉です。0-スパンの独立タプルは A→I という射です。

n-スパンが独立でも、その独立タプルが一意的に存在することは保証されません。「存在するなら一意的である」という条件を付けると話が簡単になることもあるので、射影付きモノイド圏が一意存在の性質を持つとき、シャープsharp | 鋭利〉であるということにします。

  • 射影付きモノイド圏 (C, π1, π2) がシャープ :⇔ n-スパンの独立タプルが存在するなら一意的である。

n-スパンには0-スパンも入ります。射影付きモノイド圏がシャープであり、すべてのn-スパンが独立である(独立タプルを持つ)とき、その射影付きモノイド圏はデカルト・モノイド圏になります。デカルト・モノイド圏は、射影付きモノイド圏のなかで、独立タプルの存在と一意性において最も“強い”圏として特徴付けられます。

統計的独立性とフランツ独立性

2-スパンのケースで、最初に述べた確率変数の統計的独立性と、射影付きモノイド圏Probのフランツ独立性が同じであることを示します。

ここで、念の為繰り返し注意をします; (A, ΣA, μA) という書き方は記号の乱用で、ほんとは (ΩA, ΣA, μA) と書くべきです。f:(A, ΣA, μA)→(B, ΣB, μB) の構成素は、ΩfA→ΩB と ΣfB→ΣA ですが、台写像(台集合のあいだの写像)Ωfを単にfと書き、σ代数の準同型写像Σfをf*と書きます(もちろん、記号の乱用で)。

Probには、確率空間のテンソル積(と可測写像テンソル積)によりモノイド構造が入ります。射影 π1A,B:A\otimesB→A, π2A,B:A\otimesB→B in Prob は、台集合の射影(集合圏の射影)と対応するσ代数の準同型写像(部分集合の引き戻し)で定義します。こうして定義された射影が、確率測度を保存することは容易に示せます(つうか、そうなるようにテンソル積を定義している)。

いま定義した射影により、(Prob, π1, π2) は射影付きモノイド圏になります。確率空間にその台集合を対応させる忘却関手 Ω:ProbSet は、Setも射影付きモノイド圏とみなして“射影付き圏のあいだの関手”になります。確率空間のテンソル積を集合の直積に移し、テンソル積確率空間の射影を直積集合の射影に移します。

Probが射影付きモノイド圏になったので、フランツ独立性を定義できます。まず、後で使う補題として、次の等式を示します; f:A→B, g:A→C in Prob に対して、h:A→B\otimesC in Prob がfとgの独立ペア(のひとつ)だとして:

  • [補題] α∈ΣA, γ∈ΣC に対して、h*(β×γ) = f*(α)∩g*(γ)

hがfとgの独立ペアなので、

  1. π1\circh = f : A→B in Prob
  2. π2\circh = g : A→C in Prob

これより、

  1. h*\circ1)* = f* : ΣB→ΣA
  2. h*\circ2)* = g* : ΣC→ΣA

α∈ΣA, γ∈ΣC に対して、

  1. (h*\circ1)*)(β) = f*(β)
  2. (h*\circ2)*)(γ) = g*(γ)

1)*(β) = β×C, (π2)*(γ) = B×γ なので、

  1. h*(β×C) = f*(β)
  2. h*(B×γ) = g*(γ)

h*(β×γ) = h*(β×C ∩ B×γ) = h*(β×C)∩h*(B×γ) に、すぐ上の等式を代入すると:

  • h*(β×γ) = f*(β)∩g*(γ)

これで補題の等式が示せました。

次に、fとgがフランツ独立(独立ペアを持つ)ならば、fとgは、確率変数として統計的に独立なことを示しましょう。

任意の β∈ΣB, γ∈ΣC に対して、μA(f*(β)∩g*(γ)) を計算します。補題から:

  • μA(f*(β)∩g*(γ)) = μA(h*(β×γ))

hが確率測度を保存することから、μA(h*(-)) は μB\otimesC(-) に等しいので、

  • μA(f*(β)∩g*(γ)) = μB\otimesC(β×γ)

μB\otimesCの定義から、μB\otimesC(β×γ) = μB(β)μC(γ) なので、

  • μA(f*(β)∩g*(γ)) = μB(β)μC(γ)

fもgも確率測度を保存することから、μA(f*(β)) = μB(β) かつ μA(g*(γ)) = μC(γ) なので、

  • μA(f*(β)∩g*(γ)) = μA(f*(β))μA(g*(γ))

これは、確率変数fとgが統計的に独立なことです。以上で、フランツ独立性から確率変数の統計的独立性が従うことが分かりました。

逆方向の命題「確率変数fとgが統計的に独立なら、fとgはフランツ独立である」も示す必要がありますが、台写像デカルト・ペア <f, g> : A→B×C in Set を台写像とする確率空間のあいだの射 h:A→B\otimesC を作って、それがfとgの独立ペアになることを示せばOKです。

おわりに

前回の記事「統計的独立性と線形独立性を共通に語ることは出来るのか?」で紹介したシンプソン独立性と、今回の記事のフランツ独立性を一緒に考えて、2つの独立性の関連を探ると、統計的独立性に関する理解が深まると思います。

また、シンプソン独立性/フランツ独立性は、統計的独立性以外の“独立性”概念の分析にも利用できるでしょう。

*1:射影 A×B→A と A×B→B が可測写像になるような最小のσ代数と言っても同じです。

*2:モノイド圏におけるマックレーンの五角形・三角形等式(一貫性制約)については「モノイド圏と加群圏に関するフォークロアとマックレーン五角形・三角形」に書いてあります。