このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

統計的反転の圏論的セットアップ 2/?

統計的反転の圏論的セットアップ 1/2」の続きっちゃ続きの話です。が、この話が「2/2」(全2回の2回目)になるかというと、そうはならない(まだ続く)ので、タイトルは「2/?」にしました。全部で何回になるかは不明になりました。

統計的反転を一般的に議論しようとすると、確率測度だけを相手にしていてはダメなような気がします。そこで、確率測度とは限らないより一般的な測度まで考えることにしましょう。ジリィ・モナドは、確率測度を集めて作りますが、任意の測度を集めて作る一般化ジリィ・モナド〈generalized Giry monad〉を定義して、一般化ジリィ・モナドのクライスリ圏として“核の圏”Kernを定義します。

測度に関する色々な性質(後で使う予定)を列挙して、ルベーグ錐〈Lebesgue cone〉を導入します -- 今回・第2回も淡々とセットアップ〈準備〉が続きます。\newcommand{\cat}[1]{\mathcal{#1}}\newcommand{\For}{\mbox{For }}\newcommand{\Iff}{\Leftrightarrow}\newcommand{\In}{\mbox{ in }}

内容:

一般化ジリィ・モナド

非負実数の全体を P := {x∈R| x ≧ 0} とします。無限閉区間は、[0, ∞] := P∪{∞} として、順序や演算は無限大を含めた形に拡張します。Meas は可測空間と可測写像の圏です。

可測空間Xに対して、Ms(X) をX上の測度全体の集合とします。ここで、測度はシグマ集合代数 ΣX から [0, ∞] への写像で測度の性質〈公理〉を満たすものです。Ms(X) を可測空間とするには、A∈ΣX と r∈[0, ∞] に対して、

  • \mathscr{M}(A, r) := {ω∈Ms(X) | ω(A) ≦ r} ⊆Ms(X)

として定義される集合を可測集合とする最小のシグマ集合集合代数を採用します。

Ms(X) = (Ms(X), Σ(Ms(X))) と記号の乱用をして、Ms:MeasMeas in CAT という自己共変関手が定義できます。可測写像 f:X → Y in Meas に対する Ms(f):Ms(X) → Ms(Y) in Meas は、測度の前送りで定義します。

自己関手 Ms:MeasMeas in CAT の定義の仕方は、ジリィ関手(ジリィ・モナドの台関手)のときとまったく同じです。モナド乗法とモナド単位もジリィ・モナドと同じく定義すると、Ms を台関手とするモナドが構成できます。このモナド一般化ジリィ・モナド〈generalized Giry monad〉と呼び、GGiry = (GGiry, ν, δ)/Meas (記号の乱用)と書くことにします。'/Meas' は圏Meas上のモナドであることを示しています。台関手に関しては、GGiry = Ms です。

モナドのクライスリ圏を Kl(-) と書くことにして、

  • Stoc := Kl(Giry) = Kl(​(Giry, ν, δ)/Meas)
  • Kern := Kl(GGiry) = Kl(​(GGiry, ν, δ)/Meas)

と置きます。StocはTHE・確率的圏〈the stochastic category〉です。Kernについては次節でまた話題にします。

統計的反転の圏論的セットアップ 1/2 // 確率的圏と準確率的圏」で述べた方法で、一般化ジリィ型モナド〈generalized Giry-{type | like} monad〉を定義できます。

前回と今回で定義したモナドやクライスリ圏は次のようになり、ちょっと煩雑ですね。

測度 モナド クライスリ圏 ☓☓型モナド
確率測度 ジリィ・モナド Stoc ジリィ型モナド
有限測度 準ジリィ・モナド QStoc 準ジリィ型モナド
任意の測度 一般化ジリィ・モナド Kern 一般化ジリィ型モナド

「一般化ジリィ型モナド」とか、なんだかぎごちない名前になってしまいました。再整理して、ネーミングをやり直したほうがいいかも知れません。が、今日のところはこのままいきます。

核の圏

一般化ジリィ・モナド GGiry = (GGiry, ν, δ)/Meas のクライスリ圏がKernでした。圏Kernの対象は可測空間です。圏Kernの射を〈kernel〉と呼ぶことにします。圏Stocの射も「核」と呼ぶことがありますが、それはマルコフ核の「マルコフ」を省略しているわけで、形容詞〈修飾語〉「マルコフ」を省略しないルールにすれば紛れはないです。

核 f:X → Y in Kern はクライスリ射(クライスリ圏の射)なので、一般化ジリィ・モナドの基礎圏〈ground category〉Measで考えれば、f:X → GGiry(Y) in Meas です。GGiry(Y) ⊆ Set(ΣY, [0, ∞]) (忘却関手は省略)なので、f:XSet(ΣY, [0, ∞]) in Set と考えることができます(Xは可測空間の台集合)。写像fを反カリー化〈uncurrying〉すると、f:X×ΣY → [0, ∞] in Set が得られます。右下のカップ〈∪〉は反カリー化する演算子です。

改めて、反カリー化した核を定義しましょう。写像 F:X×ΣY → [0, ∞] in Set が(反カリー化)であるとは次の性質を満たすことです。

  1. 任意の x∈X に対して、F(x, -):ΣY → [0, ∞] は Y = (Y, ΣY) 上の測度になる。
  2. 任意の B∈ΣY に対して、F(-, B):X → [0, ∞] は X = (X, ΣX) 上の[0, ∞]値可測関数になる。

反カリー化した核の定義と、もとの(反カリー化してない)核の定義は同値なことは証明できるので、反カリー化/カリー化で行き来できる2つの“核”はしばしば同一視されます。同一視の結果、次の等式(記号の乱用)を許します。

  • For x∈X, B∈ΣY, f(x)(B) = f(x, B) = f(B | x)

可測空間Xと台集合Xの区別も、必要なとき以外はやめます。

今述べたような記号の乱用は許すとして、圏Kernの結合は次のように書けます。

\For f:X \to Y, g:Y \to Z \In {\bf Kern}\\
f;g = g\circ f := \lambda\, (x, C)\in X\times \Sigma Z.(\\
\:\:\:\: {\displaystyle \int_{y\in Y}g(C \mid y) f(dy \mid x)}\\
)

恒等射は、ディラック測度を割り当てる X \ni x \mapsto \delta_X(x) \in Ms(X) で与えられます。

以上の構成は、「測度は確率測度に限る」という制限を外しているだけで、一連の議論はジリィ・モナドとマルコフ核のときと同様です。制限を外すことにより、可測空間とマルコフ核の圏Stocの代わりに、可測空間と(一般化)核の圏Kernが得られます。StocKern です。

測度空間の圏

可測空間Xに測度Λを載せた構造 (X, Λ) を測度空間〈measure space〉と呼びます。測度空間を X と書いたときは、台可測空間を X 、載っている測度を ΛX と書くことにします。

  • X = (X, ΛX)

測度空間の圏を考えたいのですが、射をどうするかに選択肢があります。ここでは、任意の可測写像を射とした測度空間の圏をMSとします。

  • MS(X, Y) = Meas(X, Y)

この定義から、圏MSから圏Measへの充満忠実な忘却関手 U:MSMeas in CAT があることになります。

測度を保存する可測写像を射とした場合は、MSmp と書くことにします。mp は measure preserving の略です。MSmpMS は同じ対象類(測度空間達)を共有します。

測度空間を対象として、核(一般化核)を射とする圏をKernMSとします。測度を保存する核を射とする圏は KernMSmp です。

測度に関する色々な性質

Xが可測空間のとき Ms(X)∈|Meas| は任意の測度からなる可測空間ですが、測度に次の性質を仮定することがあります。

  • 有限測度
  • 絶対連続測度
  • 有限台離散測度

このなかで絶対連続測度は、基準になる測度がないと定義できません。測度空間を X = (X, ΛX) と書き、次の記法を使います。

  1. Ms(X, ΛX) : 任意の測度からなる可測空間。基準となる測度 ΛX は関係ない。
  2. MsF(X, ΛX) : 有限測度〈finite measure〉からなる可測空間。ω∈MsF(X, ΛX) ⇔ ω(X) < ∞ (Xは可測空間ではなくて集合の意味)。これも、基準となる測度 ΛX は関係ない。
  3. MsAC(X, ΛX) : 基準となる測度 ΛX に対して絶対連続〈absolutely continuous〉な測度からなる可測空間。ω∈MsAC(X, ΛX) ⇔ ω \ll ΛX
  4. MsFD(X, ΛX) : 有限台離散測度〈finitely-supported discrete measure〉からなる可測空間。有限台離散測度は、一点を台〈support〉とするディラック測度の有限個の和として書ける測度。基準となる測度 ΛX は関係ない。
  5. MsP(X, ΛX) : 確率測度からなる可測空間。ω∈MsP(X, ΛX) ⇔ ω(X) = 1 。基準となる測度 ΛX は関係ない。

測度に関する性質を'Ms'の右肩に付けて表します。複数の性質をコンマで並べるとアンドの意味だとします。例えば、MsP, AC(X, ΛX) は、ΛXに関して絶対連続な確率測度からなる可測空間です。

絶対連続測度と有限台離散測度の和で書ける、という性質を AC+FD と表すことにします。ω∈MsAC+FD(X, ΛX) であるとは、絶対連続測度αと有限台離散測度βがあって、ω = α + β と書けることです。和としての表示の一意性は要求しません。

ΛX によるラドン/ニコディム微分を RNΛX として、a := RNΛX(α) とします。a は測度αの密度関数です。βも次の形で表示します。

 \beta = r_1[x_1] + \cdots + r_n[x_n] \mbox{ where }x_i\in \underline{X},\, r_i\in {\bf R}_{\gt 0}

ωのより具体的な表示は:

\For A \in \Sigma \underline{X}\\
\omega(A) = {\displaystyle \int_A a(x)\Lambda(dx) + \sum_{A}\beta}

右辺第二項の総和は次の意味です。

{\displaystyle\sum_{A}\beta = \sum_A(r_1[x_1] + \cdots + r_n[x_n]) = \sum_{x_i \in A} r_i }

ω∈MsF, AC+FD(X, ΛX) のときは、ωの絶対連続部分の密度関数は可積分関数になります。

もうひとつ、UBは一様有界〈uniform bounded〉な測度を意味します。それは次の意味です。

  • ω∈MsUB(X, ΛX) ⇔ 定数 c∈P があって、A∈ΣX に対して ω(A) ≦ c(ΛX(A)) が成立する

今まで出てきた略号をまとめておきます。

  1. F : 有限測度
  2. AC : ΛX に関する絶対連続測度
  3. FD : 有限台離散測度
  4. P : 確率測度
  5. AC+FD : ΛX に関する絶対連続測度と有限台離散測度の和である測度
  6. UB : ΛX に関する一様有界測度

ルベーグ空間とルベーグ

(X, ΛX) を測度空間として、Fn(X, ΛX) := Meas(X, R) とします。これは、実数値可測関数の集合です。必要に応じて、Rベクトル空間の構造も考えます。Fn(X, ΛX) の定義に、測度 ΛX は関与してません。

測度 ΛX に関するASE〈Almost Surely Equal〉関係を ~X と書くことにします。商集合 Fn(X, ΛX)/~X を L(X, ΛX) とします。L(X, ΛX) にもベクトル空間の構造が入ります。L(X, ΛX) の定義には測度 ΛX が関係しています。L(X) = L(X, ΛX) を、測度空間X上のルベーグ空間〈Lebesgue space〉と呼びます。

何も条件を付けない L(X) は扱いにくいので、p乗可積分な関数(の同値類)からなる部分空間 Lp(X) をpごとに考えるのが普通で、これはp-ルベーグ空間〈p-Lebesgue space〉と呼びましょう。p = ∞ のときの L(X) は(本質的に)有界な関数(の同値類)からなる空間です。測度空間 X = (X, ΛX) 上のp-ルベーグ空間(p = 1, 2, ..., ∞)はバナッハ空間になります。

X上の非負実数値可測関数の空間を Fn≧0(X) 、非負実数値可測関数で代表される~X同値類の集合を L≧0(X) と書くことにします。同様に、Lp≧0(X) も定義します。Lp≧0(X) はベクトル空間にはなりませんが、錐〈cone〉になります。バナッハ空間のノルムを受け継いでノルム錐〈normed cone〉にもなります。バナッハ空間の距離完備性からノルム錐がω完備であることも分かります。

Lp≧0(X) を、測度空間 X = (X, ΛX) 上のp-ルベーグ〈p-Lebesgue cone〉と呼びます。p-ルベーグ空間はバナッハ空間となり、p-ルベーグ錐はωバナッハ錐となります。

抽象的なバナッハ空間/ωバナッハ錐とは違い、ルベーグ空間/ルベーグ錐の要素は、可測関数による表示(代表元)を持ちます。可測関数の積分値や(本質的)最大値などの値も具体的に計算できます。この事情から、統計的反転の道具としては主にp-ルベーグ錐が使われます。