このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

参照用 記事

アレンジメント計算 6: 用語・記法の整理

先に進む前に、用語・記法の整理をしておきます。既に、気になるオーバーロード/コンフリクト、記号の乱用が幾つか出てきているので、これらに注意を促しておきます。

内容:

シリーズ第1回 兼 リンクハブ:

正規表現

用語の整理には、正規表現を使うと便利です。用語の整理のための正規表現の詳細と実例は「用語のバリエーション記述のための正規表現」に書いてありますが、要点は次のとおりです。

  • 省略可能な部分は {‥‥}? と書く。
  • 選択肢のどれか1つを選ぶ場合は {‥‥ | ‥‥} と書く(3つ以上の選択肢もあり)。

例えば、{確率}?{分布 | 測度}? で表現される文字列は次の6つになります。

  1. "確率分布"
  2. "確率測度"
  3. "確率"
  4. "分布"
  5. "測度"
  6. "" (空文字列)

用語のバリエーション記述のための正規表現」にはない書き方ですが、{‥‥}! を導入します。これは「空文字列は除く」意味です。{{確率}?{分布 | 測度}?}! だと、空文字列は除くので、5つの文字列を意味します。

確率測度、確率分布、条件付き確率

「確率測度」と「確率分布」は原則的に区別しません、同義語です。過去記事で(記事ごとにローカルに)区別したことはあります。次の2つのケースです。

  1. 可測空間が有限離散の場合: 確率測度μは通常の意味。確率分布pは p(x) = μ({x}) で定義される関数。
  2. 確率測度のなかで、なんらかの意味で扱いやすいものを確率分布と呼ぶ。例えば、確率密度関数で表現可能とか、ディラック測度の和(凸結合)であるとか。

これらは特定文脈で使っているだけのローカルな約束です。

「同時」と「周辺」が形容詞として付いたときの言い方は:

  • 同時{{確率}?{分布 | 測度}?}!
  • 周辺{{確率}?{分布 | 測度}?}!

正規表現が表す複数の語が同義語です。前節で導入したビックリマークが付いているので、「同時」だけ、「周辺」だけにはなりません。しかし、英語だと joint, marginal が形容詞ではなくて単独で名詞のように使われることがあります。

「条件付き確率」という言葉は使いません。曖昧性があり過ぎて、コミュニケーションに支障をきたすからです。

  1. マルコフ核、マルコフ行列、マルコフテンソルなどを「条件付き確率」とは呼ばない。
  2. 抽象的・公理的なマルコフ圏の射は「マルコフ射」、あるいは単に「射」と呼ぶ。「条件付き確率」とは呼ばない。
  3. 同時確率分布からマルコフ核を作る操作は「条件化〈conditionalization〉」と呼ぶ。条件化操作で得られたマルコフ核を、「条件化」を名詞的に使って表すこともある。
  4. 抽象的・公理的なマルコフ圏においても、「条件化」を使う。
  5. 確率空間 A = (A, μ) (記号の乱用)に対して、μ(B) > 0 である可測部分集合 B⊆A による制限 A|B = (B, μ|B) を「条件付き確率」とは呼ばない。
  6. 制限は、可測部分集合に対してだけではなく、ファジー述語や可測関数による制限もあるが、いずれにしても「条件付き確率」とは呼ばない。

意味が拡散しすぎてマジックワード(意味不明だが、うまく思考停止を誘発する便利な言葉)に成り下がってしまった用語はオフィシャルには使用禁止にしたほうが無難です*1

周辺、同時、条件、反転

抽象的・公理的なマルコフ圏においても、具体的に構成された確率的圏においても、「周辺」「同時」「条件」「反転」の4つは語は、とても重要な概念を表現します。

形容詞兼名詞 動詞 動詞からの名詞 可能の形容詞
1. 英語 marginal marginalize marginalization (marginalizable)
1. 日本語 周辺{化}? 周辺化する 周辺化 (周辺化可能)
2. 英語 joint jointify jointification (jointfiable)
2. 日本語 同時 同時化する 同時化 (同時化可能)
3. 英語 conditional conditionalize conditionalization conditionalizable
3. 日本語 条件{化}? 条件化する 条件化 条件化可能
4. 英語 converse converse conversion convertible
4. 日本語 反転 反転する 反転 反転可能

上の表で、丸括弧で囲まれた可能の形容詞は実質的な意味がありません。マルコフ圏ならば、必然的に周辺化可能/同時化可能だからです。

「動詞からの名詞」の欄の英語は、オペレーター〈コンビネータ〉の名前に使われます。

  1. marginalizationオペレーター = Marg
  2. jointificationオペレーター = Joint
  3. conditionalizationオペレーター = Condit
  4. conversionオペレーター = Convs

オペレーターの略記法に関しては「アレンジメント計算 3: 絵算の基本技法 // アレンジメント計算のオペレーター」に書いてあります。必要に応じて、さらに別な略記法を導入することもあるでしょう。

圏論的確率論では、圏だけではなくて、その上のオペレーター達を含めた構造を扱います。圏は、オペレーターを載せるための土台を提供しているのだ、とも言えます(「圏論的コンストラクタと圏論的オペレータ: 関手性・自然性の呪縛からの脱却」参照)。

確率変数、関連、関連類

「確率変数」は激しく曖昧な言葉で(もちろん、オフィシャルには使用禁止)、代表的な意味・用法に次があるでしょう。

  1. A, B を可測空間として、可測写像 f:A → B のこと。
  2. 可測写像 f:A → B のことだが、A上には確率測度μが載っており (A, μ) が確率空間のとき。
  3. (A, μ), (B, ν) を確率空間として、確率測度を保存する可測写像 f:A → B のこと。
  4. 確率空間 (A, μ) のこと。

二番目の状況のとき、B上の確率測度を ν := f*(μ) と前送り測度で定義すると、三番目の状況になり、fは確率測度を保存する可測写像になります。

三番目の意味である“確率測度を保存する可測写像”の拡張として、関連〈relevance〉(檜山によるローカル用語)があります。具体的状況における関連は、2つの確率空間(の台可測空間)のあいだのマルコフ核で確率測度を保存するものです。今は用語の確認だけしているので、詳しい説明はしませんが。

具体的に構成された“可測空間とマルコフ核の圏”ではなくて、抽象的・公理的なマルコフ圏でも、確率空間相当物は作れるので、類似の定義により関連〈レレバンス〉を定義できます。抽象的・公理的なマルコフ圏においても、「確率空間」「{{確率}?{測度 | 分布}?}!」「関連」という言葉は使います。具体的な状況における用語を、抽象的状況においても流用するわけです(そうしないと、用語のインフレーションが起きる)。

形式的な定義においては、「確率空間」と「{{確率}?{測度 | 分布}?}!」は同義語ですが、「確率空間」と言う場合は、ひとつの構造とみなしたい場合です。ここいらの使い分けは気持ちの問題が入りますが、確率空間は圏の対象になっている場合が多いです。

具体的な確率空間上で定義された可測写像/マルコフ核の場合、域である可測空間上の確率測度により、「ほとんど等しい〈almost surely equal〉」という同値関係があります。抽象的・公理的なマルコフ圏においても、長/ジェイコブスによる「ほとんど等しい」の概念があります。具体的でも抽象的でも、関連(確率空間のあいだの確率測度保存射)の集合上の同値関係「ほとんど等しい」による同値類を関連類〈relevance class〉と呼びます。詳しい説明はいずれ。

カップリング、カップ

ちょっと錯綜した状況になってしまっている言葉が「カップリング」「カップル」です。

確率論で使われる既存用語「カップリング(名詞)」があります。今ここでは一時的に「確率的カップリング」と呼ぶことにします。可測空間A上の確率測度μと、可測空間B上の確率測度νがあるとき、μとνの確率的カップリングとは、積可測空間 A\otimesB 上の確率測度ωで、2つの周辺確率測度がそれぞれ μ, ν となるものです。μ, ν に対して、これらの確率的カップリングは(一般的には)たくさんあります。

設定を抽象的なマルコフ圏Cに移して考えると、μ:1 → A, ν:1 → B, ω:1 → A\otimesB in C であり、ω;(idA\otimes!B) = μ, ω;(!A\otimesidB) = ν in C が成立している状況のとき、“ωはμとνの確率的カップリング”になります。

ω:1 → A\otimesB in C だけが先に与えられたとき、μ := ω;(idA\otimes!B), ν := ω;(!A\otimesidB) と後から定義しても、“ωはμとνの確率的カップリング”の状況を再現できます。したがって、Cにおける確率的カップリングという概念は、ω:1 → A\otimesB in C だけで定義してもいいでしょう。

以上の事実を踏まえて、「ベイズ確率論とデータベース理論の統合: カップル化可能圏」で次の定義をしました。

モノイド圏Cにおいて、I → X\otimesY in C の形の射をカップル{射}?〈couple {morphism}?〉と呼びます。

カップリング」ではなくて「カップル」にしたのは、「カップリング」と「デカップリング」をオペレーターの意味で使いたかったからです。上記の定義のカップルは、任意のモノイド圏で通用する定義です。例えば、Pがマルコフ多圏のとき(マルコフ多圏はモノイド圏でもある)、Pカップルは二部アレンジメント(「アレンジメント計算 4: アレンジメント // アレンジメントの二部化と二部アレンジメント」参照)と同じものです。

モノイド圏Cに対して、そのカップルの集合 Couple(C) を定義できますが、一般的には Couple(C) が面白い構造を持つわけではありません。Cが特別な圏であるとき、Couple(C) が興味深くなります。その特別な圏とはカップル化可能圏です(「ベイズ確率論とデータベース理論の統合: カップル化可能圏」参照)。

Cカップル化可能圏(カップリング/デカップリング・オペレーターを備えた圏)であるとき、Couple(C) を射の集合とする圏を構成できます。この圏も同じ記号 Couple(C) で表しています。記号の乱用ですが、同じ記号で表しているものは:

  1. モノイド圏Cカップルの集合。
  2. カップル化可能圏Cから構成された圏。その圏の射集合が、Cカップルの集合となる。

もし混乱するようなら、別な名前を与えるかも知れません。いずれ、再整理したほうがよさそうですね。

カップル化可能圏は、抽象的・公理的に与えられた圏の種別です。マルコフ圏/マルコフ多圏がただちにカップル化可能圏になるわけではないし、カップル化可能圏は(一般的には)マルコフ圏になりません。が、両者が無関係なのではなくて、条件化可能マルコフ圏/マルコフ多圏からカップル化可能圏を構成できます。カップル化可能圏においては、次の言葉を使っています。

形容詞兼名詞 動詞 動詞からの名詞 可能の形容詞
1. 英語 couple{d}? couple coupling couplable
1. 日本語 カップル{化}? カップル化する カップル化 カップル化可能
2. 英語 decouple{d}? decouple decoupling (decouplable)
2. 日本語 カップル{化}? カップル化する カップル化 (反カップル化可能)

カップル化可能圏は、必然的に反カップル化可能なので丸括弧で囲んであります。「ベイズ確率論とデータベース理論の統合: カップル化可能圏」で使ったオペレーターの名前は Cou (coupling) と Dec (decoupling) です(フルスペルを連想しにくいな)。

本来の確率的カップリングは、具体的な圏のカップルと解釈できます。確率的カップリングであるカップルは、圏の射をカップル化〈カップリング〉して作られます。カップル化オペレーターは公理的に規定されるオペレーターですが、確率的状況の実例においては同時化オペレーターになります。

話がややこしいので箇条書きでまとめておきます。

  1. 確率論の既存用語で「カップリング(名詞)」がある。
  2. 任意のモノイド圏において「カップル(名詞)」を定義できる。
  3. 確率論の「カップリング」は、適切なモノイド圏の「カップル」と解釈できる。
  4. マルコフ多圏の「カップル」は「二部アレンジメント」と同義である。
  5. 任意のモノイド圏Cに対して、カップルの集合 Couple(C) を定義できる。
  6. 抽象的・公理的に「カップル化可能圏」を定義できる(「ベイズ確率論とデータベース理論の統合: カップル化可能圏」参照)。
  7. カップル化可能圏が備えるオペレーターのひとつが「カップリング〈カップル化〉(動詞からの名詞)」である。
  8. カップル化可能圏Cに対して、圏 Couple(C) を定義できる。
  9. 「圏 Couple(C) の射集合 = 集合 Couple(C)」という記号の乱用をしている。
  10. カップル化可能圏の「カップル化オペレーター」は、抽象的セッティングにおける名前なので、個々の具体例では具体例ごとに別な名前を持つかも知れないし、具体例でも「カップル化オペレーター」と呼ぶかも知れない。

おわりに

用語のオーバーロード/コンフリクト、記号の乱用を避けることは現実的にはほぼ無理です。しかし当然ながら、オーバーロード/コンフリクト/乱用はコミュニケーションと理解を阻害します。我々は、オーバーロード/コンフリクト/乱用という膨大なゴミ屑*2をかき分けながら進むことになります。

ゴミに足を取られて転ばないように注意しましょう; 例えば、可測空間を A = (A, ΣA), 確率空間を A = (A, μA) と書いたりすると(普通の書き方ですけど)、集合・可測空間・確率空間が同じ'A'で参照されます。ときに混乱してトンチンカンな事をするリスクがあります。

抽象的状況と具体的状況の区別をしっかりしましょう。抽象的状況と具体的状況では別な言葉・記号を使うことがあります。一方で、抽象的状況に具体的状況の言葉・記号が流用されたり、その逆の流用があったりします。言葉・記号が使われる状況・文脈を常に意識する必要があるわけです。

*1:テクニカルタームとしては認めないことにする、ってことです。カジュアルな散文的な会話・文章でも禁止するわけではありません。カジュアルなら、曖昧・雰囲気的に言葉を使ってもかまいません。

*2:なんでこんなにゴミだらけなんだろう、とウンザリしますが、ゴミは必然なのでしょう。現実世界において、文明が発達すればゴミの量も増大し、ゴミ処理が切実な問題になります。似たような事情なんだと思って諦めましょう。