コンテナは、形状〈shape〉を持つデータに対する型理論的な概念として登場しました。よく知られたデータ型をコンテナとして説明できるので便利だなとは思っていましたが、データ型以外の用途でも使えることに気付きました。まずはこの記事でコンテナそのものについて説明します*1。
記事タイトルに「圏論的」が付いているのは、コンテナを圏論の枠組みで定義するからです。圏論的に見たコンテナとは、集合圏の自己関手で特別に扱いやすいものです。扱いやすい理由は具体的な仕様と表示を持つからです。
内容:
コンテナスキーマ
コンテナの圏論的な定式化では、“関手を定義するデータ”と“定義される関手”を同一視してそれをコンテナと呼ぶことが多いのですが、同一視すると分かりにくいので、コンテナスキーマとコンテナ関手に分けて説明します。コンテナ関手はコンテナスキーマから定義されます。あるいは(同じことですが)、コンテナスキーマから定義される関手がコンテナ関手だ、と言えます。
コンテナスキーマから説明を始めますが、コンテナスキーマ〈container schema〉(まだ未定義だが)を などの英字大文字で表します。コンテナスキーマは2つの構成素を持つので、 のように書けます。構成素の説明も書くと次のようです。
は任意の集合で、 は をインデックス集合とする有限集合の族〈indexed family of finite sets〉です*2。
つまらない例ですが、 を単元集合として、次はコンテナスキーマの例です。
一番目の例を 、二番目の例を という固有名で呼ぶことにします。
よりは意味のある(実用性もある)コンテナスキーマの例として二分木〈二進木〉のコンテナスキーマを挙げます。
二分木形状〈shape of binary tree〉(のテキスト表現)を以下のように定義します。詳しくは、「反ラックス・モノイド関手の一般余結合律〉の最初の2節と「BUNツリーの亜群オペラッド構造 // BUNツリー」を参照してください。
- は二分木形状である。
- が二分木形状のとき、 は二分木形状である。これは の 番目のプレースホルダーに を代入〈置換〉したもの。
- 以上により構成される記号列だけが二分木形状(のテキスト表現)である。
二分木形状の幅〈width〉を次にように定義します。
例えば:
すべての二分木形状からなる集合を として、 を次のように定義します。
ペア はコンテナスキーマになります。このコンテナスキーマを という固有名で参照します。
形状付きデータ
がコンテナスキーマのとき、 という書き方を使います。
例えば:
コンテナスキーマ において、 を形状の集合〈set of shapes〉と呼び、その要素を形状〈shape〉と呼びます。形状 に対して、 を形状 の位置の集合〈set of positions〉と呼び、その要素を形状 の位置〈positio〉と呼びます。
例えば、 はコンテナスキーマ の形状のひとつです。この形状の位置の集合は
なので、 は形状 の位置になります。意味的には、三番目のプレースホルダーを指します。
コンテナスキーマ の形状 と任意の集合 に対して、写像 を考えて、ペア を形状付きデータ〈shaped data〉といいます。もっと正確な呼び名は、-形状の値データ〈s-shaped A-valued data〉です。
写像 を、形状付きデータ の値の値割り当て〈value assignment〉、あるいは単に割り当て〈assignment〉と呼びます。
例えば、コンテナスキーマ の形状 に対して次の値割り当てを考えます。
これは、リーフに実数値が割り当てられた次の二分木を表します。
二分木に限らない一般的なツリー形状/値割り当てに関しては、次の記事に記述があります。
コンテナスキーマ の形状 と任意の集合 に対して、-形状の値データ〈形状付きデータ〉の全体を と書きます。
集合 は固定した上で、すべての形状に関して形状付きデータを寄せ集めると次のようになります。
の場合に形状付きデータの寄せ集めを計算すると:
の形状付きデータは値の集合 のデータ〈要素〉と同じでした。
コンテナスキーマのその他の事例
以外によく使うコンテナスキーマを定義しておきましょう。
リスト〈配列〉データ型を記述するためのコンテナスキーマ を定義しましょう。それに先立ち次の約束をしておきます。
の定義は:
コンテナスキーマ の値の形状付きデータを寄せ集めると次のようになります。
最近書いた次の記事のなかで、たまたまリストの定義をしています(その一部をこの記事にコピーしました)。
長さ2のリストはペアですが、ペアデータ型を記述するためのコンテナスキーマ は次のようになります*3。
コンテナスキーマ の値の形状付きデータを寄せ集めると次のようになります。
期待通りの結果ですね。
もうひとつ、「何かを四角形の形に並べる」ことに対応するコンテナスキーマ (matrix から)を定義しておきます。
コンテナスキーマ の値の形状付きデータを寄せ集めると次のようになります。
コンテナ関手
前節で出てきた記号 をオーバーロードして使います。以下に出てくるハイフンは引数を入れる位置を示します。
コンテナスキーマ があると、集合圏 上の自己関手を定義することができます。その関手を、
とします。 の定義は次のようになります。
これが実際に という関手になることは確認できます(練習問題)。このようにして定義される関手を、コンテナスキーマ のコンテナ関手〈container functor〉と呼びます。
例えば、コンテナスキーマ に関して言えば:
記号の乱用により、関手 を単に とも書きます。例えば 。慣れてしまえば、コンテナ関手とコンテナスキーマを同一視することもあります。具体例は:
既存のデータ型から新しいデータ型を作る型構成子〈type constructor〉のなかには、コンテナ関手の対象部分として記述できるものがあります。実際、上記の関手達の対象部分はよく知られた型構成子です。
コンテナスキーマの圏
が2つのコンテナスキーマのとき、そのあいだの準同型射〈homomorphism〉は、写像 と写像の族 の組で、次のような仕様を持ちます。
がコンテナスキーマ から への準同型射のとき、 という書き方を使います。
形状のあいだの写像 と、位置のあいだの写像 で向きが逆なことに注意してください。僕はこれでハマりました。
コンテナスキーマのあいだの準同型射の結合〈合成〉と恒等射の定義は容易に想像できるでしょう。その結合/恒等射により、コンテナスキーマ達とそのあいだの準同型射達は圏 を形成します。
圏 の射(コンテナスキーマのあいだの準同型射)の例を幾つか挙げます。
空コンテナスキーマ は、圏 の終対象になっています。任意のコンテナスキーマ から終対象への唯一の射〈終射〉を とすると次のようです。
ここで、 は空集合からの唯一の写像を表します。これ以外の定義のしようがないので、確かに終射が唯一に決まります。
次に、「二分木形状のリーフだけ見るとリスト形状に見える」ことをコンテナスキーマの準同型射として記述します。 は Tree to List からです。上線〈overline〉は、 の意味です。
「二分木の最初〈左端〉のリーフを取り出す」ことをコンテナスキーマの準同型射として記述します。 は First Leaf からです。
コンテナスキーマの圏から関手圏への関手
前々節で、コンテナスキーマ に対して集合圏の自己関手 を定義しました。この節では、コンテナスキーマのあいだの準同型射 に対して自然変換 を定義します。これにより、 は次のような関手となります。
ここで、 は、集合圏の自己関手を対象とする関手圏(射は自然変換)です。サイズの観点からは、圏 はだいぶ危ういものですが、ここでは気にしないことにします。
関手圏への関手としての を定義していきましょう。
圏 の対象 に対する関手圏の対象 は既に定義しているので、射 に対する関手圏の射 を定義します。 の宣言(仕様の記述)は次のようになります。
外側に巨大な“圏の2圏” を想定するなら:
関手圏の射 は自然変換なので、その成分達により定義されます。自然変換の成分の宣言は次のようになります。
集合 は次のような無共分合併〈disjoint union〉で書けます。
写像 は、この無共分合併に沿って定義します。具体的には ごとに を定義して(下に宣言)、それらを寄せ集めることにします。
定義も書くと:
今までの定義をまとめてひとつにすると:
これで、成分が定義できました。が、自然変換であるためには自然性が必要です。次節でそれを示しましょう。
形状付きデータのデータ変換の自然性
前節の定義で、形状 ごとに写像 が得られました。この写像は、形状付きデータを形状付きデータに変換するので、形状付きデータのあいだのデータ変換と言っていいでしょう。特定の形状に対する変換ではなく、コンテナスキーマに属するすべての形状に対するデータ変換の族です。
形状付きデータは形状だけでなく値〈成分 | エントリ〉の集合にも依存しますが、値の集合のあいだの写像について自然性を持ちます。そのことは次の図式の可換性として表現されます。
に関して言えば:
この可換性〈等式〉を、具体的な計算で示します。 を取ると、時計回りの計算は次のようになります。
反時計回りの計算は:
なので、結果は一致します。これで、 が自然変換であることが分かりました。
が関手であるためには次の等式も必要です。
これらも同様なやり方で示せます。
おわりに
圏 と関手 が定義できました。これが、コンテナの議論をするときの基本的な道具です。
圏 はプレーンな圏として定義しましたが、モノイド積が入ります。標準的な非対称積だけでなく、対称なハンコック・テンソル積〈Hancock's tensor product〉もあります。アルテンキルヒ/レヴィ/スタトン〈Thorsten Altenkirch, Paul Levy, Sam Staton〉の"Higher-Order Containers"によると、デカルト閉圏に出来るようです。
冒頭で触れたように、型理論以外でもコンテナを利用できそうです。コンテナはけっこう汎用的に使える概念のようです。